假設(shè)檢驗

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

假設(shè)檢驗是數(shù)理統(tǒng)計學(xué)中根據(jù)一定假設(shè)條件由樣本推斷總體的一種方法。具體作法是:根據(jù)問題的需要對所研究的總體作某種假設(shè),記作H0;選取合適的統(tǒng)計量,這個統(tǒng)計量的選取要使得在假設(shè)H0成立時,其分布為已知;由實測的樣本,計算出統(tǒng)計量的值,并根據(jù)預(yù)先給定的顯著性水平進(jìn)行檢驗,作出拒絕或接受假設(shè)H0的判斷。常用的假設(shè)檢驗方法有u—檢驗法、t—檢驗法、X2檢驗法、F—檢驗法,秩和檢驗等?! ?/p>

意義

假設(shè)檢驗是抽樣推斷中的一項重要內(nèi)容。它是根據(jù)原資料作出一個總體指標(biāo)是否等于某一個數(shù)值,某一隨機(jī)變量是否服從某種概率分布的假設(shè),然后利用樣本資料采用一定的統(tǒng)計方法計算出有關(guān)檢驗的統(tǒng)計量,依據(jù)一定的概率原則,以較小的風(fēng)險來判斷估計數(shù)值與總體數(shù)值(或者估計分布與實際分布)是否存在顯著差異,是否應(yīng)當(dāng)接受原假設(shè)選擇的一種檢驗方法。

用樣本指標(biāo)估計總體指標(biāo),其結(jié)論有的完全可靠,有的只有不同程度的可靠性,需要進(jìn)一步加以檢驗和證實。通過檢驗,對樣本指標(biāo)與假設(shè)的總體指標(biāo)之間是否存在差別作出判斷,是否接受原假設(shè)。這里必須明確,進(jìn)行檢驗的目的不是懷疑樣本指標(biāo)本身是否計算正確,而是為了分析樣本指標(biāo)和總體指標(biāo)之間是否存在顯著差異。從這個意義上,假設(shè)檢驗又稱為顯著性檢驗。

進(jìn)行假設(shè)檢驗,先要對假設(shè)進(jìn)行陳述。通過下例加以說明。

例如,設(shè)某工廠制造某種產(chǎn)品的某種精度服從平均數(shù)為方差為的正態(tài)分布,據(jù)過去的數(shù)據(jù),已知平均數(shù)為75,方差為100。現(xiàn)在經(jīng)過技術(shù)革新,改進(jìn)了制造方法,出現(xiàn)了平均數(shù)大于75,方差沒有變更,但仍存在平均數(shù)不超過75的可能性。試陳述為統(tǒng)計假設(shè)。

根據(jù)上述情況,可有兩種假設(shè),一個是假想平均數(shù)不超過75,即假設(shè)另一個假想是平均數(shù)大于75,即假設(shè)如果我們把作為原假設(shè),即被檢驗的假設(shè),稱作零假設(shè),記作于是,假設(shè)相對于假設(shè)來說,是約定的、補充的假設(shè),記作它和有兩者選擇其一的意思,即作為被檢驗的假設(shè),則就是備擇的,故稱為備擇假設(shè)或?qū)α⒓僭O(shè)。

還須指出,哪個是零假設(shè),哪個是備擇假設(shè),是無關(guān)緊要的。我們關(guān)心的問題,是要探索哪一個假設(shè)被接受的問題。被接受的假設(shè)是要作為推理的基礎(chǔ)。在實際問題中,一般要考慮事情發(fā)生的邏輯順序和關(guān)心的事件,來設(shè)立零假設(shè)和備擇假設(shè)。

在作出了統(tǒng)計假設(shè)之后,就要采用適當(dāng)?shù)姆椒▉頉Q定是否應(yīng)該接受零假設(shè)。由于運用統(tǒng)計方法所遇到的問題不同,因而解決問題的方法也不盡相同。但其解決方法的基本思想?yún)s是一致的,即都是“概率反證法”思想,即:

(1)為了檢驗一個假設(shè)(即虛擬假設(shè))是否成立, 先假定它是成立的,然后看接受這個假設(shè)之后,是否會導(dǎo)致不合理結(jié)果。如果結(jié)果是合理的,就接受它;如不合理,則否定原假設(shè)。

(2)所謂導(dǎo)致不合理結(jié)果,就是看是否在一次觀察中, 出現(xiàn)小概率事件。通常把出現(xiàn)小概率事件的概率記為0,即顯著性水平。 它在次數(shù)函數(shù)圖形中是曲線兩端或一端的面積。因此,從統(tǒng)計檢驗來說,就涉及到雙側(cè)檢驗和單側(cè)檢驗問題。在實踐中采用何類檢驗是由實際問題的性質(zhì)來決定的。一般可以這樣考慮:

①雙側(cè)檢驗。如果檢驗的目的是檢驗抽樣的樣本統(tǒng)計量與假設(shè)參數(shù)的差數(shù)是否過大(無論是正方向還是負(fù)方向),就把風(fēng)險平分在右側(cè)和左側(cè)。比如顯著性水平為0.05,即概率曲線左右兩側(cè)各占,即0.025。

②單側(cè)檢驗。這種檢驗只注意估計值是否偏高或偏低。如只注意偏低,則臨界值在左側(cè),稱左側(cè)檢驗;如只注意偏高,則臨界值在右側(cè),稱右側(cè)檢驗。

對總體的參數(shù)的檢量,是通過由樣本計算的統(tǒng)計量來實現(xiàn)的。所以檢驗統(tǒng)計量起著決策者的作用。

參數(shù)估計與假設(shè)檢驗

統(tǒng)計推斷是由樣本的信息來推測母體性能的一種方法,它又可以分為兩類問題,即參數(shù)估計假設(shè)檢驗。實際生產(chǎn)和科學(xué)實驗中,大量的問題是在獲得一批數(shù)據(jù)后,要對母體的某一參數(shù)進(jìn)行估計和檢驗。

例如,我們對45鋼的斷裂韌性作了測定,取得了一批數(shù)據(jù),然后要求45鋼斷裂韌性的平均值,或要求45鋼斷裂韌性的單側(cè)下限值,或要求45鋼斷裂韌性的分散度(即離散系數(shù)),這就是參數(shù)估計的問題。

又如,經(jīng)過長期的積累,知道了某材料的斷裂韌性的平均值和標(biāo)準(zhǔn)差,經(jīng)改進(jìn)熱處理后,又測得一批數(shù)據(jù),試問新工藝與老工藝相比是否有顯著差異,這就是假設(shè)檢驗的問題。

這樣可以看出,參數(shù)估計是假設(shè)檢驗的第一步,沒有參數(shù)估計,也就無法完成假設(shè)檢驗。

關(guān)于“假設(shè)檢驗”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個人工具
名字空間
動作
導(dǎo)航
推薦工具
功能菜單
工具箱