非參數(shù)檢驗
A+醫(yī)學(xué)百科 >> 非參數(shù)檢驗 |
非參數(shù)檢驗(Nonparametric tests)檢驗假設(shè)或估計參數(shù)的統(tǒng)計過程,其中不需要關(guān)于總體分布的性質(zhì)或形狀的假設(shè);也稱作無分布檢驗?! ?/p>
目錄 |
相關(guān)知識
一、非參數(shù)檢驗的來由
非參數(shù)檢驗是統(tǒng)計分析方法的重要組成部分,它與參數(shù)檢驗共同構(gòu)成統(tǒng)計推斷的基本內(nèi)容。參數(shù)檢驗是在總體分布形式已知的情況下,對總體分布的參數(shù)如均值、方差等進(jìn)行推斷的方法。但是,在數(shù)據(jù)分析過程中,由于種種原因,人們往往無法對總體分布形態(tài)作簡單假定,但又希望能從樣本數(shù)據(jù)中獲得盡可能的信息,此時參數(shù)檢驗的方法就不再適用了。非參數(shù)檢驗正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進(jìn)行推斷的方法。由于非參數(shù)檢驗方法在推斷過程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗。
二、單樣本非參數(shù)檢驗
SPSS單樣本非參數(shù)檢驗是對單個總體的分布形態(tài)等進(jìn)行推斷的方法,其中包括卡方檢驗、二項分布檢驗、K-S檢驗以及變量值隨機(jī)性檢驗等方法?! ?/p>
1、總體分布的卡方檢驗
例如,醫(yī)學(xué)家在研究心臟病人猝死人數(shù)與日期的關(guān)系時發(fā)現(xiàn):一周之中,星期一心臟病人猝死者較多,其他日子則基本相當(dāng)。當(dāng)天的比例近似為2.8:1:1:1:1:1:1?,F(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),推斷其總體分布是否與上述理論分布相吻合。
卡方檢驗方法可以根據(jù)樣本數(shù)據(jù),推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適于對有多項分類值的總體分布的分析。它的原假設(shè)是:樣本來自得總體分布與期望分布或某一理論分布無差異?! ?/p>
2、二項分布檢驗
在生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分成男性和女性,產(chǎn)品可以分成合格和不合格,學(xué)生可以分成三好學(xué)生和非三好學(xué)生,投擲硬幣實驗的結(jié)果可以分成出現(xiàn)正面和出現(xiàn)反面等。通常將這樣的二值分別用1或0表示。如果進(jìn)行n次相同的實驗,則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量X來描述。如果隨機(jī)變量X為1的概率設(shè)為P,則隨機(jī)變量X值為0的概率Q便等于1-P,形成二項分布。
SPSS的二項分布檢驗正是要通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設(shè)是:樣本來自的總體與指定的二項分布無顯著差異。
從某產(chǎn)品中隨機(jī)抽取23個樣品進(jìn)行檢測并得到檢測結(jié)果。用1表示一級品,用0表示非一級品。根據(jù)抽樣結(jié)果驗證該批產(chǎn)品的一級品率是否為90%?! ?/p>
3、單樣本K-S檢驗
K-S檢驗方法能夠利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗方法,適用于探索連續(xù)型隨機(jī)變量的分布。
例如,收集一批周歲兒童身高的數(shù)據(jù),需利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否服從正態(tài)分布。再例如,利用收集的住房狀況調(diào)查的樣本數(shù)據(jù),分析家庭人均住房面積是否服從正態(tài)分布。
單樣本K-S檢驗的原假設(shè)是:樣本來自得總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態(tài)分布、均勻分布、指數(shù)分布和泊松分布等?! ?/p>
4、變量值隨機(jī)性檢驗
變量值隨機(jī)性檢驗通過對樣本變量值的分析,實現(xiàn)對總體的變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗。
例如,在投硬幣時,如果以1表示出現(xiàn)的是正面,以0表示出現(xiàn)的是反面,在進(jìn)行了若干次投幣后,將會得到一個以1,0組成的變量值序列。這時可能會分析“硬幣出現(xiàn)正反面是否是隨機(jī)的”這樣的問題。
變量值隨機(jī)性檢驗正是解決這類問題的一個有效方法。它的原假設(shè)是:總體變量值出現(xiàn)是隨機(jī)的。
變量隨機(jī)性檢驗的重要依據(jù)是游程。所謂游程是樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)??梢?a href="/index.php?title=%E7%9B%B4%E6%8E%A5%E7%90%86%E8%A7%A3&action=edit&redlink=1" class="new" title="直接理解(尚未撰寫)" rel="nofollow">直接理解,如果硬幣的正反面出現(xiàn)是隨機(jī)的,那么在數(shù)據(jù)序列中,許多個1或許多個0連續(xù)出現(xiàn)的可能性將不太大,同時,1和0頻繁交叉出現(xiàn)的可能性也會較小。因此,游程數(shù)太大或太小都將表明變量值存在不隨機(jī)的現(xiàn)象。
例:為檢驗?zāi)衬蛪涸O(shè)備在某段時間內(nèi)工作是否持續(xù)正常,測試并記錄下該時間段內(nèi)各個時間點上的設(shè)備耐壓的數(shù)據(jù)?,F(xiàn)采用游程檢驗方法對這批數(shù)據(jù)進(jìn)行分析。如果耐壓數(shù)據(jù)的變動是隨機(jī)的,可認(rèn)為該設(shè)備工作一直正常,否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象?! ?/p>
二、兩獨立樣本的非參數(shù)檢驗
兩獨立樣本的非參數(shù)檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自得兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機(jī)抽樣對在另一個總體中隨機(jī)抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數(shù)檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗等。
某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品。如果希望檢驗兩種工藝下產(chǎn)品的使用是否存在顯著差異,可從兩種工藝生產(chǎn)出的產(chǎn)品中隨機(jī)抽樣,得到各自的使用壽命數(shù)據(jù)。
甲工藝:675 682 692 679 669 661 693
乙工藝:662 649 672 663 650 651 646 652
1、曼-惠特尼U檢驗
兩獨立樣本的曼-惠特尼U檢驗可用于對兩總體分布的比例判斷。其原假設(shè):兩組獨立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現(xiàn)判斷。秩簡單說就是變量值排序的名次,可以將數(shù)據(jù)按升序排列,每個變量值都會有一個在整個變量值序列中的位置或名次,這個位置或名次就是變量值的秩。
2、K-S檢驗
K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯著差異。其原假設(shè)是:兩組獨立樣本來自的兩總體的分布無顯著差異。
這里是以變量值的秩作為分析對象,而非變量值本身。
3、游程檢驗
單樣本游程檢驗是用來檢驗變量值的出現(xiàn)是否隨機(jī),而兩獨立變量的游程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。其原假設(shè)是:兩組獨立樣本來自的兩總體的分布無顯著差異。
兩獨立樣本的游程檢驗與單樣本游程檢驗的思想基本相同,不同的是計算游程數(shù)的方法。兩獨立樣本的游程檢驗中,游程數(shù)依賴于變量的秩?! ?/p>
4、極端反應(yīng)檢驗
極端反應(yīng)檢驗從另一個角度檢驗兩獨立樣本所自得兩總體分布是否存在顯著差異。其原假設(shè)是:兩獨立樣本來自的兩總體的分布無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。如果實驗樣本沒有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體分布無顯著差異,相反則認(rèn)為存在顯著差異?! ?/p>
三、多獨立樣本的非參數(shù)檢驗
多獨立樣本的非參數(shù)檢驗是通過分析多組獨立樣本數(shù)據(jù),推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。
SPSS提供的多獨立樣本非參數(shù)檢驗的方法主要包括中位數(shù)檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。
例:希望對北京、上海、成都、廣州四個城市的周歲兒童的身高進(jìn)行比較分析。采用獨立抽樣方式獲得四組獨立樣本?! ?/p>
1、中位數(shù)檢驗
中位數(shù)檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數(shù)是否存在顯著差異。其原假設(shè)是:多個獨立樣本來自的多個總體的中位數(shù)無顯著差異。
基本思想是:如果多個總體的中位數(shù)無顯著差異,或者說多個總體有共同的中位數(shù),那么這個共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。于是,每組樣本中大于該中位數(shù)或小于該中位數(shù)的樣本數(shù)目應(yīng)大致相同?! ?/p>
2、 Kruskal-Wallis檢驗
Kruskal-Wallis檢驗實質(zhì)是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用于檢驗多個總體的分布是否存在顯著差異。其原假設(shè)是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想是:首先,將多組樣本數(shù)據(jù)混合并按升序排序,求出各變量值的秩;然后,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數(shù)據(jù)充分混合,數(shù)值相差不大的結(jié)果,可以認(rèn)為多個總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數(shù)據(jù)無法混合,某些組的數(shù)值普遍偏大,另一些組的數(shù)值普遍偏小的結(jié)果,可以認(rèn)為多個總體的分布有顯著差異。
3、 Jonckheere-Terpstra檢驗
Jonckheere-Terpstra檢驗也是用于檢驗多個獨立樣本來自的多個總體的分布是否存在顯著差異的非參數(shù)檢驗方法,其原假設(shè)是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小于其他組樣本的觀察值的個數(shù)?! ?/p>
四、兩配對樣本的非參數(shù)檢驗
兩配對樣本的非參數(shù)檢驗是對總體分布不甚了解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分布是否存在顯著差異的方法。
SPSS提供的兩配對樣本非參數(shù)檢驗的方法主要包括McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗等。
例:要檢驗一種新的訓(xùn)練方法是否對提高跳遠(yuǎn)運動員的成績有顯著效果,可以收集一批跳遠(yuǎn)運動員在使用新訓(xùn)練方法前后的跳遠(yuǎn)最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售產(chǎn)生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數(shù)據(jù)(其他條件保持基本穩(wěn)定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對樣本??梢姡鋵颖镜臉颖緮?shù)是相同的,且各樣本值的先后次序是不能隨意更改的?! ?/p>
1、 McNemar檢驗
是一種變化顯著性檢驗,它將研究對象自身作為對照者檢驗其“前后”的變化是否顯著。其原假設(shè)是:兩配對樣本來自的兩總體的分布無顯著差異。
分析學(xué)生在學(xué)習(xí)“統(tǒng)計學(xué)”課程前后對統(tǒng)計學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變,可以隨機(jī)收集一批學(xué)生在學(xué)習(xí)“統(tǒng)計學(xué)”之前以及學(xué)完以后認(rèn)為統(tǒng)計學(xué)是否重要的樣本數(shù)據(jù)(0表示“不重要”,1表示“重要”)。
應(yīng)該看到:兩配對樣本的McNemar檢驗分析的變量是二值變量。因此,在實際應(yīng)用中,如果變量不是二值變量,應(yīng)首先進(jìn)行數(shù)據(jù)轉(zhuǎn)換后方可采用該方法,因而它在應(yīng)用范圍方面有一定的局限性。
2、符號檢驗
符號檢驗也是用來檢驗兩配對樣本所來自的總體的分布是否存在顯著差異的非參數(shù)方法。其原假設(shè)是:兩配對樣本來自的兩總體的分布無顯著差異。
首先,分別用第二組樣本的各個觀察值減去第一組對應(yīng)樣本的觀察值。差值為正則記為正號,差值為負(fù)則記為負(fù)號。然后,將正號的個數(shù)與負(fù)號的個數(shù)進(jìn)行比較,容易理解:如果正號個數(shù)和負(fù)號個數(shù)大致相當(dāng),則可以認(rèn)為第二組樣本大于第一組樣本變量值的個數(shù),與第二組樣本小于第一組樣本的變量值個數(shù)是大致相當(dāng)?shù)模瑥目傮w上講,這兩個組配對樣本的數(shù)據(jù)分布差距較??;相反,如果正號個數(shù)和負(fù)號個數(shù)相差較多,則可以認(rèn)為兩個配對樣本的數(shù)據(jù)分布差距較大。
應(yīng)該看到:配對樣本的符號檢驗注重對變化方向的分析,只考慮數(shù)據(jù)變化的性質(zhì),即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數(shù)據(jù)利用是不充分的?! ?/p>
3、 Wilcoxon符號秩檢驗
Wilcoxon符號秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分布是否存在差異進(jìn)行判斷。其原假設(shè)是:兩配對樣本來自的兩總體的分布無顯著差異。
基本思想是:首先,按照符號檢驗的方法,分布用第二組樣本的各個觀察值減去第一組對應(yīng)樣本的觀察值。差值為正則記為正號,為負(fù)則記為負(fù)號,并同時保存差值數(shù)據(jù);然后,將差值變量按升序排序,并求出差值變量的秩;最后,分布計算正號秩總和W+和負(fù)號秩和W-。
五、多配對樣本的非參數(shù)檢驗
多配對樣本的非參數(shù)檢驗是通過分析多組配對樣本數(shù)據(jù),推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。
例如,收集乘客對多家航空公司是否滿意的數(shù)據(jù),分析航空公司的服務(wù)水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數(shù)據(jù),分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數(shù)據(jù),分析評委的打分標(biāo)準(zhǔn)是否一致,等等。
這些問題都可以通過多配對樣本非參數(shù)檢驗方法進(jìn)行分析。SPSS中的多配對樣本的非參數(shù)檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協(xié)同系數(shù)檢驗等?! ?/p>
1、 Friedman檢驗
Friedman檢驗是利用秩實現(xiàn)對多個總體分布是否存在顯著差異的非參數(shù)檢驗方法,其原假設(shè)是:多個配對樣本來自的多個總體分布無顯著差異。
SPSS將自動計算Friedman統(tǒng)計量和對應(yīng)的概率P值。如果概率P值小于給定的顯著性水平0.05,則拒絕原假設(shè),認(rèn)為各組樣本的秩存在顯著差異,多個配對樣本來自的多個總體的分布有顯著差異;反之,則不能拒絕原假設(shè),可以認(rèn)為各組樣本的秩不存在顯著性差異。
基于上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位將數(shù)據(jù)按升序排序,并求得各變量值在各自行中的秩;然后,分別計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗適于對定距型數(shù)據(jù)的分析?! ?/p>
2、 Cochran Q檢驗
通過對多個配對樣本的分析,推斷樣本來自的多個總體的分布是否存在顯著差異。其原假設(shè)是:多個配對樣本來自的多個總體的分布無顯著差異。
Cochran Q檢驗適合對二值品質(zhì)型數(shù)據(jù)的分析。如二分的評價:1代表滿意,0代表不滿意?! ?/p>
3、Kendall協(xié)同系數(shù)檢驗
它也是一種對多配對樣本進(jìn)行檢驗的非參數(shù)檢驗方法,與第一種檢驗方法向結(jié)合,可方便地實現(xiàn)對評判者的評判標(biāo)準(zhǔn)是否一致的分析。其原假設(shè)是:評判者的評判標(biāo)準(zhǔn)不一致。
有6名歌手參加比賽,4名評委進(jìn)行評判打分,現(xiàn)在需要根據(jù)數(shù)據(jù)推斷這4個評委的評判標(biāo)準(zhǔn)是否一致。(見下頁具體分析)
如果將每個被評判者對象的分?jǐn)?shù)看做來自多個總體的配對樣本,那么該問題就能夠轉(zhuǎn)化為多配對樣本的非參數(shù)檢驗問題,仍可采用Friedman檢驗,于是相應(yīng)的原假設(shè)便轉(zhuǎn)化為:多個配對樣本來自的多個總體的分布無顯著差異。但對該問題的分析是需要繼續(xù)延伸的,并非站在對6名歌手的演唱水平是否存在顯著差異的角度進(jìn)行分析,而是在認(rèn)定他們存在差異的前提下繼續(xù)判斷4個評委的打分標(biāo)準(zhǔn)是否一致。
如果利用Friedman檢驗出各總體的分布不存在顯著差異,即各個歌手的秩不存在顯著差異,則意味著評委的打分存在隨意性,評分標(biāo)準(zhǔn)不一致。原因在于:如果各個評委的評判標(biāo)準(zhǔn)是一致的,那么對于某個歌手來說將獲得一致的分?jǐn)?shù),也就是說,評委給出的若干個評分的秩應(yīng)完全相同,這就必然會導(dǎo)致各歌手評分的秩有較大的差異
關(guān)于“非參數(shù)檢驗”的留言: | ![]() |
目前暫無留言 | |
添加留言 |