列聯(lián)表

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

列聯(lián)表是觀測數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表

列聯(lián)表分析

一般,若總體中的個(gè)體可按兩個(gè)屬性A與B分類,A有r個(gè)等級A1,A2,…,Ar,B有c個(gè)等級B1,B2,…,Bc,從總體中抽取大小為n的樣本,設(shè)其中有nij個(gè)個(gè)體的屬性屬于等級Ai和Bj,nij稱為 頻數(shù),將r×c個(gè)nij排列為一個(gè)r行c列的二維列聯(lián)表,簡稱r×c表。若所考慮的屬性多于兩個(gè),也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表?! ?/p>

分析

列聯(lián)表又稱交互分類表,所謂交互分類,是指同時(shí)一句兩個(gè)變量的值,將所研究的個(gè)案分類。交互分

列聯(lián)表分析圖

類的目的是將兩變量分組,然后比較各組的分布狀況,以徐找變量間的關(guān)系。

觀測數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表。例如,對隨機(jī)抽取的1000人按性別(男或女)及色覺(正?;?a href="/w/%E8%89%B2%E7%9B%B2" title="色盲">色盲)兩個(gè)屬性分類,得到二行二列的列聯(lián)表(表1),又稱2×2表或四格表。

一般,若總體中的個(gè)體可按兩個(gè)屬性AB分類,Ar個(gè)等級A1,A2,…,Ar;B有с個(gè)等級B1,B2,…,Bc,從總體中抽取大小為n的樣本設(shè)其中有nij個(gè)屬于等級Ai和Bj,nij稱為頻數(shù),將r×с個(gè)nij(i=1,2,…,r;j=1,2,…,с)排列為一個(gè)r行с列的二維列聯(lián)表(表2),簡稱r×с表。若所考慮的屬性多于兩個(gè),也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。由于屬性或定性變量的取值是離散的,因此多維列聯(lián)表分析屬于離散多元分析的范疇,列聯(lián)表分析在應(yīng)用統(tǒng)計(jì),特別在醫(yī)學(xué)、生物學(xué)社會科學(xué)中,有重要的應(yīng)用。

列聯(lián)表

列聯(lián)表分析的基本問題是,判明所考察的各屬性之間有無關(guān)聯(lián),即是否獨(dú)立。如在前例中,問題是:一個(gè)人是否色盲與其性別是否有關(guān)?在 r×с表中,若以pi.、p.jpij分別表示總體中的個(gè)體屬于等級Ai,屬于等級Bj和同時(shí)屬于Ai、Bj的概率(pi., p.j稱邊緣概率,pij稱格概率),“A、B兩屬性無關(guān)聯(lián)”的假設(shè)可以表述為H0:pij=pi.p.j,(i=1,2,…,r;j=1,2,…,с),未知參數(shù) pij、pi.、p.j的最大似然估計(jì)(見點(diǎn)估計(jì))分別為分別為行和及列和(統(tǒng)稱邊緣和);

樣本大小。根據(jù)K.皮爾森(1904)的擬合優(yōu)度檢驗(yàn)似然比檢驗(yàn)(見假設(shè)檢驗(yàn)),當(dāng)h0成立,且一切 pi.>0和p.j>0時(shí),統(tǒng)計(jì)量

的漸近分布是自由度為 (r-1)(с-1) 的ⅹ分布,式中Eij=ni.n.j/n 稱為期望頻數(shù)。當(dāng)n足夠大,且表中各格的Eij都不太小時(shí),可以據(jù)此對h0作檢驗(yàn):若ⅹ值足夠大,就拒絕假設(shè)h0,即認(rèn)為AB有關(guān)聯(lián)。在前面的色覺問題中,曾按此檢驗(yàn),判定出性別與色覺之間存在某種關(guān)聯(lián)。

若樣本大小n不很大,則上述基于漸近分布的方法就不適用。對此,在四格表情形,R.A.費(fèi)希爾(1935)提出了一種適用于所有 n的精確檢驗(yàn)法。其思想是在固定各邊緣和的條件下,根據(jù)超幾何分布(見概率分布),可以計(jì)算觀測頻數(shù)出現(xiàn)任意一種特定排列的條件概率。把實(shí)際出現(xiàn)的觀測頻數(shù)排列,以及比它呈現(xiàn)更多關(guān)聯(lián)跡象的所有可能排列的條件概率都算出來并相加,若所得結(jié)果小于給定的顯著性水平,則判定所

列聯(lián)表

考慮的兩個(gè)屬性存在關(guān)聯(lián),從而拒絕h0。

在判定變量之間存在關(guān)聯(lián)性后,可用多種定量指標(biāo)來刻畫其關(guān)聯(lián)程度。例如,對一般的r×с表,可用列聯(lián)系數(shù)表示之。

對一般的r×с表,特別是在多維表分析中,若無關(guān)聯(lián)性(即獨(dú)立性)的假設(shè)被拒絕,則通常還需要檢驗(yàn)進(jìn)一步的假設(shè)。例如對三維表,可能需要考慮一個(gè)變量是否與另外兩個(gè)變量獨(dú)立。對這類局部獨(dú)立性的檢驗(yàn)仍可用大樣本的ⅹ檢驗(yàn)法。但是在多維情形,變量之間的關(guān)聯(lián)性可能相當(dāng)復(fù)雜。許多假設(shè),直接用格概率表示是不方便的。一種處理方法是仿照線性統(tǒng)計(jì)模型,將格概率(或期望頻數(shù))的對數(shù)表示成各變量的主效應(yīng)及各階交互效應(yīng)等未知參數(shù)的線性形式。這種模型稱為對數(shù)線性模型,在此模型下,變量獨(dú)立性的假設(shè)等價(jià)于交互效應(yīng)等于零的假設(shè)。此外,還可以利用對數(shù)線性模型,根據(jù)實(shí)際觀測頻數(shù),對各種具體模型進(jìn)行擬合,并對各未知參數(shù)進(jìn)行估計(jì)。估計(jì)的方法一般采用最大似然方法。由于這一類似然方程的解常無顯式表示,通常需用迭代法求解,計(jì)算工作量很大。因此,多維列聯(lián)表分析只在近代高速電子計(jì)算機(jī)的使用日益普及的情況下,才得到較為充分的發(fā)展,逐漸達(dá)到可以實(shí)際應(yīng)用的程度。

關(guān)于“列聯(lián)表”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個(gè)人工具
名字空間
動(dòng)作
導(dǎo)航
推薦工具
功能菜單
工具箱