預(yù)防醫(yī)學(xué)/離散趨勢指標(biāo)

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

醫(yī)學(xué)電子書 >> 《預(yù)防醫(yī)學(xué)》 >> 計量數(shù)據(jù)分析(一) >> 離散趨勢指標(biāo)
預(yù)防醫(yī)學(xué)

預(yù)防醫(yī)學(xué)目錄

計量資料的頻數(shù)分布有集中趨勢和離散趨勢兩個主要特征,只有把兩者結(jié)合起來,才能全面地認(rèn)識事物,通過例18.8可進一步說明這一問題。

例18.8 有3組同齡男孩體重(kg)如下,其平均體重x都是30(kg),試分析其離散趨勢。

甲組 26 28 30 32 34
乙組 24 27 30 33 36
丙組 26 29 30 31 34

雖然三組資料的均數(shù)相等,即集中趨勢相同,但各組內(nèi)數(shù)據(jù)參差不齊的程度(變異度)不同,也就是說三組的離散趨勢不同。

描述一組同質(zhì)計量資料離散趨勢的常用指標(biāo)有全、四分位數(shù)間距方差標(biāo)準(zhǔn)差,其中方差和標(biāo)準(zhǔn)差最常用。

目錄

一、全距(range)

亦稱極差,用R表示。全距是一組觀察值中最大值與最小值之差,用于反映個體變異范圍的大小。全距大,說明變異度大;反之,說明變異度小。如例18.8中乙組全距為12(kg),比甲、丙兩組8(kg)大,表明乙組變異度大。全距適用于任何分布的計量資料(末端無確切數(shù)值者除外)。

用全距來表達(dá)變異度的大小,簡單明了,故曾廣為使用。但它不能反映組內(nèi)所有數(shù)據(jù)的變異度,如上述甲、丙兩組變異度的差異就反映不出來;其更大的缺點是易受個別特大或特小數(shù)值的影響,往往樣本越大,全距亦會越大。

二、四分位數(shù)間距(quartile interval)

四分位數(shù)間距是上四分位數(shù)Qu(即P75)與下四位數(shù)QL(即P25)之差,其間包括了全部觀察值的一半,用Q表示。它和極差類似,數(shù)值越大,說明變異越大;反之,說明變異越小。四分位數(shù)間距比極差穩(wěn)定,但仍未考慮到每個觀察值的變異度。它適用于偏態(tài)分布資料,特別是分布末端無確定數(shù)據(jù)不能計算全距、方差和標(biāo)準(zhǔn)差的資料。

例18.9 求表18-4中數(shù)據(jù)的四分位數(shù)間距。

QL=P25=12+12/58(164×25%-25)=15.3(小時)

Qu=P75=24+12/40(164×75%-83)=36.0(小時)

Q=Qu-QL=P75-P25=20.7(小時)

三、方差(variance)和標(biāo)準(zhǔn)差(standard deviation)

為了克服極差的缺點,需全面地考慮組內(nèi)每個觀察值的離散情況。因為組內(nèi)每一觀察值(亦稱變量值)與總體均數(shù)的距離大小都會影響總體的變異度,故有人提出以各變量值離均差(X-μ)的平方和除以變量值的總個數(shù)N,來反映變異度大小,稱為總體方差,用σ2示之。

Gum5ne97.jpg 公式(18.10)

由式可見,各個離均差平方后,原來的度量單位變成了平方單位。為了用原單位表示而將總體方差開方,稱為總體標(biāo)準(zhǔn)差。

Gum5mug4.jpg 公式(18.11)

以上是總體方差和標(biāo)準(zhǔn)差。實際工作中經(jīng)常得到的是樣本資料,μ是未知的,只能用樣本均數(shù)x來代替μ,用樣本含量n代替N,按公式(18.11)算得的標(biāo)準(zhǔn)差常比σ小,美國統(tǒng)計學(xué)家W.S.Gosset提出用n-1代替n,求得樣本標(biāo)準(zhǔn)差s,即

Gum5n1mx.jpg 公式(18.12)

式中的n-1,在統(tǒng)計學(xué)上稱為自由度(degree of freedom)

數(shù)學(xué)上可以證明離均差平方和Σ(X-x)2=ΣX2-(ΣX)2/n,故公式(18.2)可演變?yōu)椋?/p>

直接法Gum5mwsz.jpg 公式(18.13)

加權(quán)法Gum5mz81.jpg 公式(18.14)

方差與標(biāo)準(zhǔn)差適用于對稱分布,特別是正態(tài)或近似正態(tài)分布資料。

例18.10 試分別計算例18.8中組男孩體重資料的標(biāo)準(zhǔn)差。

甲組:n=5,ΣX=26=28+30+32+34=150

ΣX2=262+282+302+322+342=4540

按式(18.13)

Gum5n69t.jpg


乙組:n=5,ΣX=150,ΣX2=4590

Gum5n3w2.jpg


丙組:n=5,ΣX=150,ΣX2=4534

Gum5n8p2.jpg


以上計算表明:S丙<S甲<S乙亦即乙組的變量度最大,甲組次之,丙組最小。

例18.11 求表18-2中110名20歲健康男大學(xué)生身高的標(biāo)準(zhǔn)差。

由表18-2,已知Σf=110,ΣfX=19000,再用第(2)欄乘第(4)欄后相加得ΣfX2。如本例,ΣfX2=163×163+165×660+……+183×366=3283646代入式(18.14)

Gum5nbpy.jpg


四、標(biāo)準(zhǔn)差的應(yīng)用

(一)表示觀察值的變異程度(或離散程度

1.在兩組(或幾組)資料均數(shù)相近、度量單位相同的條件下,標(biāo)準(zhǔn)差大,表示觀察值的變異度大,即各觀察值離均數(shù)較遠(yuǎn),均數(shù)的代表性較差;反之,表示各觀察值多集中在均數(shù)周圍,均數(shù)的代表性較好。

2.若比較度量單位不同或均數(shù)相差懸殊的兩組(或幾組)觀察值的變異度時,需計算變異系數(shù)(coefficient ofvariation用CV表示)進行比較,其計算公式為:

CV= s/x×100% 公式(18.15) 公式(18.15)

式中s為樣本標(biāo)準(zhǔn)差,x為樣本均數(shù)。

例18.12 某地調(diào)查20歲男大學(xué)生110名,其身高均數(shù)為172.73(cm),標(biāo)準(zhǔn)差為4.09(cm);其體重均數(shù)為55.04(kg),標(biāo)準(zhǔn)差為4.10(kg),欲比較兩者變異度何者為大,宜先計算變異系數(shù)再比較。

身高CV=4.09/172.73×100%=2.37%

體重CV=4.10/55.04×100%=7.45%

由此可見,該地20名男大學(xué)生體重的變異度大于身高的變異度,說明身高這個指標(biāo)比較穩(wěn)定。

(二)結(jié)合均數(shù)描述正態(tài)分布的特征和估計醫(yī)學(xué)正常值范圍,詳見第三節(jié)。

(三)結(jié)合樣本含量n計算標(biāo)準(zhǔn)誤,詳見第十九章。

32 集中趨勢指標(biāo) | 正態(tài)分布和醫(yī)學(xué)正常值范圍的估計 32
關(guān)于“預(yù)防醫(yī)學(xué)/離散趨勢指標(biāo)”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個人工具
名字空間
動作
導(dǎo)航
推薦工具
功能菜單
工具箱