預(yù)防醫(yī)學(xué)/正態(tài)分布和醫(yī)學(xué)正常值范圍的估計(jì)

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

醫(yī)學(xué)電子書(shū) >> 《預(yù)防醫(yī)學(xué)》 >> 計(jì)量數(shù)據(jù)分析(一) >> 正態(tài)分布和醫(yī)學(xué)正常值范圍的估計(jì)
預(yù)防醫(yī)學(xué)

預(yù)防醫(yī)學(xué)目錄

目錄

一、正態(tài)分布

(一)正態(tài)分布的圖形

將表18-1的110名20歲健康男大學(xué)生身高頻數(shù)分布繪成圖18-1中的(1),可見(jiàn)高峰位于中部,左右兩側(cè)大致對(duì)稱。可以設(shè)想,如果抽樣觀察例數(shù)逐漸增多,組段不斷分細(xì),就會(huì)逐漸形成一條高峰位于中央(均數(shù)所在處)、兩側(cè)完全對(duì)稱地降低、但永遠(yuǎn)不與橫軸相交的鐘型曲線(圖18-1中的(3)),這條曲線近似于數(shù)學(xué)上的正態(tài)分布(normal distribution)曲線。

統(tǒng)計(jì)學(xué)家按其變化參數(shù),推導(dǎo)出正態(tài)分布密度函數(shù)f(X)

Gum5nq9k.jpg


-∞<X<+∞公式(18.16)

式中μ為均數(shù);σ為標(biāo)準(zhǔn)差;π為圓周率;е為自然對(duì)數(shù)的底,即2.71828。以上均為常數(shù),僅X為變量。

為了應(yīng)用方便,常將式(18.16)進(jìn)行變量變換—u變換(即u=(X-μ)/σ),u變換后,μ=0,σ=1,使原來(lái)的正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(standard normaldistribution)亦稱u分布,如圖18-2。

頻數(shù)分布逐漸接近正態(tài)分布示意


圖18-1 頻數(shù)分布逐漸接近正態(tài)分布示意

正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的面積與縱高


圖18-2 正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的面積與縱高

此時(shí),式( 18.16)化成

Gum5nlju.jpg


- ∞<u<+∞ 公式(18.17)

式中,φ(u)為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù),即縱軸高度。

根據(jù)X和u的不同取值,分別按式(18.16)和式(18.17)可以繪出正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的圖形(圖18-2)。

(二)正態(tài)分布的特征

由式(18.16 )gn (18.17)可看出正態(tài)分布有下列特征:①正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。②正態(tài)分布以均數(shù)為中心,左右對(duì)稱。③正態(tài)分布兩個(gè)參數(shù)(parameter),即均數(shù)μ和標(biāo)準(zhǔn)差σ;常用N(μ,σ)表示均數(shù)為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布;所以標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。④正態(tài)曲線在±1σ處各有一人拐點(diǎn)。⑤正態(tài)曲線下的面積分布有一定的規(guī)律。

二、正態(tài)曲線下面積的分布規(guī)律

正態(tài)曲線下一定區(qū)間的面積可以通過(guò)對(duì)式(18.16)和式(18.17)積分求得。為了省去計(jì)算的麻煩,有人按式(18.17)編成了附表18-1“標(biāo)準(zhǔn)正態(tài)分布曲線下的面積”通過(guò)查表可求出正態(tài)曲線下某區(qū)間的面積,進(jìn)而估計(jì)該區(qū)間的觀察例數(shù)占總例數(shù)的百分?jǐn)?shù)或變量值落在該區(qū)間的概率。查表時(shí)應(yīng)注意:①表中曲線下面積為自-∞到u的面積;②當(dāng)μ,σ已知時(shí),先根據(jù)u變換(即u=(X-μ)/σ)求得u值,再查表;③當(dāng)μ,σ未知且樣本含量n足夠大時(shí),常用樣本均數(shù)x和樣本標(biāo)準(zhǔn)差s分別代替μ和σ進(jìn)行u變換[即u=(X-μ)/S],求得u的估計(jì)值,再查表;④曲線下對(duì)稱于0的區(qū)間面積相等,如區(qū)間(-∞,-1.96)與區(qū)間(1.96,+∞)的面積相等;⑤曲線下橫軸上的總面積為100%或1。

下面三個(gè)區(qū)間的面積應(yīng)用較多,要求記住,并結(jié)合圖18-3理解其意義。①標(biāo)準(zhǔn)正態(tài)分布時(shí)區(qū)間(-1,1)或正態(tài)分布時(shí)區(qū)間(μ-1σ,μ+1σ)的面積占總面積的68.27%;②標(biāo)準(zhǔn)正態(tài)分布時(shí)間(-1.96,1.96)或正態(tài)分布時(shí)區(qū)間(μ-1.96,μ+1.96)的面積占總面積的95.00%;③標(biāo)準(zhǔn)正態(tài)分布區(qū)間(-2.58,2.58)或正態(tài)分布時(shí)間區(qū)(μ-2.58,μ+2.58)的面積占總面積的99.00%。

正態(tài)與標(biāo)準(zhǔn)正態(tài)曲線及其面積分布


圖18-3 正態(tài)與標(biāo)準(zhǔn)正態(tài)曲線及其面積分布

三、醫(yī)學(xué)正常值范圍的估計(jì)

(一)正常值范圍(normal range)的意義

正常值是指正常人體或動(dòng)物體的各種生理常數(shù),正常人體液和排泄物中某種生理、生化指標(biāo)或某種元素的含量,以及人體對(duì)各種試驗(yàn)的正常反應(yīng)值等。由于存在變異,各種數(shù)據(jù)不僅因人而異,而且同一個(gè)人還會(huì)隨機(jī)體內(nèi)外環(huán)境的改變而改變,因而需要確定其波動(dòng)的范圍,即正常值范圍。

制定正常值范圍,①首先要確定一批樣本含量足夠在的“正常人”。所謂“正常人”不是指機(jī)體任何器官、組織的形態(tài)及機(jī)能都正常的人,而是指排除了影響所研究指標(biāo)的疾病的有關(guān)因素的同質(zhì)人群。②根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值:若某種指標(biāo)過(guò)高或過(guò)低均屬異常,需要確定正常值范圍的下限和上限,如白細(xì)胞計(jì)數(shù);若某指標(biāo)過(guò)高為異常,需確定上限,如尿鉛;若某指標(biāo)過(guò)低為異常,需確定下限,如肺活量。③根據(jù)研究目的的和實(shí)用要求選定適當(dāng)?shù)陌俜纸缰?,常?0%、90%、95%或99%,其中最常用的是95%。④根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)慕缰涤?jì)算方法,如正態(tài)分布資料用正態(tài)分布法;對(duì)數(shù)正態(tài)分布資料用對(duì)數(shù)正態(tài)分布法;偏態(tài)分布資料用百分位數(shù)法。

(二)正常值范圍估計(jì)

計(jì)算正常值百分界值的方法甚多,如正態(tài)分布法、對(duì)數(shù)正態(tài)分布法、正態(tài)概率紙法、百分位數(shù)法、曲線擬合法、容許區(qū)間法等。現(xiàn)以95%正常值范圍為例,主要介紹以下三種。

1.正態(tài)分布法:適用于正誠(chéng)或近似正態(tài)分布資料。

雙側(cè)界值:x±1.96s

單側(cè)上界:x+1.645s

單側(cè)下界:x-1.645s

2.對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料。

雙側(cè)界值:lg-1(xlgx±1.96slgx)

單側(cè)上界:lg-1(xlgx+1.645slgx)

單側(cè)下界:lg-1(xlgx-1.645slgx)

3.百分位數(shù)法:常用于偏態(tài)分布資料。

雙側(cè)界值:P2.5和P97.5

單側(cè)上界:P95

單側(cè)下界:P5

例18.13 試估計(jì)表18-1中110名20歲健康男大學(xué)生身高的95%正常值范圍。

該指標(biāo)計(jì)算雙側(cè)界值

x±1.96s=172.73±1.96×4.09

該指標(biāo)的95%正常值范圍為 164.71~180.75(cm)

例18.14 某年某市調(diào)查了200例正常成人血鉛含量(μg/100g)如下,試估計(jì)該市成人血鉛含量95%正常值范圍單側(cè)上界。

3 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6
6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8
8 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 10
10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 13
13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 15 15 15
15 15 15 15 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17
17 17 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 20
20 21 21 21 21 21 22 22 22 22 22 22 23 23 23 24 24 24 24 24
24 25 25 26 26 26 26 26 27 27 28 28 29 29 30 30 31 31 31 31
32 32 32 32 32 32 33 33 36 38 38 39 40 41 41 43 47 50 53 60

該資料為偏態(tài)分布,經(jīng)對(duì)數(shù)變換(即原始數(shù)據(jù)取對(duì)數(shù))后,整理成頻數(shù)表,見(jiàn)表18-5。從頻數(shù)分布看,近似正態(tài)分布,計(jì)算對(duì)數(shù)形式的均數(shù)與標(biāo)準(zhǔn)差,得:

xlgx=Σflgx/Σf=230.0/200=1.15

Gum5nnuh.jpg


其95%正常值范圍的單側(cè)上界為lg-1xlgx+1.645slgx)=lg-11。5942=39(μg/100g)

即該市正常成人血鉛含量的95%正常值為39μg/100g以下。

例18.15 試用百分位數(shù)法估計(jì)例18.14資料的95%正常值的單側(cè)上界。

該資料不經(jīng)對(duì)數(shù)轉(zhuǎn)換時(shí)為偏態(tài)分布,也可用百分位數(shù)法估計(jì)。先整理成頻數(shù)表,見(jiàn)表18-6。

P95=L+i/f95(n×95%-ΣfL)=38+5/7(200×95%-189)=38.7(μg/100g)

表18-5 200名血鉛值對(duì)數(shù)變換后的頻數(shù)表及gx slgx計(jì)算表

對(duì)數(shù)組段 頻數(shù)f 組中值(lgX) flgX FlgX2
0.45~ 1 0.5 0.5 0.25
0.55~ 5 0.6 3.0 1.80
0.65~ 10 0.7 7.0 4.90
0.75~ 20 0.8 16.0 12.80
0.85~ 11 0.9 9.9 8.91
0.95~ 21 1.0 21.0 21.00
1.05~ 29 1.1 31.9 35.09
1.15~ 25 1.2 30.0 36.00
1.25~ 30 1.3 39.0 50.07
1.35~ 20 1.4 28.0 39.20
1.45~ 16 1.5 24.0 36.00
1.55~ 8 1.6 12.8 20.48
1.65~ 3 1.7 5.1 8.67
1.75~1.84 1 1.8 1.8 3.24
合計(jì) 200 230.00 279.04

表18-6 200名血鉛值頻數(shù)表及P95計(jì)算表

組段 頻數(shù)f 累計(jì)頻數(shù)Σf 累計(jì)頻率(%)
3~ 36 36 18.0
8~ 39 75 37.5
13~ 47 122 61.0
18~ 30 152 76.0
23~ 18 170 85.0
28~ 16 186 93.0
33~ 3 189 94.5
38~ 7 196 98.0
43~ 1 197 98.5
48~ 1 198 99.0
53~ 1 199 99.5
58~62 1 200 100.0
32 離散趨勢(shì)指標(biāo) | 附表:標(biāo)準(zhǔn)正態(tài)分布曲線下的面積 32
關(guān)于“預(yù)防醫(yī)學(xué)/正態(tài)分布和醫(yī)學(xué)正常值范圍的估計(jì)”的留言: Feed-icon.png 訂閱討論RSS

目前暫無(wú)留言

添加留言

更多醫(yī)學(xué)百科條目

個(gè)人工具
名字空間
動(dòng)作
導(dǎo)航
推薦工具
功能菜單
工具箱