第二節(jié) 計數資料的顯著性檢驗
作者:徐榮祥 出版社:中國科學技術出版社 發(fā)行日期:2009年7月
對于計數資料這些相對數我們只知它們的高低,不知其有無統(tǒng)計學意義,只有通過相對數的顯著性檢驗方能明確。常用方法為U檢驗與χ2檢驗。
一、率的u檢驗
率的u檢驗是應用范圍較為廣的一種顯著性檢驗方法,但是在用于樣本率與總體率比較時,或兩個樣本率比較時,應當考慮其差異是否由于抽樣誤差所造成的。大樣本的樣本率分布近似正態(tài)分布,可用正態(tài)分布的規(guī)律檢驗樣本率與總體率或兩個樣本率差異的顯著性。其判斷標準為:
(一)樣本率與總體率的比較
樣本率與總體率比較的目的是推斷該樣本所代表的總體率與已知總體率是否相同。公式為:
p為樣本率,π為總體率,σP為率的標準誤,由總體計算得出
示例343根據臨床經驗,胃十二指腸潰瘍患者中,一般情況下有20%的病人會發(fā)生胃出血癥狀,現某醫(yī)院觀察燒傷病人152例,其中48例傷前有過胃出血病史,問傷前患有胃十二指腸潰瘍的燒傷病人是否容易發(fā)生胃出血?
【解題步驟】
可將該例中胃十二指腸潰瘍患者有20%發(fā)生胃出血率視為總體率π(是把人們公認或經驗數值作為總體率)。
1建立檢驗假設:假設患有胃十二指腸潰瘍病的燒傷病人胃出血率(p)與一般胃十二指腸潰瘍患者的出血率(π)無差別,即樣本率(P)是由總體率(π)中隨機抽取的,兩者無差別。事實上,實驗研究結果總是有兩種情況:一種是接受所建立的檢驗假設,一種是拒絕建立的檢驗假設。
①設前者為H0:π=π0;②設后者為H1:π≠π0。
2確立顯著性水準:α=005
3計算u值:將示例343中數據代入公式(346):
4確定P值:因為u=358,而358>258,故P<001。
5推斷結論:在α=005水準上,拒絕H0,接受H1,因P<001,所以有非常顯著性差異,傷前患有胃十二指腸潰瘍的燒傷病人,其胃出血率與一般胃十二指腸潰瘍患者的出血率有本質差異,可認為患胃十二指腸潰瘍的燒傷病人較一般胃潰瘍患者容易發(fā)生胃出血。
(二)兩個樣本率比較的U檢驗
兩個樣本率比較的目的是推斷兩個樣本各自代表的兩個總體率是否相同。常用U檢驗和χ2檢驗:
U檢驗計算公式:
示例344如某醫(yī)院對1 329例燒傷病人進行應激性潰瘍出血的預防性治療,有56例發(fā)生了胃出血,發(fā)病率為421%,1 670例傷情相似的病人未進行預防性治療,其出血率達832%,問兩組樣本應激性潰瘍出血的發(fā)病率有無差異?
【解題步驟】
1建立檢驗假設:H0:π1=π2,H1:π1≠π2。
2確定顯著性水平:α=005。
3計算u值:n1=1329,X1=56,P1=00421(56/1329),n2=1670,X2=139,P2=00823(139/1670)。
代入公式(349)、(3410)、(347):
4確定P值:因425>258,故P<001。
5推斷結論:在α=005的水準上,拒絕H0,接受H1。因P<001,差異有高度顯著性,故認為預防性治療組與對照組的應激性潰瘍出血率有本質不同,預防組應激性潰瘍出血發(fā)生率低于對照組,預防治療有效。
二、χ2檢驗
χ2檢驗是英國統(tǒng)計學家Kpearson提出的,后經Yates校正改進,現已成為專用于兩組百分率的常用顯著性檢驗公式。“χ”為希臘字母,讀音為“Kai”,故χ2檢驗法又稱“卡方法”。應用范圍與U檢驗不完全相同,前者主要針對樣本率與總體率進行比較,也可用于兩個樣本率的比較;而χ2檢驗主要用于推斷兩個及兩個以上總體率(或構成比)之間的檢驗,檢查兩個分類變量之間有無關系(或關聯(lián))。
(一)χ2檢驗基本公式與計算方法
χ2檢驗的基本公式:
A為實際觀察數,T為理論計算值, ∑(希臘字母,讀音Sigma)表示總和。舉例解釋其方法及原理。
示例345某醫(yī)院對過去治療的燒傷并發(fā)敗血癥的病例進行回顧性總結,205例大面積燒傷病人并發(fā)敗血癥的例數為43,而134例中等燒傷面積病人并發(fā)敗血癥的例數為13,問敗血癥的發(fā)生與燒傷面積有無關系?
【解題步驟】
1將調查資料列入表(表342)中:
2建立“檢驗假設”(無效假設),即假如大面積與中等面積燒傷組的敗血癥發(fā)生率之間沒有本質差別,說明敗血癥的發(fā)生率(21%和97%)來自同一總體,這種差別是由抽樣誤差造成的。根據這個假設,可以用兩個組的合計發(fā)病率(165%)為假設的理論總體,并以此作為計算值的理論基礎。
3計算各組的理論數T值:理論數值是根據檢驗假設推論的兩組病人數中應有的發(fā)生敗血癥人數,即兩組都按165%患病率計算,應當有多少人患病與不患病。大面積燒傷組205人,乘以合計患病率165%,便是大面積燒傷組理論上應當發(fā)生敗血癥的人數(205×165%=3383),即為理論值;而未發(fā)生敗血癥的人數為(205-3383=17117)17117。同理,再求出中等燒傷面積組病人的理論值為2211,不發(fā)生敗血癥的理論值為(134-2211=11189)11189。
將計算的理論值匯入表343中。
4代入χ2值公式(3411)計算χ2值:
χ2值無單位,與它相應的概率為5%的χ2值(χ2 005)和概率為1%的χ2值(χ2001),可由卡方簡明界值表344中查出。
如果上述檢驗正確,A-T差值不會太小,如A-T相差太大,檢驗假設成立的可能性就不大。
5根據χ2值與自由度查χ2值表:首先確定自由度(df或n′或r,),因四格表中有四個理論值,只要先用乘除法求出任何一個,其余三個可用減法求出。這種必須先用乘除法求出理論值的格子數叫自由度。計算方法:
n′=(行數-1)(列數-1),四格表中為兩行、兩列,故:
n′=(2-1)(2-1)=1。
查簡明χ2值表(表344,或查有關書籍卡方界值表):當n′=1時,χ2005=663,本例χ2=747,大于663,已超過χ2005=663水平,但小于χ20005=788水平,故P<001。
(二)四格表資料的χ2檢驗(兩個樣本率的比較)
四格表資料的χ2檢驗法是應用最為廣泛和最為方便的一種方法,它所檢驗的僅是兩個率的比較。基本模式圖、公式和結果判斷標準如下:
4計算步驟:
(1)先將題目中的數據按四格表模式圖形式制表排列(用實際數字,不用百分率)。
(2)代入公式(3412),計算χ2值,χ2值是統(tǒng)計值,數值越大統(tǒng)計意義越大。
(3)根據χ2值的大小,按P值判斷標準確定P值大小。
(4)做出統(tǒng)計結論。
示例346用甲法治療大面積燒傷(甲組)71例,有52例并發(fā)全身性感染,用乙法治療的大面積燒傷(乙組)42例,有3例并發(fā)全身性感染。問兩組感染發(fā)生率有無統(tǒng)計學差異?
【解題步驟】
1按四格表模式重新制表(表347):
2計算χ2值(公式342):
3計算自由度:因為自由度(n′)=1{(行-1)(列-1)=(2-1)(2-1)},故本研究自由度為1(1×1)。
4按表344標準確定P值:因χ2值在384和663之間,故P<005,組間有顯著性差異。
5結果判斷:因P<005,說明乙法治療的大面積燒傷病人并發(fā)全身性感染的機會低于甲組。
(三)行×列表資料的χ2檢驗
以上講的是兩個樣本率的檢驗,用四格表法,但當行數或列數大于2時,應當用行×列表資料的χ2檢驗,又稱R×C表資料?;竟剑?br />
A為各格子的實際頻數,nR、nC為各實際頻數所對應的行的合計數和列的合計數,N為總合計數。
該公式是由基本公式轉換而來,不需要求理論頻數,方便實用。
示例337甲乙丙三所醫(yī)院同期對某藥進行抗感染療效觀察,甲院觀察了29例,有效(23例)率為793%,乙院觀察了44例,有效(14例)率為318%,丙醫(yī)院觀察了11例,有效(3例)率為273%(資料見表348)。問3所醫(yī)院抗感染治療的總體有效率是否有顯著意義?
【解題步驟】
1建立檢驗假設:H0:3所醫(yī)院的有效率相等,π1=π2;H1:3所醫(yī)院的有效率不相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3根據χ2基本計算公式(3413)計算χ2值:
4確定自由度(n′)=(2-1)(3-1)= 2。
5查χ2值表確定P值:查表344可知,χ2005(2)=1060,今χ2=17907,>χ20005(2),故P<0005。
6推斷結論:在α=005水準上,拒絕H0,接收H1,故該藥在三所醫(yī)院的抗感染效果存在統(tǒng)計學差異(P<0005)。
(四) 二列多格資料χ2值檢驗
二列多格資料χ2值檢驗也稱多個樣本率的比較,其目的是推斷它們所代表的總體率是否相等。該類資料的基本數據有R行(樣本個數),2列(指樣本的陽性數與陰性數),所以又叫R×2列聯(lián)表或列聯(lián)表(contingency table)。
公式同基本公式(3413),計算出的資料可以進行相關分析。
示例348(百分比相互比較):某醫(yī)院觀察嚴重燒傷病人早期延遲治療對休克發(fā)生率有無影響,觀察時間分別為傷后大于18小時(甲組)、傷后6~18小時(乙組)和6小時以內(丙組)3個接受治療小組,結果匯于表349中。問延遲治療對燒傷休克的發(fā)生率有無統(tǒng)計學差異,或相互之間有無關聯(lián)?
【解題步驟】
1建立檢驗假設:設H0:三種不同治療時間休克發(fā)生率相等;設H0:π1=π2;三種不同治療時間休克發(fā)生率不完全相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3計算χ2值:將表349中的數字代入公式3413,得:
4計算自由度:(n′)=(2-1)(3-1)= 2。
5確定P值:因n′=2,查χ2值表(344),χ20005(2)=1060,本研究χ2=24776>χ20005(2)(1060)水平,P<0005。
6推斷結果:在α=005水準上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認為嚴重燒傷病人早期接受治療對休克發(fā)生率有明顯影響作用,即可降低休克發(fā)生率。
7為了進一步說明它們之間的密切關聯(lián)程度,可根據公式計算關聯(lián)系數:
根據四格表的pearson列聯(lián)系數值r在0~1之間。r值愈接近0,說明兩個分類變量的關系愈弱,r值愈接近1,說明關系愈密切。因為r=0462,說明延遲治療時間與休克發(fā)生率具有一定的關聯(lián)性。
示例349(樣本結構比相互比較):某院2004年收治小兒燒傷145例,致傷因素:熱液150例,火焰10例,電流7例,其他23例;成人燒傷188人,致傷因素:熱液50例,火焰48例,電流18例,其他72例(資料見表3410),問小兒燒傷原因與成人燒傷原因相互之間是否有關聯(lián)性?
【解題步驟】
1建立檢驗假設和確定顯著性水平:①設H0:兩組病人傷因構成相等,H0:π1=π2;②設H1:兩組病人傷因構成不完全相等,H1:π1≠π2。
2顯著水平:α=005。
3計算χ2值:可將表3410中的數字代入公式(3413),得:
4計算自由度:(n′)=(2-1)(4-1)= 3。
5確定P值:n′=3,查χ2值表(344),χ20005(3)=1284,今χ2=7014,故P<0005。
6推斷結果:在α=005水準上,拒絕H0,接受H1,因P<0005,差異有非常顯著意義,故認為小兒燒傷病人的致傷因素構成比與成人不同,說明小兒以熱液燙傷多見,其他傷因構成比低于成人組。
7為了進一步說明它們之間的密切關聯(lián)程度,可根據公式3414計算關聯(lián)系數:
因為r=0417,說明兒童燒傷傷因與成年人燒傷傷因之間具有一定的關聯(lián)性。由于兒童熱液燙傷發(fā)生率為724%,成人熱液燙傷發(fā)生率為266%,兩者是否存在顯著性差異,需要進行兩兩比較方可明確。
(五) 多列多格資料χ2值檢驗
臨床經常遇到3組或3組以上的多格資料,其計算方法仍以公式(3413)為基礎 ?,F舉例說明:
示例3410(計數資料相關分析):某燒傷中心觀察了176例吸入性損傷病人的不同傷情與呼吸困難的各自例數,問呼吸困難程度與吸入損傷傷情之間有無關聯(lián)性(數據資料匯于表3411中)?
【解題步驟】
本例的設計和分析目的與上述例子不同。它并非是兩個樣本率與總體率、多個樣本率與總體率或構成比之間的比較,而是單一樣本自身的比較,每個對象分別按兩種標志分級(傷情與呼吸困難),屬于雙相率的計算,目的是推測兩種標志之間有無相關性。
1建立檢驗假設:①設H0:呼吸困難程度與吸入性損傷程度無關;②設H1:呼吸困難程度與吸入性損傷程度有關。
2確定顯著水準:α=005。
3計算χ2值:將表3411中的數字代入公式3413,得:
4計算自由度:(n′)=(3-1)(3-1)= 4。
5確定P值:n′=4,查χ2界值表(324),χ20005(4)=1486,本研究χ2=179623,>χ20005(4)(1486)水準,P<0005。
6推斷結果:在α=005水準上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認為呼吸困難程度與吸入性損傷程度關聯(lián)密切。
7為了進一步說明它們之間的密切關聯(lián)程度,可根據公式(3414)計算關聯(lián)系數:
因為r=07316,說明呼吸困難程度與吸入損程度具有明顯的關聯(lián)性,即吸入損傷越重,呼吸困難越嚴重。
(六) 配對計數資料的χ2檢驗
計數資料的配對設計常用于兩種檢驗方法,如培養(yǎng)方法、診斷方法的比較。其特點是對樣本中的各觀察單位分別用兩種方法處理,然后觀察兩種方法的結果。此類資料可用配對χ2檢驗,比較兩個率之間是否有差異。從配對設計來說,配對計數資料與前邊所介紹的配對計數資料是相同的,都是把兩種處理因素分別施加于條件相似的受試對象上,或先后施于同一對象上。配對記錄試驗結果如為計量資料,即屬計量配對資料;若結果為計數資料,即屬于計數配對資料。配對計數資料的χ2檢驗包括兩個內容:①分析它們的相關關系;②分析處理結果有無差異。
示例3411:100個深Ⅱ度燒傷創(chuàng)面,每個創(chuàng)面分別用兩種方法(甲法與乙法)診斷。結果:甲法陽性者為67個,乙法陽性者50個;其中甲乙兩法均陽性者(a)39個,甲乙兩法均陰性者(d)22個,甲法陽性乙法陰性者(d)28個,乙法陽性甲法陰性者(c)11個(資料見表3412)。問甲乙兩種方法的診斷結果有無關聯(lián)及統(tǒng)計學差異?
【解題步驟】
第一步:分析兩種診斷結果有無相關關系,每個對象按兩種處理結構分組,故可用四格χ2檢驗公式計算,推斷兩種診斷方法之間有無相關關系:
1建立檢驗假設:①設H0:甲乙診斷方法之間無關;②設H1:甲乙診斷方法之間有關。
2確定顯著水準:α=005。
3計算χ2值:將表3412中的數字代入公式3412,得:
4計算自由度:(n′)=(2-1)(2-1)=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究6推斷結果:在α=005水準上,拒絕H0,接受H1,因P<005,差異有顯著性,故認為兩種診斷程度關聯(lián)密切。
第二步:計算兩種處理結果有無差別:計算公式為(3415):
1建立檢驗假設:①設H0:兩總體b=c;②H1:兩總體b≠c。
2確定顯著水準:α=005
3計算χ2值:將表3412中的數字代入公式3415,得:
4自由度:n′=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究χ2=6564,介于χ20005和χ2001水準之間,故P<005。
6推斷結果:在α=005水準上,拒絕H0,接受H1,因P<005,差異有顯著性,故認為甲乙兩種診斷方法的確診率不同,甲法的確診率高于乙法。
7關聯(lián)性分析:根據公式3414計算關聯(lián)系數:
因為r=0629,說明甲乙兩種方法的診斷結果關聯(lián)性較強,甲法優(yōu)于乙法。
(七)兩個小樣本的χ2檢驗方法
因為χ2檢驗是以一條光滑曲線為基礎,大樣本所得的概率與其真正概率很接近。當為小樣本時,如n<40(有人認為n<50)時,用前邊講的大樣本比較的u檢驗或χ2檢驗公式計算結果都不準確,或偏倚較大,需要采用小樣本校正公式計算。兩個小樣本的檢驗方法有兩種:一種是樣本(n)偏??;一種是四格表中有理論頻數中出現0或1時?,F舉例說明:
1小樣本校正公式(3416):
示例3312:用甲乙兩種藥物治療糖尿病壞疽創(chuàng)面各30個,甲藥組瘢痕發(fā)生率為70%,乙藥組癜痕發(fā)生率為50%。問兩組之間的療效有無統(tǒng)計學差異?
【解題步驟】
(1)根據題中數據列表3413:
(2)將表3413中數字代入公式(3416),得:
(3)結果判斷:因n′=1,χ2值=7050<χ2001(6635),故P<001。組間有非常顯著差異。
(4)結論:甲藥治療的創(chuàng)面瘢痕發(fā)生率低于乙藥治療組。
小樣本率的χ2公式計算結果優(yōu)于大樣本率的χ2公式,尤其在其他檢驗公式所得概率接近檢驗水準時,宜用小樣本率的χ2公式。目前許多統(tǒng)計學者認為:①小樣本率的χ2公式誤差最小,最為常用;②過去有一種誤解,只有當例數小于30時,或理論頻數小于5時,χ2原公式計算值中有誤差,否則不必進行校正。實踐證明,只要是判斷P=005或P=001的顯著檢驗,用校正公式肯定優(yōu)于基本公式,即使例數大于30,或理論頻數大于5,采用校正公式也比χ2原計算方法誤差小。
2 兩組數據中有1或0的小樣本資料計算:前邊已敘述了小樣本率的χ2計算公式與方法,但在實際工作中,小樣本資料經常出現理論頻數小于1的情況,即T<1。這種資料不宜用小樣本計算公式計算,更不能用四格表公式計算,但宜用四格表確切概率法計算。確切概率法是由RAFisher提出的,故又稱Fisher確切概率檢驗。此法本不屬于χ2檢驗范疇,但可作為四格表資料假設檢驗的補充。介紹如下:
確切概率法各種組合概率的計算公式(3417)為:
式中a、b、c、d的意義同表345,!為階乘符號,N!=1×2×3×4×…×N,數學上規(guī)定!=1。一般計算器不能計算N≥70的階乘,這種情況下用對數計算。
四格表中|A-T|值的特點:①各格相等,如表3414的A-T,a、d兩格均為-14,b、c兩格均為+14,其絕對值相等。因而計算某一四格表的|A-T|值時,只需計算表中任一格的|A-T|值即可;②依次增減四格表中任何一格的數據,可列出周邊合計不變條件下各種組合的四格表,如示例3413中的五個四格表,分別計算其|A-T|值,列于表下。由此可見,兩側的|A-T|值較大,而中間的較小。
各種組合下累計概率的計算:①雙側檢驗:按公式3417分別計算兩側所有|A-T|值的各四格表的P值,然后相加,即為雙側檢驗的P值;②單側檢驗:按研究目的,只計算一側的所有|A-T|值等于及大于樣本|A-T|值得四格表的P值,然后相加,即為單側檢驗的P值。
示例3313:某醫(yī)生用新舊兩種方法治療燒傷后貧血病人共計27例,結果匯于表3414中,問新舊藥物的療效有無差異?
【解題步驟】
(1)建立檢驗假設:H0:新藥與舊藥治愈率相等,即π1=π2;H1:新藥與舊藥治愈率不相等,即π1≠π2。
(2)確定顯著水準:α=005。
(3)計算概率P:本組N=25<40,且又T<5,故宜用確切概率法。由表3414可見,最小周邊合計數為4,故所有可能的組合有5種,分別為:
(4)確定P值,做出推斷結論:P值應等于所有小于樣本點的各種概率之和,本例符合樣本點要求者為(1)、(2)、(5),因此,P值的組合為上述三點之和,即P=00166+01423+01079=02668。按α=005水準,P>005。不能認為兩種療法的治愈率有統(tǒng)計學差異。
3查四格表顯著性檢驗用表(C值表)法:此方法簡便易行,本文不再敘述,可參照有關資料查詢。