医学统计学(6)-卡方检验



《医学统计学(6)-卡方检验》由会员分享,可在线阅读,更多相关《医学统计学(6)-卡方检验(143页珍藏版)》请在装配图网上搜索。
1、单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,医学统计学〔6〕,《,中华医学杂志,》,对来稿统计学处理的有关要求,卡方检验,(chi-square test),χ2检验是现代统计学的创始人之一,英国人Karl . Pearson于1900年提出的一种具有广泛用途的统计方法。,,,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。,卡方检验根本思想,用卡方值的大小来衡量实际频数和理论频数之间的吻合程度。,,在零假设H0 成立的条件下,实际频数与理论频数相差不应当很大,即x2值不应当很大。,,假设实际计算出的x2值较大,说
2、明实际频数和理论频数吻合程度小,相差大,则有理由疑心H0的真实性,从而拒绝H0,承受H1。,x,2,检验,单个样本构成比的,x,2,检验,——,拟合优度检验,,独立样本四格表的,x,2,检验,,行,×,列,的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,x,2,检验,,单个样本构成比的,x,2,检验,——,拟合优度检验,,独立样本四格表的,x,2,检验,,行,×,列,的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,在中医药科研中,常常遇到同一个样本中两个或多个构成比比较的问题,在满足卡方检验的要求条件下,可用卡方检验来
3、分析实际频数的比率是否符合理论比率。,【例1】为探究高血压患者中医证型构成,调查原发性高血压患者3578例,中医证型构成见表。问原发性高血压患者中医证型内部构成是否一样?,,,A,T,X,2,=392.514,,V=5-1=4,,P=1-CDF.CHISQ(392.514,,,4)=0.000,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,例数→加权个案〔频数变量〕,第,4,步:,x,2,检验,选择,分析,→,非参数检验,→,卡方,,中医证型,→检验变量列表,第,5,步:结果解读,结果解读:x2=392.514,p=0.000,
4、说明原发性高血压患者中医证型内部构成不一样。,留意事项,进展拟合优度 x2 检验,一般要求有足够的样本含量,理论频数不小于 5 。,,理论频数小于 5 时,需要合并计算。,x,2,检验,,单个样本构成比的,x,2,检验,,独立样本四格表的,x,2,检验,,行,×,列,的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,四格表的卡方检验,也是通过计算代表实际频数A与理论频数T之间的吻合程度的卡方值来进展检验的。,,理论频数T承受两组的合并状况来计算。,【例2】某医院把慢性支气管炎患者376名,随机分为2组,分别用中西医结合法和西医法治疗,结果见表。问两种疗法治疗
5、慢性支气管炎病人的治愈率是否有差异?,理论值,T,的计算,345/376〔总的治愈率〕*276=253.24,276-253.24=22.76,345/376〔总的治愈率〕*100=91.76,100-91.76=8.24,卡方值的计算,卡方值的影响因素:,,1,、格子数,,2,、实测值与理论值的差距,,专用公式的推导,T11=(a+c)/(a+b+c+d)*〔a+b〕,T12=(b+d)/(a+b+c+d)*〔a+b〕,T21=(a+c)/(a+b+c+d)*〔c+d〕,T22=(b+d)/(a+b+c+d)*〔c+d〕,专用公式的推导,,SPSS,软件操作,第,1,步:定义变量,第,2,步
6、:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别和疗效分别进入行和列,输出4种卡方检验结果:1、pearson卡方2、卡方值的校正值3、似然比卡方,一般用于对数线性模型。4、fisher的准确检验5、线性趋势检验,,输出,2,种相关系数:,1,、,pearson,相关系数,2,、,spearman,相关系数,,,列联系数:分析行与列之间的关联程度,Kappa:全都性检验,,,风险:计算相对危急度〔RR〕和比数比〔OR〕。,,McNemar,:优势性检验。,,,CMH,多维卡方检验,第
7、4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方,,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、百分比:行、列,,第5步:结果解读〔1〕,结果解读:,中西医组的治愈率为,98.2%,,西医组的治愈率为,74.0%,。,,,第5步:结果解读〔2〕,结果解读:x2=56.772,p=0.000,,两种疗法治疗慢性支气管炎病人的治愈率的差异有统计学意义,四格表,x,2,检验结果的选择,1〕当n≥40,全部理论值≥ 5时,用pearson卡方检验。,,2〕当n≥40,但有理论频数1≤理论值<5时,用连续校正的卡方检验;或者准确概率法。,,3〕
8、 n<40或有理论值<1,或P≈α时,用准确概率法。,卡方检验的校正公式,,,【例3】某中医院比较两药治疗某病的效果,所得结果见表。问甲乙两药疗效有无差异?,校正公式,,,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别和疗效分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行,第5步:结果解读〔1〕,结果
9、解读:,甲药组的有效率为,92.9%,,乙药组的有效率为,64.3%,。,,,第5步:结果解读〔2〕,结果解读:,有,2,个格子的期望值小于,5,,不符合卡方检验的条件。,,,第5步:结果解读〔3〕,结果解读:四格表中有期望值小于5,选连续校正的卡方。x2=3.621,p=0.057?,,P〔exact〕=0.031?,四格表,x,2,检验结果的选择,1〕当n≥40,全部理论值≥ 5时,用pearson卡方检验。,,2〕当n≥40,但有理论频数1≤理论值<5时,用连续校正的卡方检验;或者准确概率法。,,3〕 n<40或有理论值<1,或P≈α时,用准确概率法。,【例4】某医师为争论乙肝免疫球蛋白
10、预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表。问两组新生儿的HBV总体感染率有无差异?,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别和感染结果分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行,第5步:结果解读〔1〕,结果解读:,预防注射组的感染阳性率
11、为,4/22,,非预防组的感染阳性率为,5/11,。,,,第5步:结果解读〔2〕,结果解读:,四格表中有期望值小于,5,,,总例数小于,40,。,,,第5步:结果解读〔3〕,结果解读:选Fisher的准确检验p〔exact〕=0.121,x,2,检验,,单个样本构成比的,x,2,检验,,独立样本四格表的,x,2,检验,,行,×,列,的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,行,×,列卡方检验计算公式,n,为总例数;,R,和,C,分别为行数和列数;,A,为第,R,行、第,C,列位置上的实际频数;,nR,为实际频数所在行的行合计;,nC,为实际频数所在列
12、的列合计。,【例5】某中医师将某病患者随机分为三组,分别用新药、传统药物和劝慰剂治疗,结果见表。问三种方法治疗该病的有效率是否有差异?,,,,A,n,C,n,R,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别和疗效分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行,第5步:结果解读〔1〕,结果解读:新药
13、组的有效率为88.9%,传统药物组的有效率为86.7%,劝慰剂组的有效率为70.9%。,,,,第5步:结果解读〔2〕,结果解读:,x,2,=13.238,,,p=0.001,,进一步的两两比较,P<0.017,才有,,统计学意义!!,【例6】某中医院用三种治疗方法治疗413例糖尿病患者,资料见表。为避开中医不同证型对疗效比较的影响,分析3种疗法治疗的病人按3种中医分型的构成比有无差异?,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别和中医分
14、型分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行,第5步:结果解读〔1〕,结果解读:,各组的中医分型构成比,。,,,,第5步:结果解读〔2〕,结果解读:,x,2,=4.020,,,p=0.403,【例7】某医院肝胆外科在手术中,观看了222例胆结石患者,其发病部位与结石类型的资料见表,分析其发病部位与结石类型间有无关系?,行变量和列变量均为无序分类变量。,,可分析行、列两变量之间有无关联,关联的亲密程度。,,可进展多个样本率或构成比的比较。,关联性分析
15、,列联系数的意义,,|r,p,|<0.4,,关联程度低,,0.4≤|r,p,|<0.7,,关联程度中等,,|r,p,|≥0.7,,关联程度高,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:结石部位和结石类型分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方和相关系数,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、百分比:行、列,第5步:结果解读〔1〕,结果解读:,行与列均
16、为无序变量,行、列百分比均有各自专业意义。,,,,,,,第5步:结果解读〔2〕,结果解读:,x,2,=64.059,,,p=0.000,第5步:结果解读〔3〕,结果解读:,r,p,=0.473,,,p=0.000,,两者有关联,但关联度不高。,行×列表卡方检验留意事项,同四格表资料一样,R×C表的卡方分布是建立在大样本的假定上的,要求总例数不行过少,不能有1/5以上的格子理论频数小于5,且不能有一个格子的理论频数小于1。,,假设消失上述状况,可以考虑:增大样本量;依据专业学问合理地合并相邻的组别;删除理论数太小的行列 ;改用其它方法分析,例如准确概率法或似然比卡方检验。,当多个样本率〔或构成比
17、〕作卡方检验,结论为拒绝零假设时,只能认为各总体率〔或总体构成比〕之间总的有差异,不能说明两两之间有差异;两组间的比较需进一步做多个样本率或构成比的两两比较,即多重比较。,行×列表卡方检验留意事项,行×列表卡方检验留意事项,R×C表可以分为双向无序、单向有序、双向有序属性一样和双向有序属性不同等4类。,,通常状况下只有双向无序的资料〔例如多个样本率的比较、多个样本构成比的比较〕可以使用R×C列联表卡方检验。,,右上表格使用卡方检验分析不同疗法间疗效是否有别,右下表格分析不同的血型分类结果是否有关联〔不同的血型分类是否相互独立〕;它们都属于双向无序的列联表,都可使用卡方检验分析,疗法,疗效,,合
18、计,有效率,,(%),,有效,无效,,,物理疗法,199,7,206,96.60,药物治疗,164,18,182,90.11,外用膏药,118,26,144,81.94,合计,481,51,532,90.41,ABO,,血型,MN,血型,,,合计,,M,N,MN,,O,431,490,902,1823,A,388,410,800,1598,B,495,587,950,2032,AB,137,179,32,348,合计,1451,1666,2684,5801,行×列表卡方检验留意事项,单向有序R×C表 有两种形式。一种是表中的分组变量〔如年龄〕是有序的,而指标变量〔如传染病的类型〕是无序的,其
19、争论目的通常是分析不同年龄组各种传染病的构成状况,可用行列表资料的χ2检验进展分析;而假设指标变量为二分类,如右上表,想分析是否随工龄增加患病率也增加可以考虑线性趋势检验;另一种状况是表中的分组变量〔如疗法〕为无序的,而指标变量〔如疗效按等级分组〕是有序的,如右下表,其争论目的为比较不同疗法的疗效,宜用秩和检验进展分析。,药物,,种类,疗效,,,合计,,治愈,好转,无效,,A,16,50,4,70,B,4,5,21,30,C,20,25,15,60,合计,40,80,40,160,工龄,患病人数,未患病人数,合计,<1,1,51,52,1~,6,94,100,2~,23,201,224,4~,
20、35,156,191,6~,24,87,114,行×列表卡方检验留意事项,双向有序属性一样的R×C表 表中的两分类变量皆为有序且属性一样。实际上是2×2配对设计的扩展,即水平数≥3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其争论目的通常是分析两种检测方法的全都性,此时宜用全都性检验〔或称Kappa检验〕,对比法,,测定结果,核素法测定结果,,,合计,,正常,减弱,异常,,正常,,58,2,3,63,减弱,1,42,7,50,异常,8,9,17,34,合计,67,53,27,147,行×列表卡方检验留意事项,双向有序属性不同的R×C表 R×C表中两分类变量皆为有序的,
21、但属性不同,如下表;对于该类资料,①假设争论目的为分析不同年龄组患者混浊度之间有无差异时,可把它视为单向有序R×C表资料,选用秩和检验;②假设争论目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析;③假设争论目的为分析两有序分类变量间是否存在线性变化趋势,宜用线性趋势检验。,年龄,晶状体混浊程度,,,合计,,+,++,+++,,20,~,,215,67,44,326,30,~,131,101,63,295,40,~,148,128,132,408,合计,494,296,239,1029,行,×,列表资料假设检验方法选择,双向无序的行×列表:pearson卡方、关联度分析;,,单向有序
22、的行×列表:Ridit分析、秩和检验;,,双向有序属性一样的行×列表:McNemar检验(优势性检验)、全都性检验、关联度分析;,,双向有序属性不同的行×列表:秩和检验、 Ridit分析、等级相关、线性趋势检验等。,x,2,检验,,单个样本构成比的,x,2,检验,,独立样本四格表的,x,2,检验,,行,×,列,的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,配对设计包括:,,①同一批样品用两种不同的处理方法。,,②两个评估者对争论对象进展逐一评估。,,③观看对象依据配对条件配成对子,同一对子内两个体分别承受不同的处理。,,观看结果均分为k个一样的类别,资料
23、可归纳整理成k×k的表格形式,又称为方表。这样的资料又称为方表资料。,对于配对设计的分类资料,假设争论目的为分析两种方法(即行变量和列变量)之间的相关关系(包括是否有关联、关联程度及全都性),应选用 关联度分析及全都性检验( Kappa 检验);,,假设争论目的为分析两种方法间是否存在差异则应用优势性检验(McNemar检验)。,【例8】用两种方法检查60名乳腺癌患者,检查结果如表。请对两种检查方法进展分析。,优势性检验公式,X,2,=(b-c),2,/(b+c) n>=40,,X,2,=(|b-c|-1),2,/(b+c) n<40,,,全都性检验Kappa分析,SPSS,软件操
24、作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:甲法和乙法分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方、相关系数、Kappa、McNemar,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行、总计,第5步:结果解读〔1〕,结果解读:两种方法穿插的例数关系。,,甲法阳性率65.0%,乙法阳性率48.3%。,,,第5步:结果解读〔2〕,结果解读:配对设计选用优势性检验结果
25、,,p=0.031,。甲组的阳性率高于乙组的阳性率。,第5步:结果解读〔3〕,结果解读:关联性rp=0.395,p=0.001,,全都性kappa=0.406,p=0.004,Kappa的意义,,<0.02 差,,0.02~ 稍微,,0.20~ 尚可,,0.40~中等,,0.60~好,,0.80-1.00 几乎完全全都,【例9】下表为外侧半月板撕裂的膝关节镜诊断〔金标准〕与MRI〔核磁共振成像〕诊断的结果,试对两种诊断方法进展分析。,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1
26、〕,选择分析→穿插表,,穿插表对话框:MRI诊断和关节镜诊断分别进入行和列,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方、相关系数、Kappa、McNemar,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、期望值、百分比:行、总计,第5步:结果解读〔1〕,结果解读:,两种方法交互的例数关系。,,,,,,,第5步:结果解读〔2〕,结果解读:优势性检验,p=0.268,。两种诊断方法的诊断结果差异无统计学意义。,第5步:结果解读〔3〕,结果解读:关联性rp=0.580,p=0.000,,全都性kappa=0.515,p=0.000,x
27、,2,检验,,单个样本构成比的,x,2,检验,,独立样本四格表的,x,2,检验,,独立样本多个率和构成比的,x,2,检验,,配对设计分类资料的,x,2,检验,,多维分类资料的,x,2,检验,【例10】某药业集团研制了一种治疗慢性皮炎的新药,为了解该药的药物疗效,同某种常用药物的疗效作了比较,资料如表。问该新药与常用药物的疗效有无差异?,SPSS,软件操作,第,1,步:定义变量,第,2,步:输入原始数据,第,3,步:定义频数,选择数据→加权个案,,频数→加权个案〔频数变量〕,第4步:x2检验〔1〕,选择分析→穿插表,,穿插表对话框:组别、疗效和中心分别进入行、列和层1的1,第4步:x2检验〔2〕,选择统计量按钮,,在穿插表:统计量对话框:勾上卡方及CMH统计量。,第4步:x2检验〔3〕,选择单元格按钮,,在穿插表:单元显示对话框:勾上观看值、百分比:行、列,第5步:结果解读〔1〕,结果解读:,每个中心的描述。,第5步:结果解读〔2〕,结果解读:,每个中心的卡方检验。,第5步:结果解读〔3〕,结果解读:中心效应,x,2,=1.642,,,p=0.650,第5步:结果解读〔4〕,结果解读:x2=5.531,p=0.019,,考虑分层〔多中心〕混杂因素影响后的卡方值。,第5步:结果解读〔5〕,结果解读:假设是病例比照争论,或者队列争论,OR值及其95%CI。,谢 谢!,
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。