医学医学统计学卡方检验.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《医学医学统计学卡方检验.pptx》由会员分享,可在线阅读,更多相关《医学医学统计学卡方检验.pptx(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、名人格言谬误的好处是一时的,真理的好处是永久的,真理有弊病时,这些弊病会很快被消灭,而谬误的弊病则与谬误始终相随。狄德罗狄德罗(法国思想家法国思想家,1713,17131784)1784)第1页/共103页案例1:评价方法的讨论怎样评价男女生在德、智、体的差异?怎样评价A、B、C三种降压药物疗效的差别?第2页/共103页什么是定性数据?定性数据(qualitative data)或称为分类数据(categorical data),其观察值是定性的,表现为互不相容的类别或属性。例如患者服药后结局为治愈和未治愈,生存和死亡、阴性和阳性等。定性数据的统计分析主要是如何估计总体的率及如何推断两个及两个
2、以上总体率或构成比是否有差异、两个分类变量间有无相关关系等。第3页/共103页第一节 率的估计一、一、率的点估计与总体均数的估计相似,从总体中随机抽取一个样本,从样本计算得到的率是总体率的点估计值。例 132例美国冠心病黑人在进行心脏搭桥手术后,有5人死亡,试估计美国冠心病黑人心脏搭桥手术后死亡率为多少?解:P=5/132*100%=3.8%第4页/共103页二、二、率的抽样误差与标准误率的抽样误差与标准误 从总体中随机抽取一个样本,样本率与总体率之间存在差别,差别的大小可以估计。由抽样而引起的样本率与总体率的差异称为率的抽样误差。即率的标准误。第5页/共103页率的标准误计算公式式中,p p
3、为率的标准误;为总体率;n n为样本量当总体率未知时,以样本率p p作为的估计值,相 应 地 此 时 率 的 标 准 误 估 计 值 按 下 式 计 算:式中,S Sp p为率的标准误的估计值;p p为样本率。第6页/共103页二、率的区间估计总体率的点估计是计算样本的率,很简单,但计算得到的样本率不等于总体率,它们间存在差异。因此,我们还需要知道总体率大概会在一个什么样的区间范围,即所谓总体率的可信区间估计。第7页/共103页总体率的可信区间可以用正态分布法估计。当n足够大,且p 和1-p均不太小,如np 和n(1-p)均大于5时,p的抽样分布逼近正态分布。此时,可根据正态分布的特性计算总体
4、率的(1-a)%可信区间:双侧:(p-u/2Sp,p+u/2Sp)单侧:大于p-uSp 或小于 p+uSp正态分布法第8页/共103页例10-1 采用某药治疗高血压病人200例,服药一月后160人有效,试估计该药的有效率及其双侧95%可信区间。解 该药总体有效率:p=160/200=80%,Sp=0.02828 u0.05/2=1.96,总体有效率的95%CI为:(0.8-1.960.02828,0.8+1.960.02828)=(0.7446,0.8554)即估计该药的有效率为80%,该药的有效率的95%可信区间为(0.7446,0.8554)。第9页/共103页 练习 随机抽取某市小学40
5、0名儿童,查出患有牙疼200名,患有牙周炎240名,患有龋齿320名。试估计儿童牙疼、牙周炎、龋齿的患病率及其95可信区间为多少?指 标 例数 阳性数 阳性率 95%CI正态近似法牙疼 400 200 0.5000 0.45100.5490牙周炎 400 240 0.6000 0.55200.6480龋齿 400 320 0.8000 0.76080.8392 第10页/共103页CHISSCHISS软件实现1.进入数据模块 点击 数据文件建立数据库表2.进入统计模块 进行统计计算 点击 统计统计推断可信区间率的可信区间反应变量:确认第11页/共103页率的置信区间CHISSCHISS数据库1
6、二行数据:1)第一行总例数;2)第二行阳性数(分子)2 每个指标(组)各一列第12页/共103页第二节第二节 2 222表资料的表资料的2 2检验检验第13页/共103页一、一、2 222四格表的数据 A、B两个定性变量各分两类,交叉分类计数所得的表称为22列联表。表中产生四个格子四个数a,b,c,d,亦称为四格表(fourfold table),如下表所示。分组B1B2合计A1aba+bA2cdc+d合计a+cb+da+b+c+d第14页/共103页案例1 治疗肺炎新药临床试验 用某新药治疗肺炎病,并选取另一常规药作为对照药,治疗结果如下:采用新药治100例,有效 60例;采用对照药治40例
7、,有效 30例。试问:1)列表描述临床试验结果;2)两种药物疗效有无差别?组别 有效 无效 新药 60 40 对照药 30 10 第15页/共103页2检验(chi-square test)是由英国统计学家K.Pearson于1900年提出的,其广泛地应用于分类数据的统计分析,推断两个及两个以上总体率或构成比差异是否有统计学意义、两个分类变量间有无相关关系等。设计类型的不同2检验不同,四个表2检验可以分为完全随机设计的两样本率比较的2检验和配对设计的2检验。2 2检验检验第16页/共103页(一)完全随机设计 随机抽取n个个体,按照A属性分为两组,进行试验,然后按试验效应B属性分为两类。由A、
8、B两属性组合分成四格,得到相应的22频数表。这类22表主要进行两个样本率之间差异的显著性检验和两属性A、B之间是否存在相关关系。第17页/共103页二、2 2检验 2检验的统计量是2值,它是每个格子实际频数A(actualfrequency)与理论频数T(theoreticalfrequency)差值的平方与理论频数T之比的累计和。计算公式为:2检验是由统计学家K.Pearson(1899)提出,故也称为Pearson2检验。第18页/共103页实际数和理论频数实际频数 是通过科学试验观察得到的数据,记为A。理论频数 根据在两总体率相同的假设推算出的频数称为理论频数或希望数,记为T。为了便于理
9、解,我们以实际例子来说明2检验的假设。第19页/共103页理论数计算某班100名学生,其中女生40名,男生60名,现在评选优秀学生20名,问1)假设如果男女优秀生相同,男女生优秀生和非优秀生各多少名?2)现在男女优秀生各10人,问男女生优秀生率有无差别?解:女生优秀数为T11=女生非优秀数为T12=男生优秀数为T21=男生非优秀数为T22=第20页/共103页实际数与理论数优秀(理论数)非优秀(理论数)合计女生10(8 )30(32 )40男生10(12 )50(48 )60合计2080100第21页/共103页2检验的基本思想 2值反映了实际频数A与理论频数T吻合的程度。实际频数A与理论频数
10、T相差越大,则2值越大,2值越大,P值越小,越有理由认为两组总体率不相同。第22页/共103页TRC表示列联表中第R行第C列交叉格子的理论频数;nR表示该格子所在的第R行的合计数;nC表示该格子所在的第C列的合计数;n表示总例数。2)理论频数计算公式理论频数计算公式第23页/共103页例10-1 用磁场疗法治疗腰部扭挫伤患者708人,其中有效673例。用同样疗法治疗腰肌劳损患者347人,有效312例。观察结果如表10-6所示。问磁场疗法对两种疾病患者治疗效果有无差异?分 组有效无效合 计有效率(%)扭伤673673353570895.06腰肌劳损 312312353534789.92合 计98
11、570105593.36第24页/共103页解题分析扭伤有效率95.06%,腰肌劳损有效率89.92%,造成这种差别的原因是什么呢?可能有两种:其一病的不同(本质上的差异);其二抽样误差差别到底是本质上的差异还是纯粹的抽样误差,需进行假设检验。第25页/共103页解题步骤:1.建立假设:H0:磁场疗法对腰部扭伤和腰肌劳损治疗的总体有效率相同,即1=2H1:磁场疗法对腰部扭伤和腰肌劳损治疗的总体有效率不同,即12确定显著水平=0.05第26页/共103页3)2值 计算公式服从自由度=(R-1)(C-1)的2分布R表示列联表中行标识的分组数;C表示列联表中列标识的分组数。第27页/共103页 本例
12、实际数与理论数 有效(理论数)无效(理论数)小计 扭伤 673(661.0)35(47.0)708 腰肌劳损 312(324.0)35(23.0)347 合计 985 70 1055 第28页/共103页本例的2值:=(2-1)(2-1)=1由2界值表得20.05,1=3.84,本例2检验=9.94273.84,所以,P0.05。第29页/共103页2分布曲线第30页/共103页3.判断与决策按照=0.05的检验水准,拒绝H0,接受H1,两个总体有效率的差异有统计学意义。专业结论 磁场疗法治疗腰部扭伤和腰肌劳损的治疗效果不相同。第31页/共103页4.CHISS软件实现步骤如下:点击 数据文件
13、打开数据库表找到文件名:b10-1.DBF确认。(2)进入统计模块:进行相应的统计计算,具体操作为点击 统计统计推断pearsonpearson卡方反应变量:有效、无效期望频数确认。(3)进入结果模块:点击 结果。第32页/共103页设计的讨论治疗方法:磁场疗法、针灸疗法、推拿按摩疾病类型:腰部扭伤、腰肌劳损、腰疼观察结果:有效,无效 第33页/共103页四格表2 2检验专用公式*为了简化计算,可以由2检验的基本公式和一些相关公式推导出四格表专用公式式中a,b,c,d是指表10-1中所示,n为样本总例数。第34页/共103页四格表2检验应用条件四格表2检验应根据实际频数和理论频数选取计算2统计
14、量的公式,四格表2检验专用公式应用条件是样本总例数n40,且四个格子中的每个理论数Tij5。第35页/共103页(三)2检验的连续性校正公式在四格表中n40,但是有一个格子的理论数1Tij40,且有格子的理论数1T12=4.765,1T22=3.245,所以不能应用2检验的基本公式,而应使用四格表2检验的连续性校正公式计算2统计量。第40页/共103页解题步骤:1.建立假设H0:1=2,即试验组与对照组实验室指标的改善及恢复正常率相同 H1:12,即试验组与对照组实验室指标的改善及恢复正常率不同 确定显著水平=0.05第41页/共103页2.计算2统计量由2界值表得20.05,1=3.84,本
15、例2检验=3.2790.05。第42页/共103页3.3.统计推断按照=0.05的检验水准,不拒绝H0,两组病人的改善及恢复正常率差别差异无统计学意义。第43页/共103页4.CHISS软件实现(1)进入数据模块:打开已有数据文件的操作点击 数据文件打开数据库表找到文件名:b10-2.DBF确认。(2)进入统计模块:进行相应的统计计算,具体操作为点击 统计统计推断双向无序列联表反应变量:改善、未改善期望频数确认。第44页/共103页(4)结论:CHISS软件运行例10-3资料检验2后,在运行结果中会自动提示使用者,本资料“有理论频数小于5,推荐使用校正卡方结果”。连续校正 2=3.2790,P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内