分类变量资料统计分析.ppt
《分类变量资料统计分析.ppt》由会员分享,可在线阅读,更多相关《分类变量资料统计分析.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类变量资料的统计分析分类变量资料的统计分析第十章第十章1卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析主要内容主要内容分类变量资料的统计描述分类变量资料的统计描述分类变量资料的统计推断分类变量资料的统计推断卡方检验卡方检验2卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析什么是分类变量资料?什么是分类变量资料?用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易
2、感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。3卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 常用相对数常用相对数应用相对数时的注意事项应用相对数时的注意事项率的标准化法率的标准化法4
3、卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析相对数相对数相对数相对数:是两个有关联的数值或指标之比。:是两个有关联的数值或指标之比。常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比5卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率率(rate)率率:是是指指在在一一定定观观察察时时间间内内,某某现现象象实实际际发发生生数数与与可可能能发发生生该该现现象象的的总总数数之之比比,用用以以说说明明某某现现象象发发生生的频率或强度。的频率或强度。
4、K K为为比比例例基基数数,如如100%100%、10001000等等。比比例例基基数数的的选选择择主主要要依依习习惯而定或使计算结果能保留惯而定或使计算结果能保留1 12 2位整数。位整数。6卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析构成比构成比(constituent ratio)构构成成比比:是是指指事事物物内内部部某某一一部部分分的的观观察察单单位位数数与与事事物物内内部部各各组组成成部部分分的的观观察察单单位位数数总总和和之之比比,用用以以说说明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布
5、。常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。7卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析各部分构成比之和为各部分构成比之和为100%。此消彼长。此消彼长。构成比的两个特点:构成比的两个特点:8卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析例例10-1 2001年年对对某某地地中中小小学学学学生生进进行行HbsAg检检查查,结结果果见见表表10-1,试试计计算算各各级级学学生生HbsAg检检出出率率及及阳阳性者构成比性者构成比 率和
6、构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。9卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析相对比相对比相相对对比比:指指两两个个有有关关指指标标之之比比,说说明明两两个个指指标标的的比比例关系。例关系。两个指标可以是绝对数、相对数、平均数,可以是性质相同两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。或性质不同,但两个指标互不包含。10卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量
7、资料的统计分析例例10-2 某某地地2003-2005年年不不同同性性别别新新生生儿儿数数见见表表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。11卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析应用相对数的注意事项应用相对数的注意事项计算相对数时分母不宜过小计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 正确计算平均率正确计算平均率对率和构成比进行比较时,对率和构成比进行比较时,应注意资料的可比性应注意资料的可比性 率的标准化率的标准化
8、样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 12卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率的标准化率的标准化13卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析 在在进进行行两两个个内内部部构构成成不不同同的的总总率率比比较较时时,采采用用统统一一的的标标准准进进行行校校正正,然然后后计计算算校校正正后后的的标标准准化化率,再进行比较的方法称为率的标准化法。率,再进行比较的方法称为率的标准化法。率的标准化法率的标准化法
9、14卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析计算标准化率时,首先要选定一个比较的计算标准化率时,首先要选定一个比较的“标准标准”。如如,对对年年龄龄构构成成进进行行标标化化时时,可可选选用用全全国国、全全省省等等大大范范围围人人口口构构成成资资料料作作标标准准,也也可可将将比比较较组组的的合合并并人人口口或或以以其其中中任任一一组的人口构成作标准。组的人口构成作标准。原原则则上上,选选定定的的标标准准人人口口应应有有代代表表性性、较较稳稳定定,容容易易获获得得,便于比较。便于比较。根根据据获获得得的的资资料料和和选选
10、定定的的标标准准不不同同,标标准准化化法法可可分分为为直直接接法法和和间接法间接法。15卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析直接法直接法适适用用情情况况:已已知知被被标标化化组组各各年年龄龄组组的的实实际际率率P Pi i,用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。其中其中 为第为第i 组标准人口数,组标准人口数,为标准组总人数,为标准组总人数,为第为第i 组的实际率,组的实际率,为第组标准人口构成。为第组标准人口构成。16卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章
11、分类变量资料的统计分析7版)第十章 分类变量资料的统计分析甲社区标准化后的患病率甲社区标准化后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率17卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准,18卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析间接法间接法适适用用情情况况:已已知知被被标标化化组组的的死死亡亡总总数数及及年年龄龄别别人人口数,但不知道各年龄组的实际死亡率。口数,但不知道
12、各年龄组的实际死亡率。标准化死亡比标准化死亡比19卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析标标准准化化死死亡亡比比:被被标标化化组组实实际际死死亡亡数数与与预预期期死死亡亡数数之之比比,称称为为标标准准化化死死亡亡比比(standard mortality ratio),简简称称为为SMR。若若SMR1,表表示示被被标标化化人人群群的的死死亡亡率率高高于于标标准准组组;反反之之,若若SMR1,表表示示被被标标化人群的死亡率低于标准组。化人群的死亡率低于标准组。20卫生学(第7版)第十章 分类变量资料的统计分析7版)第
13、十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析例例10-410-4 某某地地观观察察了了吸吸烟烟者者与与不不吸吸烟烟者者各各年年龄龄组组人人数数如如表表10-610-6,同同时时观观察察期期内内吸吸烟烟者者中中有有432432人人死死于于肺肺癌癌,不不吸吸烟烟者者中中有有210210人人死死于于肺肺癌癌,试试计计算算吸吸烟烟者者与与不不吸吸烟烟者者的的标标准准化化死死亡率。亡率。21卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡比吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比非
14、吸烟者的肺癌标准化死亡比 22卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 23卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率的标准化应注意的问题率的标准化应注意的问题 (1 1)当当各各比比较较组组内内部部构构成成(如如年年龄龄、性性别别等等)不不同同时时,应对率进行标准化后,再作比较。应对率进行标准化后,再作比较。(2 2)标标准准化化率率只只
15、表表明明各各标标化化组组率率的的相相对对水水平平,而而不不代代表表其实际水平。其实际水平。(3 3)两两总总率率各各分分组组对对应应的的率率有有明明显显交交叉叉时时,则则不不能能用用标标准化率进行比较。准化率进行比较。(4 4)如如为为抽抽样样研研究究资资料料,两两样样本本标标准准化化率率的的比比较较也也应应作作假设检验。假设检验。24卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析第二节第二节 分类变量资料的统计推断分类变量资料的统计推断率的抽样分布率的抽样分布率的抽样误差与标准误率的抽样误差与标准误总体率的区间估计总体率
16、的区间估计率比较的率比较的u u检验检验25卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率的抽样分布率的抽样分布从从某某个个二二项项分分类类总总体体中中随随机机抽抽取取含含量量一一定定的的样样本本,其其样样本本率率的的分分布布概概率率是是有有规规律律的的,这这种种规规律律为为服服从从二二项项分分布布(binomial distribution),即即样样本本中中阳阳性性数数或或样样本本阳阳性性率率的的分分布布概概率率等等于于二二项项式式展展开开后后各各项项。若若总总体体阳阳性性率率为为、样样本本含含量量为为n,阳阳性性数
17、数为为X,则则样样本本中中出出现现X个阳性事件的概率可由下式求得。个阳性事件的概率可由下式求得。26卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析已已知知:=0.5,n=10;=0.3,n=5;=0.3,n=10;=0.3,n=15。试试根根据据式式(10-6)求求各各阳阳性性数数事事件件的的概概率率并作概率分布图。并作概率分布图。图图10-1 10-1 率的抽样分布图率的抽样分布图 27卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率的抽样分布特征率
18、的抽样分布特征1.为离散型分布;为离散型分布;2.2.当当 =1-=1-时,呈对称分布;时,呈对称分布;3.3.当当n n增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。一般认为,当一般认为,当nn和和n n(1-(1-)5)5时时,可近似看可近似看作正态分布。作正态分布。28卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析率的抽样误差和标准误率的抽样误差和标准误由由于于抽抽样样所所引引起起的的样样本本率率和和总总体体率率或或各各样样本本率率之之间间存存在在着着差差异异,这这种种差差异异称称为为率率的的抽抽样样误误差差。
19、用率的标准误表示用率的标准误表示 。29卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析例例10-6 10-6 为为了了解解某某地地人人群群结结核核菌菌素素试试验验阳阳性性率率情情况况,某某医医疗疗机机构构在在该该地地人人群群中中随随机机检检测测了了17731773人人,结结核核菌菌素素试试验验阳阳性有性有682682人,阳性率为人,阳性率为38.47%38.47%,试计算其标准误。,试计算其标准误。30卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析总体
20、率的区间估计总体率的区间估计总体率的估计:总体率的估计:点估计点估计区间估计区间估计正态近似法正态近似法查表法查表法31卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析正态近似法正态近似法当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。u 是是标标准准正正态态分分布布双双侧侧临临界界值值,在在估估计计总总体体率率的的95%置信区间时,其值为置信区间时,其值为1.96;99%置信区间时,其值为置信
21、区间时,其值为2.58。32卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析95%的置信区间:的置信区间:38.47%1.96 1.16%=36.20%40.74%99%的置信区间:的置信区间:38.47%2.58 1.16%=35.48%41.46%例例10-6中中该该地地人人群群中中结结核核菌菌素素试试验验阳阳性性率率95%和和99%的置信区间为:的置信区间为:33卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析查表法查表法当当n较较小小,如如n 50
22、,特特别别是是p接接近近于于0或或1时时,按按二二项项分布原理估计总体率的可信区间。分布原理估计总体率的可信区间。因因其其计计算算比比较较复复杂杂,统统计计学学家家已已经经编编制制了了总总体体率率可可信信区区间间估估计计用用表表,可可根根据据样样本本含含量量n和和阳阳性性数数x查查阅阅统统计计学专著中的附表学专著中的附表。34卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析u u 检验检验 当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均均大大于于5),样样本本率率
23、的的分分布布近近似似正正态态分分布布。样样本本率率和和总总体体率率之之间间、两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test)。35卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析样本率与总体率的比较样本率与总体率的比较 36卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析例例10-7 10-7 一一般般情情况况下下,直直肠肠癌癌围围术术期期并并发发症症发发生生率率为为30%30%,现现某某医医院院手手术术治治疗疗了了385385例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 变量 资料 统计分析
限制150内