样本量估算的统计学方法.ppt





《样本量估算的统计学方法.ppt》由会员分享,可在线阅读,更多相关《样本量估算的统计学方法.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 8、样本量估算的统计学方法骆福添骆福添骆福添骆福添 公共卫生学院公共卫生学院公共卫生学院公共卫生学院参考教材:参考教材:参考教材:参考教材:生物医学研究的统计方法生物医学研究的统计方法生物医学研究的统计方法生物医学研究的统计方法主编:方积乾,主编:方积乾,主编:方积乾,主编:方积乾,2007200720072007,高等教育出版社,高等教育出版社,高等教育出版社,高等教育出版社一、临床研究为什么需要估计样本含量复习1:统计学三大任务与三大规则任务:任务:描述描述样本特征、样本特征、估计估计总体参数、总体参数、检验总体差别检验总体差别规则:(必须考虑)规则:(必须考虑)数据数据类型、类型、分布
2、分布类型、类型、对比对比类型类型1.统计描述任务例:某样本个体分布的例:某样本个体分布的集中集中趋势与趋势与离散离散趋势怎趋势怎样样?(1V1V点,点,2V2V线,线,3 3面面.影子影子_ _线)线)数据数据:计数(:计数(%),定量(平均数),等级),定量(平均数),等级(平均(平均RiditRidit值)值)分布分布:正态:正态(Mean(Mean,SDSD,95%CR95%CR),对数正,对数正态态(G)(G),偏态,偏态(M,Q/R(M,Q/R,P P2.52.5P P97.597.5)(双(双/多变多变量量-相关回归)相关回归)对比对比:变量:变量=两组观察值(各组均数与标准两组观
3、察值(各组均数与标准差),变量差),变量=差值(差值的均数与标准差)差值(差值的均数与标准差)2.置信区间任务例:某总体指标在哪一区间例:某总体指标在哪一区间?(借鉴反推)(借鉴反推)数据数据:计数(直接法:计数(直接法/正态近似),计量(正正态近似),计量(正态法),等级(正态近似)态法),等级(正态近似)分布分布:正态(正态法),对数正态:正态(正态法),对数正态(lg lg值置信值置信区间区间),偏态(百分位数法),偏态(百分位数法)对比对比:变量参数置信区间,差值参数置信:变量参数置信区间,差值参数置信区间(临床试验)区间(临床试验)3.假设检验任务例:某例:某2 2个总体指标相同个总
4、体指标相同?(直接应用概率分布直接应用概率分布)数据数据:计数(正态近似法:计数(正态近似法u u,卡方),计量卡方),计量(均数检验),等级(秩和检验)(均数检验),等级(秩和检验)分布分布:正态(:正态(u u,t,t),对数正态(),对数正态(lg lg值值t t检验),检验),偏态(秩和检验)偏态(秩和检验)对比对比:组间比较(:组间比较(u u,t t,H H),与总体比较),与总体比较(u u,t t,H H)统计推断中的误差估计最基本公式:最基本公式:误差误差=个体变异程度个体变异程度/n n的平方根的平方根均数误差均数误差 =标准差标准差/sqrt(sqrt(n n)率的误差率
5、的误差 =sqrtsqrtp p(1-(1-p p)/)/n nn大小举例1 1、n n=3=3,三个克隆,三个克隆2 2、女大学生、女大学生33%33%自动退学?自动退学?n n=?3 3、n n1 1=20=20,n n2 2=100=100,n n=?4 4、19871987年某产科医师为研究胎次与儿童智年某产科医师为研究胎次与儿童智力的关系,收集病案资料(考上大学人数):力的关系,收集病案资料(考上大学人数):第一胎第一胎1919人、第二胎人、第二胎1818人、第三胎人、第三胎1010人、第人、第四胎四胎7 7人、第五胎人、第五胎4 4人。由此得出结论:智力人。由此得出结论:智力与胎次
6、有关,胎次愈多智力愈差,第一胎智与胎次有关,胎次愈多智力愈差,第一胎智力最好。力最好。n n=?可重复原则样本含量(样本含量(SampleSample)的估计是临床研)的估计是临床研究科学设计的重要内容。究科学设计的重要内容。可重复性,是指任何科学研究必须遵可重复性,是指任何科学研究必须遵守的原则,其目的是要排除偶然因素守的原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律的影响,得出科学的、真实的、规律性的结论。性的结论。样本含量的大小在临床研究中,样本含量越小,其抽在临床研究中,样本含量越小,其抽样误差越大。样误差越大。若样本含量不足,可重复性差,检验若样本含量不足,可重复性差,
7、检验效能低,不能排除偶然因素的影响,效能低,不能排除偶然因素的影响,其结论缺乏科学性、真实性。其结论缺乏科学性、真实性。若样本含量过大,试验条件难以严格若样本含量过大,试验条件难以严格控制,容易造成人力、物力和时间上控制,容易造成人力、物力和时间上的浪费。的浪费。估计样本含量的目的在保证某个临床试验在保证某个临床试验/临床研究的结论临床研究的结论具有一定科学性、真实性和可靠性前具有一定科学性、真实性和可靠性前提下,确定某研究所需的提下,确定某研究所需的最小观察例最小观察例数数。二、估计样本含量的方法两大类方法1 1、公式法,可满足多种设计的要求,公式法,可满足多种设计的要求,目前应用广泛。目前
8、应用广泛。2 2、查表法,简单、方便,但受条件限查表法,简单、方便,但受条件限制,有时不一定完全适应。制,有时不一定完全适应。三、估计样本含量的步骤1、确定设计方法任何临床试验,其设计方案是首先需任何临床试验,其设计方案是首先需要确定的,而样本含量的估计也是在要确定的,而样本含量的估计也是在设计方案基础上的。不同的临床科研设计方案基础上的。不同的临床科研设计方法,其样本含量的估计方法不设计方法,其样本含量的估计方法不相同相同2、确定资料类型当临床试验的设计方案确定后,需要当临床试验的设计方案确定后,需要确定临床试验所得数据的类型,例如,确定临床试验所得数据的类型,例如,计量计量(数值)、(数值
9、)、计数计数(无序分类)、(无序分类)、等级等级(有序分类),因为样本含量估(有序分类),因为样本含量估计方法与数据类型有关计方法与数据类型有关3、考虑统计方法样本含量的估计还要与以后将要使用样本含量的估计还要与以后将要使用的统计方法的条件相结合。如的统计方法的条件相结合。如单因素单因素分析分析、相关与回归相关与回归、多因素分析多因素分析等。等。目前样本含量估计的公式计算主要针目前样本含量估计的公式计算主要针对单因素分析,而多因素分析的例数对单因素分析,而多因素分析的例数估计请参考有关书籍估计请参考有关书籍4、确定基本参数 在各种临床科研设计方法的样本含量估计中,在各种临床科研设计方法的样本含
10、量估计中,需要研究者事先确定的条件有:需要研究者事先确定的条件有:第一类错误的概率第一类错误的概率,第二类错误概率,第二类错误概率,容许误差容许误差。若终点指标为数值变量时,还需要研究者确若终点指标为数值变量时,还需要研究者确定总体标准差定总体标准差。若终点指标为分类变量时,有时需要研究者若终点指标为分类变量时,有时需要研究者确定总体率确定总体率。(1)确定第一类误差的概率所有样本含量估计公式中,都需要所有样本含量估计公式中,都需要u u的的值,研究者确定检验水准(值,研究者确定检验水准()的大小后,)的大小后,查表得查表得u u值。值。有有单侧单侧与与双侧双侧之分,单侧之分,单侧的的u u小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估算 统计学 方法

限制150内