统计学在临床研究中的应用精选PPT.ppt
关于统计学在临床研究中的应用第1页,讲稿共47张,创作于星期二统计是什么?统计是什么?指总括地计算。例:把全国报来的数据统计一下指对某一现象有关的数据的搜集、整理、计算和分析等。例:人口统计第2页,讲稿共47张,创作于星期二3 3 统计v是一种对客观现象数量方面进行的调查研究活动;v是收集、整理、分析、推断、判断等认识活动的总称。v数据汇总数据汇总仅仅是统计工作的一小部分内仅仅是统计工作的一小部分内容。容。第3页,讲稿共47张,创作于星期二工作生活中常见的统计学问题工作生活中常见的统计学问题v如何判断某药物或治疗方法的疗效?如何判断某药物或治疗方法的疗效?v明天是否下雨?体育彩票能否中奖?明天是否下雨?体育彩票能否中奖?v子女为什么象父母,其强度有多大?子女为什么象父母,其强度有多大?v美国的民意测验是如何进行的?美国的民意测验是如何进行的?v中国的市场调查的可信性有多大?中国的市场调查的可信性有多大?统计学都能回答第4页,讲稿共47张,创作于星期二5 5统计学统计学 作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。统计学就是研究数据及其存在规律的科学。第5页,讲稿共47张,创作于星期二 统计资料的类型第6页,讲稿共47张,创作于星期二住院号性别年龄(岁)WBC(1012/L)疗效xxxxxxxx男559.76好转xxxxxxxx女635.21治愈xxxxxxxx男7821.14无效序号性别民族年龄红细胞计数血红蛋白白细胞1女汉204.81109/L136g/L6.431012/L2女汉203.67109/L115g/L8.951012/L3女汉204.15109/L128g/L5.061012/L第7页,讲稿共47张,创作于星期二8 8 120名正常成年男子红细胞计数值名正常成年男子红细胞计数值 5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57 第8页,讲稿共47张,创作于星期二v男、女vA、B、O、ABv、v身高:172cm、174cm、177cmv体重:50kg、58kg、60kgv白细胞数:4109/L、5109/L、3.8109/Lv痊愈、显效、有效、无效v轻、中、重v第9页,讲稿共47张,创作于星期二 计数资料 计量资料 等级资料统计资料的类型计量资料:对每个观察单位的各样项指标用定量的方法,通过测量得到的数值,我们把这样的资料称为计量资料,一般有度量衡等单位。如调查某地10岁女童的身体发育状况,以人为观察单位,每个人的身高(cm)、体重(kg)和血压(mmHg)等;又如以每个采样点为观察单位,测得不同采样点的二氧化碳浓度(mg/L)。计数资料:先将观察单位按某种属性或类别分组,然后清点所得各组的观察单位数,称为计数资料。例如对某小学全体学生进行蛔虫卵粪检,每个学生是一个观察单位,将每个学生按粪检结果阳性与阴性分组,得每组人数;又如调查某人群的血型分布,按A、B、AB、O四型分组,得各血型组的人数。等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。例如用某药治疗若干痢疾病人,其中治愈、显效、有效、无效人数。这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半计量资料。第10页,讲稿共47张,创作于星期二v男、女vA、B、O、ABv、v身高:172cm、174cm、177cmv体重:50kg、58kg、60kgv白细胞数:4109/L、5109/L、3.8109/Lv痊愈、显效、有效、无效v轻、中、重v计数资料计量资料等级资料第11页,讲稿共47张,创作于星期二住院号性别年龄(岁)WBC(1012/L)疗效xxxxxxxx男559.76好转xxxxxxxx女635.21治愈xxxxxxxx男7821.14无效计数资料观察个体等级资料计量资料第12页,讲稿共47张,创作于星期二1313 120 120名正常成年男子红细胞计数值名正常成年男子红细胞计数值 5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57 第13页,讲稿共47张,创作于星期二统计学常涉及的基本概念第14页,讲稿共47张,创作于星期二总体样本同质变异参数统计量频率概率基本基本概概念念抽样第15页,讲稿共47张,创作于星期二总体样本第16页,讲稿共47张,创作于星期二 population and sample总体总体:根据研究目的确:根据研究目的确定的定的同质同质研究对象的研究对象的全全体体(集合)。分有限总(集合)。分有限总体与无限总体体与无限总体样本样本:从总体中随机抽:从总体中随机抽取的部分观察单位取的部分观察单位 总体样本第17页,讲稿共47张,创作于星期二同质与变异variationhomogeneity第18页,讲稿共47张,创作于星期二 同种族、性别、年龄的健康人,在相同条件下,测得其RBC、Hb、WBC等指标,存在很大差异:序号性别民族年龄红细胞计数血红蛋白白细胞1女汉204.81109/L136g/L6.431012/L2女汉203.67109/L115g/L8.951012/L3女汉204.15109/L128g/L5.061012/L第19页,讲稿共47张,创作于星期二住院号性别年龄疗程数xxxxxxxx男551xxxxxxxx女632xxxxxxxx男783变量观察个体108例高血压患者治疗后的临床记录例高血压患者治疗后的临床记录第20页,讲稿共47张,创作于星期二频数与概率probability frequency第21页,讲稿共47张,创作于星期二频率(frequency)某事件实际发生的次数与试验总次数的比值。由于观察的时间有长短,随机事件的发生与否也有随机性,所以在不同的试验中,同一个事件发生的频率可以彼此不相等。概率(probability)某事件发生的可能性的大小。如果该事件是必然事件,它发生的概率就是1,如果该事件是不可能事件,它发生的概率是0,随机事件发生的概率通常大于O且小于1。第22页,讲稿共47张,创作于星期二2323 实验者 投掷次数 出现“正面”次数 频率 甲 1 1 1.0000 乙 2 0 0.0000 丙 3 2 0.6667 丁 4 3 0.7500 戊 5 3 0.6000 己 6 2 0.4000 庚 7 4 0.5714 辛 4040 2048 0.5069 壬 12000 6019 0.5016 癸 24000 12012 0.5005抛硬币实验 假设在相同的条件下,独立进行n次重复试验,随着n逐渐增加,频率的摆动幅度越来越小,则该事件为随机事件,其频率可作为概率的估计值。第23页,讲稿共47张,创作于星期二 第24页,讲稿共47张,创作于星期二参数与统计量parameters statistic 第25页,讲稿共47张,创作于星期二参数参数(parameters):总体总体的统的统计指标,如总体均数、标准差,计指标,如总体均数、标准差,采用希腊字母分别记为采用希腊字母分别记为、。固定的常数固定的常数 总体总体样样本本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参 数数 推断推断inference统计量统计量(statistic):样本样本的统计指标,如样本均数、标准差,采用英文的统计指标,如样本均数、标准差,采用英文字母分别记为字母分别记为 。参数附近波动的随机变量参数附近波动的随机变量。第26页,讲稿共47张,创作于星期二误差error第27页,讲稿共47张,创作于星期二误差:误差:观察值与真实值之差非随机误非随机误差差随机误差随机误差随机测量误差随机测量误差抽样误差抽样误差系统误差系统误差过失误差过失误差误差误差误差误差 产生于设计人员。调产生于设计人员。调查者或调查对象,或者查者或调查对象,或者由于考虑不当、汇总计由于考虑不当、汇总计算有误等算有误等有倾向性有倾向性对研究结果有影响对研究结果有影响难用统计方法评价难用统计方法评价错误,一般应杜绝错误,一般应杜绝产生的根本原因:产生的根本原因:生物个生物个体的变异体的变异分布有规律性分布有规律性同一观察单位某项指标同一观察单位某项指标在同一条件下进行反复在同一条件下进行反复测量所产生的误差。测量所产生的误差。第28页,讲稿共47张,创作于星期二统计工作的基本步骤第29页,讲稿共47张,创作于星期二 基本步骤第30页,讲稿共47张,创作于星期二 根据研究目的 研究 收集 整理 分析 设计 资料 资料 资料 研究对象、日常工作 使资料系 用统计的 指标、例 记录、病 统化、便 方法分析 数、如何 历。专门 于进一步 资料、阐 得到准确 的调查和 统计分析 述规律、可信的数 实验 得出结论 据第31页,讲稿共47张,创作于星期二T检验方差分析卡方检验线性回归分析秩和检验生存分析常见的统计方法第32页,讲稿共47张,创作于星期二 根据研究目的 研究 收集 整理 分析 设计 资料 资料 资料 研究对象、日常工作 使资料系 用统计的 指标、例 记录、病 统化、便 方法分析 数、如何 历。专门 于进一步 资料、阐 得到准确 的调查和 统计分析 述规律、可信的数 实验 得出结论 据第33页,讲稿共47张,创作于星期二第34页,讲稿共47张,创作于星期二第35页,讲稿共47张,创作于星期二 根据研究目的 研究 收集 整理 分析 设计 资料 资料 资料 研究对象、日常工作 使资料系 用统计的 指标、例 记录、病 统化、便 方法分析 数、如何 历。专门 于进一步 资料、阐 得到准确 的调查和 统计分析 述规律、可信的数 实验 得出结论 据第36页,讲稿共47张,创作于星期二ExcelExcelSPSSSPSSSASSASEpiDataEpiData第37页,讲稿共47张,创作于星期二 为了研究DC-CIK免疫细胞治疗法治疗肺癌是否有效,将病人在完成细胞治疗一个疗程后外周血中的免疫标志物前后数值记录如下:根据研究目的和资料性质,选用相应的统计学方法进行分析。第38页,讲稿共47张,创作于星期二第39页,讲稿共47张,创作于星期二统计学在临床研究中的应用第40页,讲稿共47张,创作于星期二实例(观察对比)v19世纪中叶伦敦流行霍乱,Snow研究分析了伦敦不同地区霍乱死亡人数及伦敦宽街霍乱死亡病例标点地图后,提出霍乱病原存在与肠道,随粪便排出污染饮水,任何了被污染的水而感染发病。(这一结论距霍乱弧菌被人从粪便中分离出的时间早了30年。)第41页,讲稿共47张,创作于星期二实例(实验性研究)干预研究英国英国Lind医生医生效果评价法国医生Louis临床干预实验英国英国队列研究英国英国Doll和和Hill1747183519481960坏血病放血疗法治疗肺癌链霉素治疗肺结核吸烟与肺癌的关系第42页,讲稿共47张,创作于星期二临床医学上的两大未知数 疾病 药物第43页,讲稿共47张,创作于星期二调查某些疾病的发病率或人群分布为某些医学指标制定参考范围或为某些疾病的诊断与治疗制定标准评价某治疗方法与药物的有效性与安全性的研究探查某些疾病的发病原因的研究基因治疗研究 统计学在临床研究中的应用 对临床现有数据的分析描述 对临床试验的全程参与(总体设计,资料采集,资料整理,资料分析及最后结论)临床研究的类型统计学在临床研究中的主要应用临床研究的类型临床研究的类型第44页,讲稿共47张,创作于星期二 为了研究DC-CIK免疫细胞治疗法治疗肺癌是否有效,将病人在完成细胞治疗一个疗程后外周血中的免疫标志物前后数值记录如下:第45页,讲稿共47张,创作于星期二 表:患者在进行第一疗程治疗后外周血T淋巴细胞亚群及NK细胞变化的比较 p0.05,差异有统计学意义第46页,讲稿共47张,创作于星期二感感谢谢大大家家观观看看第47页,讲稿共47张,创作于星期二