第一节统计学方法概述精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第一节统计学方法概述精选PPT.ppt》由会员分享,可在线阅读,更多相关《第一节统计学方法概述精选PPT.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节统计学方法概述第一节统计学方法概述4/18/20231第1页,本讲稿共65页 “统计统计”一词,对一般人来说并不陌生。一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计数字、统计绩的数字、表、图,称为统计数字、统计表和统计图。表和统计图。在西方,统计学(在西方,统计学(statistics)statistics)一词,一词,源出于源出于state(state(国家、情况),专指有关国家、情况),专指有关“国国情情”的学问,最初多用于文字记叙,后发展的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法
2、的引为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。备的独立学科。4/18/20232第2页,本讲稿共65页 1.某年级甲班、乙班各有男生某年级甲班、乙班各有男生5050人。从人。从两个班各抽取两个班各抽取1010人测量身高,如果甲班的平人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?平均身高也大于乙班?为什么?2用用A A,B B两种药物分别治疗同病患者各两种药物分别治疗同病患者各5050人,如果人,如果A A药的治愈率(药的治
3、愈率(60%60%)高于)高于B B药药(50%50%),证明),证明A A药的疗效优于药的疗效优于B B药。这种说药。这种说法对吗?为什么?法对吗?为什么?思考题第3页,本讲稿共65页如何学习医学统计学如何学习医学统计学1、掌掌握握基基本本概概念念、基基本本原原理理和和基基本本方方法法。培培养统计思维能力。养统计思维能力。2、掌掌握握常常用用统统计计分分析析方方法法。对对统统计计公公式式,要要求求了了解解其其用用途途、适适用用条条件件和和注注意意事事项项。切切忌忌死记硬背,关键是灵活运用。死记硬背,关键是灵活运用。3、重重视视习习题题课课。联联系系实实际际,紧紧密密结结合合专专业业知知识,多
4、做练习题。识,多做练习题。4/18/20235第5页,本讲稿共65页 例:例:北京某医院某大夫使用北京某医院某大夫使用“乌贝散乌贝散”(乌贼骨(乌贼骨3钱,白芨钱,白芨3钱,川贝钱,川贝3钱钱,甘草甘草3钱钱,共共研细末过研细末过120目筛,冲服)治疗胃溃疡病出血目筛,冲服)治疗胃溃疡病出血107例,有效例,有效101例,有效率为例,有效率为94.4%。那么如。那么如果别的医院,其它大夫使用果别的医院,其它大夫使用“乌贝散乌贝散”来治来治疗胃溃疡病出血,其有效率也一定是疗胃溃疡病出血,其有效率也一定是94.4%吗吗?显然,不一定恰为?显然,不一定恰为94.4%,那么是多少呢,那么是多少呢?比它
5、高还是比它低?这就是一个求可信区?比它高还是比它低?这就是一个求可信区间的问题。间的问题。4/18/20238第8页,本讲稿共65页 例:某杂志中一篇文章报导,用某种中例:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为草药治疗玫瑰糠疹,有效率为78,平均疗,平均疗程为三周左右。问此药治疗玫瑰糠疹的确程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的些患者也会自愈。所以,此药的78疗效疗效有待探讨。有待探讨。这就要求设立具有可比性
6、的对照组。这就要求设立具有可比性的对照组。4/18/20239第9页,本讲稿共65页 再譬如,用某药治某病,治一例有效,再譬如,用某药治某病,治一例有效,能说能说100有效吗?治疗二例有效,能说明有效吗?治疗二例有效,能说明100有效吗?治十例,其中九例有效,能有效吗?治十例,其中九例有效,能说说90有效吗?显然,观察的例数将是个重要有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。少例能说明问题?这是一个样本可
7、靠性问题。4/18/202310第10页,本讲稿共65页s 一些现象既有规律性又有随机性,肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性,而绝非每个吸烟的人都会患肺癌,这体现了随机性;s 再如,一般来说,白种人身材比黄种人要高些,这就是规律性,但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性。4/18/202311第11页,本讲稿共65页第一节第一节 统计学方法概述统计学方法概述s一、统计学的意义一、统计学的意义s统计学统计学是运用数理统计的原理和方法,研究数据资料的搜是运用数理统计的原理和方法,研究数据资料的搜集、整理、分析与推断的科学,是认识社会和自然现象客集、整
8、理、分析与推断的科学,是认识社会和自然现象客观规律的数量特征的重要工具。观规律的数量特征的重要工具。s医学统计学医学统计学 是认识医学现象数量特征的重要工具,是运是认识医学现象数量特征的重要工具,是运用数理统计的原理和方法,结合医学实际,来研究医学科研用数理统计的原理和方法,结合医学实际,来研究医学科研的的实验设计实验设计和和数据处理数据处理的一门科学。的一门科学。s“医学统计学是处理医学资料中的医学统计学是处理医学资料中的同质性同质性(homogeneity)和)和变变异性异性(variation)的科学与艺术)的科学与艺术”4/18/202312第12页,本讲稿共65页二、统计学中的几个基
9、本概念(一)(一)同质与变异同质与变异(二)(二)总体与样本总体与样本(三)(三)参数与统计量参数与统计量(四)(四)误差误差(五)(五)概率概率4/18/202313第13页,本讲稿共65页(一)同质与变异 homogeneity and variation s同质:指观察单位(研究个体)间被研究指标的影响因素相同。s个体:即观察单位,是统计研究中的最基本单位。s变量:观察单位的研究特征s变量值:变量的观察结果s变异:指同质的个体之间的差异。4/18/202314第14页,本讲稿共65页 同质与变异的例子同质与变异的例子s例例1 调查调查2008年淄博市年淄博市7岁男童的身高岁男童的身高和体
10、重和体重同质同质:2008年、淄博市、年、淄博市、7岁男童岁男童变异变异:身高和体重各不相同:身高和体重各不相同s例例2 研究某降压药的疗效研究某降压药的疗效同质同质:高血压患者、用某药治疗:高血压患者、用某药治疗变异变异:疗效各不相同:疗效各不相同4/18/202315第15页,本讲稿共65页(二)(二)总体与样本总体与样本 population and sample总体总体:根据研究目的所确定:根据研究目的所确定的的同质同质观察单位某项变量值观察单位某项变量值的集合(的集合(全体全体)。)。分有限总体与无限总体分有限总体与无限总体样本样本:从总体中随机抽取:从总体中随机抽取的部分观察单位变
11、量值的的部分观察单位变量值的集合。集合。4/18/202318第18页,本讲稿共65页随机抽样随机抽样 random sampling为了保证样本的为了保证样本的可靠可靠性性和和代表性代表性,需要采,需要采用随机的抽样方法用随机的抽样方法(在总体中每个个体(在总体中每个个体具有具有相同的机会相同的机会被抽被抽到)。到)。4/18/202319第19页,本讲稿共65页(三)参数与统计量 parameter and statistic参数参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数固定的常数 总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量
12、 参参参参 数数数数 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记为 。参数附近波动的随机变量参数附近波动的随机变量。4/18/202320第20页,本讲稿共65页(四)误差 error误差误差:泛指实验数据的:泛指实验数据的实测实测值值与与真实值真实值之差之差1 系统误差系统误差2 随机测量误差随机测量误差3抽样误差抽样误差4/18/202321第21页,本讲稿共65页系统误差 systematic error 在实际观测过程中,由受试对象、研究者、仪器设在实际观测过程中,由受试对象、研
13、究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为倾向性或规律性的误差。流行病学称之为偏倚偏倚(bias)。)。特点:观察值特点:观察值系统性系统性、方向性方向性、周期性周期性的偏离的偏离真值。真值。可以通过严格的可以通过严格的实验设计实验设计和和技术措施技术措施消除。消除。4/18/202322第22页,本讲稿共65页s2随机测量误差随机测量误差(random error of measurement)或称偶然误差,是指排除)或称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的了系统误差后尚存的
14、误差。它受多种因素的影响,使观察值不按方向性和系统性而随机影响,使观察值不按方向性和系统性而随机地变化。地变化。s随机测量误差服从随机测量误差服从正态分布正态分布,可以用概率统,可以用概率统计方法处理。计方法处理。4/18/202323第23页,本讲稿共65页s3抽样误差抽样误差(sampling error)s 我们从同一总体中随机抽取若干个例数我们从同一总体中随机抽取若干个例数相同的样本,其样本统计量之间会有所不同。相同的样本,其样本统计量之间会有所不同。这种由于随机抽样所引起的样本统计量与总这种由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的体参数之间的差异以及各
15、样本统计量之间的差异,统计上称为差异,统计上称为抽样误差抽样误差。s 抽样误差在医学生物实验中最主要的来抽样误差在医学生物实验中最主要的来源是个体的变异。所以这是一种难以控制的、源是个体的变异。所以这是一种难以控制的、不可避免的误差。但抽样误差是有一定规律不可避免的误差。但抽样误差是有一定规律的。的。4/18/202324第24页,本讲稿共65页(五)(五)概率概率probability 确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定不会发会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的生的现象。其表现结果为两种事件:肯定发生某种结果的叫叫必然事件
16、必然事件;肯定不发生某种结果的叫;肯定不发生某种结果的叫不可能事件不可能事件。随机现象随机现象:在同样条件下:在同样条件下可能可能会出现两种或多种结果,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为究竟会发生哪种结果,事先不能确定。其表现结果称为随随机事件机事件。随机事件的特征:随机事件的特征:随机性随机性;规律性规律性:每次发:每次发生的可能性的大小是确定的。生的可能性的大小是确定的。概率:概率:随机事件发生的可能性大小,用大写的随机事件发生的可能性大小,用大写的P P表示;取值表示;取值00,11。4/18/202325第25页,本讲稿共65页必然事件必然事件 P
17、P=1 =1 不可能事件不可能事件 P P=0 =0 随机事件随机事件 0 0 P P 1 1 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称称为为小概率事件小概率事件(习惯习惯),统计学上认为不大可能发,统计学上认为不大可能发生。生。小概率事件4/18/202326第26页,本讲稿共65页 样本的实际发生率称为样本的实际发生率称为频率频率。设在相同条。设在相同条件下,独立重复进行件下,独立重复进行N次试验,事件次试验,事件A出现出现n次,次,则事件则事件A出现的频率为出现的频率为f=n/N。频率与概率间的关系:频率与概率间的关系:概率是参数,频率是统计量;概
18、率是参数,频率是统计量;频率总是围绕概率上下波动;频率总是围绕概率上下波动;样本含量样本含量n越大,波动幅度越小,频率越接近越大,波动幅度越小,频率越接近概率。概率。频率 frequency4/18/202327第27页,本讲稿共65页三 统计资料的类型(一)(一)数值变量资料数值变量资料(二)(二)分类变量资料分类变量资料(三)(三)变量间转化变量间转化4/18/202328第28页,本讲稿共65页住院号年龄岁身高cm体重kg住院天数d职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06
19、管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesnumerical variable numerical variable data data 数值变量资料数值变量资料Categorical variable Categorical variable
20、 data data 分类变量资料分类变量资料Units;elements4/18/202329第29页,本讲稿共65页(一)数值变量资料 numerical variable data 用定量 方法测定观察单位(个体)某项指标数值的大小,所得的资料,称数值变量资料。也叫定量资料Quantitative data或计量资料特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L);资料之间具连续性。4/18/202330第30页,本讲稿共65页(二)分类变量(二)分类变量资料资料categorical variable data 将观察单位按
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一节 统计学 方法 概述 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内