统计学的基本概念及其工作步骤.pptx
本资料来源第一章第一章 绪论绪论卫生统计学教研室刘洪庆卫生统计学教研室刘洪庆 Email: Tel:13583625690学习目标1、掌握统计学基本知识、基本技能、基本、掌握统计学基本知识、基本技能、基本概念、基本方法。建立逻辑思维方法和提概念、基本方法。建立逻辑思维方法和提高分析问题的能力。高分析问题的能力。2、掌握统计工作的基本步骤。具有收集、掌握统计工作的基本步骤。具有收集、整理、分析统计资料的系统工作能力。整理、分析统计资料的系统工作能力。3、掌握统计研究资料的类型及相互转化。、掌握统计研究资料的类型及相互转化。一、卫生统计思维进化与概念一、卫生统计思维进化与概念概念概念 StatisticsA science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”“The science and art of dealing with variation in data through collection,classification,and analysis in such a way as to obtain reliable results”(A Dictionary of Epidemiology)统计学:是一门处理数据中变异性的统计学:是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。和表达数据,目的是求得可靠的结果。卫生统计学:是一门应用统计学方法卫生统计学:是一门应用统计学方法和原理研究卫生服务数据的收集、分析、和原理研究卫生服务数据的收集、分析、解释和表达的学科。解释和表达的学科。统计学的发展简史统计学的发展简史时期时期科学家科学家发明与应用发明与应用1749-1827Pierre-Simon Laplace研究概率研究概率(probability)。1745-1826Philippe Pinel应用概率研究疗效应用概率研究疗效1787-1872Louis 临床疗效,对照临床疗效,对照1822-1911 Francis Galton 分布与变异分布与变异卫生统计思维进化与概念卫生统计思维进化与概念时期时期科学家科学家发明与应用发明与应用1857-1936Karl Pearson现代统计学之父现代统计学之父相关分析,相关分析,x21880-1949Major Greenwood抽样误差抽样误差 1879-1940Raymond Pearl 医院统计,生物统计医院统计,生物统计(1890-1962 Ronald A.Fisher现代统计学奠基现代统计学奠基误差理论极大似然误差理论极大似然实验设实验设计计随机化做实验,随机化做实验,F检验检验 1897-1991 Hill 爵士爵士现代临床试验现代临床试验(clinical trial)1948年,年,英国发表了评价链霉素治疗肺结核疗效英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。计方法进行临床干预试验。1948年,郭祖超教授年,郭祖超教授(19121999)编著的)编著的医医学与生物统计方法学与生物统计方法,是我国第一部医学统计方,是我国第一部医学统计方法的教科书。法的教科书。统计软件实现统计软件实现;SAS and SPSS;SAS and SPSS统计学与公共卫生的关系统计学与公共卫生的关系统计学是得力工具:统计学是得力工具:统计设计:抽样、样本量、统计方法等统计设计:抽样、样本量、统计方法等 统计描述:群体事件的分布特征统计描述:群体事件的分布特征 统计推断:找危险因素、评价效果、决统计推断:找危险因素、评价效果、决策等策等 历史成就历史成就:John Graunt、William Farr(寿命表寿命表););John Snow(霍乱发生霍乱发生原因原因);Doll 和和Hill(吸烟与肺癌吸烟与肺癌)现代公共卫生对统计学的挑战现代公共卫生对统计学的挑战 疾病谱的变化需要新的统计方法疾病谱的变化需要新的统计方法:为了研究非感染性疾病的流行,人们发展了多因素分为了研究非感染性疾病的流行,人们发展了多因素分析、生存分析、疾病自然史的模型等现代统计方法析、生存分析、疾病自然史的模型等现代统计方法 学科交叉结合需要新的统计学方法:学科交叉结合需要新的统计学方法:如:人群药物代谢动力学与现代统计学几个分支的交如:人群药物代谢动力学与现代统计学几个分支的交叉结合,包括广义线性混合效应模型、非线性混合效应模叉结合,包括广义线性混合效应模型、非线性混合效应模型、等级和经验型、等级和经验Bayes方法等方法等 遗传流行病学需要遗传统计学方法;生物信息海量数据遗传流行病学需要遗传统计学方法;生物信息海量数据库的统计分析;卫生经济与决策的统计学方法。库的统计分析;卫生经济与决策的统计学方法。学点统计学,迎接新挑战学点统计学,迎接新挑战New England J.MedicineBritish Medical J.Lancet 70%国内优秀的医学杂志国内优秀的医学杂志 多数多数 应用的统计学知识应用的统计学知识 70%为基本理论和经典统计为基本理论和经典统计方法,较少部分为复杂的、新发展的统计理论方法,较少部分为复杂的、新发展的统计理论和技术,但出现错误最多的就是前一部分和技术,但出现错误最多的就是前一部分 某疾病某年各季度病人分布情况某疾病某年各季度病人分布情况季度季度人数人数构成(构成(%)第一第一4023.80第二第二3822.61第三第三5432.14第四第四3621.43急性中毒后合并感染组与非感染组之间的比较急性中毒后合并感染组与非感染组之间的比较组别组别例例数数使用抗生素使用抗生素 气管插管气管插管 尿管留置尿管留置例例数数百分率百分率(%)例例数数百分率百分率(%)例例数数百分率百分率(%)感染组感染组17642.91164.71694.1非感非感染组染组302076.9723.32066.7*(4.65/3.15)卫生统计学的主要内容卫生统计学的主要内容统统计计学学基基本本原原理理和和方方法法 包包括括资资料料的的收收集集、整整理理和分析的基本原理和方法。和分析的基本原理和方法。医医学学研研究究设设计计 包包括括观观察察性性研研究究中中的的现现场场调调查查、病病例例对对照照研研究究和和队队列列研研究究设设计计,实实验验研研究究中中的的临床试验、动物实验及实验室研究设计等。临床试验、动物实验及实验室研究设计等。统统计计学学的的应应用用 包包括括医医学学人人口口统统计计、生生命命统统计计及及疾病监测与控制中常用的综合评价方法。疾病监测与控制中常用的综合评价方法。卫生统计学包括卫生统计学包括健康统计健康统计卫生服务统计卫生服务统计医学人口统计医学人口统计疾病统计疾病统计生长发育统计生长发育统计卫生资源利用卫生资源利用医疗卫生服务需求医疗卫生服务需求医疗保健体制改革医疗保健体制改革二、统计学的基本概念二、统计学的基本概念总体与样本总体与样本同质与变异同质与变异随机变量与研究资料的类型随机变量与研究资料的类型医学研究中常用的测量尺度医学研究中常用的测量尺度参数与统计量参数与统计量误差误差频率与概率频率与概率总体、样本与个体总体、样本与个体 总体(总体(population)population)根根据据研研究究目目的的所所确确定定的的性性质质相相同同的的所所有有观观察察单位的某种变量值的集合。单位的某种变量值的集合。如如:调调查查某某地地19991999年年正正常常成成年年男男子子的的红红细细胞胞数数,则则观观察察对对象象是是该该地地19991999年年正正常常成成年年男男子子,总总体就是该地体就是该地19991999年正常成年男子的年正常成年男子的血红细胞数。血红细胞数。根据总体中观察单位数是否已知,分为:根据总体中观察单位数是否已知,分为:有有限限总总体体:有有确确定定的的时时间间、空空间间和和有有限限个个观观察单位,察单位,无无限限总总体体:没没有有确确定定的的时时间间、空空间间限限制制,观观察单位数为无限。察单位数为无限。个个体体(individual)individual):可可以以是是一一个个人人、一一个个动动物物、一一个个家家庭庭、一一个个地地区区、一一份份样样品品等等,是是科科学学研研究究的基本观察单位的基本观察单位。样本样本(sample)从总体中随机抽取的部分观察单位的某个变量的测量值所组从总体中随机抽取的部分观察单位的某个变量的测量值所组成的集合。成的集合。随机抽样(随机抽样(sampling)目的是用样本信息来推断总体特征,因此要保证样本的可靠目的是用样本信息来推断总体特征,因此要保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。这就要性和代表性,使样本能够充分地反映总体的真实情况。这就要求抽样要遵守随机化的原则,并保证足够的样本含量。求抽样要遵守随机化的原则,并保证足够的样本含量。随机抽样是保证总体中每一个观察单位均有同等机会被抽取。随机抽样是保证总体中每一个观察单位均有同等机会被抽取。样本含量样本含量:指样本中所包含的观察单位数。指样本中所包含的观察单位数。同质同质(homogeneity)总体中的个体具有相同的性质称为同质性,总体中的个体具有相同的性质称为同质性,它是进行统计分析的前提。它是进行统计分析的前提。统计分析是在一定数量的观察单位的基础上统计分析是在一定数量的观察单位的基础上进行的,这一定数量的观察单位在研究的主要进行的,这一定数量的观察单位在研究的主要方面必须具有相同的性质。方面必须具有相同的性质。比如,研究某地高血压病人的生活质量,研究对象比如,研究某地高血压病人的生活质量,研究对象必须是同质的,即都是同一地区的高血压病人。必须是同质的,即都是同一地区的高血压病人。如果不能满足同质的要求,那么研究资料就是杂乱如果不能满足同质的要求,那么研究资料就是杂乱无章的,便不能得出有用的信息和结论。无章的,便不能得出有用的信息和结论。同质是相对的,同质是相对的,研究对象只是在某一方面是性质相研究对象只是在某一方面是性质相同的,同类的观察对象之间往往也存在着变异。同的,同类的观察对象之间往往也存在着变异。比如,同一地区、同一年龄的男童的身高并非完全相比如,同一地区、同一年龄的男童的身高并非完全相同,而是千差万别、参差不齐的,这种参差不齐的情同,而是千差万别、参差不齐的,这种参差不齐的情况就是变异况就是变异。因个体差异引起的现象称为变异因个体差异引起的现象称为变异(variation)与同质的相对性不同,变异是绝对的、客观存在的,与同质的相对性不同,变异是绝对的、客观存在的,变异是生物界的基本特点变异是生物界的基本特点,也是生物界随机现象的根也是生物界随机现象的根本原因本原因,统计学就是通过对变异的研究来探讨生物随统计学就是通过对变异的研究来探讨生物随机现象内在规律的一门科学。机现象内在规律的一门科学。变量与随机变量变量与随机变量变变量量是是指指我我们们观观察察或或测测量量到到的的每每个个观观察察单单位位的的特特征征或或指指标标,对对观观察察单单位位的的各各个个变变量量的的观观察察结结果果称称为为变变量量值值或或观观察察值值,因因为为测测量量不不同同的的观观察察单单位位会会得得到到不不同同的的观观察察结结果果,所以称之为变量。所以称之为变量。变变异异是是生生物物个个体体的的共共有有特特征征,反反映映了了生生物物个个体体的的不不确确定定性性。在在测测量量观观察察单单位位的的变变量量值值之之前前,只只知知道道变变量量值值所所在在的的可可能能范范围围,并并不不知知道道其其具具体体取取值值情情况况,比比如如只只知知道道8岁岁男男童童的的身身高高可可能能在在50-150厘厘米米的的范范围围内内,但但不不能能确确定定某某个个男男童童的的具具体体身身高高,正正是是因因为为变变量量的的这这种种不不确确定定性性,概概率论中将其称为随机变量率论中将其称为随机变量。参数和统计量参数和统计量在在科科研研工工作作中中,通通过过对对样样本本中中的的观观察察单单位位的的变变量量值值进进行行统统计计分分析析所所得得到到的的统统计计指指标标称称为为统统计计量量。如如:样样本本均数、样本回归系数、样本标准差、样本率等。均数、样本回归系数、样本标准差、样本率等。参参数数是是反反映映总总体体特特征征的的统统计计指指标标,如如果果样样本本的的代代表表性性好好,那那么么统统计计量量与与相相应应的的参参数数的的数数值值非非常常接接近近,就就可可以以用用样样本本统统计计量量来来估估计计总总体体参参数数,所所以以样样本本的的统统计计量量也也称称为为参参数数的的估估计计值值,例例如如用用样样本本均均数数、样样本本回回归归系系数和样本率来估计总体均数、总体回归系数和总体率。数和样本率来估计总体均数、总体回归系数和总体率。误差误差 统计学研究中,将观察值(实际值)与真实值统计学研究中,将观察值(实际值)与真实值(理论值)之差称之为误差(理论值)之差称之为误差,由于生物个体的变由于生物个体的变异性等原因使得误差在医学领域中广泛存在。异性等原因使得误差在医学领域中广泛存在。误差按其产生的原因和性质可分为误差按其产生的原因和性质可分为:过失误差过失误差 系统误差系统误差 随机误差随机误差 不同的误差应采取不同的方法进行处理。不同的误差应采取不同的方法进行处理。1.过失误差过失误差过失误差是过失误差是由于观察者的错误造成的误差由于观察者的错误造成的误差,比如,比如观察者有意或无意的记录错误,计算错误,数据观察者有意或无意的记录错误,计算错误,数据核查、录入错误,度量衡单位错误,甚至故意修核查、录入错误,度量衡单位错误,甚至故意修改数据导致的错误。改数据导致的错误。过失误差在统计学研究中是不允许的,必须通过过失误差在统计学研究中是不允许的,必须通过加强调查、录入和分析人员的责任心,完善检查加强调查、录入和分析人员的责任心,完善检查核对制度等方法来避免和消除过失误差,以保证核对制度等方法来避免和消除过失误差,以保证数据和结果的真实性。数据和结果的真实性。2.系统误差系统误差系统误差是由于设计人员、受试者、观察者、研究者、系统误差是由于设计人员、受试者、观察者、研究者、仪器设备、研究方法及外部环境的非实验因素等原因的仪器设备、研究方法及外部环境的非实验因素等原因的影响造成的有一定的变化规律的误差。影响造成的有一定的变化规律的误差。总的来说,系统误差的产生原因复杂,而且不能通过适总的来说,系统误差的产生原因复杂,而且不能通过适当的统计方法来消除,所以对研究结果的影响很大。当的统计方法来消除,所以对研究结果的影响很大。但是系统误差一般是恒向、恒量的,且有其特定的变化但是系统误差一般是恒向、恒量的,且有其特定的变化规律,故可以通过严格、科学的实验设计将其减小或控规律,故可以通过严格、科学的实验设计将其减小或控制在最小范围之内。制在最小范围之内。3.随机误差随机误差随机误差是排除过失误差、系统误差之后尚存在的随机误差是排除过失误差、系统误差之后尚存在的误差,它由多种无法控制的因素引起的,大小和方误差,它由多种无法控制的因素引起的,大小和方向是随机变化的。向是随机变化的。尽管随机误差是不可避免的,但其以零为中心呈正尽管随机误差是不可避免的,但其以零为中心呈正态分布,所以可以利用概率统计学的方法对随机误态分布,所以可以利用概率统计学的方法对随机误差进行估计。差进行估计。随机误差包括抽样误差和随机测量误差两类。随机误差包括抽样误差和随机测量误差两类。抽样误差抽样误差是在随机抽样研究中,由于抽样而引起的是在随机抽样研究中,由于抽样而引起的样本统计量和总体参数之间的差异。抽样误差的大样本统计量和总体参数之间的差异。抽样误差的大小主要取决于个体之间变异程度的大小和样本含量小主要取决于个体之间变异程度的大小和样本含量的多少,变异程度越大,样本含量越小,抽样误差的多少,变异程度越大,样本含量越小,抽样误差就越大;反之亦然。就越大;反之亦然。随机测量误差随机测量误差指在同一条件下对同一观察单位的同指在同一条件下对同一观察单位的同一指标进行重复测量所产生的误差。由于医学技术一指标进行重复测量所产生的误差。由于医学技术水平的限制,随机测量误差目前也是无法避免的,水平的限制,随机测量误差目前也是无法避免的,只能尽量提高仪器设备的准确性和精密性来控制随只能尽量提高仪器设备的准确性和精密性来控制随机测量误差在容许的范围之内。机测量误差在容许的范围之内。频率与概率频率与概率 频率:某单位配蜂刺脱敏药,陆续试用于被蜂刺的患频率:某单位配蜂刺脱敏药,陆续试用于被蜂刺的患者,共计者,共计200人,其中人,其中180人用药后症状减轻。有效率人用药后症状减轻。有效率 80/200=0.90或或90%。这个数字是从反复实验与实际观察得来的。那么对于这个数字是从反复实验与实际观察得来的。那么对于另一个接受此治疗的病人,预计脱敏得可能性约为另一个接受此治疗的病人,预计脱敏得可能性约为90。就是说若有蜂刺患者。就是说若有蜂刺患者10人使脱敏药,预计约人使脱敏药,预计约9人可人可能有效。比值能有效。比值180/200是频率。是频率。用数学语言来表示,在用数学语言来表示,在n次随机试验中,随机事件次随机试验中,随机事件A发发生生k次,记次,记fn(A)=k/n,则称则称fn(A)为随机事件为随机事件A在在n次试验次试验中出现的频率中出现的频率。实践证明,当实验次数实践证明,当实验次数n逐渐增多时,逐渐增多时,fn(A)在一个常数在一个常数附近摆动。摆动的幅度随着附近摆动。摆动的幅度随着n的增大将愈来愈小,而逐的增大将愈来愈小,而逐渐稳定下来。这个常数是客观存在的,称为事件渐稳定下来。这个常数是客观存在的,称为事件A的概的概率,记作率,记作P(A),),概率表示随机事件发生可能性的大概率表示随机事件发生可能性的大小。小。频率稳定性是定义事件的概率的客观基础,它揭示了频率稳定性是定义事件的概率的客观基础,它揭示了隐藏在随机现象中的规律性,这种规律性就是通常所隐藏在随机现象中的规律性,这种规律性就是通常所说的统计规律性。说的统计规律性。实际应用中,常用实际应用中,常用n时的频率作为概率的估计值时的频率作为概率的估计值。随机事件概率的大小在随机事件概率的大小在0 与与1 之间。之间。P 值越接近值越接近1,表示某事件发生的可能性越大,表示某事件发生的可能性越大,P 值越接近值越接近0,表示某事件发生的可能性越小。,表示某事件发生的可能性越小。P=1,表示事件必然发生,表示事件必然发生,P=0,表示事件不可能发生,表示事件不可能发生,他们是确定性的,不是随机事件,但可把他们看成他们是确定性的,不是随机事件,但可把他们看成随机事件的特例。随机事件的特例。统计分析中的很多结论都是带有概率性的。统计分析中的很多结论都是带有概率性的。习惯上习惯上将将 P0.05,称为称为小概率事件小概率事件,表示在一次实验或观,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不察中该事件发生的可能性很小,可以视为很可能不发生。发生。三三、统计工作的基本步骤统计工作的基本步骤 1 1、研究设计(、研究设计(designdesign)资料的收集、整理和分析资料的收集、整理和分析的全过程进行总的设想和安排的全过程进行总的设想和安排 2.2.(collection of datacollection of data)采取措施取得准确可采取措施取得准确可靠的原始数据靠的原始数据 要求:准确、及时要求:准确、及时 来源来源 (1 1)统计报表)统计报表 (2 2)经常性工作记录)经常性工作记录 (3 3)专题调查或实验)专题调查或实验 3 3、整整理理资资料料(sorting sorting of of datadata)净净化化原原始始数数据据,利于计算和分析利于计算和分析4 4、分析资料(、分析资料(analysis of dataanalysis of data)计算指标,反计算指标,反映特征,揭示规律映特征,揭示规律 统统计计描描述述(descriptive descriptive statisticsstatistics)利利用用统统计计指指标标、统统计计图图表表等等,对对资资料料的的数数量量特特征征及及其其分分布规律进行测定和描述布规律进行测定和描述 统计推断(统计推断(inferential statisticsinferential statistics)包括如包括如何抽样,以及如何由样本信息推断总体特征何抽样,以及如何由样本信息推断总体特征四四、研究资料的类型、研究资料的类型定量变量、数值变量计量资料定量变量、数值变量计量资料定性变量、分类变量计数资料定性变量、分类变量计数资料1.定量变量定量变量/计量资料计量资料/数值变量资料数值变量资料定量变量是用仪器、工具或其它定量方法进行测定量变量是用仪器、工具或其它定量方法进行测定或衡量所取得的数据。定或衡量所取得的数据。其变量值是定量的,表现为大小不等的数值,可其变量值是定量的,表现为大小不等的数值,可以由区间尺度、比数尺度测得。以由区间尺度、比数尺度测得。定量变量一般带有度量衡单位,如身高(定量变量一般带有度量衡单位,如身高(cm)、)、体重(体重(kg)、)、白细胞计数(白细胞计数(109/L)、)、血压血压(kPa)、)、龋齿个数等。龋齿个数等。由一组同质的定量变量所组成的资料称为计量资由一组同质的定量变量所组成的资料称为计量资料,计量资料的各个观察值之间有量的区别,没料,计量资料的各个观察值之间有量的区别,没有性质的不同。有性质的不同。2.定性变量定性变量/计数资料计数资料/分类变量资料分类变量资料其其变变量量值值是是定定性性的的,表表现现为为无无不不相相容容的的类类别别或或属性,一般由名义尺度测得。属性,一般由名义尺度测得。定定性性变变量量的的属属性性指指标标的的分分类类是是无无序序的的,这这是是定定性变量与顺序变量的区别所在。性变量与顺序变量的区别所在。由由同同质质的的定定性性变变量量组组成成的的资资料料称称为为计计数数资资料料,计计数数资资料料是是按按照照事事物物的的属属性性分分组组,然然后后清清点点各各组组的的观观察察单单位位个个数数得得到到的的资资料料,各各观观察察单单位位之之间一般没有量的区别,但有质的不同。间一般没有量的区别,但有质的不同。计计数数资资料料的的变变量量值值只只能能代代表表事事物物的的某某些些属属性性或或分类,不能反映程度上的差别。分类,不能反映程度上的差别。定性变量的分类定性变量的分类如如果果变变量量只只有有相相互互独独立立的的两两种种属属性性,称称为为二二分分类类变变量量,这这是是最最简简单单的的数数据据类类型型,如如性性别别有有男男或或女女;检检查查乙乙肝肝表表面面抗抗原原的的携携带带情情况况,有有阳阳性性或或阴阴性性;给给小小白鼠注射药物,其结局有生存或死亡等。白鼠注射药物,其结局有生存或死亡等。如如果果变变量量的的观观察察结结果果表表现现为为相相互互独独立立的的多多种种属属性性,称称为为多多分分类类变变量量,比比如如血血型型分分为为相相互互独独立立的的四四类类:A型型、B型型、O型型和和AB型型,肺肺癌癌可可分分为为腺腺癌癌、鳞鳞癌癌、腺腺鳞鳞癌癌、未未分分化化癌癌、类类癌癌和和支支气气管管腺腺癌癌等等,各各类类之之间只有性质的不同,没有大小和程度上的差别。间只有性质的不同,没有大小和程度上的差别。顺序变量等级资料顺序变量等级资料顺顺序序变变量量的的观观察察结结果果由由顺顺序序尺尺度度测测得得。顺顺序序变变量量可可以以体体现现程程度度上上的的不不同同,但但是是不不能能精精确确地地测测量相邻的两个变量值之间的差别。量相邻的两个变量值之间的差别。由由同同质质的的顺顺序序变变量量组组成成的的资资料料称称为为等等级级资资料料,它它是是介介于于计计量量资资料料和和计计数数资资料料之之间间的的半半定定量量观观察结果,通常有两个以上的等级。察结果,通常有两个以上的等级。等等级级资资料料也也是是先先将将观观察察单单位位按按照照某某种种属属性性或或某某个个标标志志分分组组,然然后后清清点点各各组组观观察察单单位位的的数数目目得得来来的的,但但是是所所分分的的各各组组之之间间有有等等级级的的顺顺序序,各各个个类类别别之之间间存存在在着着大大小小和和程程度度上上的的差差别别,这这一一点不同于计数资料。点不同于计数资料。3.连续型资料和离散型资料连续型资料和离散型资料连连续续型型资资料料 理理论论上上在在任任何何两两个个连连续续型型数数据据之之间间都都还还有有无无穷穷多多个个数数据据,只只要要测测量量仪仪器器足足够够精精确确,连连续续型型数数据据可可以以精精确确到到小小数数点点后后第第无无限限位位,比比如如体体重重,在在60.1和和60.2kg之间理论上存在着无限多个数据。之间理论上存在着无限多个数据。离离散散型型资资料料 往往往往是是一一种种计计数数,比比如如心心率率、脉脉搏搏、儿儿童童龋龋齿齿个个数数、血血小小板板数数、某某年年某某地地交交通通事事故故死死亡亡人人数数等等,这这种种计计数数只只能能是是0和和正正整整数数,不不会会是是负负数数,也没有小数点。也没有小数点。4.资料的转化资料的转化 变量转化:变量只能由高级向低级转化:变量转化:变量只能由高级向低级转化:离散型变量常常通过适当的变换或连续性校离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。正后借用连续型变量或有序变量的方法来分析。连续型连续型有序有序分类分类二值二值小小 结结1、卫生统计学的基本概念卫生统计学的基本概念总体与样本、同质与变异、参数与统计量总体与样本、同质与变异、参数与统计量误差误差频率与概率频率与概率2、统计工作的基本步骤、统计工作的基本步骤3、统计研究资料的类型、统计研究资料的类型练习题练习题:1.统计工作的基本步骤是什么统计工作的基本步骤是什么?2.统计资料分为几类统计资料分为几类?特点特点?判断:大学教授的年收入,欧洲的国家数,血判断:大学教授的年收入,欧洲的国家数,血红蛋白含量,患病人数等。红蛋白含量,患病人数等。3.什么是总体什么是总体?什么是样本什么是样本?4.基本的概率抽样方法是什么基本的概率抽样方法是什么?5.什么是抽样误差什么是抽样误差?如何减小如何减小?能否避免能否避免?