第一统计数据的收集和整理课件.ppt
第一统计数据的收集和整理第1页,此课件共119页哦生物统计学授课人:授课人:陈建中陈建中E-mail:第2页,此课件共119页哦 生生 物物 统统 计计 学学 1.理解生物统计学基本原理和统计分析方法,学会如何进行科学的试验设计,掌握常用的统计学软件的使用2.教材:李春喜等 编著,2008,生物统计学(第四版),科学出版社。第3页,此课件共119页哦第第 一一 次次 统计数据的收集和整理统计数据的收集和整理第第 二二 次次 概率与概率分布以及常见的概率分布概率与概率分布以及常见的概率分布第第 三三 次次 抽样分布和统计推断抽样分布和统计推断第第 四四 次次 参数估计和拟合度检验参数估计和拟合度检验第第 五五 次次 单因素方差分析单因素方差分析第第 六六 次次 多因素方差分析 第第 七七 次次 直线回归与相关分析直线回归与相关分析第第 八八 次次 试验设计与统计分析试验设计与统计分析 SpssSpss软件在生物统计学中的应用(软件在生物统计学中的应用(8 8学时)学时)教学计划(学时安排)教学计划(学时安排)第4页,此课件共119页哦第一章第一章 统计数据的收集和整理统计数据的收集和整理第5页,此课件共119页哦主要内容n n生物统计学的概述定义、作用、发展简史n n统计学中几个基本概念总体、样本、个体、抽样n n数据类型及频率分布连续和离散数据 频数频率分布图n n样本的典型参数平均数 标准差 偏斜度和崤度 变异系数第6页,此课件共119页哦一、生物统计学的概述1.1.生物统计学定义2.2.生物统计学的主要内容3.3.生物统计学的作用4.4.生物统计学的发展简史第7页,此课件共119页哦 统计学统计学(StatisticsStatistics)是把是把数学的语言数学的语言引入引入具体具体的科学领域的科学领域,将所研究的问题,将所研究的问题抽象抽象为数学问题的过程为数学问题的过程,是是收集收集、分析分析、列示列示和和解释解释数据的一门科学。数据的一门科学。统计学被广泛地应用于解决统计学被广泛地应用于解决自然科学自然科学和和社会科学社会科学各各个领域中具体的个领域中具体的随机现象随机现象的规律性,形成了应用于各的规律性,形成了应用于各个学科领域的统计学,即个学科领域的统计学,即应用统计学应用统计学。第8页,此课件共119页哦生物统计学概念生物统计学概念 生物统计学(Biostatistics)是数理统是数理统计在生物学研究中的应用,它是应用数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统象和试验调查资料的一门学科。属于应用统计学的一个分支。计学的一个分支。第9页,此课件共119页哦在对事物的研究过程中,人们往往是通过某事物的一部分(样本),来估计事物全部(总体)的特征,目的是为了以样本的特征对未知总体进行推断,从特殊推导一般,对所研究的总体作出合乎逻辑的推论,得到对客观事物的本质和规律性的认识。在生物学研究中,我们所期望的是总体,而不是样本。但是在具体的试验过程中,我们所得到的却是样本而不是总体。因此,从某种意义上讲,生物统计学是研究生命过程中以样本来推断总体样本来推断总体的一门学科。生物统计学生物统计学是研究生命过程中以样本推断总体的一门学科。是研究生命过程中以样本推断总体的一门学科。第10页,此课件共119页哦生生生生 的的的的物物物物 基基基基统统统统 本本本本计计计计 内内内内学学学学 容容容容试试试试 验验验验 设设设设 计计计计Experiment designExperiment design统统统统 计计计计 分分分分 析析析析Statistical analysisStatistical analysis基本原则基本原则方案制定方案制定常用试验设计常用试验设计资料的搜集和整理资料的搜集和整理数据特征数的计算数据特征数的计算统计推断统计推断方差分析方差分析回归和相关分析回归和相关分析协方差分析协方差分析主成分分析主成分分析聚类分析聚类分析对比设计对比设计随机区组设计随机区组设计平衡不完全区组设计平衡不完全区组设计裂区设计裂区设计拉丁方设计拉丁方设计正交设计正交设计生物统计学的内容与作用生物统计学的内容与作用如何合理地进行调查或试验设计如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的规律性。第11页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供整理和描述数据资料的科学方法,确定某些性提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。状和特性的数量特征。运用显著检验,判断试验结果的可靠性或可行性。运用显著检验,判断试验结果的可靠性或可行性。提供由样本推断总体的方法提供由样本推断总体的方法。提供试验设计的的一些重要原则提供试验设计的的一些重要原则。第12页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供整理和描述数据资料的科学方法,确定某些性提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。状和特性的数量特征。原始的数据和资料,杂乱无章原始的数据和资料,杂乱无章,生物统计学提供一套生物统计学提供一套完整科学系统的分析分析方法,能够在众多数据中完整科学系统的分析分析方法,能够在众多数据中提炼出有价值的东西提炼出有价值的东西第13页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:运用显著检验,判断试验结果的可靠性或可行性。运用显著检验,判断试验结果的可靠性或可行性。无论实验条件如何严格控制,总是无法避免无论实验条件如何严格控制,总是无法避免随机误差。所以当拿到实验结果后,首先要随机误差。所以当拿到实验结果后,首先要判定数据的可靠性!换句话说就是要分离误判定数据的可靠性!换句话说就是要分离误差产生的原因:是处理导致还是环境导致,差产生的原因:是处理导致还是环境导致,还是系统误差等等还是系统误差等等第14页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供由样本推断总体的方法提供由样本推断总体的方法。由样本推断总体这是生物统计学的总体思路,具体由样本推断总体这是生物统计学的总体思路,具体落实需要一套完整的推断方案落实需要一套完整的推断方案。第15页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供试验设计的的一些重要原则提供试验设计的的一些重要原则。实验设计有三个原则:随机,重复和局部控制实验设计有三个原则:随机,重复和局部控制我们力求以较少的人力财力获得较多的数据我们力求以较少的人力财力获得较多的数据同时我们也能看到由于实验设计不但,导致实验丧同时我们也能看到由于实验设计不但,导致实验丧失大量的数据,或者实验设计就不科学!没有代表失大量的数据,或者实验设计就不科学!没有代表性性第16页,此课件共119页哦生物统计学的任务生物统计学的任务新药物旧药物不同剂量性能试验不同剂量对照试验结果是结果是?问题:最适使用剂量分别是多少?新药物比旧药物治愈率高吗?1.试验如何设计?2.数据如何整理、分析呢?3.结果是什么?可靠性有多高?4.结论如何?新药是否可生产?第17页,此课件共119页哦课外活动:生物统计方法在生物学学术刊物中的应用情况第18页,此课件共119页哦学习生物统计的方法和要求1.掌握统计的基本原理、基本公式和应用条件。2.做好习题作业。3.培养科学的统计思维方法。4.结合所学专业,联系实际。第19页,此课件共119页哦J.Bernoulli(贝努里,瑞士,贝努里,瑞士,16541705)系统论证了“大数定律”,即样本容量越大,样本统计数与总体参数之差越小。P.S.Laplace(拉普拉斯,法国,拉普拉斯,法国,17491827)最早系统的把概率论方法运用到统计学研究中去,建立了严密的概率数学理论,提出“拉普拉斯定理”,并应用到人口统计、天文学等方面的研究上。初步建立了大样本推断的理论基础,为后人开创了抽样调查的方法。一、古典记录统计学一、古典记录统计学(17(17世纪中叶至世纪中叶至1919世纪中叶世纪中叶)生物统计学发展概况第20页,此课件共119页哦Gauss(高斯,德国,高斯,德国,17771855)正态分布理论最早由De Moiver于1733年发现,后来Gauss在进行天文观察和研究土地测量误差理论时又一次独立发现了正态分布(又称常态分布)的理论方程,提出“误差分布曲线”,后人为了纪念他,将正态分布也称为Gauss分布。另外,他还完成了最小二乘法的研究,正式发表于1809年。第21页,此课件共119页哦F.Galton(高尔登,英国,高尔登,英国,18221911)19世纪末统计学开始用于生物学的研究。1882年Galton开设“人体测量实验室”,测量9337人的资料,探索能把大量数据加以描述与比较的方法和途径,引入了中位数以及分布、相关、回归等重要的统计学概念与方法。1889年发表第一篇生物统计论文自然界的遗传。1901年Galton和他的学生Pearson创办了“Biometrika(生物统计学报)”杂志,首次明确“Biometry(生物统计)”一词。所以后人推崇GaltonGalton为生物统计为生物统计学的创始人学的创始人。二、近代描述统计学(19世纪中叶至世纪中叶至20世纪上半叶世纪上半叶)第22页,此课件共119页哦K.Pearson(卡(卡.皮尔逊,英国,皮尔逊,英国,18571936)Pearson的一生是统计研究的一生。他首创频数分布表与频数分布图,如今已成为最基本的统计方法之一;观察到许多生物的度量并不呈现正态分布,利用相对斜率得到矩形分布、J型分布、U型分布或铃型分布等;1900年独立发现了X2分布,提出了有名的卡方检验法,后经Fisher补充,成为小样本推断统计的早期方法之一;Pearson对“回归与相关”进一步作了发展,在18971905年,Pearson还提出复相关、总相关、相关比等概念,不仅发展了Galton的相关理论,还为之建立了数学基础。第23页,此课件共119页哦W.S.Gosset(歌赛特,英国,歌赛特,英国,18761937)在生产实践中对样本标准差进行了大量研究。于1908年以“Student(学生)”为笔名在该年的Biometrika上发表了论文平均数的概率误差,创立了小样本检验代替大样本检验的理论,即t分布和t t检验法检验法,也称为学生式分布。t检验已成为当代生物统计工作的基本工具之一,为多元分析理论的形成和应用奠定了基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。三、现代推断统计学(始于始于20世纪初世纪初)第24页,此课件共119页哦 R.A.Fisher(费歇尔,英国,费歇尔,英国,18901962)Fisher一生论著颇多,共写了329篇。他跨进统计学界是从研究概率分布开始的,1923年发展了显著性检验及估计理论,提出了F分布和F检验,1918年在孟德尔遗传试验设计间的相对关系一文中首创“方差”和“方差分析”两个概念,1925年提出随机区组和拉丁方试验设计,并在卢桑姆斯坦德农业试验站得到检验与应用,他还在试验设计中提出“随机化”原则,1938年和Yates合编了Fisher Yates随机数字表。第25页,此课件共119页哦另外,另外,Neyman(18941981)和E.Pearson进行了统计理论研究,分别与1936和1938年提出一种统计假说检验学说。P.C.Mabeilinrobis对作物抽样调查、A.Waecl对序贯抽样、Finney对毒理统计、K.Mather对生统遗传学、F.Yates对田间试验设计等都作出了杰出贡献。第26页,此课件共119页哦统计学在中国的传播统计学在中国的传播 我国在解放前,社会经济发展缓慢,统计的应用和发展受到了很大的限制。1913年,顾澄教授(1882?)翻译了英国统计学家尤尔的著作统计学之理论(1911),即为英美数理统计学传入中国之始。之后又有一些英美统计著作被翻译成中文,Fisher的理论和方法也很快传入中国。在20世纪30年代,生物统计与田间试验就作为农学系的必修课,1935年王绶(18761972)编著出版的实用生物统计法是我国出版最早的生物统计专著之一。随后1942年范福仁出版了田间试验技术等,这些对推动我国农业生物统计和田间试验方法的应用都产生了很大影响。第27页,此课件共119页哦 新中国成立后,许多学者翻译、编著了统计学论著,有力的推动了数理统计方法在中国的普及和应用。1978年12月国家统计局在四川峨眉召开了统计教学、科研规划座谈会,全面引进了前苏联的社会经济统计理论和统计制度,对我国社会经济统计学的发展起到了一定的积极作用。1984年年1月月1日颁布实施日颁布实施中华人民共和国统计法中华人民共和国统计法,1987年2月国家统计局又发布中华人民共和国统计法实施细则,1996年5月八届人大十九次会议通过了关于修改的决定。统计电算程序SAS(Statistical Analysis System)、SPSS(Statistical Package for Social Science)、Excel、DPS(试验设计design of experiment数据处理processing of data模型建立simulation analysis)等的引进,统计学在中国的应用与研究出现了崭新的局面。第28页,此课件共119页哦二、统计学中几个基本概念1.1.总体、个体和样本以及抽样2.2.变量与常量3.3.参数与统计数4.4.效应与互作5.5.误差与错误6.6.准确性和精确性第29页,此课件共119页哦一、总体与样本一、总体与样本一、总体与样本一、总体与样本具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为总体总体总体总体 (population)(population),它是指研究对象的全体;,它是指研究对象的全体;,它是指研究对象的全体;,它是指研究对象的全体;组成总体的基本单元称为组成总体的基本单元称为组成总体的基本单元称为组成总体的基本单元称为个体个体个体个体(individual)(individual);(总体中的一个研究单位);(总体中的一个研究单位);(总体中的一个研究单位);(总体中的一个研究单位)从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为样本样本样本样本(sample)(sample);(总体中的一部分);(总体中的一部分);(总体中的一部分);(总体中的一部分)总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:含有有限个个体的总体称为含有有限个个体的总体称为含有有限个个体的总体称为含有有限个个体的总体称为有限总体有限总体有限总体有限总体(finitude popufinitude popul lationation););););包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为无限总体无限总体无限总体无限总体(infinitude popuinfinitude popul lationation).第30页,此课件共119页哦统计推断统计推断总总 体体样本样本随机抽样随机抽样总体研究的目的是要了解总体,观测到的是样本,通过样本来推断总体是统计分析的基本特点。第31页,此课件共119页哦 构成样本的每个个体称为构成样本的每个个体称为构成样本的每个个体称为构成样本的每个个体称为样本单位样本单位样本单位样本单位;样本中所包含的个体数目叫;样本中所包含的个体数目叫;样本中所包含的个体数目叫;样本中所包含的个体数目叫样本容量样本容量样本容量样本容量或或或或样本大小样本大小样本大小样本大小(sample size)(sample size),样本容量常记为,样本容量常记为,样本容量常记为,样本容量常记为n n。一般在生物学研究中,通常把一般在生物学研究中,通常把一般在生物学研究中,通常把一般在生物学研究中,通常把n n3030的样本叫的样本叫的样本叫的样本叫小样本小样本小样本小样本,n n 3030的样本叫的样本叫的样本叫的样本叫大样本大样本大样本大样本。对于小样本和大样本,在一些统计数的计算和分析检验上是不一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。样的。样的。样的。研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,通过样通过样通过样通过样本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点。第32页,此课件共119页哦抽样n n从总体中获得样本的过程叫抽样(sampling)n n抽样的目的:通过抽取的样本来研究总体n n随机抽样n n放回式抽样 非放回式抽样第33页,此课件共119页哦二、变量与常数二、变量与常数二、变量与常数二、变量与常数 变量变量,或变数,指相同性质的事物间表现差异性或差,或变数,指相同性质的事物间表现差异性或差异特征的数据。异特征的数据。常数常数,表示能代表事物特征和性质的数值,通常由变量,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。计算而来,在一定过程中是不变的。第34页,此课件共119页哦变变量量定性变量定性变量定量变量定量变量连续变量非连续变量也叫离散变量,只也叫离散变量,只能取固定的值,通能取固定的值,通常是整数。如小白常是整数。如小白鼠的每胎产仔数鼠的每胎产仔数在一定范围内可以取任意值,在一定范围内可以取任意值,取值是无限的取值是无限的 连续的。如小连续的。如小麦的株高麦的株高在在8090间间第35页,此课件共119页哦 为了表示总体和样本的数量特征,需要计算出几个特征为了表示总体和样本的数量特征,需要计算出几个特征数,包括平均数和变异数(极差、方差、标准差等)。数,包括平均数和变异数(极差、方差、标准差等)。描述总体特征的数量称为描述总体特征的数量称为参数参数(parameter),也称参量。常用希,也称参量。常用希腊字母表示参数,例如用腊字母表示参数,例如用表示总体平均数,用表示总体平均数,用表示总体标准差;表示总体标准差;描述样本特征的数量称为描述样本特征的数量称为统计数统计数(staistic),也称统计量。常用,也称统计量。常用英文字母表示统计数,例如用英文字母表示统计数,例如用 表表 示样本平均数,用示样本平均数,用S表示样本表示样本标准差。标准差。三、参数与统计数三、参数与统计数三、参数与统计数三、参数与统计数第36页,此课件共119页哦 由于总体一般都很大,或者不能得到,所以总体参数常常无法计由于总体一般都很大,或者不能得到,所以总体参数常常无法计算,但可以通过从总体中随机抽样,取得样本,用容易计算得到的样算,但可以通过从总体中随机抽样,取得样本,用容易计算得到的样本的统计数来估计总体参数。用样本平均数本的统计数来估计总体参数。用样本平均数 估计总体平均数估计总体平均数,用,用样本标准差样本标准差S估计总体标准差估计总体标准差等。等。“样本的作用在于估计总体样本的作用在于估计总体”第37页,此课件共119页哦四、效应与互作四、效应与互作四、效应与互作四、效应与互作 通过施加试验处理,引起试验差异的作用称为通过施加试验处理,引起试验差异的作用称为效应效应(effect)。效应。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应正效应与与负效应负效应之分。之分。小麦亩产原来小麦亩产原来400kg 新品种亩产新品种亩产450kg 效应值为效应值为50kg亩亩;高血压病人原来高血压病人原来180 吃降压药后为吃降压药后为130 效应值为效应值为50mm汞柱汞柱;某人体重原来某人体重原来60kg 经减肥后为经减肥后为55kg 效应值为效应值为5kg.例:例:第38页,此课件共119页哦 互作互作(interaction),又叫连应,是指两个或两个以上处理因素间,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有相互作用产生的效应。互作也有正效应(协同作用)正效应(协同作用)与与负效应(拮负效应(拮抗作用)抗作用)之分。之分。例:例:田间施肥,田间施肥,亩施亩施1kg氮肥氮肥 粮食增产粮食增产3kg;亩施亩施1kg磷肥磷肥 粮食增产粮食增产2kg;亩施亩施1kg氮肥氮肥1kg磷肥磷肥 粮食增产粮食增产6kg;32 6多出来1kg,?氮肥和磷肥相互作用引起的正效应氮肥和磷肥相互作用引起的正效应氮肥和磷肥相互作用引起的正效应氮肥和磷肥相互作用引起的正效应:氮肥氮肥氮肥氮肥(3)(3)+磷肥磷肥磷肥磷肥(2)(2)+氮肥氮肥氮肥氮肥 磷肥磷肥磷肥磷肥(1)(1)6(6(kg)kg)第39页,此课件共119页哦五、误差与错误五、误差与错误五、误差与错误五、误差与错误变异效应效应误差误差随机误差抽样误差随机误差抽样误差偶然误差(偶然误差(Random error)系统误差片面误差系统误差片面误差(Systematic error)第40页,此课件共119页哦 随机误差,随机误差,也叫也叫 抽样误差抽样误差(sampling error),是由于试验中无,是由于试验中无法控制的内在和外在的偶然因素所造成的试验结果与真实结法控制的内在和外在的偶然因素所造成的试验结果与真实结果之间的差异。如试验动物的初始条件、饲养条件、管理措果之间的差异。如试验动物的初始条件、饲养条件、管理措施等尽管在试验中力求一致,但也不可能达到绝对一致,所施等尽管在试验中力求一致,但也不可能达到绝对一致,所以随机误差带有偶然性质,在试验中,即使十分小心也以随机误差带有偶然性质,在试验中,即使十分小心也是不可是不可避免的避免的。如果通过良好的试验设计、正确的试验操作,增加抽样或。如果通过良好的试验设计、正确的试验操作,增加抽样或试验次数,随机误差可能减小,但不可能完全消灭。试验次数,随机误差可能减小,但不可能完全消灭。统计上的试统计上的试验误差一般都指随机误差。验误差一般都指随机误差。随机误差越小,试验精确性越高随机误差越小,试验精确性越高。第41页,此课件共119页哦 系统误差,系统误差,也叫也叫片面误差片面误差(lopsided error),是由于试验处,是由于试验处理以外的其他条件控制不一致所产生的带有倾向性的或定向性的理以外的其他条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起的,如仪器调校偏差。系统误差主要由一些相对固定的因素引起的,如仪器调校的差异、各批药品间的差异、不同操作者操作习惯的差异等。的差异、各批药品间的差异、不同操作者操作习惯的差异等。系系统误差影响试验的准确性统误差影响试验的准确性。只要试验工作做得精细,系统误差只要试验工作做得精细,系统误差是是可以克服的可以克服的。第42页,此课件共119页哦 错误错误(mistake),是指在试验过程中,由于人为作用引起的差错。,是指在试验过程中,由于人为作用引起的差错。如测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记如测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的,只要以认真负责的态载、抄录、计算中出现错误等人为因素而引起的,只要以认真负责的态度和细心的工作作风,在试验中度和细心的工作作风,在试验中是完全可以避免的是完全可以避免的。原则上,试验原则上,试验中是不允许出现错误的。中是不允许出现错误的。2020年前,德国化学家劳尔赫在研究化肥对蔬菜的危害时,无意中发现,菠菜的实际含铁量并不像年前,德国化学家劳尔赫在研究化肥对蔬菜的危害时,无意中发现,菠菜的实际含铁量并不像所宣传的那样高,只有食品营养化学和各种有关手册所载数据的十分之一,劳尔赫很是诧异,怀所宣传的那样高,只有食品营养化学和各种有关手册所载数据的十分之一,劳尔赫很是诧异,怀疑试验是否有偶然性。于是,他找来各种各样的菠菜叶子,一一加以分析化验,但从未发现哪一疑试验是否有偶然性。于是,他找来各种各样的菠菜叶子,一一加以分析化验,但从未发现哪一种菠菜叶子的含铁量比别的蔬菜特别高的情况。他进而探索所谓菠菜含铁量高的种菠菜叶子的含铁量比别的蔬菜特别高的情况。他进而探索所谓菠菜含铁量高的“神话神话”,是从,是从哪里来的。追踪结果发现,原来是哪里来的。追踪结果发现,原来是100100年前,印刷厂在排版时,不小心把菠菜含铁量的小数点向右错移年前,印刷厂在排版时,不小心把菠菜含铁量的小数点向右错移了一位,从而使它的含铁量扩大了十倍,缪误相传,以至今日。(了一位,从而使它的含铁量扩大了十倍,缪误相传,以至今日。(3.5mg/100g3.5mg/100g)菠菜中仅有菠菜中仅有1%1%的铁在肠道中吸收,的铁在肠道中吸收,90%90%与草酸结合,不仅难以吸收,而且也会影响人体对铁的与草酸结合,不仅难以吸收,而且也会影响人体对铁的吸收利用。吸收利用。第43页,此课件共119页哦六、准确性与精确性六、准确性与精确性六、准确性与精确性六、准确性与精确性 准确性准确性(accuracy),也叫,也叫准确度准确度,指在调查或试验中某一试指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。验指标或性状的观测值与其真值接近的程度。设某一试验指标或设某一试验指标或性状的真值为性状的真值为,观测值为,观测值为 x,若,若 x与与相差的绝对值相差的绝对值|x|越小,越小,则观测值则观测值x的准确性越高;的准确性越高;反之则低。反之则低。精确性精确性(precision),也叫,也叫精确度精确度,指调查或试验中同一试验指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,若观测值彼此接近,即任意二个观测值即任意二个观测值xi、xj 相差的绝对值相差的绝对值|xi xj|越小,则观测越小,则观测值精确性越高;反之则低。值精确性越高;反之则低。第44页,此课件共119页哦图1图2图3图4准确性不等于精确性。准确性是说明测定值对真值符合的程度大小,准确性不等于精确性。准确性是说明测定值对真值符合的程度大小,而精确性是说明多次测定值的变异程度大小。而精确性是说明多次测定值的变异程度大小。调查或试验的准确性、精确性合称为调查或试验的准确性、精确性合称为正确性正确性。第45页,此课件共119页哦第46页,此课件共119页哦统计推断总体总体样本样本随机抽样现象现象本质本质平均数变异数第47页,此课件共119页哦畅所欲言q 为什么要学习生物统计学?q 如何学好生物统计学?q 指出下列术语间的差别:总体与样本 变数与常数 参数与统计数 机误和错误 效应与互作 准确性与精确性第48页,此课件共119页哦试验资料的整理特征数的计算与第49页,此课件共119页哦在生物学试验及调查中,通过对某种具体事物或现象观察在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为获得的结果称为资料资料。原原始始数数据据无序无序有序有序统统计计分分析析揭示事物本质揭示事物本质第50页,此课件共119页哦第一节:试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理三、试验资料的整理第51页,此课件共119页哦对试验资料进行分类是统计归纳的基础。对试验资料进行分类是统计归纳的基础。数量性状资料数量性状资料质量性状资料质量性状资料(属性性状资料)(属性性状资料)计数资料计数资料(非连续变量资料)(非连续变量资料)计量资料计量资料(连续变量资料)(连续变量资料)变量变量定量变量定量变量定性变量定性变量连续变量连续变量非连续变量非连续变量资料资料第52页,此课件共119页哦 数量性状数量性状数量性状数量性状(quantitative character)quantitative character)是指能够以计数和测是指能够以计数和测是指能够以计数和测是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获量或度量的方式表示其特征的性状。观察测定数量性状而获量或度量的方式表示其特征的性状。观察测定数量性状而获量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是得的数据就是得的数据就是得的数据就是数量性状资料数量性状资料数量性状资料数量性状资料 (data of quantitative(data of quantitative characteristicscharacteristics)。数量性状资料的获得有计数和测量两种方。数量性状资料的获得有计数和测量两种方。数量性状资料的获得有计数和测量两种方。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。式,因而数量性状资料又分为计数资料和计量资料两种。式,因而数量性状资料又分为计数资料和计量资料两种。式,因而数量性状资料又分为计数资料和计量资料两种。一、数量性状资料一、数量性状资料第53页,此课件共119页哦 1 1、计数资料、计数资料、计数资料、计数资料 指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。各个观察值只能以整数表示,在两个相邻整数间不得有任各个观察值只能以整数表示,在两个相邻整数间不得有任各个观察值只能以整数表示,在两个相邻整数间不得有任各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,各观察值是不连续的何带小数的数值出现,各观察值是不连续的何带小数的数值出现,各观察值是不连续的何带小数的数值出现,各观察值是不连续的.该类资料也称为该类资料也称为该类资料也称为该类资料也称为非连续变量资料非连续变量资料非连续变量资料非连续变量资料或或或或间断变量资料间断变量资料间断变量资料间断变量资料或或或或离散变离散变离散变离散变量资料量资料量资料量资料。第54页,此课件共119页哦 2 2、计量资料、计量资料、计量资料、计量资料 指用测量或度量法获得的数量性状资料,即用度、量、指用测量或度量法获得的数量性状资料,即用度、量、指用测量或度量法获得的数量性状资料,即用度、量、指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。衡等计量工具直接测定获得的数据资料。衡等计量工具直接测定获得的数据资料。衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表示,其数据是用长度、重量、容积、温度、浓度等来表示,其数据是用长度、重量、容积、温度、浓度等来表示,其数据是用长度、重量、容积、温度、浓度等来表示,要带单位。两个相邻的整数间可以有带小数的任何数要带单位。两个相邻的整数间可以有带小数的任何数要带单位。两个相邻的整数间可以有带小数的任何数要带单位。两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,值出现,其小数位数的多少由度量工具的精确度而定,值出现,其小数位数的多少由度量工具的精确度而定,值出现,其小数位数的多少由度量工具的精确度而定,计量资料也称为计量资料也称为计量资料也称为计量资料也称为连续变量资料连续变量资料连续变量资料连续变量资料。第55页,此课件共119页哦 二、质量性状资料二、质量性状资料 质量性状质量性状质量性状质量性状(qualitative characterqualitative character)是指能观察到而不能直接测是指能观察到而不能直接测是指能观察到而不能直接测是指能观察到而不能直接测量的性状。量的性状。量的性状。量的性状。观察质量性状而获得的数据就是观察质量性状而获得的数据就是观察质量性状而获得的数据就是观察质量性状而获得的数据就是质量性状资料质量性状资料质量性状资料质量性状资料(data of data of qualitative characteristicsqualitative characteristics),也称为属性性状资料。),也称为属性性状资料。),也称为属性性状资料。),也称为属性性状资料。这类性状本身不能直接用数值表示,要获得这类性状的数这类性状本身不能直接用数值表示,要获得这类性状的数这类性状本身不能直接用数值表示,要获得这类性状的数这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两据资料,须对其观察结果作数量化处理,其方法有以下两据资料,须对其观察结果作数量化处理,其方法有以下两据资料,须对其观察结果作数量化处理,其方法有以下两种:种:种:种:第56页,此课件共119页哦 1 1、统计次数法、统计次数法、统计次数法、统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以在一定的总体或样本中,根据某一质量性状的类别统计其次数,以在一定的总体或样本中,根据某一质量性状的类别统计其次数,以在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。花杂交,子二代中红花、紫花和白花的株数分类统计如下表。花杂交,子二代中红花、紫花和白花的株数分类统计如下表。花杂交,子二代中红花、紫花和白花的株数分类统计如下表。株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%这种由质量性状数量化得来的资料又叫这种由质量性状数量化得来的资料又叫次数资料次数资料。第57页,此课件共119页哦 2 2、评分法评分法评分法评分法 对某一质量性状分成不同级别,对不同级别进行评对某一质量性状分成不同级别,对不同级别进行评对某一质量性状分成不同级别,对不同级别进行评对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行数量分来表示其性状差异的方法。从而将质量性状进行数量分来表示其性状差异的方法。从而将质量性状进行数量分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。例如,试剂化,以便统计分析。例如,试剂化,以便统计分析。例如,试剂化,以便统计分析。例如,试剂pHpH值由酸到碱分成值由酸到碱分成值由酸到碱分成值由酸到碱分成1414个个个个等级,取待测试剂滴在等级,取待测试剂滴在等级,取待测试剂滴在等级,取待测试剂滴在pHpH试纸上,与试纸上,与试纸上,与试纸上,与pHpH标准色版对比,标准色版对比,标准色版对比,标准色版对比,由红到紫分别定义为由红到紫分别定义为由红到紫分别定义为由红到紫分别定义为 1 11414 的数值。的数值。的数值。的数值。第58页,此课件共119页哦 两种不同类型的资料相互间是有区别的,但有时可根据研究的两种不同类型的资料相互间是有区别的,但有时可根据研究的两种不同类型的资料相互间是有区别的,但有时可根据研究的两种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资目的和统计方法的要求将一种类型资料转化成另一种类型的资目的和统