第一统计数据的收集和整理课件.ppt
《第一统计数据的收集和整理课件.ppt》由会员分享,可在线阅读,更多相关《第一统计数据的收集和整理课件.ppt(119页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一统计数据的收集和整理第1页,此课件共119页哦生物统计学授课人:授课人:陈建中陈建中E-mail:第2页,此课件共119页哦 生生 物物 统统 计计 学学 1.理解生物统计学基本原理和统计分析方法,学会如何进行科学的试验设计,掌握常用的统计学软件的使用2.教材:李春喜等 编著,2008,生物统计学(第四版),科学出版社。第3页,此课件共119页哦第第 一一 次次 统计数据的收集和整理统计数据的收集和整理第第 二二 次次 概率与概率分布以及常见的概率分布概率与概率分布以及常见的概率分布第第 三三 次次 抽样分布和统计推断抽样分布和统计推断第第 四四 次次 参数估计和拟合度检验参数估计和拟合度
2、检验第第 五五 次次 单因素方差分析单因素方差分析第第 六六 次次 多因素方差分析 第第 七七 次次 直线回归与相关分析直线回归与相关分析第第 八八 次次 试验设计与统计分析试验设计与统计分析 SpssSpss软件在生物统计学中的应用(软件在生物统计学中的应用(8 8学时)学时)教学计划(学时安排)教学计划(学时安排)第4页,此课件共119页哦第一章第一章 统计数据的收集和整理统计数据的收集和整理第5页,此课件共119页哦主要内容n n生物统计学的概述定义、作用、发展简史n n统计学中几个基本概念总体、样本、个体、抽样n n数据类型及频率分布连续和离散数据 频数频率分布图n n样本的典型参数平
3、均数 标准差 偏斜度和崤度 变异系数第6页,此课件共119页哦一、生物统计学的概述1.1.生物统计学定义2.2.生物统计学的主要内容3.3.生物统计学的作用4.4.生物统计学的发展简史第7页,此课件共119页哦 统计学统计学(StatisticsStatistics)是把是把数学的语言数学的语言引入引入具体具体的科学领域的科学领域,将所研究的问题,将所研究的问题抽象抽象为数学问题的过程为数学问题的过程,是是收集收集、分析分析、列示列示和和解释解释数据的一门科学。数据的一门科学。统计学被广泛地应用于解决统计学被广泛地应用于解决自然科学自然科学和和社会科学社会科学各各个领域中具体的个领域中具体的随
4、机现象随机现象的规律性,形成了应用于各的规律性,形成了应用于各个学科领域的统计学,即个学科领域的统计学,即应用统计学应用统计学。第8页,此课件共119页哦生物统计学概念生物统计学概念 生物统计学(Biostatistics)是数理统是数理统计在生物学研究中的应用,它是应用数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统象和试验调查资料的一门学科。属于应用统计学的一个分支。计学的一个分支。第9页,此课件共119页哦在对事物的研究过程中,人们往往是通过某事物的一部分(样本),来估计事物全部
5、(总体)的特征,目的是为了以样本的特征对未知总体进行推断,从特殊推导一般,对所研究的总体作出合乎逻辑的推论,得到对客观事物的本质和规律性的认识。在生物学研究中,我们所期望的是总体,而不是样本。但是在具体的试验过程中,我们所得到的却是样本而不是总体。因此,从某种意义上讲,生物统计学是研究生命过程中以样本来推断总体样本来推断总体的一门学科。生物统计学生物统计学是研究生命过程中以样本推断总体的一门学科。是研究生命过程中以样本推断总体的一门学科。第10页,此课件共119页哦生生生生 的的的的物物物物 基基基基统统统统 本本本本计计计计 内内内内学学学学 容容容容试试试试 验验验验 设设设设 计计计计E
6、xperiment designExperiment design统统统统 计计计计 分分分分 析析析析Statistical analysisStatistical analysis基本原则基本原则方案制定方案制定常用试验设计常用试验设计资料的搜集和整理资料的搜集和整理数据特征数的计算数据特征数的计算统计推断统计推断方差分析方差分析回归和相关分析回归和相关分析协方差分析协方差分析主成分分析主成分分析聚类分析聚类分析对比设计对比设计随机区组设计随机区组设计平衡不完全区组设计平衡不完全区组设计裂区设计裂区设计拉丁方设计拉丁方设计正交设计正交设计生物统计学的内容与作用生物统计学的内容与作用如何合理
7、地进行调查或试验设计如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的规律性。第11页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供整理和描述数据资料的科学方法,确定某些性提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。状和特性的数量特征。运用显著检验,判断试验结果的可靠性或可行性。运用显著检验,判断试验结果的可靠性或可行性。提供由样本推断总体的方法提供由样本推断总体的方法。提供试验设计的的一些重要原则提供试验设计的的一些重要原则。第12页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供整理和描述数据资料的科学方法,确定某
8、些性提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。状和特性的数量特征。原始的数据和资料,杂乱无章原始的数据和资料,杂乱无章,生物统计学提供一套生物统计学提供一套完整科学系统的分析分析方法,能够在众多数据中完整科学系统的分析分析方法,能够在众多数据中提炼出有价值的东西提炼出有价值的东西第13页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:运用显著检验,判断试验结果的可靠性或可行性。运用显著检验,判断试验结果的可靠性或可行性。无论实验条件如何严格控制,总是无法避免无论实验条件如何严格控制,总是无法避免随机误差。所以当拿到实验结果后,首先要随机误差。所以当拿到实验
9、结果后,首先要判定数据的可靠性!换句话说就是要分离误判定数据的可靠性!换句话说就是要分离误差产生的原因:是处理导致还是环境导致,差产生的原因:是处理导致还是环境导致,还是系统误差等等还是系统误差等等第14页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供由样本推断总体的方法提供由样本推断总体的方法。由样本推断总体这是生物统计学的总体思路,具体由样本推断总体这是生物统计学的总体思路,具体落实需要一套完整的推断方案落实需要一套完整的推断方案。第15页,此课件共119页哦生物统计学的基本作用:生物统计学的基本作用:提供试验设计的的一些重要原则提供试验设计的的一些重要原则。实验设计
10、有三个原则:随机,重复和局部控制实验设计有三个原则:随机,重复和局部控制我们力求以较少的人力财力获得较多的数据我们力求以较少的人力财力获得较多的数据同时我们也能看到由于实验设计不但,导致实验丧同时我们也能看到由于实验设计不但,导致实验丧失大量的数据,或者实验设计就不科学!没有代表失大量的数据,或者实验设计就不科学!没有代表性性第16页,此课件共119页哦生物统计学的任务生物统计学的任务新药物旧药物不同剂量性能试验不同剂量对照试验结果是结果是?问题:最适使用剂量分别是多少?新药物比旧药物治愈率高吗?1.试验如何设计?2.数据如何整理、分析呢?3.结果是什么?可靠性有多高?4.结论如何?新药是否可
11、生产?第17页,此课件共119页哦课外活动:生物统计方法在生物学学术刊物中的应用情况第18页,此课件共119页哦学习生物统计的方法和要求1.掌握统计的基本原理、基本公式和应用条件。2.做好习题作业。3.培养科学的统计思维方法。4.结合所学专业,联系实际。第19页,此课件共119页哦J.Bernoulli(贝努里,瑞士,贝努里,瑞士,16541705)系统论证了“大数定律”,即样本容量越大,样本统计数与总体参数之差越小。P.S.Laplace(拉普拉斯,法国,拉普拉斯,法国,17491827)最早系统的把概率论方法运用到统计学研究中去,建立了严密的概率数学理论,提出“拉普拉斯定理”,并应用到人口
12、统计、天文学等方面的研究上。初步建立了大样本推断的理论基础,为后人开创了抽样调查的方法。一、古典记录统计学一、古典记录统计学(17(17世纪中叶至世纪中叶至1919世纪中叶世纪中叶)生物统计学发展概况第20页,此课件共119页哦Gauss(高斯,德国,高斯,德国,17771855)正态分布理论最早由De Moiver于1733年发现,后来Gauss在进行天文观察和研究土地测量误差理论时又一次独立发现了正态分布(又称常态分布)的理论方程,提出“误差分布曲线”,后人为了纪念他,将正态分布也称为Gauss分布。另外,他还完成了最小二乘法的研究,正式发表于1809年。第21页,此课件共119页哦F.G
13、alton(高尔登,英国,高尔登,英国,18221911)19世纪末统计学开始用于生物学的研究。1882年Galton开设“人体测量实验室”,测量9337人的资料,探索能把大量数据加以描述与比较的方法和途径,引入了中位数以及分布、相关、回归等重要的统计学概念与方法。1889年发表第一篇生物统计论文自然界的遗传。1901年Galton和他的学生Pearson创办了“Biometrika(生物统计学报)”杂志,首次明确“Biometry(生物统计)”一词。所以后人推崇GaltonGalton为生物统计为生物统计学的创始人学的创始人。二、近代描述统计学(19世纪中叶至世纪中叶至20世纪上半叶世纪上半
14、叶)第22页,此课件共119页哦K.Pearson(卡(卡.皮尔逊,英国,皮尔逊,英国,18571936)Pearson的一生是统计研究的一生。他首创频数分布表与频数分布图,如今已成为最基本的统计方法之一;观察到许多生物的度量并不呈现正态分布,利用相对斜率得到矩形分布、J型分布、U型分布或铃型分布等;1900年独立发现了X2分布,提出了有名的卡方检验法,后经Fisher补充,成为小样本推断统计的早期方法之一;Pearson对“回归与相关”进一步作了发展,在18971905年,Pearson还提出复相关、总相关、相关比等概念,不仅发展了Galton的相关理论,还为之建立了数学基础。第23页,此课
15、件共119页哦W.S.Gosset(歌赛特,英国,歌赛特,英国,18761937)在生产实践中对样本标准差进行了大量研究。于1908年以“Student(学生)”为笔名在该年的Biometrika上发表了论文平均数的概率误差,创立了小样本检验代替大样本检验的理论,即t分布和t t检验法检验法,也称为学生式分布。t检验已成为当代生物统计工作的基本工具之一,为多元分析理论的形成和应用奠定了基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。三、现代推断统计学(始于始于20世纪初世纪初)第24页,此课件共119页哦 R.A.Fisher(费歇尔,英国,费歇尔,英国,1890196
16、2)Fisher一生论著颇多,共写了329篇。他跨进统计学界是从研究概率分布开始的,1923年发展了显著性检验及估计理论,提出了F分布和F检验,1918年在孟德尔遗传试验设计间的相对关系一文中首创“方差”和“方差分析”两个概念,1925年提出随机区组和拉丁方试验设计,并在卢桑姆斯坦德农业试验站得到检验与应用,他还在试验设计中提出“随机化”原则,1938年和Yates合编了Fisher Yates随机数字表。第25页,此课件共119页哦另外,另外,Neyman(18941981)和E.Pearson进行了统计理论研究,分别与1936和1938年提出一种统计假说检验学说。P.C.Mabeilinr
17、obis对作物抽样调查、A.Waecl对序贯抽样、Finney对毒理统计、K.Mather对生统遗传学、F.Yates对田间试验设计等都作出了杰出贡献。第26页,此课件共119页哦统计学在中国的传播统计学在中国的传播 我国在解放前,社会经济发展缓慢,统计的应用和发展受到了很大的限制。1913年,顾澄教授(1882?)翻译了英国统计学家尤尔的著作统计学之理论(1911),即为英美数理统计学传入中国之始。之后又有一些英美统计著作被翻译成中文,Fisher的理论和方法也很快传入中国。在20世纪30年代,生物统计与田间试验就作为农学系的必修课,1935年王绶(18761972)编著出版的实用生物统计法
18、是我国出版最早的生物统计专著之一。随后1942年范福仁出版了田间试验技术等,这些对推动我国农业生物统计和田间试验方法的应用都产生了很大影响。第27页,此课件共119页哦 新中国成立后,许多学者翻译、编著了统计学论著,有力的推动了数理统计方法在中国的普及和应用。1978年12月国家统计局在四川峨眉召开了统计教学、科研规划座谈会,全面引进了前苏联的社会经济统计理论和统计制度,对我国社会经济统计学的发展起到了一定的积极作用。1984年年1月月1日颁布实施日颁布实施中华人民共和国统计法中华人民共和国统计法,1987年2月国家统计局又发布中华人民共和国统计法实施细则,1996年5月八届人大十九次会议通过
19、了关于修改的决定。统计电算程序SAS(Statistical Analysis System)、SPSS(Statistical Package for Social Science)、Excel、DPS(试验设计design of experiment数据处理processing of data模型建立simulation analysis)等的引进,统计学在中国的应用与研究出现了崭新的局面。第28页,此课件共119页哦二、统计学中几个基本概念1.1.总体、个体和样本以及抽样2.2.变量与常量3.3.参数与统计数4.4.效应与互作5.5.误差与错误6.6.准确性和精确性第29页,此课件共11
20、9页哦一、总体与样本一、总体与样本一、总体与样本一、总体与样本具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为具有相同性质的个体所组成的集合称为总体总体总体总体 (population)(population),它是指研究对象的全体;,它是指研究对象的全体;,它是指研究对象的全体;,它是指研究对象的全体;组成总体的基本单元称为组成总体的基本单元称为组成总体的基本单元称为组成总体的基本单元称为个体个体个体个体(individual)(individual);(总体中的一个研究单位);(总体中的一个研究单位);(总体中的一个研究单位);(总体中
21、的一个研究单位)从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为从总体中抽出若干个体所构成的集合称为样本样本样本样本(sample)(sample);(总体中的一部分);(总体中的一部分);(总体中的一部分);(总体中的一部分)总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:总体又分为有限总体和无限总体:含有有限个个体的总体称为含有有限个个体的总体称为含有有限个个体的总体称为含有有限个个体的总体称为有限总体有限总体有限总体有限总体(finitude popufinitude popul lat
22、ionation););););包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为包含有极多或无限多个体的总体称为无限总体无限总体无限总体无限总体(infinitude popuinfinitude popul lationation).第30页,此课件共119页哦统计推断统计推断总总 体体样本样本随机抽样随机抽样总体研究的目的是要了解总体,观测到的是样本,通过样本来推断总体是统计分析的基本特点。第31页,此课件共119页哦 构成样本的每个个体称为构成样本的每个个体称为构成样本的每个个体称为构成样本的每个个体称为样本单位样本单位样本单位样本单位;样
23、本中所包含的个体数目叫;样本中所包含的个体数目叫;样本中所包含的个体数目叫;样本中所包含的个体数目叫样本容量样本容量样本容量样本容量或或或或样本大小样本大小样本大小样本大小(sample size)(sample size),样本容量常记为,样本容量常记为,样本容量常记为,样本容量常记为n n。一般在生物学研究中,通常把一般在生物学研究中,通常把一般在生物学研究中,通常把一般在生物学研究中,通常把n n3030的样本叫的样本叫的样本叫的样本叫小样本小样本小样本小样本,n n 3030的样本叫的样本叫的样本叫的样本叫大样本大样本大样本大样本。对于小样本和大样本,在一些统计数的计算和分析检验上是不
24、一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一。对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。样的。样的。样的。研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,研究的目的是要了解总体,然而能观测到的却是样本,通过样通过样通过样通过样本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点本来推断总体是统计分析的基本特点。第32页,此课件共119页哦抽样n n从总体中获得样本
25、的过程叫抽样(sampling)n n抽样的目的:通过抽取的样本来研究总体n n随机抽样n n放回式抽样 非放回式抽样第33页,此课件共119页哦二、变量与常数二、变量与常数二、变量与常数二、变量与常数 变量变量,或变数,指相同性质的事物间表现差异性或差,或变数,指相同性质的事物间表现差异性或差异特征的数据。异特征的数据。常数常数,表示能代表事物特征和性质的数值,通常由变量,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。计算而来,在一定过程中是不变的。第34页,此课件共119页哦变变量量定性变量定性变量定量变量定量变量连续变量非连续变量也叫离散变量,只也叫离散变量,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一 统计数据 收集 整理 课件
限制150内