生物统计学考试总结.pdf
《生物统计学考试总结.pdf》由会员分享,可在线阅读,更多相关《生物统计学考试总结.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.生物统计学考试总结生物统计学考试总结第一章第一章生物统计学:生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。容:容:试验设计:试验设计的根本原则、试验设计方案的制定和常用试验设计的方法统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协方差分析等生物统计学的作用:生物统计学的作用:1.提供整理、描述数据资料的科学方法并确定其特征2.判断试验结果的可靠性3.提供由样本推断总体的方法4.试验设计的原则相关概念相关概念:1.总体:研究对象的全体,是具有一样性质的个体
2、所组成的集合2.个体:组成总体的根本单元3.样本:由总体中抽出的假设干个体所构成的集合n30 大样本;n30 小样本4.参数:描述总体特征的数量5.统计数:描述样本特征的数量由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数6.效应:由因素而引起试验差异的作用7.互作:两个或两个以上处理因素间的相互作用产生的效应生物统计学的研究包括了两个过程:生物统计学的研究包括了两个过程:1.从总体抽取样本的过程抽样过程2.从样本的统计数到总体参数的过程统计推断过程第二章第二章1 1算术平均数算术平均数:是所有观察值的和除以观察的个数平均数AVERAGE
3、特性特性:1样本中各观测值与平均数之差离均差的总和等于零2样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小设a为x以外的任何数值2 2中位数中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以Md表示3 3众数众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以Mo 表示4 4几何平均数几何平均数:资料中有 n 个观测值,其乘积开n 次方所得的数值,以 G 表示。5.5.极差全距极差全距:样本数据资料中最大观测值与最小观测值的差值Rma*1,*2,*n mi*1,*2,*n6 6样本方差样本方差
4、:总体方差总体方差:1.用n1 代替n作,可以防止偏小估计,从而实现样本方差对总体方差的无偏估计在统计上,自由度dfn1 是指样本独立而能自由变动的观测值的个数在计算其他统计数时,如果受到k个条件的限制,则其自由度为nk7 7样本标准差样本标准差:总体标准差总体标准差:1标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大2在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;如果乘以或除以一个常数a,则标准差扩大或者缩小a倍STDEV:STDEV:基于给定样本的标准偏差STDEVPSTDEVP:基于给定样本总体的标准偏差8 8 变异系数变异系数CVCV
5、:样本标准差除以样本的平均数,得到百分比1变异系数是样本变量的相对变量,是不带单位的纯数2用变异系数可以比较不同样本相对变异程度的大小第三章第三章概率的计算法则:概率的计算法则:1乘法定理:如果 A 和 B 为独立事件,则事件A 和 B 同时发生的概率等于各自事件的概率的乘积P(AB)P(A)P(B)2加法定理:互斥事件A和B的和的概率等于事件A 和事件 B 的概率之和加法定理推理 1:如果A1、A2、An为n个互斥事件,则其和事件的概率为:P(A1A2An=P(A1)+P(A2)PAn加法定理:如果A和B是任何两件事件,则P(A B)P(A)P(B)P(AB)概率分布:概率分布:1离散型随机
6、变量的概率分布变量*概率P*1*2*3*np1p2p3pnRP(*=*i)=pi(i=1,2,n)离散随机变量的方差2(xi)2P(X xi)i12连续型随机变量的概率分布连续型随机变量的概率分布连续型随机变量的概率分布1.连续型随机变量可以取*一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率4.通常研究它取*一区间值的概率5.用数学函数的形式和分布函数的形式来描述概率密度函数:概率密度函数:1设*为一连续型随机变量,*为任意实数,*的概率密度函数记为f(*),它满足条件(2),f(*)不是概率几种常见的概率分布:几种常见的概率分布:适用
7、围,尾函数,自由度1.1.二项分布的概率函数二项分布的概率函数 记作B(n,p)或者B(n,)1每次试验只有两个对立结果,分布记为A与,它们出现的概率分布为p与qqA1.1-p2试验具有重复性和独立性i二项式分布的概率累积函数:F(x)P(x)x0假设随机变量*服从二项式分布,则有二项分布的总体平均数为x二项分布的总体标准差为:(xi)2pxinpqx二项成数百分数分布的平均数:二项成数百分数分布的标准差:x p(x)npiiB(n,p)BINOMDISTnumber_strialsprobability_scumulative实验成功次数独立实验次数一次实验中成功的概率True:False:
8、*np例:例:假设年龄 6064 岁的 100 名男性在 1986 年注射了一种新的流感疫苗而在第二年死亡 5 人,这正常嘛.注:1986 年,6064 岁的男性老人第二年的死亡率约为0.02解:要知道 100 个男性的样本死亡 5 人是不是“异常事件,这种估计的一个准则是寻找至少 5 人死亡的概率。注:通常是把概率值为0.05或者更小的概率事件识别为异常 稀有事件。由于至少 5 人死亡的概率是 0.05,可见 100 人中至少死亡 5人是稍微有点异常,但不是很异常。如果至少死亡 10 人,则概率是3.44*10-5,这就很不正常,因而,在没有其他证据显示此疫苗有效前,应考虑停顿使用。2.2.
9、泊松分布泊松分布二项式分布中,如果p值很小而n值很大p0.1和np5),则泊松分布式中:为参数,np,x 0,1,2,.泊松分布的平均数、方差、标准差POISSON*meancumulative2*事件出现的次数期望值True:P(X x)iFalse:P(X xi)例:例:假设我们研究乳腺癌的遗传敏感性。我们发现,母亲曾患有乳腺癌的 1000 名 4049 岁的妇女,在研究开场后的1 年中,有4 人患有乳腺癌,而我们从大总体中知道在这一样的时间,1000 人中有 1 个人发生乳腺癌。试问乳腺癌有没有敏感性.解:如果用二项分布,则n1000,p1/1000,BINOMDIST number_s
10、Trials probability_scumulativeP(X 3)P(X 4)31000 0.001Ture0.9810.0191.解:如果用泊松分布,则n1000,p1/1000,则平均值1POISSION*3mean1cumulativeTureP(X 3)P(X 4)0.9810.019则:这个事件是异常事件,则认为有乳腺癌的妇女,她们的子代具有遗传敏感性3.3.正态分布高斯分布正态分布高斯分布为总体平均数,为总体标准差正态分布的特征正态分布的特征1.当时,xf(*)有最大值2.当的绝对值相等的时候,f(*)值也相等x 3.当的绝对值越大,f(*)值就越小,但永远不等于04.正态分
11、布曲线完全由函数和来决定5.正态分布曲线在处各有一个拐点6.正态分布求和为 0 x NORMDISTNORMDIST*i*MeanStandard_devcumulative函数值的区间点算术平均值标准差True:累积False:概率密度函数值标准正态分布:NORMSDIST 0,21u x*iZNORMSINVprobability标准正态分布的区间点正态分布概率,介于 01 之间,含 0,1u4 4 t t 分布分布:是小样本分布,小样本分布一般是指nt)=probability,即P(|*|t)=P(*t)2 单尾t值可通过用两倍概率替换概率而求得eg:如果概率为 0.05 而自由Deg
12、rees_freedomDegrees_freedom自由度自由度1.度为 10,双尾值由TINV(0.05,10)计算得到 2.28139;而同样概率和自由度的单尾值由 TINV(2*0.05,10)计算得到 1.812462。5.5.卡方分布卡方分布P456.F6.F 分布分布1、概率抽样:根据的概率选取样本简单随机抽样:完全随机地抽选样本分层抽样:总体分成不同的“层,然后在每一层进展抽样整群抽样:将一组被调查者群作为一个抽样单位等距抽样:在样本框中每隔一定距离抽选一个被调查者2、非概率抽样:不是完全按随机原则选取样本非随机抽样:由调查人员自由选取被调查者判断抽样:通过*些条件过滤来选择被
13、调查者3、配额抽样:选择一群特定数目、满足特定条件的被调查者抽样分布:抽样分布:从一个给定的总体中抽取不管是否有放回容量或大小为n的所有可能的样本,对于每一个样本,计算出*个统计量如样本均值或标准差的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布1.所有样本指标如均值、比例、方差等所形成的分布称为抽样分布2.是一种理论概率分布3.随机变量是 样本统计量样本均值,样本比例等4 结果来自容量一样的所有可能样本符号样本平均数的根本性质样本平均数的根本性质:1样本均值的均值数学期望等于总体均值x),则称,如果E(是的无偏估计定义:一个参数的估计量是2样本均值的方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 考试 总结
限制150内