《2022年生物统计学名词解释 .pdf》由会员分享,可在线阅读,更多相关《2022年生物统计学名词解释 .pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习必备欢迎下载1.样本 : 样本从总体中抽出的若干个体所构成的集合称为样本。2.总体 : 总体指具有相同性质的个体所组成的集合称为总体。3.连续变量:表示在不变量范围内可抽出某一范围的所有值。4.非连续变量: 也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。5.准确性 : 指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。8.数量性状资料:指一般是由计数和测量或度量得到的。9.质量性状资
2、料:是指对某种现象只能观察而不能测量的资料,也称属性资料。10. 计数资料 ; 指由计数得到的数据。11. 计量资料:有测量或度量得到的数据。12. 普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。13. 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。14. 全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组限下线和上限的中间值。15. 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。16. 中位数:是指
3、将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。17. 众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。18. 几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。19. 方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。20. 标准差:指方差的平方根和。21. 变异系数 : 指将样本标准差除以样本平均数得出的百分比。22. 概率 : 指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 W(A) 概率就越来越接近某一确定值 P ,于是则定 P 为事件 A 发生的概率. 23. 和事件:指事件 A 和事件
4、B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。24. 积事件 : 指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A 和事件 B 的积事件。25. 互斥事件: 指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B 互斥。26. 对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时发生。27. 独立事件:指事件 A 的发生与事件 B 的发生毫无关系。28. 完全事件系:指如果多个事件 A1 、A2、 、 、 、 、 、An 两两相斥,且每次精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共
5、 7 页学习必备欢迎下载试验结果必然发生其一,则称事件 A1 、 完全事件系 A2 、 、 、 、 、 、 An 为一个完全事件系。29. 概率加法定理:指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和, P(A+B)=P(A)+P(B)。30. 概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时 发 生 的 概 率 等 于 事 件A 和 事 件B 各 自 概 率 乘 法 定 理 的 乘 积 ,即:P(A*B)=P(A)*P(B)。31. 伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而不是事件 A 在每次试验中出现的概率,
6、则对于任意小的正数 ,有如下关系 :limpm/n-p =1 32. 辛钦大数定律: 是用来说明为什么可以用算术平均数来推断总体平均数 m 的。33. 统计推断 : 指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验。34. 假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。35. 参数估计 : 指由样本结果对总体参数在一定概率水平下所作出的估计。点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在, X 拔不同的样本将会得到不同的点估计值,点估计
7、缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足36. 小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件 A 出现的概率 a 为很小,则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。37. 显著水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率标准,这个概率称为显著水平。38. 方差同质性:就是指各个总体的方差是相同的。39. 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为 错误。40. 错误:指如果H0 不是真实的, 假设检验时却接受了 H0 , 否定了 HA 这样就犯了接受不真
8、实假设的错误,称为 错误。41. 适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验。42. 独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法。43. 相关分析 : 是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法。44. 回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。45. 回归系数: y=a+bx ,自变量 x 改变一个单位,依变量 y 平均增加或减少的单位数,即回归直线的斜率 b 。46. 回归截距:y=a+bx ,a 是当 x=0 时
9、的 Y 值,即直线在 y 轴上的截距,称为回归截距。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 7 页学习必备欢迎下载47. 离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数。48. 回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而产生 y 变异减小的部分。49. 相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数。50. 决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和的比率。51. 转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z 。52. 试验设
10、计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。53. 试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果。54. 处理因素:一般指对受试对象给予的某种外部干预。55. 主效应:多因素中试验中引起实验结果发生变化的主要。56. 互作:因素之间的交互作用。57. 受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体。58. 处理效应:是处理因素作用于受试对象的反应,是研究最终体现59. 误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离
11、试验处理真值的差异。60. 随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差。61. 系统误差 : 由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差62. 重复:在试验中,同一处理设置的试验单位数。63. 随机 : 是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。64. 均积:是 x 与 y 的平均的离均差的乘积和,简称均积。65. 协方差:与均积相应的总体参数。66. 协方差分析:把回归分析与方差分析结合。67. 试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下。6
12、8. 统计控制 : 是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响。69. 估计量:估计总体参数的统计量70. 无偏估计量:如果一个统计量的理论平均数(即数学期望)等于总体参数,这个统计量就叫无偏估计量71. 矩估计:用样本矩作为总体矩的估计值72. 矩估计法(数字特征法、矩法)用样本矩作为相应总体矩的估计量,也可以用样本数字特征作为相应的总体数字特征的估计量。用矩法获得的估计值,叫据估计值。据发的思想实质是用样本去替换总体矩的原则,称之为替换原则73. 有效估计量:设a1,a2 是 A 的两个无偏估计量,若var(a1)var(a2),则 a1 为有效估计量
13、精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 7 页学习必备欢迎下载74. 抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在75. 标注误差(标准误):描述样本平均数波动情况的统计量,就是X 拔的方差或标准差,计均数抽样误差为西格玛X 拔, =西格玛 / 根号 n,西格玛 X 拔就是标准误(差)76. 估计样本平均数方差:SX拔平方, =S平方 /n 77. 估计标准误:SX拔, =S/ 根号 n 78. 置信区间:达到某一置信度( 如 95
14、) 时,预报量可能出现的范围( 如E(y) 1.96西格玛,这里西格玛是标准差) 置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间a1,a2,这个区间包含a 的概率是100(1- 阿尔法) % ,不包含a 的概率是100 阿尔法 % 79. 置信水平(置信度,置信系数,可靠度)是指总体参数值落在样本统计值某一区内的概率;而置信区间 是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。80. 拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之间的一致性,通过检验观测数与理论书之间的一致性来判断事件之间的独立性81. 皮尔逊定理
15、:若n 充分大,则不论总体服从什么分布,卡平方总是近似服从自由度为m-a-1 的卡平方分布82. 方差分析:能同时判断多组数据平均数之间的差异显著性,能把随机变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据83. 方差分析的前提条件:等方差,正态性、独立性84. 固定因素:若因素的a 个水平是经过特意选择的,则该因素为固定因素。发差分析所得到的结论只适合于选定的几个水平,并不能将其结论扩展到未加考虑的水平上85. 固定效应模型:处理固定因素所用的模型称为固定效应模型或固定模型86. 随机因素:若因素的a 个水平,是从该因素水平总体中随机抽出的样本,则该因素称为随机因素,
16、从随机因素a 个水平所得到的结论,可以推广到这个因素的所有水平上87. 处理随机因素所用的模型称为随机效应模型88. 多重比较:对各对均值之间的差异的显著性检验89. LSD法在统计推断时犯第一类错误的概率大,而Duncan 法犯第一类错误的概率小。90. 多个方差齐性检验(bartlett检验,巴特氏卡平方检验):当a 个随机样本是从独立正态总体中抽取时,可以计算出统计量K 平方,当n=min(nj)充分大时, K 平方的抽样分布非常接近于a-1 自由度的卡方分布。由此可对多个总体进行卡平方检验。91. 两因素之间交互作用产生新效应的现象为交互作用92. 由因素水平的改变而造成的因素效应的改
17、变称为该因素的主效应93. 交叉分组设计:假设A 药物有 a 水平, B 药物有b 水平,共有ab 个剂精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 7 页学习必备欢迎下载量组合,每一组重复n 次。共有abn 名病人参加实验,这样的实验设计称为交叉分组设计94. 相关:设有两个随机变量X 和 Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个确定的分布与之相对应,则称这两个随机变量之间存在相关关系95. 如果变量之间的关系可以用函数关系来表达,就称它们之间的关系为确定性关系96. 回归关系、相关关系:统计学上把变量之间的非确
18、定性关系称为相关关系,也成为回归关系97. 如果对于一个普通变量x 的每一个可能的值xj 都有随机变量Y的一个分布与之对应,则称随见变量Y 的一个分布与之对应,则称随机变量Y 对 x 存在回归关系98. 具有回归关系的两变量之间对于任一xi都不会有一个确切的yi与之对应,但为了描述两变量之间的数量关系,可选当x=xi时 Y 的平均数谬角标 Y 乘 X=xi 与之相对应,则称谬角标Y 乘 X是 Y 的条件平均数99. Y1,y2 yn 这 n 个数据的离差平方和,记作SYY ,称为总离差平方和,反映了 n 个 yi 折的离散程度100.回归平方和(y 折-y 拔)平方求和,几座SSR 。是 n
19、个 yi 折的离差平方和,反映了n 个 yi 折的离散程度101.剩余平方和(残差平方和)(yi-yi拔)平方求和,记作SSe,是除了 x 对 Y 的线性影响之外的其他剩余因素造成的平方和,这些因素中包括 x 对 Y 的非线性影响及试验误差,观察误差等随机因素102.相关分析是对两个或两个以上随见变量之间相互关联程度进行分析的统计学方法103.存在于两个随机变量之间的相关关系称为简单相关或单相关,存在于三个或三个以上变量之间的相关关系为多重相关或复相关在一元回归中,回归的显著程度,可以用相关系数来表示,同样,在多元回归问题中,回归的显著程度可以用复相关系数表示104.统计学上把衡量变量之间关系
20、密切程度的统计量称为相关系数105.消除了其他变量的影响后两个变量之间的相关关系称为偏相关(纯相关)。为了反映两变量间的真正关系,就要保证在其他变量都保持不变的情况下,计算它们的相关系数,这时的相关系数称为偏相关系数或纯相关系数106.样本平均数作为总体平均数估计值的优良:无偏(均值等于总体平均数)、有效(方差小雨其他估计值)、一致性(总体平均数为极限值)107.概率论中有关论证随机变量的和的分布服从正态分布的一类定理称为中心极限定理108.若 X 为一随机变量,则F( x)=P(X=x) 为 X 的分布函数数理统计上称统计量的分布为抽样分布第一个统计假设是 =10 ,这个假设称为原假设(零假
21、设,零值假设),用符号H0 表示 ; 第二个统计假设 10 称为备择假设(替代假设),用符号 H1 或 HA 表示。概率很小的事件在一次试验中实际上是不可能发生的。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 7 页学习必备欢迎下载按小概率原理否定H0,不免要犯错误,我们知道,当H0 为真时,小概率事件A 也有可能发生,因此当我们拒绝H0 时,我们可能会犯以真为假的错误,称之为型错误。原假设不真实,而我们却按小概率原理接受了它,这种以假为真的错误称为型错误。假设检验的步骤提出假设 H0,即,假定试验结果与真值(正常值,或要求值)没有差
22、异,现有差异是由抽样误差所引起的。确定检验方法 ,在 H0 为真的前提下,构造一个合适的统计量U、T、X2 、或F。显著性水平a 的确定 ,然后由 a确定所选检验统计量的临界值。从而划定接受域和拒绝域。做出推断根据样本值计算所选统计量的具体值。然后做出推断:统计推断的主要内容分为两大类:总体参数估计和统计假设检验。通过样本确定分布函数中参数值的过程称为参数估计。随机变量的数字特征同它的概率分布中的参数之间通常有一定的关系,因而对数字特征的估计也被称为参数估计。由抽样引起的样本值与总体值之间的差异称为抽样误差。下面是几种常用的衡量估计量好坏的准则。无偏性有效性一致性标准误差,标准误描述样本平均数
23、波动情况的统计量就是样本平均数这个随机变量的方差或标准差,配对实验是指这样的实验,来自两个总体的样本值是成对出现的,它的特点是n1=n2,一个样本中的某个数据必然对应于另一个样本中的相应数据。由于同一配对内两个供试材料的实验条件很接近, 而且这一配对内的系统误差又可以通过这一对数据的差数来消除,从而使处理效果更加明显,因而可以减小实验误差,提高实验精度。对总体分布类型的检验通常称为分布函数的拟合优度检验(goodness of fit test) 。该检验包括两种类型:一是检验观测数与理论数之间的一致性;二通过检验观测数与理论数之间的一致性来判断事件之间的独立性。皮尔逊卡平方检验的第二个主要应
24、用方面是通过检验观测数与理论数之间的一致性来判断事件之间的独立性。列联表的独立性检验就属于这种情况。列联表是样本观测数据按两个或两个以上标准分类所得的一种频数表。方差分析的前提条件等方差: a 组数据可看作来自a个总体的a 个样本,要求每个总体要有相同的方差s2;正态性:要求a 个总体均服从正态分布独立性:要求a 个总体之间相互独立。处理固定因素所用的模型称为固定效应模型(fixed effect model) 或简单地称为固定模型(fixed model)。两因素之间相互作用而产生新效应的现象称为交互作用精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - -
25、-第 6 页,共 7 页学习必备欢迎下载由因素水平的改变而造成的因素效应的改变称为该因素的主效应如果变量之间的关系不可以用函数关系来表达,则称它们之间的关系为非确定性关系。统计学上把变量之间的非确定性关系称为相关关系,有时也称为回归关系。若 X 也是一个随机变量,在Y 对 X 存在回归关系的同时,X 对 Y 也存在回归关系,这时称X 和 Y 间存在相关 (correlation)关系。相关分析是对两个或两个以上随机变量之间相互关联程度进行分析的统计学方法。存在于两个随机变量之间的相关关系称为简单相关,或单相关; 存在于三个或三个以上变量之间的相关关系为多重相关,或复相关。统计学上把衡量变量之间关系密切程度的统计量称为相关系数。一个变量与两个或两个以上变量之间的相关关系称为复相关,而它们之间相关联密切程度的数量指标就称为复相关系数消除了其它变量的影响后两个变量之间的相关关系称为偏相关(或纯相关),相应的相关系数称为偏相关系数(partialcorrelationcoefficient) (或纯相关系数)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 7 页
限制150内