试验设计与分析园艺第三章统计推断精品文稿.ppt
《试验设计与分析园艺第三章统计推断精品文稿.ppt》由会员分享,可在线阅读,更多相关《试验设计与分析园艺第三章统计推断精品文稿.ppt(104页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验设计与分析园艺第三章统计推断第1页,本讲稿共104页n第一节第一节 参数估计参数估计 n第二节第二节 统计假设测验的原理统计假设测验的原理n第三节第三节 样本平均数的显著性测验样本平均数的显著性测验 n第四节第四节 统计假设测验的两类错误统计假设测验的两类错误 第2页,本讲稿共104页第一节第一节 参数估计参数估计n统计推断的内容统计推断的内容q总体的参数估计总体的参数估计q总体的假设检验总体的假设检验n参数估计:总体参数未知时,需要从总体抽出一个样本对参数估计:总体参数未知时,需要从总体抽出一个样本对未知参数进行估计。分为未知参数进行估计。分为点估计点估计和和区间估计区间估计。q点估计是
2、对参数点估计是对参数真值真值的估计的估计q区间估计是对参数区间估计是对参数真值取值范围真值取值范围的估计的估计第3页,本讲稿共104页一、参数的点估计一、参数的点估计 (1)点估计的定义)点估计的定义n假设总体假设总体x 的分布函数的形式已知,但含有未知参数的分布函数的形式已知,但含有未知参数。x1、x2、xn为总体的一个样本,构造一个为总体的一个样本,构造一个 的的统计量统计量(如平均数),将所测得的样本值代入统计(如平均数),将所测得的样本值代入统计量,就会得到量,就会得到 ,那么就称,那么就称 为未知参数为未知参数 的估计值。的估计值。第4页,本讲稿共104页(2)评价估计量优劣的标准评
3、价估计量优劣的标准n无偏性无偏性:如果:如果 的数学期望值存在,且等于待估的数学期望值存在,且等于待估参数参数,就是就是 的无偏估计。的无偏估计。n有效性有效性:如果:如果 和和 都是都是 的无偏估计,但的无偏估计,但 的方差的方差小于小于 的方差,我们就说的方差,我们就说 比比 有效。有效。n一致性一致性:对任意小的正数:对任意小的正数,成立,成立,则称则称 是参数是参数 的一致估计量。的一致估计量。第5页,本讲稿共104页二、参数的区间估计二、参数的区间估计(1)点估计的缺点)点估计的缺点n只给出了总体参数的估计值,没有考虑只给出了总体参数的估计值,没有考虑试验误差试验误差的影响,的影响,
4、从总体中抽取不同的样本,可能得到不同的结果。从总体中抽取不同的样本,可能得到不同的结果。n没有指出估计的没有指出估计的可靠程度可靠程度。第6页,本讲稿共104页(2)区间估计相关概念)区间估计相关概念n区间估计区间估计:在一定概率保证下给出总体参数的可能范围:在一定概率保证下给出总体参数的可能范围n置信区间置信区间:所给出的可能范围:所给出的可能范围n置信限置信限:置信区间的上、下限,用:置信区间的上、下限,用L1和和L2表示表示n置信距置信距:置信区间的长度:置信区间的长度n置信度置信度:所给出的概率保证,也称置信概率,用:所给出的概率保证,也称置信概率,用P=(1)表示)表示第7页,本讲稿
5、共104页(3)区间估计的原理)区间估计的原理n置信度置信度1反映了区间估计的可信度,常取反映了区间估计的可信度,常取0.90、0.95和和0.99。n置信距反映了区间估计的精确度。置信距反映了区间估计的精确度。n在保证置信度在保证置信度1的前提下,置信区间越短越好的前提下,置信区间越短越好。第8页,本讲稿共104页(4)进行区间估计的一般步骤:)进行区间估计的一般步骤:n首先,构造一个与待估计参数首先,构造一个与待估计参数 有关的统计量有关的统计量 ;n其次,找出统计量其次,找出统计量 的分布,在一定的置信度下,给出临界值;的分布,在一定的置信度下,给出临界值;n最后,计算总体参数最后,计算
6、总体参数 的置信区间。的置信区间。第9页,本讲稿共104页三、正态总体平均数三、正态总体平均数的置信区间的置信区间(1)总体方差总体方差2已知已知时,时,的置信区间为的置信区间为n其中,其中,u为正态分布下置信度为为正态分布下置信度为1时时u的临界值。的临界值。第10页,本讲稿共104页应用举例应用举例n某棉花株行圃某棉花株行圃36个单行的皮棉平均产量为个单行的皮棉平均产量为 4.1kg,已知已知0.3kg,求,求99%置信度下该株行皮棉产量置信度下该株行皮棉产量的的置信区间。置信区间。第11页,本讲稿共104页q置信度置信度P=(1)0.99,0.01,则,则u0.012.58q由于由于q置
7、信区间为置信区间为(4.12.580.05)(4.12.58 0.05),即,即3.9714.229q推断:该株行圃皮棉平均产量在推断:该株行圃皮棉平均产量在3.9714.229kg之间,此之间,此估计值的可靠度有估计值的可靠度有99%。q0.05时,平均产量在时,平均产量在4.0024.198kg之间之间 第12页,本讲稿共104页(2)总体方差)总体方差2未知但为大样本未知但为大样本时,时,用样本方差用样本方差s2 代代替替2,的置信区间为的置信区间为(3)总体方差)总体方差2未知且为小样本未知且为小样本时,时,用样本方差用样本方差s2 估估计计2,的置信区间为的置信区间为 其中,其中,t
8、为为t分布分布下置信度为下置信度为1时时t的临界值。的临界值。第13页,本讲稿共104页t 分布分布n由样本平均数抽样分布的性质知道:若由样本平均数抽样分布的性质知道:若xN(,2),则,则 N(,2/n)。将随机变量标准化:。将随机变量标准化:,则,则uN(0,1)。n当总体标准差当总体标准差未知时,如果为大样本,可以用样本标准差未知时,如果为大样本,可以用样本标准差s直接直接代替代替使用。使用。n如果为小样本,那么用如果为小样本,那么用s代替代替所得到的统计数记为所得到的统计数记为t,即,即 。n由于用由于用s代替代替,t变量不再服从标准正态分布,而是服从自由度变量不再服从标准正态分布,而
9、是服从自由度dfn1的的t分布,分布,t的取值范围是的取值范围是(,)。n附表附表5中数字为两尾临界中数字为两尾临界t值。值。第14页,本讲稿共104页应用举例应用举例n某春小麦良种在某春小麦良种在8个小区的平均千粒重个小区的平均千粒重 ,。试估计在置信度为。试估计在置信度为95%时该品种的千时该品种的千粒重范围。粒重范围。n由附表由附表4,t 0.05(7)2.365,95%置信区间为置信区间为(35.22.3650.58)(35.22.3650.58),即,即33.836.6n推断:该品种的千粒重范围在推断:该品种的千粒重范围在33.836.6g之间,之间,此估计值的可靠度有此估计值的可靠
10、度有95%。也可以写作。也可以写作35.22.3560.5835.21.4g,即,即33.836.6g。第15页,本讲稿共104页四、两总体平均数差数四、两总体平均数差数(12)的的 置信区间置信区间 (1)两总体方差已知两总体方差已知时,时,12在在1置信度下的置信置信度下的置信区间为区间为(2)两总体方差未知但为大样本两总体方差未知但为大样本时,用时,用s1、s2分别代替分别代替1、2,12在在1置信度下的置信区间为置信度下的置信区间为第16页,本讲稿共104页应用举例应用举例n测两个甘薯品种单株平均产量,其中第一个品种测了测两个甘薯品种单株平均产量,其中第一个品种测了332株,株,=15
11、50g,s1=5.350g;第二个品种测了;第二个品种测了282株,株,=1250g,s2=3.750g。试估计这两个品种单株。试估计这两个品种单株平均产量的相差在平均产量的相差在95%置信度下的置信区间。置信度下的置信区间。第17页,本讲稿共104页n由附表由附表3查得置信度为查得置信度为95%时,时,u0.05=1.96,并且,并且n95%置信度下的置信区间为置信度下的置信区间为n(1512)1.960.3612(1512)1.960.36,即即2.2912 3.71。因此,第一个品种比第二个品种。因此,第一个品种比第二个品种的单株平均产量多的单株平均产量多2.29 50g3.7150g,
12、这个估计有,这个估计有95%的把握。的把握。第18页,本讲稿共104页(2)两总体方差未知且为小样本两总体方差未知且为小样本时时 如果如果两总体方差相等两总体方差相等,即,即1222 2。12在在1置信度下的置信区间为:置信度下的置信区间为:其中,其中,df=n1+n2-2第19页,本讲稿共104页应用举例应用举例n比较两种密度水稻的平均亩产量,每种密度各调比较两种密度水稻的平均亩产量,每种密度各调查查5个小区,结果个小区,结果 =428kg,=440kg,=11.136kg。试估计这两种密度水稻的平均亩。试估计这两种密度水稻的平均亩产量差数在产量差数在99%置信度下的置信区间。置信度下的置信
13、区间。第20页,本讲稿共104页n由附表由附表5查得查得df8时置信度为时置信度为99%时,时,t0.013.355n99%置信度下的置信区间为置信度下的置信区间为(428440)3.355 11.13612(428440)3.35511.136,即,即49.41225.4。n结果说明:第一种密度的平均亩产量可以比第二种密度少收结果说明:第一种密度的平均亩产量可以比第二种密度少收49.4kg到多收到多收25.4kg,波动很大。,波动很大。n因此,这个例子说明因此,这个例子说明12的。的。第21页,本讲稿共104页n当当 12时,意味着两总体平均数相等,因此,可用两样时,意味着两总体平均数相等,
14、因此,可用两样本平均数的加权平均数本平均数的加权平均数 作为对作为对的估计:的估计:第22页,本讲稿共104页 如果如果两总体方差不相等两总体方差不相等,即,即1222。12在在1置信度下的置信区间为:置信度下的置信区间为:其中其中 取其整数部分取其整数部分第23页,本讲稿共104页第二节第二节 统计假设测验的原理统计假设测验的原理一、统计假设测验的概念一、统计假设测验的概念二、统计假设测验的原理二、统计假设测验的原理 三、统计假设测验的步骤三、统计假设测验的步骤 四、两尾测验和一尾测验四、两尾测验和一尾测验 第24页,本讲稿共104页一、统计假设测验的概念一、统计假设测验的概念(1)为什么要
15、进行统计假设测验)为什么要进行统计假设测验n一个试验相当于一个样本,由一个样本统计数可以对总体参数作一个试验相当于一个样本,由一个样本统计数可以对总体参数作出估计,但总体参数是固定的,而样本统计数会因样本不同而不出估计,但总体参数是固定的,而样本统计数会因样本不同而不同,即样本统计数存在误差。同,即样本统计数存在误差。第25页,本讲稿共104页n如:某地区主栽水稻品种的亩产量为如:某地区主栽水稻品种的亩产量为550kg(总体),一新(总体),一新品种的多点试验结果为品种的多点试验结果为600kg的亩产量,试问这一新品种的亩产量,试问这一新品种的亩产量是否真正高于主栽品种?(其它举例见教材的亩产
16、量是否真正高于主栽品种?(其它举例见教材P75)n该新品种的亩产量比主栽品种高该新品种的亩产量比主栽品种高600550=50kg,这是试验,这是试验的表面效应,造成这种差异的可能原因有两个:的表面效应,造成这种差异的可能原因有两个:q一是新品种确实优于主栽品种一是新品种确实优于主栽品种q二是试验误差二是试验误差第26页,本讲稿共104页(2)如何进行假设测验)如何进行假设测验n那么如何判断是哪一种原因?方法是将表面效应与误差作比较。那么如何判断是哪一种原因?方法是将表面效应与误差作比较。q如果表面效应并不大于误差,则无充分证据说明新品种确实优于主栽如果表面效应并不大于误差,则无充分证据说明新品
17、种确实优于主栽品种,表面效应是由试验误差造成的。品种,表面效应是由试验误差造成的。q如果表面效应大于误差,表面效应不完全是由试验误差造成的,说明新品如果表面效应大于误差,表面效应不完全是由试验误差造成的,说明新品种确实优于主栽品种。种确实优于主栽品种。第27页,本讲稿共104页n表面效应是否大于试验误差这个度怎么把握?表面效应是否大于试验误差这个度怎么把握?q我们可以根据抽样误差出现的概率而利用抽样分布来计算。我们可以根据抽样误差出现的概率而利用抽样分布来计算。q只要设定一定的概率标准,如只要设定一定的概率标准,如5%或或1%,如果表面效应属于误差,如果表面效应属于误差的概率不超过这个标准,我
18、们就可以认为表面效应不完全是由的概率不超过这个标准,我们就可以认为表面效应不完全是由试验误差造成的。试验误差造成的。第28页,本讲稿共104页(3)相关概念)相关概念n统计推断统计推断:把试验的表面效应与误差大小相比较并由表面效:把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率而作出推论的方法。应可能属于误差的概率而作出推论的方法。n统计假设测验:统计假设测验:计算表面效应由误差造成的概率首先必计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成的(如假定新品种并不优须假设表面效应是由误差造成的(如假定新品种并不优于主栽品种)。有了这个事先的假设,才能计算概率。于主栽品种
19、)。有了这个事先的假设,才能计算概率。这种先作处理无效的假设(无效假设)再依据该假设概率这种先作处理无效的假设(无效假设)再依据该假设概率大小来判断接受或否定该假设的过程称为统计假设测验大小来判断接受或否定该假设的过程称为统计假设测验。第29页,本讲稿共104页二、统计假设测验的原理二、统计假设测验的原理(1)两个总体间的差异如何比较?)两个总体间的差异如何比较?q一种方法是检验整个总体材料,获得全部结果,这种一种方法是检验整个总体材料,获得全部结果,这种方法很准确,但实际上不可能进行。方法很准确,但实际上不可能进行。q另一种方法是通过研究样本来研究其所代表的总体。另一种方法是通过研究样本来研
20、究其所代表的总体。n如将新旧品种共同种植如将新旧品种共同种植12年,取得其平均产量,然后由此年,取得其平均产量,然后由此推断推断“新旧品种无差异新旧品种无差异”的假设是否正确。如果发现假设和的假设是否正确。如果发现假设和试验结果相符的可能性大,接受该假设;反之,否定该假设。试验结果相符的可能性大,接受该假设;反之,否定该假设。第30页,本讲稿共104页(2)相关概念)相关概念 n统计假设统计假设:要进行统计假设测验,首先需要提出一个有关某:要进行统计假设测验,首先需要提出一个有关某一总体参数的假设,这种假设称为统计假设。一总体参数的假设,这种假设称为统计假设。n无效假设无效假设:统计假设一般假
21、设没有效应差异,即表面效应是:统计假设一般假设没有效应差异,即表面效应是由误差造成的,这种假设称为无效假设,记作由误差造成的,这种假设称为无效假设,记作H0。n备择假设备择假设:和无效假设相对应的是备择假设,记作:和无效假设相对应的是备择假设,记作HA。q如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,也就否定了备择假设。也就否定了备择假设。第31页,本讲稿共104页(3)常见的统计假设类型)常见的统计假设类型n单个平均数的假设单个平均数的假设:样本是从具有平均数:样本是从具有平均数0的总体中随机抽出的总体中随机抽出的,记
22、作的,记作H0:0。q如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产量的一个随机样本,其平均产量量的一个随机样本,其平均产量等于主栽品种产量等于主栽品种产量0,故记为,故记为H0:0。n两个平均数相比较的假设两个平均数相比较的假设:两个样本是从两个具有相等平:两个样本是从两个具有相等平均数的总体中随机抽出的,记为均数的总体中随机抽出的,记为H0:12或或120。q如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。第32页,本讲稿共104页三
23、、统计假设测验的步骤三、统计假设测验的步骤(1)对所研究的总体及所抽取的样本首先提出一个无效假设)对所研究的总体及所抽取的样本首先提出一个无效假设和备择假设和备择假设(2)在承认上述无效假设的前提下,获得平均数的抽样分)在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率布,计算该假设正确的概率(3)根据)根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否原理接受或否定假设定假设第33页,本讲稿共104页应用实例n某地小麦主栽品种亩产某地小麦主栽品种亩产300kg,即当地品种这个总体的平,即当地品种这个总体的平均数均数0=300kg,并从多年种植结果获得
24、其标准差,并从多年种植结果获得其标准差=75kg,而现有某新品种通过,而现有某新品种通过25个小区的试验,计得其样本平个小区的试验,计得其样本平均亩产量为均亩产量为330kg,即即 =330,那么新品种样本所属总,那么新品种样本所属总体与体与0=300kg的主栽品种这个总体是否有显著差异呢?的主栽品种这个总体是否有显著差异呢?第34页,本讲稿共104页(1)对所研究的总体首先提出一个无效假设)对所研究的总体首先提出一个无效假设n通常无效假设常为所比较的两个总体间无差异。通常无效假设常为所比较的两个总体间无差异。n测验单个平均数,则假设该样本是从一已知总体中随机抽出测验单个平均数,则假设该样本是
25、从一已知总体中随机抽出的,即的,即H0:0,备择假设为,备择假设为HA:0。q假定新品种的总体平均数假定新品种的总体平均数等于原品种的总体平均数等于原品种的总体平均数0=300kg,而样本平均,而样本平均数和之间的差数:数和之间的差数:330300=30kg属随机误差;属随机误差;n如果测验两个平均数,则假设两个样本的总体平均数相等,即如果测验两个平均数,则假设两个样本的总体平均数相等,即H0:12,也就是假设两个样本平均数的差数,也就是假设两个样本平均数的差数 属随机误差,并非真实差异;其备择假设为属随机误差,并非真实差异;其备择假设为HA:1 2。第35页,本讲稿共104页(2)在承认上述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 设计 分析 园艺 第三 统计 推断 精品 文稿
限制150内