高级生物统计精选文档.ppt





《高级生物统计精选文档.ppt》由会员分享,可在线阅读,更多相关《高级生物统计精选文档.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高级生物统计本讲稿第一页,共八十五页(一)数学模型(一)数学模型其中:x预先确定,不受试验误差影响;y随x而变,且受试验误差影响;或 x、y都受试验误差的影响(x、y都为可观测的随机变量)本讲稿第二页,共八十五页总体回归截距,总体回归截距,总体回归系数,总体回归系数,i为随机变量,相互独立,且都服从为随机变量,相互独立,且都服从N(0,2)即即iN(0,2),E(i)=0,V(i)=2;yN(+x,2),E(y)=+x,V(y)=2本讲稿第三页,共八十五页(二)回归方程a估计估计b估计估计估计估计+x本讲稿第四页,共八十五页b、a的计算公式为:的计算公式为:其中本讲稿第五页,共八十五页离回归标
2、准误,表示回离回归标准误,表示回 归方程估测的偏离度归方程估测的偏离度离回归均方离回归均方本讲稿第六页,共八十五页(三)显著性检验本讲稿第七页,共八十五页1、t检验Ho:=0,HA:0回归系数标准误回归系数标准误其中:其中:本讲稿第八页,共八十五页2、F检验Ho:=0,HA:0平方和与自由度的划分式:平方和与自由度的划分式:本讲稿第九页,共八十五页SSyy的总平方和的总平方和,SSR 回归方平方和回归方平方和,SSr离回归平方和,离回归平方和,dfy=n-1y的总自由度的总自由度,dfR=1回归自由度回归自由度,dfr=n-2离回归自由度离回归自由度(剩余自由度剩余自由度)本讲稿第十页,共八十
3、五页(舍入误差小)舍入误差小)(便于推广便于推广)各项平方和的计算公式如下:本讲稿第十一页,共八十五页可用可用 df1=1,df2=n-2来检验来检验 Ho:=0成立与否。成立与否。本讲稿第十二页,共八十五页 在直线回归分析中,在直线回归分析中,F 检验与检验与t 检验等检验等价,这是因为价,这是因为t(n-2)与与F(1,n-2)有如下关系:有如下关系:也就是说,凡是也就是说,凡是F 检验中的大均方自由检验中的大均方自由度为度为1,则相应有一个与之等价的,则相应有一个与之等价的t 检验,检验,反之亦然。反之亦然。本讲稿第十三页,共八十五页 相关系数r 表示x与y线性相关的性质与程度 将将 r
4、 与与r0.05(n-2)、r0.01(n-2)比比较较,进进行行显显著著性性检检验验,从从而推断而推断y与与x间是否存在线性关系。间是否存在线性关系。3、由相关系数由相关系数r的显著性检验进行判断的显著性检验进行判断本讲稿第十四页,共八十五页(四)决定系数四)决定系数r2 决定系数决定系数r2决定系数决定系数r2表示回归方程估测的可靠程表示回归方程估测的可靠程度。度。本讲稿第十五页,共八十五页(五)区间估计本讲稿第十六页,共八十五页1、的置信区间的置信区间a是是的点估计值的点估计值其中其中样本回归截距标准误样本回归截距标准误本讲稿第十七页,共八十五页于是,可以得出:于是,可以得出:的的95%
5、置信区间:置信区间:at0.05(n-2)Sa的的99%置信区间:置信区间:at0.01(n-2)Sa本讲稿第十八页,共八十五页b是是的点估计值的点估计值其中其中样本回归系数标准误样本回归系数标准误2、的置信区间的置信区间本讲稿第十九页,共八十五页于是,可以得出:于是,可以得出:的的95%置信区间:置信区间:b t0.05(n-2)Sb的的99%置信区间:置信区间:b t0.01(n-2)Sb本讲稿第二十页,共八十五页是是+x的点估计值的点估计值其中其中回归估计值标准误回归估计值标准误3、E(y)=+x 的置信区间本讲稿第二十一页,共八十五页于是,可以得出:于是,可以得出:+x的的95%置信区
6、间:置信区间:+x的的99%置信区间:置信区间:本讲稿第二十二页,共八十五页其中其中观测值观测值y的标准误的标准误4、单个、单个y 值值的置信区间的置信区间本讲稿第二十三页,共八十五页于是可以得出:于是可以得出:y的的95%置信区间:置信区间:y 的的99%置信区间:置信区间:本讲稿第二十四页,共八十五页二、加权回归(weighted regression)【例1.1】为了研究某品种水稻中蛋白质和赖氨酸含量的关系,把不同地区的水稻进行分组,每组抽测若干个样品的蛋白质和赖氨酸,结果如表1-1所示,进行回归分析。本讲稿第二十五页,共八十五页mi样本数;样本数;xi、yi 均为平均数均为平均数。组号
7、12345678910mi35481174629xi8.90 8.41 9.80 8.09 9.00 10.22 8.56 8.78 10.08 9.90 yi0.283 0.320 0.276 0.299 0.267 0.255 0.290 0.295 0.263 0.270 表1-1 水稻蛋白质和赖氨酸测定结果 本讲稿第二十六页,共八十五页 此例各组样本数不等,须以样本数此例各组样本数不等,须以样本数mi 为权进行加权回归分析。为权进行加权回归分析。本讲稿第二十七页,共八十五页本讲稿第二十八页,共八十五页本讲稿第二十九页,共八十五页回归方程的建立于是于是回归方程回归方程本讲稿第三十页,共八
8、十五页回归方程的显著性检验由于由于说明说明y与与x间存在极显著的线性关系,间存在极显著的线性关系,可以用所建立的可以用所建立的回归方程来进行预测与控制。回归方程来进行预测与控制。本讲稿第三十一页,共八十五页决定系数决定系数表明回归方程估测可靠程度高。表明回归方程估测可靠程度高。回归方程估测可靠程度回归方程估测可靠程度本讲稿第三十二页,共八十五页变异系数:变异系数:表明回归方程估测值相对偏离度较小。表明回归方程估测值相对偏离度较小。本讲稿第三十三页,共八十五页三、有重复观察值的回归 t=b/sb或或F=MSR/MSr 显显著著表表明明相相对对于于其其它它因因素素、x的的高高次次项项及及试试验验误
9、误差差来来说说,因因素素x的的一一次次项项对对y的的影影响响是是主主要要的的,但但未未回回答答:影影响响y的的除除x外外是是否否还还有有其其它它不不可可忽忽略略的的因因素素,x与与y是是否否确确是是线线性性关关系系。也也就就是是说说,还还须须检检验验一一个个回回归归方方程程的的失失拟拟性性。这这个个问问题题可可以以通通过过做做一一些重复试验从而估计出真正的试验误差来解决。些重复试验从而估计出真正的试验误差来解决。本讲稿第三十四页,共八十五页设设一个一个试验试验有有n个个处处理,其中理,其中x1、x2、xn-1重复重复1次,次,xn重复重复m次,次,观测结观测结果如下:果如下:x1x2xn-1x
10、nxn+1xn+m-1(xn=xn+1=xn+m-1)y1y2yn-1ynyn+1yn+m-1 m次重复次重复(一一)部分部分试验试验有重复的回有重复的回归归本讲稿第三十五页,共八十五页对这一资料可按有对这一资料可按有(n+m-1)组观测值进行回归分组观测值进行回归分析。析。进行显著性检验时各项平方和与自由度计算如进行显著性检验时各项平方和与自由度计算如下:下:本讲稿第三十六页,共八十五页 利用利用xn处理的处理的m个重复观测值,可以计算出反应真正个重复观测值,可以计算出反应真正的试验误差的平方和的试验误差的平方和称为纯误平方和相应的自由度:称为纯误平方和相应的自由度:纯误平方和纯误平方和纯误
11、自由度纯误自由度本讲稿第三十七页,共八十五页失拟平方和及其自由度失拟平方和及其自由度此此时时,SSr-SSe反反映映除除x的的一一次次项项以以外外的的其其它它因因素素(包包含含别别的的因因素素和和x的的高高次次项项)所所引引起起的的变变异异,是是x的的一一次次项项所所未未能能拟拟合合的的部部分分,称称为为失失拟拟平平方方和和,记记为为SSLf,相相应应的自由度记为的自由度记为dfLf。SSLf、dfLf计算公式如下:计算公式如下:SSLf=SSr-SSedfLf=(n+m-1)-2-(m-1)=n-2本讲稿第三十八页,共八十五页SSrdfr或或SSLf+SSedfLf+dfe平方和与自由度的划
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 生物 统计 精选 文档

限制150内