《生物统计学专题培训市公开课一等奖百校联赛特等奖课件.pptx》由会员分享,可在线阅读,更多相关《生物统计学专题培训市公开课一等奖百校联赛特等奖课件.pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生 物 统 计 学主讲教师:宋喜娥第1页第九章 直线相关与直线回归 第一节 回归和相关概念 第二节 直线回归 第三节 直线相关 第四节 直线相关和回归关系 第五节 相关问题讨论第2页第一节 回归和相关概念一、变数关系函数关系:函数关系:即一个变数任一变量必与另一变数一个确定数值相对应。是一个确定关系,不受误差影响。统计关系:统计关系:即一个变数取值受到另一个变数影响。是一个非确定关系,是受误差影响。第3页二、自变数、依变数依据两个变数作用特点,统计关系又能够分为:因果关系:有自变数x和依变数y之分。相关关系:x、y相互影响,平行改变,不存在自变数x和依变数y之分。第4页三、回归分析和相关分析回
2、归分析:回归分析:就是指以计算回归方程为基础分析方法。X为自变数,y为依变数,x不受或少受误差影响相关分析:相关分析:就是指以计算相关关系为基础统计分析方法X和y都受误差影响,没有自变数和依变数区分两个变数中,假如y含有试验误差而x不含试验误差时着重进行回归分析;假如x和y均含有试验误差时着重进行相关分析第5页四、两个变数散点图第6页五、在回归和相关分析中,必须注意问题变数间是否存在相关以及在什么条件下会发生什么相变数间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各详细学科本身来确定。关等问题,都必须由各详细学科本身来确定。因为自然界各种事物间相互联络或相互制约,一事物因为自然界
3、各种事物间相互联络或相互制约,一事物改变通常都会受到许多其它事物影响。所以假如仅研究改变通常都会受到许多其它事物影响。所以假如仅研究一事物与另一事物关系,则要求其它事物均匀性必须得一事物与另一事物关系,则要求其它事物均匀性必须得到严格控制,不然回归和相关分析可能造成完全虚假结到严格控制,不然回归和相关分析可能造成完全虚假结果果 为了提升回归和相关分析准确性,两个变数成对观察为了提升回归和相关分析准确性,两个变数成对观察值应尽可能多一些,并使值应尽可能多一些,并使x x变数取值尽可能大一些,普通变数取值尽可能大一些,普通应有对以上观察值应有对以上观察值第7页第二节直线回归一、直线回归方程二、直线
4、回归假设测验和区间预计第九章第8页一、直线回归方程方程直线回归方程计算直线回归方程图示回归标准误第9页方程直线回归方程通式为:其中x是自变数,是和x量相对应依变数点预计值A是方程在y轴上截距,叫回归截距,b是回归系数,即x每增加或降低一个单位数时,平均要增加或降低单位数第10页当a0时,回归截距为正数,说明直线与y轴有交点;当a0时,回归截距为负数,说明直线与y轴有交点;当b0时,伴随x增大,y增大,x与y成正相关;当b0时,伴随x增大,y减小,x与y成负相关;当b时,说明变异和取值无关,直线回归关系不能成立。第11页第12页直线回归方程计算重点是要算出a和b值。(举例说明)设某食品感官评定时
5、,测得食品甜度与蔗糖浓度关设某食品感官评定时,测得食品甜度与蔗糖浓度关系以下表,试求系以下表,试求y y对对x x直线回归方程。直线回归方程。蔗糖质量分数x/%1.03.04.05.57.08.09.5甜度y1518192122.623.826食品甜度与蔗糖浓度第13页这是一个二无一次方程组,解这个方程组能够得到:第14页首先计算个一级数据第15页然后由一级数据算出个二级数据第16页从而有所求直线回归方程为:第17页直线回归方程图示第18页直线回归标准误能够反应不一样资料中误差大小。第19页二、直线回归假设测验和区间预计假设测验()t测验设:;对:其中为总体回归系数其中b为回归系数标准误自由度
6、为n-2第20页()测验回归平方和:用“”表示,其自由度为第21页区间预计()回归截距a置信区间:a标准误为Saa置信区间为第22页(2)回归系数置信区间回归系数标准误为:回归系数置信区间为:(3)y预计值置信区间预计标准误为:第23页置信区间为:第24页 相关系数、决定系数 相关系数假设测验第三节 直线相关第九章第25页 相关系数 相关系数:对两个变数之间关系进行定性和定量描述统计数。相关系数正负表示相关性质;相关系数绝对值大小表示相关亲密程度。普通用表示总体相关系数,用r表示样本相关系数。一、相关系数、决定系数第26页第27页 决定系数 决定系数:指由x不一样而引发y平方和占总平方和比率第
7、28页相关系数和决定系数区分在于:除掉r=1和情况外,r2总是小于r。r是可正可负,而r2则一律取正值,其取值区间为,。所以,在相关分析中将二者结合起来是可取,即由r正负表示相关性质,由r2大小表示相关程度。第29页 相关系数和决定系数计算测定某大豆子粒内脂肪含量(%)和蛋白质含量(%)关系,样本含量n=42,结果以下,试作相关分析第30页xyxyxy15.444.019.442.021.937.217.538.220.437.423.836.618.941.821.635.917.042.820.038.922.936.018.642.121.038.416.142.119.737.922.
8、838.118.140.020.736.215.844.619.640.222.036.717.840.720.439.124.237.619.139.821.839.417.442.220.440.023.433.218.939.921.537.816.843.120.837.122.934.718.440.922.338.615.942.619.738.924.634.817.939.820.735.819.939.8第31页经计算得该资料第32页二、相关系数假设测验 首先提出假设:无效假设和备择假设(:)对(:)。然后由相关系数标准差进行检验计算。(有t测验和测验)第33页t测验测验第3
9、4页统计学家已依据相关系数r显著性t测验法计算出了临界r值,并列出了表格,所以可直接采取查表法对相关系数和r进行显著性检验若rr0.05,P0.05,则相关系数不显著若r0.05 rr0.01,0.01P0.05,则相关系数r显著,若rr0.01,P0.01,则相关系数r极显著第35页第四节直线相关与回归关系l联系:相关与回归是回归分析中变数两种相互关系类型相关强调是两个变数偕同变异,而回归则注重是一个变数随另一个变数变化数量关系确定性表达二者之间没有严格界限,随着对问题研究深入,变数间相关关系可能转化成回归关系,其次,回归关系也常以相关关系形式表现出来l在相关系数和回归系数假设测验时,相关显著,回归必显著,相关不显著,回归也必不显著第九章第36页区分:()二者所遵照模型不一样,两变数之间关系也不一样()相关与回归分析目标不一样,相关主要考查两个变数间相关程度和性质;而回归分析则是为了预测和控制第37页第五节相关问题讨论一、回归分析主要处理问题(1)确定几个特定变数之间是否存在相关关系,假如存在话,找出它们之间适当数学表示式;(2)依据一个或几个变数值,预测或控制另一个变数取值,而且要知道这种预测或控制可到达什么样准确度;(3)进行原因分析,对共同影响一个变数许多变数,找出哪些是主要原因,哪些是次要原因及这些原因间关系。第九章第38页
限制150内