简单线性回归ppt课件.ppt
《简单线性回归ppt课件.ppt》由会员分享,可在线阅读,更多相关《简单线性回归ppt课件.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单线性回归篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统本章内容本章内容 第一节第一节 简单线性回归简单线性回归 第二节第二节 线性回归的应用线性回归的应用 第三节第三节 残差分析残差分析 第四节第四节 非非线性回归线性回归 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统双双变量量计量量资料:料:每个个体有两个每个个体有两个变量量值 总体:体:无限或有限无限或有限
2、对变量量值 样本:本:从从总体随机抽取的体随机抽取的n对变量量值(X1,Y1),(X2,Y2),(Xn,Yn)目的:目的:研究研究X和和Y的数量关系的数量关系 方法:方法:回回归与相关与相关简单、基本、基本直直线回回归、直、直线相关相关第一节第一节 简单线性回归简单线性回归篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 英国人类学家 F.Galton首次在自然遗传一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端
3、的最大长度)做了测量,发现发现:历史背景:篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:。也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 “回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”
4、等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表12-1)进行回归分析,得到图12-1所示散点图(scatter plot)篮球比赛是根据运动队在规定的比赛
5、时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统No.123456789101112131415X1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7Y141315151314161714161516141517篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 在定量描述健康人凝血酶浓度(X)与凝血时间(Y)数据的数量上的依存关系时,将凝 血 酶 浓 度称 为 自 变 量(independent variable),用X 表示;凝血时间称为因变量(dependent v
6、ariable),用Y 表示篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 由图12-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其其方方程程叫叫直直线线回回归归方方程程,以以区区别别严严格格意意义义的的直直线线方方程程。回回归归是是回回归归分分析析中中最最基基本本、最最简简单单的一种,故又称简单
7、回归。的一种,故又称简单回归。篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统样本线回归方程样本线回归方程 为各X处Y的总体均数的估计。简单线性回归模型 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1a 为回归直线在为回归直线在 Y 轴上的截距轴上的截距a 0,表表示示直直线线与与纵纵轴轴的的交交点点在在原点的上方原点的上方a 0,直线从左下方走向右上方,直线从左下方走向右上方,Y 随随 X 增大而增大;增大而增大;b0,直线从左上方走向右下方,直线从左上方走向右下方,Y
8、 随随 X 增大而减小;增大而减小;b=0,表示直线与,表示直线与 X 轴平行,轴平行,X 与与Y 无直线关系无直线关系b 的统计学意义是:的统计学意义是:X 每增加每增加(减减)一个单位,一个单位,Y 平均改变平均改变b个单位个单位 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统回归模型的前提假设回归模型的前提假设o线性回归模型的前提条件是:线性线性(linear)独立独立(independent)正态正态(normal)等方差等方差(equal variance)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,
9、篮球比赛的计时计分系统是一种得分类型的系统 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。原则:最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小回归参数的估计回归参数的估计最小二乘原则最小二乘原则 篮球比赛是根据运动队在规定
10、的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 回归参数的估计方法回归参数的估计方法 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统本例:n=15 X=14.7 X2=14.81 Y=224 XY=216.7 Y2=3368篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因
11、此,篮球比赛的计时计分系统是一种得分类型的系统解题步骤篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统3、计算有关指标的值4、计算回归系数和截距5、列出回归方程篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 此直此直线必然通必然通过点点(,)且与且与纵坐坐标轴相交于相交于截距截距a。如果散点。如果散点图没有从坐没有从坐标系原点开系原点开始,可在自始,可在自变量量实测范范围内内远端取易于端取易于读数的数的值代入回代入回归方程得到一个点的坐方程得到一个点的坐标,连接此点与点接此
12、点与点(,)也可也可绘出回出回归直直线。绘制回归直线绘制回归直线篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统总体回归系数总体回归系数的的的统计推断样本回归系数样本回归系数b的标准误的标准误 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统回归方程的假设检验 建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在,即是否对总体有?篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计
13、分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1方差分析 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统Y的离均差,总变异残差回归的变异篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统数理统计可证明:篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计
14、分系统是一种得分类型的系统上式用符号表示为 式中 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统上述三个平方和,各有其相应的自由度 ,并有如下的关系:篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F:篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负
15、的,因此,篮球比赛的计时计分系统是一种得分类型的系统式中篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统t 检验 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统(1)方差分析篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 方差分析表 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统(2)t 检验参数的意义是:若自变量X增加一个单位,反因变量Y的平均值便增
16、加 篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统注意:篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统总体回归系数 的可信区间 利用上述对回归系数的t检验,可以得到的1双侧可信区间为篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统 本例b=-6.9802,自 由 度=13,t0.05,13=2.16,Sb=0.78655,代入公式(12-7)得参数的95%置信区间为 =(-8.6791 -5.2813)篮球比赛是
17、根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统第二 节 线性回归的应用(估计和预测)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统反映其抽样误差大小的标准误为篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统o例12-1中,第一观测值X1=1.1,0.4994,0.404,代入(12.8)式获得第一观测点X1对应的 的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 线性 回归 ppt 课件
限制150内