(本科)(09)第9章一元线性回归(Py1)ppt课件.pptx
-
资源ID:15304092
资源大小:1.10MB
全文页数:19页
- 资源格式: PPTX
下载积分:10金币
快捷下载
![游客一键下载](/images/hot.gif)
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(本科)(09)第9章一元线性回归(Py1)ppt课件.pptx
课程主讲人:(09)第9章 一元线性回归(Py1)第 1 章1 - 2统计学Python实现贾俊平2022-5-11PythonPython 实现实现第 9 章9 - 3统计学Python实现贾俊平2022-5-11第 9 章9 - 4统计学Python实现贾俊平2022-5-11 变量间的关系 变量间的关系变量间的关系回归建模需要清楚的问题回归建模需要清楚的问题l 建立回归模型时,首先需要弄清楚变量之间的关系l 分析变量之间的关系需要解决下面的问题 变量之间是否存在关系 如果存在,它们之间是什么样的关系 变量之间的关系强度如何 样本所反映的变量之间的关系能否代表总体变量之间的关系第 9 章9 - 5统计学Python实现贾俊平2022-5-11 变量间的关系 变量间的关系变量间的关系函数关系与相关关系函数关系与相关关系l函数关系对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上l相关关系一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值对应着一个分布各观测点分布在直线周围 第 9 章9 - 6统计学Python实现贾俊平2022-5-11 变量间的关系 相关关系的描述相关关系的描述散点图散点图例题分析例题分析【例例9-1】为研究销售收入与广告支出之间的关系,随机抽取20家医药生产企业,得到它们的销售收入和广告支出的数据如表91所示。绘制散点图描述销售收入与广告支出之的关系第 9 章9 - 7统计学Python实现贾俊平2022-5-11 变量间的关系 相关关系相关关系关系强度的度量关系强度的度量相关系数相关系数性质与解读性质与解读l度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r也称为Pearson相关系数 (Pearsons correlation coefficient)l样本相关系数的计算公式l性质性质1:r 的取值范围是 -1,1|r|=1,为完全相关;r = 0,不存在线性相关关系-1r0,为负相关;0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱l性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy= ryxl性质性质3:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小l性质性质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意为着, r=0只表示两个 变量之间不存在线性相关关系,并不说明变量之间没有任何关系l性质性质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系第 9 章9 - 8统计学Python实现贾俊平2022-5-11 变量间的关系 相关关系相关关系相关系数检验相关系数检验二者的相关系数为 0.9371检验的p值为 1.161e-09第 9 章9 - 9统计学Python实现贾俊平2022-5-11 一元线性回归 回归模型与回归方程回归模型与回归方程l模型假定模型假定因变量x与自变量y之间为线性关系l在重复抽样中,自变量x的取值是固定的,即假定x是非随机的l误差项 满足正态性。 是一个服从正态分布的随机变量,且期望值为0,即 N(0 , 2 ) 。对于一个给定的 x 值,y 的期望值为E(y)=0+ 1x方差齐性。对于所有的 x 值, 的方差一个特定的值,的方差也都等于 2 都相同。同样,一个特定的x 值, y 的方差也都等于2独立性。独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关;对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关第 9 章9 - 10统计学Python实现贾俊平2022-5-11 一元线性回归 参数的最小二乘估计参数的最小二乘估计xy回归线:y 01xyy残差:观测值:(x,y)第 9 章9 - 11统计学Python实现贾俊平2022-5-11 一元线性回归 一元线性回归建模一元线性回归建模例题分析例题分析第 9 章9 - 12统计学Python实现贾俊平2022-5-11 一元线性回归 一元线性回归建模一元线性回归建模拟合优度拟合优度误差分解误差分解xyy回归线:y 0 1xyyyyyyl总平方和总平方和(SSTtotal sum of squares)反映因变量的 n 个观察值与其均值的总误差l回归平方和回归平方和(SSRsum of squares of regression)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和l残差平方和残差平方和(SSEsum of squares of error)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和第 9 章9 - 13统计学Python实现贾俊平2022-5-11 一元线性回归 一元线性回归建模一元线性回归建模拟合优度拟合优度决定系数决定系数R2估计标准误估计标准误l实际观察值与回归估计值误差平方和的均方根l反映实际观察值在回归直线周围的分散状况l对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量l反映用估计的回归方程预测y时预测误差的大小 l计算公式为第 9 章9 - 14统计学Python实现贾俊平2022-5-11 一元线性回归 一元线性回归建模一元线性回归建模模型检验模型检验F 检验检验t 检验检验第 9 章9 - 15统计学Python实现贾俊平2022-5-11 利用回归方程进行预测 回归预测回归预测置信区间和预测区间置信区间和预测区间第 9 章9 - 16统计学Python实现贾俊平2022-5-11 利用回归方程进行预测 回归预测回归预测置信区间和预测区间置信区间和预测区间例题分析例题分析ObsDep Var PopulationPredicted ValueMean ci 95% lowMean ci 95% uppPredict ci 95% lowPredict ci 95% uppResidual014597.54264.923998.354531.53395.385134.47332.581266116945.076590.497299.646044.647845.49-334.07237349.36448.646168.066729.225574.77322.58900.66345525.75260.055074.795445.314411.96108.2265.65454675.94763.054552.74973.413909.075617.04-87.15564418.64762.494552.084972.893908.495616.48-343.89675845.46196.175948.686443.665332.297060.05-350.777873137151.016763.537538.496237.138064.9161.99895035.45015.524822.895208.154165.735865.3219.889104322.64578.14349.554806.653719.455436.75-255.510116389.56320.996057.646584.335452.437189.5468.5111124152.24011.893709.984313.83130.874892.9140.3112135544.84854.964652.125057.814002.85707.13689.8413146095.15946.545726.96166.185090.226802.86148.5614153626.23821.833491.534152.132930.684712.97-195.6315163745.44074.33781.44367.23196.334952.27-328.916175121.85888.15674.076102.135033.26743-766.317185674.55747.975545.685950.254895.936600-73.4718194256.64043.663746.364340.963164.214923.11212.9419205803.76008.955782.96234.995150.966866.93-205.25第 9 章9 - 17统计学Python实现贾俊平2022-5-11 回归模型的模型诊断 模型诊断模型诊断残差与标准化残差残差与标准化残差l残差残差因变量的观测值与预测值之差,用e表示l反映了用估计的回归方程去预测而引起的误差 l可用于确定有关误差项的假定是否成立 l标准化残差标准化残差残差除以它的标准差l残差图残差图模型诊断工具第 9 章9 - 18统计学Python实现贾俊平2022-5-11 回归模型的模型诊断 模型诊断模型诊断例题分析例题分析 THE END THE END T H A N K S T H A N K S2022-5-11