概率统计教案9章第1-2-3节.pdf
《概率统计教案9章第1-2-3节.pdf》由会员分享,可在线阅读,更多相关《概率统计教案9章第1-2-3节.pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 307 页页 题目 与 课时题目 与 课时 *第一节 回归分析的含义 *第二节 一元线性回归分析 *第三节 可线性化为一元线性回归模型的基本类型 (注意:本章内容工科类不学,经管类选学) 课时:2 教学目的 教学目的 *(1) 了解回归分析的含义; *(2) 会用最小二乘法求回归系数; *(3) 会作简单预测; *(4) 了解可线性化为一元线性回归的基本类型. 内容 内容 一元线性回归分
2、析方法及计算过程. 教学重点 教学重点 解决办法 解决办法 加强一元线性回归分析方法的讲解与讲评,加大例题讲解力度,留足作业以达到训练与巩固. 内容 内容 一元线性回归分析的假设检验过程. 教学难点 教学难点 解决办法 解决办法 加大假设检验知识的分析,加大例题讲解力度. 教学辅助 教学辅助 利用多媒体课件,板书配合分析. 习题布置 习题布置 P231:2; P237:3、5; P241:2; P243:2、3. 参考文献 参考文献 1 郑一,王玉敏,冯宝成. 概率论与数理统计. 大连理工大学出版社, 2015 年 8 月. 2 郑一,戚云松,王玉敏. 概率论与数理统计学习指导书. 大连理工大
3、 学出版社,2015 年 8 月. 3 郑一,戚云松,陈倩华,陈健. 光盘:概率论与数理统计教案 作业册 与试卷考题及答案、数学实验视频. 大连理工大学出版社,2015 年 8 月. 4 王玉敏,郑一,林强. 概率论与数理统计教学实验教材. 中国科学技术 出版社, 2007 年 7 月. 联系方式: 概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 308 页页 教 学 内 容 教学笔记 教 学 内 容 教学笔记 内容简介内容简介 回归分
4、析是研究随机变量与可控制的普通变量之间相互关系的一种统计推断方法, 它在数理统计的实际应用中占有重要的地位. 在一元线性回归中, 有两个变量, 其中 x 是可观测、可控制的普通变量, 常称它为自变量或控制变量, Y为随机变量, 常称其为响应变量. 通过散点图或计算相关系数可以判定Y与x之间是否存在着显著的线性相关关系, 如果存在,我们将得到它们的线性回归直线方程,并利用这个回归直线方程进行预测和控制. 回归分析方法在解决实际问题时常用,希望同学们一定学好. 预备知识 预备知识 函数定义,最小二乘法,检验统计量,参数假设检验,置信区间,变量代换. * *第九章 回归分析 第九章 回归分析 回归分
5、析是研究随机变量与可控制的变量之间相互关系的一种统计方法, 它在数理统计的实际应用中占有重要的地位, 回归分析在数据处理等问题中应用十分普遍. 本章主要内容是一元线性回归分析的基本方法以及可线性化为一元线性回归的基本模型的应用问题. 教师教学建议: (1)本章内容实际上就是两种问题的处理. 1)满足一元线性回归的问题:讲清楚作图、计算回归系数、线性相关性检验、 点预测及区间预测的过程.可要求学生对所安排的例题结合起来再完整的模拟一遍. 2)可线性化为一元线性回归的问题:讲清楚作图、试用回归函数并线性化、线性相关性检验、点预测及区间预测、将结果返回到原来的模型,再试用其他的回归函数、选定最优的回
6、归方程的过程.可要求学生对例题再做一遍. (2)教学问题引入: 1)进行实验,获得了大量的实验证据.如何确定一个经验公式,以反映变量之间的相互依存的变化关系?如,子女身高是否与父母身高有某种关系?纤维强度与拉伸长度的关系怎样? 2)利用得到的这种变化关系,我们可以预测变化和控制变化. 概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 309 页页 第一节 回归分析的含义 第一节 回归分析的含义 大家知道, 人的血压 Y 与年龄 x 有关,
7、 这里 x 是一个普通变量, Y 是一个随机变量. Y 与 x 之间的相互关系 f(x)受随机误差的干扰使之不能完全确定, 因此,我们可设有关系 ( )Yf x, (1.1) 式中 f(x)称作回归函数回归函数, 为随机误差随机误差或随机干扰随机干扰, 它是一个与 x 无关的随机变量, 根据 的实际意义和中心极限定理, 我们常假定它是均值为 0 的正态变量. 为了得到 Y 与 x 之间的回归函数 f(x), 我们通常进行 n 次独立观测, 得到 x与 Y 的 n 对实测数据 (xi, yi), i=1,2,n, 将观察值(xi,yi)(i=1, 2, n)在平面直角坐标系下用点标出, 所得的图
8、称为散点图(散点图(scatter diagram). 利用这些数据及其所得的散点图对回归函数 f(x)进行估计和假设检验. 在实际问题中, 常遇到的是多个自变量的情形. 例如, 在考察某化学反应时, 发现反应速度 Y 与催化剂用量 x1, 反应温度x2, 所加压力 x3等多种因素有关. 这里 x1, x2,都是可控制的普通变量, Y 是随机变量, Y 与诸 xi间的相互关系受随机干扰或随机误差的影响,可假设有关系 12( ,)kYf x xx. (1.2) 这里是随机误差, 它是与 x1, x2,xk无关的随机变量, 一般设其均值为 0. 这里的多元函数 f(x1, x2,xk)称为回归函数
9、回归函数. 为了确定具体的回归函数, 同样可作 n 次独立观察, 基于观测值去寻求 f(x1, x2,xk)的形式. 在以下的讨论中, 我们总称自变量 x1, x2,xk为控制变量控制变量, Y 为响应变量响应变量. 不难想象, 如对回归函数 f(x1, x2,xk)的形式不作任何假设, 会使问题过于一般, 将难以处理. 所以本章将主要讨论 Y 和控制变量 x1, x2,xk呈现线性相关关系的情形, 即假定 f(x1, x2,xk)=b0+b1x1+bkxk., 并称由它确定的模型(1.1)(当 k=1 时)及(1.2)为线性回归模型线性回归模型, 否则,称其为非线性回归模型非线性回归模型.
10、对于线性回归模型, 估计回归函数 f(x1, x2,xk)就转化为估计系数 b0, bi, i=1,2,k. 当线性回归模型只有一个控制变量时, 称为一元线性回归模型一元线性回归模型, 有多个控制变量时称为多元线性回归模型多元线性回归模型. 思考题思考题 1. 回归分析要解决的是哪些变量之间的相互关系?得到这种关系可以有哪些用途? 2. 回归分析研究的主要问题有哪些? 解题参考解题参考 1. 回归分析要解决的是随机变量与可控制的普通变量之间的相关关系的统计规律问题. 利用得到的这种公式关系或函数关系,可以分析随机变量与可控制的普通变量之间的统计规律,可以通过可控制变量取某点值时,对相应的随机变
11、量进行点预测和区间预测. 2. 回归分析研究的主要问题有: (1) 利用数据及其散点图对回归函数 f(x)形式进行选取; 概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 310 页页 (2) 对曲线模型做变量代换转化为线性回归模型; (3) 对随机变量 Y 与 x 之间的线性相关关系进行假设检验; (4) 给定可控制变量 x 取值对随机变量 Y 进行预测等统计分析. (5) 当事先确定随机变量取值 y0方案时, 反过来研究如何控制自变量
12、 x 的取值. 第二节 一元线性回归分析 第二节 一元线性回归分析 教师教学建议: (1) 一元拟合直线方程知识,在高中学过,高考也考试过. 这里讲:回归分析的完整过程、线性关系的合理性检验、预测问题、可线性化的函数类型及其变换. (2) 本节讲述了一个实际问题的完整分析过程、处理过程.环环联系,注意讲清问题的解决思路. 注意循着“提出问题分析问题解决问题”的完整过程讲授,培养学生的科研思想. (3) 教学问题引入: 在生产或生活实际问题中,往往有两个变量,其中 x 是可观测可控制的普通变量, Y 为随机变量.如何寻找和判定 Y 与 x 之间是否存在着显著的线性相关关系呢?如果存在,我们将如何
13、利用它们的线性关系进行预测和控制呢? 一、一、一元线性回归模型一元线性回归模型 前面我们曾提到, 在一元线性回归中, 有两个变量:其中 x 是可观测、可控制的普通变量, 常称它为自变量或控制变量;Y 为随机变量, 常称其为响应变量. 通过散点图判定 Y 与 x 之间是否存在线性关系, 即 Y 与 x 之间是否存在如下关系: Y=a+bx+. (2.1) 通常认为N(0, 2),且假设 2与 x 无关. 将观测数据(xi,yi)(i=1, 2, n)代入(2.1)式, 再注意样本为简单随机样本, 得: 212,1,2, ,(0,).,iiinyabxinN 相互独立且服从同一正态分布 (2.2)
14、 称(2.2)式所确定的模型为一元线性回归模型一元线性回归模型, 对其进行统计分析称为一元线性回归分析一元线性回归分析. 不难理解, 在模型(2.1)中, E(Y)=a+bx. 若记 y=E(Y), 则我们获得关系式 y= a+bx, 此等式就是所谓的一元线性回归方程一元线性回归方程, 其图像就是回归直线回归直线, b 为回归系数回归系数, a 称为回归常数, 回归常数, 也称其为回归系数回归系数. 二、 二、 a, b 的最小二乘估计及经验公式 的最小二乘估计及经验公式 现讨论如何根据观测值(xi,yi)(i=1,2,n)估计模型(2.2)中回归函数 概率论与数理统计教案 第九章第一、二、三
15、节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 311 页页 f(x)=a+bx 的回归系数 a 和 b. 采用最小二乘法, 记平方和 21( , )() .iniiQ a byabx (2.3) 我们寻找使 Q(a, b)达到最小的 a, b 作为其估计, 即 ( , )min( , )Q a bQ a b. 为此, 对 Q(a, b)求偏导, 令 112()0,2()0.niiiniiiiQyabxaQyabx xb 化简, 得到如下方程组(称为模型的正规方程组模型的正规
16、方程组), 112111(),()().nniiiinnniiiiiiinax byx ax bx y 解得 ,.xyxxSbSaybx (2.4) 其中 22211122211111111() ,1() ,1()()()().nnnxxiiiiiinnnyyiiiiiinnnnxyiiiiiiiiiixxxxnynxxyyx yxynSSyyyS (2.4)式的ba, 分别称为 a, b 的最小二乘估计值, 最小二乘估计值, 将其中的 y 改写为随机变量 Y,就得到 a,b 的最小二乘估计量最小二乘估计量. 讲评讲评 (9.2.4)式常用, 注意最小二乘估计值与最小二乘估计量的写法区别和作用
17、不同. 例例9.2.1 某种合成纤维的强度与其拉伸倍数有关. 下表是24个纤维样品的强度与相应的拉伸倍数的实测记录. 试求这两个变量间的经验公式. 编号 1 2 3 4 5 6 7 8 9101112 拉伸倍数 x 1.9 2.0 2.1 2.5 2.7 2.73.53.54.04.04.54.6 强度 Y (Mpa) 1.4 1.3 1.8 2.5 2.8 2.53.02.74.03.54.23.5 编 号 13 14 15 16 17 18192021222324 拉伸倍5.0 5.2 6.0 6.3 6.5 7.18.08.08.99.09.510.0 概率论与数理统计教案 第九章第一、
18、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 312 页页 数 x 强度 Y (Mpa) 5.5 5.0 5.5 6.4 6.0 5.36.57.08.58.08.1 8.1 教学建议: (1)此例是生产实际问题,要求学生在分析问题和解决问题方法方面要进行系统化、程序化分析. (2)此例在后面的线性相关性检验、点预测及区间预测问题中还要继续深入. 解解 从本例的散点图看出(见图 9-1), 强度 Y 与拉伸倍数 x 之间大致呈现线性关系, 因此选用一元线性回归模型是适
19、用 Y 与 x 的关系的. 图图 9- -1 例例 9.2.1 数据散点图数据散点图 现用公式(2.4)求ba, , 这里 n=24, 2424112424242211122127.5,113.1,829.61,650.93,731.6,1829.61(127.5)152.266,241731.6127.5 113.1130.756,241650.93(113.1)117.946,241127.55.313,241iiiiiiiiiiixxxyyyxyxyx ySSSxy113.14.713.24 所以 0.859,0.15.xyxxSbaybxS 由此得到强度 Y 与拉伸倍数 x 之间的经验
20、公式为 xy859. 015. 0. 概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版概率论与数理统计教案 第九章第一、二、三节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 313 页页 讲评讲评 例 9.2.1 在解法上可以程序化,学生应掌握解法. 三、 线性相关性的检验 三、 线性相关性的检验 前面的讨论都是在假设 Y 与 x 呈现线性关系的前提下进行的. 若这个假设不成立, 则我们建立的经验回归直线方程也就完全失去实际意义. 为此必须对Y 与 x 之间的线性关系作出理论上的检验. 1. 偏差平方和分解及其实际意义 .
21、 偏差平方和分解及其实际意义 已知21()nyyiiSyy, 将其中的 yi改写为 Yi, y改写为Y, 并记 21()nYYiiSYY, 人们称它为总偏差平方和总偏差平方和, 它反映数据 Yi的总波动. 简单计算易得 Syy有如下分解式: 222111()()()nnnyyiiiiiiiiiSyyyyyyyy, 通常记为 yySeQU. (2.5) 其中: (1) 21()niiUyy称为回归平方和,回归平方和,它反映了回归方程xbay的理论值12,ny yy对平均值y的离散程度; (2) 21()neiiiQyy称为剩余平方和剩余平方和或残差平方和残差平方和, 它是实际观察值 yi与回归值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 教案
限制150内