《概率论与数理统计》(第3版) 习题详解ppt-(第10章) 回归分析.ppt
《《概率论与数理统计》(第3版) 习题详解ppt-(第10章) 回归分析.ppt》由会员分享,可在线阅读,更多相关《《概率论与数理统计》(第3版) 习题详解ppt-(第10章) 回归分析.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章第十章 回归分析回归分析第一节第一节 回归分析的概述回归分析的概述第二节第二节 参数估计参数估计第三节第三节 假设检验假设检验第四节第四节 预测与控制预测与控制第五节第五节 非线性回归的线性化处理非线性回归的线性化处理第一节第一节 回归分析的概述回归分析的概述一个过程中多个变量之间的关系分为两类:一个过程中多个变量之间的关系分为两类:确定性关系,也就是通常所说的函数关系;确定性关系,也就是通常所说的函数关系;非确定性关系,即所谓的相关关系。非确定性关系,即所谓的相关关系。确定性关系是指当一些变量的值确定以后另一些变确定性关系是指当一些变量的值确定以后另一些变量的值也随之完全确定的关系。量
2、的值也随之完全确定的关系。相关关系是指变量之间有一定的依赖关系,但当一相关关系是指变量之间有一定的依赖关系,但当一些变量的值确定以后,另一些变量的值虽随之变化些变量的值确定以后,另一些变量的值虽随之变化却并不能完全确定,这时变量间的关系不能精确地却并不能完全确定,这时变量间的关系不能精确地用函数来表示。用函数来表示。上一页上一页下一页下一页返回返回(1) 给出建立具有相关关系的变量之间的数学关系式给出建立具有相关关系的变量之间的数学关系式(通常称为经验公式)的一般方法;(通常称为经验公式)的一般方法;(2) 判别所建立的经验公式是否有效;判别哪些预报判别所建立的经验公式是否有效;判别哪些预报变
3、量对响应变量的影响是显著的,哪些是不显著的;变量对响应变量的影响是显著的,哪些是不显著的;(3)利用所得到的经验公式进行预测和控制。利用所得到的经验公式进行预测和控制。回归分析(回归分析(regression analysis)是数理统计中研究一个是数理统计中研究一个响应变量与若干个预报变量之间相关关系的一种有效方响应变量与若干个预报变量之间相关关系的一种有效方法;其中只有一个预报变量的回归分析称为一元回归分法;其中只有一个预报变量的回归分析称为一元回归分析,多于一个预报变量的回归分析称为析,多于一个预报变量的回归分析称为多元回归分析。多元回归分析。回归分析的任务主要有三个:回归分析的任务主要
4、有三个:上一页上一页下一页下一页返回返回一元回归分析与最小二乘法一元回归分析与最小二乘法取定取定x时随机变量时随机变量y的数学期望的数学期望E(y|x)作为作为x时随机变量时随机变量y的估计值,即的估计值,即)(xyEy 显然,当显然,当x变化时变化时E(Y|X=x)是是x的函数,记作的函数,记作)()(xyEx 可以用一个确定的函数关系式可以用一个确定的函数关系式)(xy 大致地描述大致地描述y与与x之间的相关关系。之间的相关关系。函数函数 称为称为y关于关于x的回归函数,简称的回归函数,简称回归回归; 称为称为y关于关于x的回归方程。的回归方程。)(x )(xy 上一页上一页下一页下一页返
5、回返回回归方程反映了回归方程反映了y的数学期望的数学期望E(y)随随x的变化而变化的的变化而变化的规律性。规律性。y与与x的相关关系表示为的相关关系表示为 )(xy 是随机误差,它是均值为零的随机变量,是随机误差,它是均值为零的随机变量,通常假定通常假定 是不依赖于是不依赖于X的未知参数。的未知参数。 22), 0( N 的大小在一定程度上反映了在的大小在一定程度上反映了在x处随机变量处随机变量y的观测值的大小的观测值的大小,如能找到如能找到 ,就能在一定条件下就能在一定条件下解决如下两个问题:解决如下两个问题:1.在给定的置信度下,估计当在给定的置信度下,估计当x取某一定值时取某一定值时y的
6、取值情况的取值情况,这就是所谓的这就是所谓的预测问预测问题题;2.在给定的置信度下在给定的置信度下,控制控制X的取值范围以使的取值范围以使y在给定的范围内取值在给定的范围内取值,这就是所谓的这就是所谓的控制问题控制问题。)(x )(x 上一页上一页下一页下一页返回返回通常先限制通常先限制 为某一类型的函数。函数为某一类型的函数。函数 的类型的类型可以由与被研究问题的本质有关的物理假设来确定;可以由与被研究问题的本质有关的物理假设来确定;若没有任何理由可以确定函数若没有任何理由可以确定函数 的类型,则只能根的类型,则只能根据在试验结果中得到的散点图来确定。据在试验结果中得到的散点图来确定。)(x
7、 )(x )(x 在确定了函数在确定了函数 的类型后,就可以设的类型后,就可以设)(x ),;()(21kaaaxx 其中其中a1, a2 ak为未知参数。为未知参数。寻找合适的回归函数寻找合适的回归函数 的问题就归结为:如何根的问题就归结为:如何根据试验数据合理地选择参数据试验数据合理地选择参数a1, a2 ak的估计值的估计值)(x kaaa,21上一页上一页下一页下一页返回返回这些估计值使得方程这些估计值使得方程 在一定的在一定的),;(21kaaaxy 意义下意义下“最佳地最佳地”表现变量表现变量Y与与X之间的相关关系。之间的相关关系。选取选取 中参数,使得观测值中参数,使得观测值yi
8、与相应与相应的函数值的函数值 (i=1,2n)的偏差平方的偏差平方和为最小,这就是所谓的和为最小,这就是所谓的最小二乘法最小二乘法。),;(21kaaax ),;(21kiaaax 最小二乘法的概率意义最小二乘法的概率意义:设当可控变量:设当可控变量X取任意实数取任意实数x时,随机变量时,随机变量Y服从正态分布服从正态分布 ,即,即Y的概的概率密度为率密度为),(2 xN22)(2121)(xyeyf 其中其中 ,而,而 是不依赖于是不依赖于x的常的常数。数。 ),;(21kaaaxx 2 上一页上一页下一页下一页返回返回在在n次独立试验中得到观测值(次独立试验中得到观测值(x1,y1),(x
9、2,y2),(xn,yn),利用极大似然估计法估计未知参数),利用极大似然估计法估计未知参数a1, a2, ak,时,有似然函数时,有似然函数 niiixynniikeyfaaaL122)(2112121)(),( 似然函数似然函数L取得极大值,上式指数中的平方和取得极大值,上式指数中的平方和 nikiiaaaxyS1221),;( 取最小值。取最小值。即为了使观测值(即为了使观测值(xi , yi)(i=1,2,n)出现的可能性最大,出现的可能性最大,应当选择参数应当选择参数a1,a2,ak,使得观测值,使得观测值yi与相应的函数值与相应的函数值 的偏差平方和最小。这就是最小二乘的偏差平方和
10、最小。这就是最小二乘法法 的概率意义。的概率意义。),;(21kiaaax 上一页上一页下一页下一页返回返回解方程组求出参数解方程组求出参数a1,a2,ak的估计值(这样求出的的估计值(这样求出的参数参数a1,a2,ak的估计,称为的估计,称为最小二乘估计最小二乘估计(least squares estimation ,简称简称LSE),再求回归方程的估计再求回归方程的估计式(称为式(称为经验回归方程经验回归方程)。)。分别求分别求S对对a1,a2,ak的偏导数,并令它们等于零,的偏导数,并令它们等于零,就得到就得到 0),;(),;( 0),;(),;(0),;(),;(2121121221
11、1211211kikkniiikikniiikikniiiaaaxaaaaxyaaaxaaaaxyaaaxaaaaxy 上一页上一页下一页下一页返回返回1、一元线性回归、一元线性回归回归方程为回归方程为bxay 方程的图形称为回归直线。方程的图形称为回归直线。x,y的相关关系可表示为的相关关系可表示为), 0(,2 Nbxay ),(2 bxaNy 或或其中其中a, b, 2为不依赖于为不依赖于x的未知参数,上式称为一元的未知参数,上式称为一元线性回归模型,简称一元线性模型。当线性回归模型,简称一元线性模型。当y与与x间满足这间满足这种关系时,种关系时,y与与x间有线性相关关系。间有线性相关关
12、系。考虑回归函数考虑回归函数 是线性函数,即是线性函数,即 ,这就是,这就是所谓的一元线性回归分析。所谓的一元线性回归分析。)(x bxa 回归方程为回归方程为bxay 第二节第二节 参数估计参数估计上一页上一页下一页下一页返回返回用最小二乘法确定未知参数用最小二乘法确定未知参数a及及b。考虑试验点关于回考虑试验点关于回归直线的偏差平方和归直线的偏差平方和 niiinibxaybaQi1212),( 分别求分别求Q对对a及及b的偏导数,的偏导数,令它们等于零,得方程组令它们等于零,得方程组 niiiiniiixbxaybxay110)(0)( nininiiiiniiniiyxbxaxybxn
13、ai111211)()()(整理得整理得称为正规方程组称为正规方程组上一页上一页下一页下一页返回返回 ,)()(:121xbyaxxyyxxbniiniii方程有唯一解方程有唯一解线性回归方程为线性回归方程为xbay 称为经验回归系数(也称回归系数),对应的直线称为经验回归系数(也称回归系数),对应的直线称为经验回归直线(简称回归直线)。称为经验回归直线(简称回归直线)。b亦可表示为亦可表示为)(xxbyy 上一页上一页下一页下一页返回返回 niiixyniiyyniixxyyxxSyySxxS11212)()()( 引入记号:引入记号: bxnynaSSbbaniiniixxxy)1(1 :
14、,11的估计可写成的估计可写成上一页上一页下一页下一页返回返回例例1 Pearson测量了测量了10对父子的身高,所得数据如下对父子的身高,所得数据如下(单位:英寸)(单位:英寸)父亲父亲身高身高606264666768707274儿子儿子身高身高63.665.26666.967.1 67.468.3 70.170求儿子身高求儿子身高y关于父亲身高关于父亲身高x的回归方程。的回归方程。 72.79;529.38,01.67; 6 .171, 8 .66: xyyyxxSSySx由所给数据算得由所给数据算得解解上一页上一页下一页下一页返回返回977.354646. 0 xbyaSSbxxxy于是
15、于是977.354646. 0 xy高高的的经经验验回回归归方方程程为为故故儿儿子子身身高高关关于于父父亲亲身身可知,当父亲身高高于或低于父代身高的平均值时,可知,当父亲身高高于或低于父代身高的平均值时,儿子的身高有向子代的平均身高靠近的趋势,这就是儿子的身高有向子代的平均身高靠近的趋势,这就是“回归回归”。上一页上一页下一页下一页返回返回2、多元线性回归、多元线性回归满满足足数数多多元元线线性性回回归归中中未未知知参参根根据据最最小小二二乘乘法法原原理理为为一一样样本本若若pnnpnnpbbbyxxxyxxx,),( ,),(1021111211.)( 21110达到最小达到最小ippnii
16、ixbxbbyQ 0)(20)(2,11101110010 niijippiijippniiipxxbxbbybQxbxbbybQbbbQ并并让让它它们们等等于于零零的的偏偏导导数数对对分分别别求求上一页上一页下一页下一页返回返回 niiippniniiipniipniiipniipininiiniipniiniipyxbxbxxbxyxbxxbxbxybxbxnbbbbipi112111011111112011111111010)()()( )()()()()(,1的线性方程组的线性方程组整理得关于整理得关于正规方程正规方程上一页上一页下一页下一页返回返回 pnnpnnppbbbByyyYx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论与数理统计 概率论与数理统计第3版 习题详解ppt-第10章 回归分析 概率论 数理统计 习题 详解 ppt 10 回归 分析
限制150内