【数学】311回归分析的基本思想及其初步应用(1).ppt
《【数学】311回归分析的基本思想及其初步应用(1).ppt》由会员分享,可在线阅读,更多相关《【数学】311回归分析的基本思想及其初步应用(1).ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-3必修必修3(3(第二章第二章 统计统计)知识结构知识结构 收集数据收集数据 (随机抽样随机抽样)整理、分析数据整理、分析数据估计、推断估计、推断简简单单随随机机抽抽样样分分层层抽抽样样系系统统抽抽样样用样本估计总体用样本估计总体变量间的相关关系变量间的相关关系 用样本用样本的频率的频率分布估分布估计总体计总体分布分布 用样本用样本数字特数字特征估计征估计总体数总体数字特征字特征线线性性回回归归分分析析统计的基本思想统计的基本思想实际实际样本样本模模 拟拟抽抽 样样分分 析析问题问题1
2、1:正方形的面积正方形的面积y y与正方形的边长与正方形的边长x x之间之间 的的函数关系函数关系是是y=xy=x2 2确定性关系确定性关系问题问题2 2:某水田水稻产量某水田水稻产量y y与施肥量与施肥量x x之间是否之间是否 -有一个确定性的关系?有一个确定性的关系?例如:例如:在在 7 7 块并排、形状大小相同的试验田块并排、形状大小相同的试验田上上 进行施肥量对水稻产量影响的试验,得到进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:如下所示的一组数据:施施化肥量化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻产量水稻产量y y
3、 330 345 365 405 445 450 455 330 345 365 405 445 450 455复习、变量之间的两种关系复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做机性的两个变量之间的关系叫做相关关系相关关系。1 1、定义:、定义:1 1)相关关系是一种不确定性关系;相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行对具有相关关系的两个变量进行统计分析的方法叫统计分析的方法叫回归分析回归分析。2 2)2 2、现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。如:人的身
4、高与年龄;如:人的身高与年龄;产品的成本与生产数量;产品的成本与生产数量;商品的销售额与广告费;商品的销售额与广告费;家庭的支出与收入。等等家庭的支出与收入。等等探索:水稻产量探索:水稻产量y y与施肥量与施肥量x x之间大致有何之间大致有何规律?规律?10 20 30 40 5010 20 30 40 50500500450450400400350350300300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2 2:在这些点附近可画直线不止一条,:在这些点附近可画直线不止一条,哪条直线最能代表哪条直线最能代表x x与与y y之间的关系呢?之间的关系
5、呢?x xy y施施化肥量化肥量水稻产量水稻产量施施化肥量化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻产量水稻产量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455散点图散点图10 20 30 40 50500450400350300 xy施施化肥量化肥量水稻产量水稻产量oxy易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。的值。假设我们已经得到两个具有相关关系的变量的一组数据假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:
6、且回归方程是:其中,其中,是待定参数。当变量是待定参数。当变量x取取 时时 它与实际收集到的它与实际收集到的 之间的偏差是之间的偏差是最小二乘法:最小二乘法:称为样本点的中心称为样本点的中心。3 3、对、对两个两个变量进行的线性分析叫做变量进行的线性分析叫做线性线性回归分析回归分析。2 2、回归直线方程、回归直线方程:2.2.相应的直线叫做相应的直线叫做回归直线回归直线。1 1、所求直线方程、所求直线方程 叫做叫做回归直回归直 -线方程线方程;其中;其中相关系数相关系数 1.1.计算公式计算公式2 2相关系数的性质相关系数的性质(1)|r|1(1)|r|1(2)|r|(2)|r|越接近于越接近
7、于1 1,相关程度越大;,相关程度越大;|r|r|越接越接近于近于0 0,相关程度越小,相关程度越小问题:达到怎样程度,问题:达到怎样程度,x x、y y线性相关呢?它线性相关呢?它们的相关程度怎样呢?们的相关程度怎样呢?正相关正相关负相关负相关相关系数相关系数正相关;负相关通常,正相关;负相关通常,r r-1,-0.75-0.75-负相关很强负相关很强;r0.75,1正相关很强正相关很强;r-0.75,-0.3-负相关一般负相关一般;r0.3,0.75正相关一般正相关一般;r r-0.25,0.25-0.25-相关性较弱相关性较弱;10 20 30 40 5010 20 30 40 5050
8、0500450450400400350350300300 xy施施化肥量化肥量水稻产量水稻产量施施化肥量化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻产量水稻产量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455解解:1.画出散点图画出散点图3.写出回归方程写出回归方程4.计算相关系数计算相关系数2.求出求出某大学中随机选取某大学中随机选取8名女大学生,其身高和体重数据名女大学生,其身高和体重数据如下表所示如下表所示.编号编号1 12 23 34 45 56 67 78 8
9、身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报体重的回归方程,并预报求根据女大学生的身高预报体重的回归方程,并预报一名身高为一名身高为172cm的女大学生的体重的女大学生的体重.分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量1.散点图;散点图;样本点呈条状分布,身高和体重有较好的线性相关关样本点呈条状分布,身高和体重有较好
10、的线性相关关系,因此可以用回归方程来近似的刻画它们之间的关系,因此可以用回归方程来近似的刻画它们之间的关系系.由由得:得:故所求回归方程为:故所求回归方程为:因此,对于身高因此,对于身高172cm的女大学生,由回归方程可以的女大学生,由回归方程可以预报其体重为:预报其体重为:是斜率的估计值,说明身高是斜率的估计值,说明身高x每增加每增加1个单个单位时,体重位时,体重y就增加就增加0.849个单位,这表明个单位,这表明体重与身高具有正的线性相关关系体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?如何描述它们之间线性相关关系的强弱?相关系数相关系数相关系数的性质相关系数的性质(
11、1)|r|1(1)|r|1(2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接近于越接近于0 0,相关程度越弱相关程度越弱注注:b:b 与与 r r 同号同号问题:达到怎样程度,问题:达到怎样程度,x x、y y线性相关呢?它们的相线性相关呢?它们的相关程度怎样呢?关程度怎样呢?相关系数相关系数正相关;负相关通常,正相关;负相关通常,r0.75,认为两个变量有很强的相关性认为两个变量有很强的相关性本例中本例中,由上面公式由上面公式r=0.7980.75某大学中随机选取某大学中随机选取8名女大学生,其身高和体重数据名女大学生,其身高和体重数据如下表所示如下
12、表所示.编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报体重的回归方程,并预报求根据女大学生的身高预报体重的回归方程,并预报一名身高为一名身高为172cm的女大学生的体重的女大学生的体重.故所求回归方程为:故所求回归方程为:r=0.798表明体重与身高有很强的线性相关性,从表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的而说明我们建立的回归模型
13、是有意义的.认为她的平均体重的估计值是认为她的平均体重的估计值是60.316kg.因为所有的样本点不共线,所以线性函数模型只能近因为所有的样本点不共线,所以线性函数模型只能近似地刻画身高和体重之间的关系,即:体重不仅受身似地刻画身高和体重之间的关系,即:体重不仅受身高的影响,还受其他因素的影响,把这种影响的结果高的影响,还受其他因素的影响,把这种影响的结果用用e来表示,从而把线性函数模型修改为线性回归模来表示,从而把线性函数模型修改为线性回归模型:型:y=bx+a+e.其中,其中,e包含体重不能由身高的线包含体重不能由身高的线性函数解释的所有部分性函数解释的所有部分.线性回归模型线性回归模型其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 311 回归 分析 基本 思想 及其 初步 应用
限制150内