样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《样本相关系数课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、形形数数通通过观过观察察散点散点图图中成中成对样对样本数据的分布本数据的分布规规律,我律,我们们可以大致推断可以大致推断两个两个变变量是否存量是否存在相关关系、是正相关在相关关系、是正相关还还是是负负相关、是相关、是线线性相关性相关还还是非是非线线性相关性相关等等.散点散点图虽图虽然直然直观观,但无法确切地反映成,但无法确切地反映成对样对样本数据的相关程度,也就无法量化两个本数据的相关程度,也就无法量化两个变变量之量之间间相关相关程度的大小程度的大小.能否像引人均能否像引人均值值、方差等数字特征、方差等数字特征对对单单个个变变量数据量数据进进行分析行分析那那样样,引,引入一个适当的入一个适当的
2、“数字特征数字特征”,对对成成对样对样本数据的相关程度本数据的相关程度进进行定量分析呢行定量分析呢?8.1.2 样本相关系数样本相关系数 思考思考1 根据上述分析,你能利用正相关变量和负相关变量的成对样本数据根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗字特征吗?利用散点利用散点 的的横、横、纵纵坐坐标标是否同号是否同号,可以构造,可以构造一个量一个量一般情形下,一般情形下,Lxy0表明成表明成对样对样本数据本数据正相关正相关;Lxy 0表明成对样
3、本数据正相关;Lxy(Lxy)1,但单位的改变并不会导致体重与身高之间相关程度的改变.不宜直接用Lxy度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.形形数数Bug:Lxy的大小受数据的度量单位的影响,但单位的改变并不会导致两个变量之间相关程度的改变.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.称称r为变量为变量x和变量和变量y的样本的样本(线性线性)相关系数相关系数.r的正负的正负:反映成对样本数据的变化趋势变量变量x和变量和变量y的样本的样本(线性线性)相关系数:相关系数:思考思考3:r的大小的大小能否能否刻画刻画成对样本数据的成
4、对样本数据的相关程度相关程度的强弱的强弱?r的取值范围是什么?的取值范围是什么?强强强强弱弱弱弱观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,r的正负的正负:反映成对样本数据的变化趋势变量变量x和变量和变量y的样本的样本(线性线性)相关系数相关系数:r的范围的范围:1r1样样本相关系数本相关系数r是一个描述成是一个描述成对样对样本数据的数字特征,它反映了本数据的数字特征,它反映了两个随机两个随机变变量量之之间间的的线线性相关程度性相关程度.思考思考4:当:当|r|=1时,成对样本数据之间具有怎样的关系呢?时,成对样本数据之间具有怎样的关系呢?即此时两个变量之间满足一种
5、线性(函数)关系,即满足完全线性相关.故|r|越接近1时,线性相关程度越强;|r|越接近0时,线性相关程度越弱;若所有样本点(xi,yi)(i1,2,n)都在直线y-2x1上,则这组样本数据的样本相关系数为()r的正负的正负:反映成对样本数据的变化趋势变量变量x和变量和变量y的样本的样本(线性线性)相关系数:相关系数:r的范围的范围:1r1|r|的大小的大小:反映成对样本数据线性相关的程度(即散点集中于某条直线的程度):|r|越接近1:线性相关程度越强;|r|越接近0:线性相关程度越弱.r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.样本容量越大,用样本相关系数估计两
6、个变量的相关系数的效果越好.如如:要确切了解脂肪含量要确切了解脂肪含量y与年龄与年龄x的线性相关程度,需要的线性相关程度,需要调查所有人的年调查所有人的年龄及其龄及其脂肪脂肪含量含量,再将得到的成对数据代入,再将得到的成对数据代入r的的公式公式,计算出相关系数计算出相关系数r.在实际中,获得总体中所有的成对数据往往是不容易的.在有限的总体中,可以利用这两个变量取值的所有成对数据,通过上述公式就可计算出两个变量的相关系数,这个相关系数就能确切地反映变量之间相关关系的正负性及线性相关程度的强弱.通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了
7、解两个变量之间的相关程度.思想:用样本估计总体样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.例例1 根据表根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度关,计算样本相关系数,并推断它们的相关程度.解解:由由样样本数据可得本数据可得由此可以推断脂肪含量和年由此可以推断脂肪含量和年龄这龄这两个两个变变量量正正线线性相关,且相关程度很性相关,且相关程度很强强.编编号号1234567891011121314年年龄龄/岁岁2327394145495053545657586061
8、脂肪含量脂肪含量/9.517.821.225.927.526.328.229.630.231.430.833.535.234.6 例例1 根据表根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度关,计算样本相关系数,并推断它们的相关程度.编编号号1234567891011121314年年龄龄/岁岁2327394145495053545657586061脂肪含量脂肪含量/9.517.821.225.927.526.328.229.630.231.430.833.535.234.6解解2:由
9、由样样本数据可得本数据可得由此可以推断脂肪含量和年由此可以推断脂肪含量和年龄这龄这两个两个变变量量正正线线性相关,且相关程度很性相关,且相关程度很强强.练习练习.有一个同学家开了一个小卖部,他为了研究气温对热饮料销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的数据的散点图和对比表.解:观察散点图,可看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.代入公式可得样本相关系数r0.97,可以推断脂肪含量和年龄这两个变量的负线性相关程度很强.摄氏温度摄氏温度x-5471015233036热饮杯数热饮杯数y16212811513589716337画出散点图,并用相关系数r判断热饮
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 相关系数 课件 2023 2024 学年 下学 期数 学人 2019 选择性 必修 第三
![提示](https://www.taowenge.com/images/bang_tan.gif)
链接地址:https://www.taowenge.com/p-97295539.html
限制150内