2.3.2两个变量的线性相关.doc
23. 2两个变量的线性相关一、选择题1由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到的回归直线方程bxa,那么下面说法不正确的选项是()A直线bxa必经过点(,)B直线bxa至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点C直线bxa的斜率为D直线bxa和各点(x1,y1),(x2,y2),(xn,yn)的偏差yi(bxia)2是该坐标平面上所有直线与这些点的偏差中最小的直线答案B解析由ab 知b bx,必定过(,)点回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可2设有一个回归方程为x,那么变量x增加一个时()AyBy平均增加2个CyDy平均减少2个答案C解析2121.5(xx1.5.3如图是具有相关关系的两个变量的一组数据的散点图和回归直线,去掉哪个点后,剩下的5个点数据的相关系数最大?()ADBECFDA答案C解析第F组数据距回归直线最远,所以去掉第F组后剩下的相关系数最大4以下关于线性回归的判断,正确的有_个()假设散点图中所有点都在一条直线附近,那么这条直线为回归直线散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点回归直线方程为x0.81,那么x25时,y回归直线方程的意义是它反映了样本整体的变化趋势A0个 B1个 C2个 D3个答案D解析能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线axb才是回归直线,不对;正确;将x25代入x0.81,解得11.69,正确;正确,选D.5为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地作10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么以下说法正确的选项是()A直线l1和l2有交点(s,t)B直线l1和l2相交,但是交点未必是点(s,t)C直线l1和l2由于斜率相等,所以必定平行D直线l1和l2必定重合答案A解析由题意,结合回归直线易知只有选项A符合条件6对于样本频率分布直方图与总体密度曲线的关系,以下说法中正确的选项是()A频率分布直方图与总体密度曲线无关B频率分布直方图就是总体密度曲线C样本容量很大的频率分布直方图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线答案D解析因为如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线7济南市某校在“创新素质实践行活动中,组织学生进行社会调查,并对学生的调查报告进行了评比,如图是将某年级60篇学生的调查报告的成绩进行整理,分成5组画出的频率分布直方图从左往右4个小组的频率分别是0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于等于80分为优秀,且分数为整数)()A18篇 B24篇 C25篇 D27篇答案D解析80分以下的报告有:(0.050.150.35)×6033(篇),所以被评为优秀的有:603327(篇)8某地共有10万户居民,从中随机调查了1000户,拥有彩电的调查结果如下表:彩电城市农村有432400无48120假设该地区城市与农村住户之比为46,估计该地区无彩电的农村总户数约为()A0.923万户 C1.8万户 答案B解析根据题意知农村住户有6万无彩电的农村总户数为6×1.385(万)二、填空题9一家保险公司调查其总公司营业部的加班速度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,那么用最小二乘法估计求出的回归直线方程是_.x825215107055048092013503256701215y答案x解析i762,(xi)21297860,2.85,(xi)(yi)4680.6,b0.003606,ab 0.1022.10(·广东文,12)某市居民家庭年平均收入x(:万元)与年平均支出Y(:万元)的统计资料如下表所示:年份收入x1315支出Y1012根据统计资料,居民家庭平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系答案13正解析奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数11两个变量x和y线性相关,5次试验的观测数据如下:x100120140160180y4554627592那么变量y关于x的回归方程是_答案x解析由线性回归参数公式可求出b0.575,a14.9,回归方程为x14.9.12某校为了了解高三一次模拟考试数学质量检测的情况,随机抽取了100名学生的成绩,具体情况如下表:分数段(0,80)80,100)100,120)120,150频数15502510平均成绩6092110130那么本次检测中所抽取样本的平均成绩为_解析样本的平均成绩为×(60×1550×9225×11010×130)95.5(分),平均成绩为95.5分三、解答题13一项关于16艘轮船的研究中,船的吨位区间从192吨到3246吨,船员的数目从5人到32人通过对船员人数关于船的吨位的回归分析得到如下结果:船员人数9.50.0062×吨位(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数是多少?对于最大的船估计的船员数是多少?解析(1)船员平均人数相差0.0062×10006.2(人)(2)当取最小吨位192时,预计船员数为950.0062×19210.711(人)当取最大吨位3246吨时,预计船员数为950.0062×324629.630(人)14假设学生在初中和高一数学成绩是线性相关的假设10个学生初中(x)和高一(y)数学成绩如下:x74717268767367706574y76757170767965776272试求初中和高一数学成绩间的回归方程解析因为71,50520,72.3,iyi51467,所以b1.2182,ax14.192.15某厂某产品的产量x(:千件)与本钱y(:万元/千件)的对应数据如下:x29 28 28.5 29.530 31 30 28y500510504494 493485492498(1)对于变量y与x作出散点图;(2)假设y与x具有线性相关关系,求回归直线方程;(3)预测产量x25千件时的本钱解析(1)散点图略(2)29.375,4976909,1976494,iyi116744,b8,a497(8)×29.375732,8x732.(3)当x25时,8×25732532万元/千件16某服装店月销售额(:万元)如下:月份123456789101112销售额5831016378438484512470465459517461508(1)试估计该商品月销售额的平均数和标准差s.(2)有几个月的销售额在(s,s)范围内?解析标准差反映了样本数据距离样本平均数的平均距离,表达了样本数据的波动范围(1)524.25,s155.70.(2)落入(s,s)即(368.55,679.95)内的数据有11个17某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据:x3 45678 9y66697381899091280,45309,iyi3487.(1)求,;(2)求纯利y与每天销售件数x的回归直线方程;(3)估计每天销售10件这种服装时,纯利润是多少元?解析(1)(3456789)6,(66697381899091)79.86.(2)设回归直线方程为bxa,那么b4.75.ab 79.864.75×651.36.所求回归直线方程为x51.36.(3)当x10时,98.86,估计每天销售这种服装10件可获纯利润98.86元