变量间的相关关系及统计案例.doc
2014届高考数学理科试题大冲关:变量间的相关关系与统计案例一、选择题1.设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)2通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得,K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3一位母亲记录了自己儿子39岁的身高数据(略),由此建立的身高与年龄的回归模型为7.19x73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm左右D身高在145.83 cm以下4如图5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A相关系数r变大B残差平方和变大C相关指数R2变大D解释变量x与预报变量y的相关性变强5某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200 B.10x200C.10x200 D.10x2006下列四个命题正确的是()线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;残差平方和越小的模型,拟合的效果越好;用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好;随机误差e是衡量预报精确度的一个量,它满足E(e)0.A BC D二、填空题7调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元8某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.9第二十届世界石油大会将于2011年12月4日8日在卡塔尔首都多哈举行,能源问题已经成为全球关注的焦点某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为_吨三、解答题10已知x,y的一组数据如下表:x13678y12345(1)从x,y中各取一个数,求xy10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为yx1与yx,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好11为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议现对他前7次考试的数学成绩x、物理成绩y进行分析下面是该生7次考试的成绩.数学888311792108100112物理949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议(其中,数据(xi,yi)(i1,2,n)的线性回归方程为x,)12某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)甲(50岁以下)来源:Z,xx,k.Com乙(50岁以上)15386784532023456789015676来源:学+科+网Z+X+X+K237964528158(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;(2)根据以上数据完成下列2×2的列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析附:K2.P(K2k0)0.250.150.100.050.0250.0100.0050.001k01.3232.0722.7063.8415.0246.6357.87910.828详解答案一、选择题1. 解析:回归直线过样本中心(,)答案:D2解析:根据独立性检验的思想方法,正确选项为A.答案: A3解析:用回归模型7.19x73.93,只能作预测,其结果不一定是一个确定值答案:C4解析:相关系数r越接近1,R2越大,残差平方和越小,拟合效果越好答案:B5解析:由图象可知,选项B、D为正相关,选项C不符合实际意义,只有A项符合要求答案:A 6解析:线性相关系数r满足|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱,故错误;相关指数是度量模型拟合效果的一种指标相关指数越大,模型拟合效果越好故正确答案:B二、填空题7解析:以x1代x,得0. 254(x1)0.321,与0.254x0.321相减可得,年饮食支出平均增加0.254万元答案:0.2548解析:设父亲身高为x cm,儿子身高为y cm,则x173170176y170176182173,176,1,1761×1733,x3,当x182时,185.来源:学科网答案:1859解析:由题知,4.5,3.5,故样本数据的中心点为A(4.5,3.5)设回归方程为y0.7xb,将中心点坐标代入得:3.50.7×4.5b,解得b0.35,故回归方程为y0.7x0.35,所以当x10时,y0.7×100.357.35,即该工厂每年大约消耗的汽油为7.35吨答案:7.35三、解答题10解:(1)从x,y中各取一个数组成数对(x,y),共有25对,其中满足xy10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对故所求概率P.(2)用yx1作为拟合直线时,所得y值与y的实际值的差的平方和为S1(1)2(22)2(33)2(4)2(5)2.用yx作为拟合直线时,所得y值与y的实际值的差的平方和为S2(11)2(22)2 (3)2(44)2(5)2.S2<S1,直线yx的拟合程度更好11解:(1)100100,100100,s142,s,从而s>s,该生的物理成绩更稳定(2)由于x 与y之间具有线性相关关系,0.5,1000.5×10050,线性回归方程为0.5x50.当y115时,x130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高12解:(1)在30位亲属中,50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主(2)2×2的列联表如下:主食蔬菜主食肉类合计50岁以下481250岁以上16218合计来源:学*科*网Z*X*X*K201030(3)因为K210>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关