《统计案例分析及典型例题文档.doc》由会员分享,可在线阅读,更多相关《统计案例分析及典型例题文档.doc(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 基础自测 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭 1 600户,工人家庭 303户,现要从中抽取容量为 40 的样本,则在整个抽样过程中,可以用到下列抽样方法:简单随机抽样,系统抽样,分层抽样中的答案.3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为答案3,9,18.4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为 235,现用分层抽样方法抽出一个容量为n的样本,
2、样本中A型号产品有16件,那么此样本的容量n=.答案80例1 某大学为了支援我国西部教育事业,决定从 2007应届毕业生报的名18名志愿者中,选取 6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解 抽签法:第一步:将18名志愿者编号,编号为 1,2,3,18.第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:第一步:将18名志愿者编号,编号为01,02,03,18.第二步:在随机数表中任选一数
3、作为开始,按任意方向读数,比如第 8 行第 29 列的数 7 开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在0118中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取 10人参加体检,试用系统抽样进行具体实施.解 (1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号将这3名工人剔除.(3)将剩余的1 000名工人重新随机编号由0001至1000.(4)分段,取间隔k=1 000=100将总体均分为10段,每段含100个工人.10
4、(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l,100+l,200+l,,900+l共10个号码选出,这10个号码所对应的工人组成样本.例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为32523,从3万人中抽取一个300人的样本,分某析种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300 3 =60(人);300 2 =40(人);5分1515300 5 =100(
5、人);300 2 =40(人);1515300 3 =60(人),1510分因此各乡镇抽取人数分别为60 人,40人,100人,40人,60人.(3)将300人组到一起即得到一个样本.12分14分练习: 一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为答案15,10,20.2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为.那么,分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最
6、适宜用系统抽样的是 (填序号).某市的4个区共有2 000名学生,且4个区的学生人数之比为3282,从中抽取200人入样某厂生产的2 000个电子元件中随机抽取5个入样从某厂生产的2 000个电子元件中随机抽取200个入样从某厂生产的20个电子元件中随机抽取5个入样答案4.(2013重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是答案分层抽样法.5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正的确是高一学生被抽
7、到的概率最大高三学生被抽到的概率最大高三学生被抽到的概率最小每名学生被抽到的概率相等答案(填序号).6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案10 8.将参加数学竞赛的 1 000 名学生编号如下 0001,
8、0002,0003,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,0020,从第一9.某政府机关有在编人员 100 人,其中副处级以上干部 10 人,一般干部 70 人,工人 20 人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解 用分层抽样抽取.(1)20100=15,10=2,70=14,20=4555从副处级以上干部中抽取2 人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2 人和 4 人;对一般干部可用随机数
9、表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解 总体容量为 6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为 36,分层抽样的比例n是 n ,抽取工程师 n6=n (人),63636抽取技术人员 n12=n (人),36 3抽取技工 n18=n (人).36 2所以n应是6的倍数,36的约数即n=6,12,18,36.当
10、样本容量为(n+1)时,在总体中剔除 1 人后还剩 35 人,系统抽样的间隔为 35 ,因为 35必须是n +1 n +1整数,所以n只能取6,即样本容量为6.总体分布的估计与总体特征数的估计基础自测 2.(2008山东理)右图是根据山东统计年鉴 2007中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997 年至2006年我省城镇居民百户家庭人口数的平均数为 .答案303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是
11、其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|=.答案mh4.(2008山东文,9)从某项综合能力测试中抽取 100 人的成绩,统计如表,则这 100 人成绩的标准差为 .分数 5人数 20432110303010答案2 1055.为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为17.5 岁18 岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在56.5,64.5)的学生人数是答案40.典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品
12、的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为234641,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高?解(1)第三组的频率为4 =12+3+4+6+4+1 5又因为第三组的频数为12,参评作品数为12=60.15(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60=18(件).62+3+4+6+4+1(3)第四组的获奖率是 =5,第六组上交的作品数量为609=3(件),101182+3+4+6+4+1第六组的获奖率为2=6,
13、显然第六组的获奖率高.93例 4(14 分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99, 98, 103,98, 99;乙:110,115,90, 85, 75, 115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.解(1)因为间隔时间相同,故是系统抽样.(2)茎叶图如2分下:5分(3)甲车间:平均值: =1(102+101+99+98+103+98+99)=100,77分9分方差:2s= (102-100)2+(101-100)
14、2+(99-100)3.428 6.2117乙车间:平均值:=1(110+115+90+85+75+115+110)=100,711分13分x2方差:s= (110-100)2+(115-100)2+(110-100)2228.571 4.1227=x ,ss2,甲车间产品稳定.14分21x122练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位
15、数落在第几小组内?解(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.(2)设参加这次测试的学生人数是n,则有n=第一小组频数=50.1=50(人).第一小组频率(3)因为0.150=5,0.350=15,0.450=20,0.250=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是. 2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩答案 甲 乙4.某班50名学生在一次百
16、米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为.答案 0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、平均成绩乙两人的分别是x、x,则x甲x,乙比稳定.乙甲答案 乙 甲7.(上海,9)已知总体的各个体的值由小到大依次为 2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是.答案 10.5、10.5二、解答题1
17、0.为了了解高一学生的体能情况,某校抽画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为24171593,第二组频数为12.取部分学生进行一分钟跳绳次数测试,将所得数据整理后,小 (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,=0.08.42+4+17 +15+9+3又因为频率=第二小组频数,样本容量所以样本容量=第二小组频数= 12 =150.第二小组频率0.08(2)由图可估计该学校高一学生的达标率
18、约为17 +15+9+32+4+17 +15+9+3100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程基础自测1.下列关系中,是相关关系的为 (填序号).学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;家庭的经济条件与学生的学习成绩之间的关系.答案 2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10 次和 15 次试验,并利用最小二乘法求得回归直线分别为l 和l.已知在
19、两人的试验中发现变量x的观测数据的平均值恰好21 相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是 (填序号).直线l,l 有交点(s,t)21直线l,l 相交,但是交点未必是(s,t)21直线l,l 由于斜率相等,所以必定平行21直线l,l 必定重合21答案 3.下列有关线性回归的说法,正确的是(填序号).相关关系的两个变量不一定是因果关系散点图能直观地反映数据的相关程度回归直线最能代表线性相关的两个变量之间的关系任一组数据都有回归直线方程答案 4.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变
20、量的关系是否可以用线性关系表示;通过回归直线 = + 及回归系数b,可以估计和预测变量的取值和变化趋势.y b x a其中正确命题的序号是 .答案 5.已知回归方程为y=0.50x-0.81,则x=25时,的估计值为 .y答案 11.69例1 下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解 (1)散点图如下: (2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量
21、由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化 肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号1 2345 678910x(收入)i0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.80.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5千元y(支出)i千元(1)判断家庭平均收入与月平均生活支出是否相关?
22、(2)若二者线性相关,求回归直线方程.解 (1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系 .7分(2)x= 1 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,10y= 1 (0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,109分nxiyi -nxy=0.813 6,i=1nbxi2 -nx2i=1a=1.42-1.740.813 60.004 3,13分 例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)xy3435
23、462.54.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程= x+a;y b(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5+43+54+64.5=66.5)解 (1)散点图如下图:(2)x=4.5,y=2.5 +3+4 +4.5=3.543 4 5 6+ + +44=32.5+43+45+64.5=66.5.xiyii=14xi2=32+42+52+62=86i=1=4xiyi -4x y=66.5 -43.54.5=
24、0.7- bi=1486 4 4.52xi2 -4x2i=1= - =3.5-0.74.5=0.35.y b xa所求的线性回归方程为y=0.7x+0.35.(3)现在生产100吨甲产品用煤 y=0.7100+0.35=70.35,1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,),并作了统计.年平均气12.51 12.84 12.84 13.69 13.33 12.74 13.05温年降雨量 748 542 507813 574 701 432(1)试画出散点图;(2)判断两个变量是否具有相关关系.解 (1)作出散点图如图所示
25、,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:温度(x) 010205070溶解度66.7 76.0 85.0 112.3 128.0(y)由资料看y与x呈线性相关,试求回归方程.解 x=30,y=66.7 +76.0 +85.0 +112.3+128.0=93.6.55xiyi -5xy=i 1=52 -5x2xi0.880 9.bi=1= - =93.6-0.880 930=67.173.a y b x回归方程为 y=0.880 9x+67.173. 3.某企业上半年产品产量与
26、单位成本资料如下:月份 产量(千件)单位成本(元)123456234345737271736968(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元? 66解(1)n=6,=21,=426,x=3.5,y=71,xyiii=1i=1 66=79,=1 481,x yi i2ixi=1i=16xiyi -6xy=1 481-63.571=-1.82.79 -63.52=bi=162 -6x2xii=1= - =71+1.823.5=77.37.a y b x回归方程为= + x=77.37-1.82x. y a b(
27、2)因为单位成本平均变动=-1.820,且产量x的计量单位是千件,所以根据回归系数b的意义有:一个单位即 1 000件时,单位成本平均减少1.82元.6 000件时,即x=6,代入回归方程:b产量每增加(3)当产量为y=77.37-1.826=66.45(元)当产量为6 000件时,单位成本为66.45元. 1.观察下列散点图,则正相关;负相关;不相关.它们的排列顺序与图形对应顺序是.答案a,c,b2.回归方程y=1.5x-15,则下列说法正确的有个.y=1.5x-1515是回归系数a1.5是回归系数ax=10时,y=0答案 13.(2009.湛江模拟)某地区调查了 29 岁儿童的身高,由此建
28、立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是.该地区一个10岁儿童的身高为142.63 cm该地区29岁的儿童每年身高约增加8.25 cm该地区9岁儿童的平均身高是134.38 cm利用这个模型可以准确地预算该地区每个29岁儿童的身高答案 4.三点(3,10),(7,20),(11,24)的回归方程是.答案 y=1.75x+5.755.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程 y=0.66x+1.562.若该地区的人均消费水平为 7.675 千元,估计该地区的人均消费额占人均工资收入的百
29、分比约为答案 83%.6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值, xi8888计算,得=52, =228, 2=478,ixiyi =1 849,则其线性回归方程为.xyii=1i=1i=1i=1答案y=11.47+2.62x7.有下列关系:人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系; 苹果的产量与气候之间的关系;森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 .答案8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x23456维修费用y2.23.85.
30、56.57.0若y对x呈线性相关关系,则回归直线方程y=bx+a表示的直线一定过定点.答案(4,5)二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:学生ABCDE学科数学80707566706865646062物理(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点.解 (1)数学成绩和物理成绩具有相关关系.(2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在条一直线附近 .10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面
31、积x(m2) 115 110 80 135 105销售价格y(万 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线.解(1)数据对应的散点图如图所示:5(2)x=109,y=23.2, =60 975,x2ii=15xi yi=12 952,i=15xiyi -5xy=0.196 2bi=152 -5x2xii=1= - 1.814 2a y b x所求回归直线方程为y=0.196 2x+1.814 2.11.某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:x 101517202252832y11.3 1.82
32、.6 2.7 3.3(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润.解(1)散点图如图所示:(2)x=1(10+15+17+20+25+28+32)=21,7y=1(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,7 7xi2=102+152+172+202+252+282+322=3 447,i=17=101+151.3+171.8+202+252.6+282.7+323.3=346.3,xi yii=17xiyi -7xy=346.3-7212.10.104,3 447 -7212bi=17xi2 -7x2i=1= - =2.1-0.10421=-
33、0.084,a y b xy=0.104x-0.084.(3)把x=24(千万元)代入方程得,y=2.412(千万元).估计销售总额为 24千万元时,利润为 2.412 千万元.12.某种产品的广告费支出 x与销售额 y(单位:百万元)之间有如下对应数据 :xy245683040605070(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为 10百万元时,销售额多大?解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:i12243545xi68yi3040605070 560因此,x=25=5,y=250 =50,55555xi2=145, 2=
34、13 500,xi yi=1 380.yii=1i=1i=1于是可得:=5xiyi -5xy=1 380 -5550=6.5;145 -555bi=152 -5x2xii=1= - =50-6.55=17.5.a y b x因此,所求回归直线方程为:y=6.5x+17.5.(3)根据上面求得的回归直线方程,当广告费支出为10百万元时,y=6.510+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.11.4 统计案例基础自测 1.对有线性相关关系的两个变量建立的回归直线方程= + x中,回归系数b与0的大小关系为 . y a b(填序号)大于或小于 大于小于不小于答案 2
35、.如果有90%的把握说事件A和B有关系,那么具体计算出的数据c2 2.706.(用“”,“”,“=”填空)答案 3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是. 4.下列说法中正确的有:若r0,则x增大时,y也相应增大;若r0,则x增大时,y也相应增大;若r=1 或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:未患慢性气管患慢性气管炎总计炎162吸烟 43205134339不吸烟合计1356121283试问:(1)吸烟习惯与患慢
36、性气管炎是否有关?(2)用假设检验的思想给予证明.(1)解根据列联表的数据,得到=n(ad bc(a +b)(a +c)(d +b)(d +c)-)22分6分c 2=339 (43121-162 13)2 =7.4696.63520556283134所以有99%的把握认为“吸烟与患慢性气管炎有关” .9分(2)证明假设“吸烟与患慢性气管炎之间没有关系”,由于事件A= c 26.6350.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件
37、的多少,随机器运转的速度而变化,下表为抽样试验结果: 转速x(转/秒)161114912885每小时生产有缺点的零件数y(件)(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解(1)x=12.5,y =8.25,4xi yi=438,4x y=412.5,i=1=660,2=291,44xi2yii=1i=14xiyi -4x y所以r=i=1 44x2 -4x2 )(yi2 -4y2)(ii=1i=1438 -412.5(660 -625)(291-272
38、.25)= 25.500.995 4.25.525.62656.25因为rr ,所以y与x有很强的线性相关关系.0.05(2)y=0.728 6x-0.857 1.(3)要使y10 0.728 6x-0.857 110,所以x14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归方程.使用年12 3456 7 8910 格2651 1943 1494 1087 765 538 484 290 226 204解作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,
39、y与x之间应是非线性相关关系.与已学函数图象比较,用=e 来刻画题中模型更为合理,令z=lny,则= x+a,题中数据变成如下表所示:y+ bx az bx 17.88 7.57 7.30 6.99 6.64 6.28 6.18 5.67 5.42 5.312 9 1 0 8 2 0 1234 56789 10z38相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r-0.996.|r|r .认为x与z之间具有线性相关关系,由表中数据得b-0.298,a0.058.165,所以z=-0.298x+8.165,最后回代z=lny,即y=e-0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:不太主动参加班级工积极参加班级工作合计作7学习积极性高1825 学习积极性一般合计61926255024(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的
限制150内