考点47 变量间的相关关系、统计案例.docx
考点47 变量间的相关关系、统计案例1.(2022·新高考卷·T20)(12分)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,P(B|A)P(B|A)与P(B|A)P(B|A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(i)证明:R=P(A|B)P(A|B)·P(A|B)P(A|B);(ii)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(i)的结果给出R的估计值.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.0500.0100.001k3.8416.63510.828【命题意图】本题考查了独立性检验应用问题,也考查了条件概率的应用问题.【解析】(1)由已知K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200(40×9060×10)2100×100×50×150=24,又P(K26.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为R=P(B|A)P(B|A)·P(B|A)P(B|A)=P(AB)P(A)·P(A)P(AB)·P(AB)P(A)·P(A)P(AB),所以R=P(AB)P(B)·P(B)P(AB)·P(AB)P(B)·P(B)P(AB),所以R=P(A|B)P(A|B)·P(A|B)P(A|B).(ii)由已知P(A|B)=40100,P(A|B)=10100,又P(A|B)=60100,P(A|B)=90100,所以R=P(A|B)P(A|B)·P(A|B)P(A|B)=6.2.(2022·全国甲卷文科)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.1000.0500.010k2.7063.8416.635【命题意图】本题考查概率计算以及独立性检验,考查运算求解能力【解析】(1)根据表中数据,A共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则P(M)=240260=1213;B共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,则P(N)=210240=78.A家公司长途客车准点的概率为1213;B家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计45050500K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30-210×20)2260×240×450×503.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.3.(2022·全国乙卷文科·T19)(与理科T19相同) 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得i=110xi2=0.038,i=110yi2=1.615 8,i=110xiyi=0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,1.8961.377.【命题意图】考查样本均值、相关系数的概念,考查学生的数学运算能力以及分析问题、解决问题的能力.【解析】(1)样本中10棵这种树木的根部横截面积的平均值x=0.610=0.06,样本中10棵这种树木的材积量的平均值y=3.910=0.39,据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.(2)r=i=110(xi-x)(yi-y)i=110(xi-x)2i=110(yi-y)2=i=110xiyi-10xy(i=110xi2-10x2)(i=110yi2-10y2)=0.247410×0.06×0.39(0.038-10×0.062)(1.6158-10×0.392)=0.01340.00018960.01340.013770.97,则r0.97;(3)设该林区这种树木的总材积量的估计值为Y m3,又已知树木的材积量与其根部横截面积近似成正比,可得0.060.39=186Y,解得Y=1 209 m3.则该林区这种树木的总材积量估计为1 209 m3.