第3节 成对数据的统计分析.docx
第3节 成对数据的统计分析考试要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2义2列 联表,会运用这些方法解决简单的实际问题.知识诊断基础夯实【知识梳理】1 .变量的相关关系(1)相关关系的分类:正相关和负相关.(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量 非线性相关或曲线相关.2 .样本相关系数(1)相关系数厂的计算变量x和变量y的样本相关系数r的计算公式如下:一 一£(X/-x) (y- j)i=1r rn - rn - ,a / Z (x/x) 2a / Z (y-y) 2(2)相关系数厂的性质当厂0时-,称成对样本数据正相关;当Y0时,成对样本数据兔相关;当r=0 时,成对样本数据间没有线性相关关系.样本相关系数r的取值范围为一一1, 11.当W越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3 .一元线性回归模型 A AA我们将称为y关于X的经验回归方程,其中n -n£ (8一x) (y-y)Z_ xiyi/?;Z (X;-x) 2Z_ jnx-z=li=1A A <a=y bx.(2)决定系数AnZ (yy) 2R2=lF, R2越大,即拟合效果越好,R2越小,模型拟合效果越差.n一一Z (yy) 2 i=4 .列联表与独立性检验关于分类变量X和y的抽样数据的2X2列联表XY合计Y=0y=ix=oaba+bX=1cdc+d合计a+cbdna h c dn (ad-be) 2记i+0+c+d,则随机变量尤=(八,工、“八.人 (。十 Z?) (c 十 d) (q十 c) <b+d)(2)独立性检验基于小概率值a的检验规则是:当Z22%/寸,我们就推断Ho不成立,即认为X和y不独立,该推断犯错误的概率不超过«;当/<Xa时,我们没有充分证据推断”0不成立,可以认为X和y独立.下表给出了 Z2独立性检验中几个常用的小概率值和相应的临界值a0.10.050.010.0050.001Xa2.7063.8416.6357.87910.828常用结论1 .求解经验回归方程的关键是确定回归系数联,h,应充分利用经验回归直线过样 本点的中心(%, y).2 .根据z2的值可以判断两个分类变量有关的可信程度,若/越大,则两个分类变 量有关的把握越大.【诊断自测】1 .思考辨析(在括号内打“ J ”或“ X ”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.() A AA(2)通过经验回归方程可以估计预报变量的取值和变化趋势.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()事件X, 丫关系越密切,则由观测数据计算得到的好的值越大.()答案 J (2)7 (3)7 (4)72 .(选修三P103T1改编)两个变量的相关关系有:正相关;负相关;不相关, 则下列散点图从左到右分别反映的变量间的相关关系是()yytyOx Ox OxA.B.C.D.答案D解析第一个图大体趋势从左向右上升,故正相关,第二个图不相关,第三个图 大体趋势从左向右下降,故负相关,故选D.3 .(多选)在统计中,由一组样本数据(%i, yi), (%2, ”),(x«, 利用最小二乘A AA法得到两个变量的经验回归方程为那么下列说法正确的是( )A AA A.直线必经过点(x, y) A AAB.直线y=/u+o表示最接近y与x之间真实关系的一条直线C.相关系数为厂,且m越接近于1,相关程度越大;|r|越接近于0,相关程度越小D.用决定系数R2来刻画回归效果,改越小说明拟合效果越好答案ABCA AAA AA解析 直线必过样本点中心即点(x, y),故A正确;直线y=Zzx+a是采 用最小二乘法求解出的直线方程,接近真实关系,故B正确;相关系数厂的绝对 值越接近于1,表示相关程度越强,越接近于0,相关程度越弱,故C正确;用 决定系数R2来刻画回归效果,尺2越大,说明模型的拟合效果越好,故D错误.4.(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的 数据,绘制了如下所示的2X2列联表(个别数据暂用字母表示):幸福感强幸福感弱合计阅读量多m1872阅读量少36n78合计9060150计算得:12.981,参照下表:a0.100.050.0250.0100.0050.001Xa2.7063.8415.0246.6357.87910.828对于下面的选项,正确的是()A.根据小概率值a=0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无 关”B.m54C.根据小概率值a=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前 提下认为“阅读量多少与幸福感强弱有关”D.=52答案BC角星析 Vz212.981>7.879>6.635,根据小概率值。=0.010的独立性检验,可以在犯错误的概率不超过1%的前提 下认为“阅读量多少与幸福感强弱有关”,根据小概率值0=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提 下认为“阅读量多少与幸福感强弱有关”,A错,C正确,Vm+36 = 90, 18+h=60,/.77i=54,几=42,AB正确,D错.