变量间的相关关系与统计案例W.doc
变量间的相关关系与统计案例基础梳理1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,其中,b是回归方程的斜率,a是在y轴上的截距4样本相关系数,用它来衡量两个变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|0.75时,认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2 ,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好6独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量),可利用独立性检验判断表来判断“x与y的关系”这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验练习:1对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui、vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关2(2012·南昌模拟)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()y1y2合计x1a2173x2222547合计b46120A.10x200 B.10x200C.10x200 D.10x2003(2012·枣庄模拟)下面是2×2列联表:则表中a,b的值分别为()A94,72 B52,50 C52,74 D74,524. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系_(填“是”与“否”)5. 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数12638618292614乙厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数297185159766218(1)试分别估计两个分厂生产零件的优质品率;甲厂乙厂合计优质品非优质品合计(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.解析几何复习1、若双曲线的一条渐近线经过点(3,-4),则此双曲线的离心率为( )A、 B、 C、 D、2、已知抛物线:的焦点为,准线为,是上一点,是直线与 的一个交点,若,则=( )(A) (B) (C) (D) O3、已知双曲线的左、右焦点分别为为双曲线C的右支上一点,且,则 的面积等于()A24B36C48D964、椭圆上一点关于原点的对称点为,为其左焦点,若,设,则该椭圆的离心率为 _5、已知点为双曲线,的左顶点,线段交双曲线一条渐近线于点,且满足,则该双曲线的离心率为 _6、已知双曲线与椭圆有相同的焦点,且以为其一条渐近线,则双曲线方程为 _ _,过其中一个焦点且长为4的弦有 _ 条7、已知椭圆,过点且不过点的直线与椭圆交于,两点,直线与直线交于点(I)求椭圆的离心率;(II)若垂直于轴,求直线的斜率;(III)试判断直线与直线的位置关系,并说明理由解答题训练三1、某学校高三年级800名学生在一次百米测试中,成绩全部介于13秒与18秒之间.抽取其中50个样本,将测试结果按如下方式分成五组:第一组13,14);第二组14,15)第五组17,18,下图是按上述分组方法得到的频率分布直方图()若成绩小于14秒被认为优秀,求该样本在这次百米测试中优秀的人数;()请估计本年级这800人中第三组的人数; ()若样本第一组只有一名女生,第五组只有一名男生,现从第一、第五组中各抽取一名学生组成一个实验组,求在被抽出的2名学生中恰好为一名男生和一名女生的概率. 2、等差数列中,.()求数列的通项公式;()设,求数列的前n项和3、已知函数 .(I)求函数图象的对称中心;()在ABC中,内角A、B、C的对边长分别为a、b、c,若ABC为锐角三角形且,求的取值范围4、圆上两点C,D在直径AB的两侧(如图甲), 沿直径AB将圆折起形成一个二面角(如图乙), 若DOB的平分线交弧于点G,交弦BD于点E,F为线段BC的中点.()证明:平面OGF平面CAD.()若二面角C-AB-D为直二面角,且AB=2,求四面体FCOG的体积. 5、设椭圆:1(ab0),其长轴长是其短轴长的2倍,椭圆上一点到两焦点的距离之和为4()求椭圆的方程()设曲线的上、下顶点分别为A、B,点P在曲线上,且异于点A、B,直线AP,BP与直线y=分别交于点M,N (1)设直线AP,BP的斜率分别为k1,k2,求证:k1k2为定值;(2)求线段MN长的最小值