回归分析的基本思想及其初步应用(19页).doc
《回归分析的基本思想及其初步应用(19页).doc》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用(19页).doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-第一章:统计案例回归分析的基本思想及其初步应用实例 从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:编号12345678身高165165157170175165155170体重4857505464614359问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.解:由于问题中要求根据身高预报体重,因此 选 自变量x, 为因变量.(1)做散点图:从散点图可以看出 和 有比较好的 相关关系.(2) = =所以于是得到回归直线的方程为(3)身高为172cm的女大学生,由回归方程可以预报其体重为 新知:用相关系数r可衡量
2、两个变量之间 关系.计算公式为 r =r0, 相关, rk)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83 典型例题例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某
3、城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学总计男3785122女35143178总计72228300由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?练1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:不健康健康总计不优秀41626667优秀37296333总计789221000请问有多大把握认为“高中生学习状况与生理健康有关”?练习:1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A. 若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名
4、吸烟者中,有99个患肺病.B. 从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D. 以上三种说法都不对.2. 下面是一个列联表不健康健康总计不优秀a2173优秀22527总计b46100则表中a,b的之分别是( )A. 94,96 B. 52,50 C. 52,54 D. 54,523.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总计玩游戏18927不玩游戏81523总计262450则认为喜欢玩游戏与认为作业量
5、多少有关系的把握大约为( )A. 99% B. 95% C. 90% D.无充分依据4. 在独立性检验中,当统计量满足 时,我们有99%的把握认为这两个分类变量有关系.统计案例检测题一、 选择题(本大题共12小题,每题4分)1、散点图在回归分析中的作用是 ( )A查找个体数目 B比较个体数据关系C探究个体分类D粗略判断变量是否呈线性关系2、对于相关系数下列描述正确的是 ( )Ar0表明两个变量相关Br0表明两个变量无关C越接近1,表明两个变量线性相关性越强Dr越小,表明两个变量线性相关性越弱3、预报变量的值与下列哪些因素有关 ( )A受解释变量影响与随机误差无关B受随机误差影响与解释变量无关C
6、与总偏差平方和有关与残差无关D与解释变量和随机误差的总效应有关4、下列说法正确的是 ( )A任何两个变量都具有相关系B球的体积与球的半径具有相关关系C农作物的产量与施肥量是一种确定性关系D某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的 ( )A. 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上C. 可以选择两个变量中任意一个变量在x 轴上 D. 可以选择两个变量中任意一个变量在 y 轴上6、回归直线必过 ( )A B C D7、三维柱形图中,主、副对角线上两个柱形高度的 相差越大,要推断的论述成立的可能性就越大
7、 ( )A和 B差 C积 D商8、两个变量 y与x的回归模型中,求得回归方程为,当预报变量 ( )A. 解释变量 B. 解释变量大于C. 解释变量小于 D. 解释变量在左右9、在回归分析中,求得相关指数,则( )A. 解释变量解对总效应的贡献是 B. 解释变量解对总效应的贡献是 C. 随机误差的贡献是C. 随机误差的贡献是10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C若从统
8、计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D以上三种说法都不对.11、通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为 ( )A回归分析 B独立性检验分析C残差分析 D. 散点图分析12、在独立性检验时计算的的观测值=3.99,那么我们有 的把握认为这两个分类变量有关系 ( ) A90% B95%C99% D以上都不对二、填空题(本大题共4小题,每题4分)13、已知回归直线方程,则时,y的估计值为 .14、如下表所示:不健康健康总计不优秀41626667优秀37296333总计789221000计算= .15、下列关系中:(1)玉
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 基本 思想 及其 初步 应用 19
限制150内