《第一章 统计案例.ppt》由会员分享,可在线阅读,更多相关《第一章 统计案例.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章第一章 统计案例复习小结统计案例复习小结1.通过复习,了解本章知识脉络,体会数学思想、方法.2.自主学习,合作交流,探究解决回归分析、独立性检验问题的一般规律和方法.3.加深对统计学中有关数学符号的理解.能应用相关符号解释有关意义。学习目标自学指导仔细阅读选修1-2P216页习题1.2前面内容1、在文中找出相关关系、回归分析、样本点中心、独立性检验的定义(画出来)2、文中对两个具有相关关系的变量进行分析时,画散点图的目的是什么?3、文中介绍了几种方法来衡量模型的拟合效果?分别是怎样衡量的?4、怎样用独立性检验的方法来衡量两个分类变量是否相关?如何查表?5、注意文中例题解题格式 5分钟后比
2、比谁能做对检测题。知识梳理一、回归分析1.回归分析回归分析是对有相关关系的两个变量进行统计分析的一种常用方法。相关关系是指两个变量具有关系,但是它们的关系又是不确定的,是一种相对关系,即y除了由x决定,还有其他因素决定。相关关系分为直线相关和曲线相关。函数关系是一种确定性的关系,即x变一定引起y变,y仅由x来决定。而线性关系属于函数关系。2建立回归模型的一般步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系)(4)按一定规则估计回归方程中的参数(5)得出结果后分析残差图是否有异常(个别数据对应的
3、残差过大,或残差呈现不随机的规律性,等等),若残差存在异常,则应检查数据是否有误,或模型是否合适等思考:画散点图的目的是什么?用回归方程求出来的预报变量是准确值吗?有几种方法来衡量模型的拟合效果,分别是怎么判断模型好差的?二、独立性检验1.分类变量:同一种事物或同一件事情的两种或两种以上的不同类别列联表:两个分类变量的频数表独立性检验:用随机变量K2来判断两个分类变量是否有关系的方法2判断两个分类变量之间是否有关系的方式有三种:所占比例、等高条形图和独立性检验其中所占比例和等高条形图只能粗略地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论3独立性检验的一般步骤:(1)根据样本
4、数据制成22列联表(2)根据公式计算K2的值(3)比较K2与临界值的大小关系作统计推断思考:怎么通过查P13表格比较K2与临界值的大小关系?本章知识结构当堂检测1.下列两个变量之间的关系不具有相关关系的是下列两个变量之间的关系不具有相关关系的是 ()A.小麦产量与施肥值小麦产量与施肥值 B.球的体积与表面积球的体积与表面积 C.蛋鸭产蛋个数与饲养天数蛋鸭产蛋个数与饲养天数 D.甘蔗的含糖量与生长期的日照天数甘蔗的含糖量与生长期的日照天数2.下列变量之间是函数关系的是下列变量之间是函数关系的是 ()A.已知二次函数已知二次函数 ,其中其中a,b是已知常数是已知常数,取取b为为自自变变量量,因因变
5、变量是量是这这个函数的判个函数的判别别式:式:B.光照光照时间时间和果和果树亩产树亩产量量 C.降雪量和交通事故降雪量和交通事故发发生率生率 D.每每亩亩施用肥料量和粮食施用肥料量和粮食亩产亩产量量 BA3.3.变量变量y y与与x x之间的回归方程表示(之间的回归方程表示()A Ay y与与x x之间的函数关系之间的函数关系 B By y与与x x之间的不确定性关系之间的不确定性关系Cy与x之间的真实关系的形式 Dy与x之间的真实关系达到最大限度的吻合B4.4.关于如何求回归直线的方程,下列说法正确关于如何求回归直线的方程,下列说法正确的一项是(的一项是()A.A.先画一条,测出各点到它的距
6、离,然后移动先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程此时的斜率与截距,就可得到回归直线方程 B.B.在散点图中,选两点,画一条直线,使所画在散点图中,选两点,画一条直线,使所画直线两侧的点数直线两侧的点数一一样多或基本相同,求出此直多或基本相同,求出此直线方程,方程,则该方程即方程即为所求回所求回归方程方程C.在散点在散点图中多中多选几几组点,分点,分别求出各直求出各直线的的斜率与截距,再求它斜率与截距,再求它们的平均的平均值,就得到了回,就得到了回归直直线的斜率与截距,即可的斜
7、率与截距,即可产生回生回归方程方程 D.上述三种方法都不可行上述三种方法都不可行D5.5.在画两个变量的散点图时,下面叙述正确的是在画两个变量的散点图时,下面叙述正确的是()A.A.预报变量在预报变量在x x轴上,解释变量在轴上,解释变量在y y轴轴上上 B.解解释变量在量在x轴上,上,预报变量在量在y轴上上C.可以可以选择两个两个变量中的任意一个量中的任意一个变量在量在x轴上上D.可以可以选择两个两个变量中的任意一个量中的任意一个变量在量在y轴上上6.散点散点图在回在回归分析分析过程中的作用是(程中的作用是()A.查找个体个数找个体个数 B.比比较个体数据大小关系个体数据大小关系 C.探究个
8、体分探究个体分类 D.粗略判断粗略判断变量是否量是否线性相性相关关BD7.(2011.陕陕西)西)设设 是是变变量量x和和y的的n个个样样本点,直本点,直线线 是由是由这这些些样样本点通本点通过过最小二乘最小二乘法得到的法得到的线线性回性回归归直直线线(如(如图图)。)。则则()A.x和和y之之间间具有正的具有正的线线性相关关系;性相关关系;B.这这些些样样本点都在本点都在这这条直条直线线上;上;C.当当n为为偶数偶数时时,分布在两,分布在两侧侧的的样样本点的一定相本点的一定相等;等;D.直直线线 过过点(点()。)。D8.8.某医院用光电比色计检验尿汞时,得尿汞某医院用光电比色计检验尿汞时,
9、得尿汞含量含量(mg/L)(mg/L)与消光系数读数的结果如下:如与消光系数读数的结果如下:如果果y y与与x x之间具有线性相关关系,那么当消光之间具有线性相关关系,那么当消光系数的读数为系数的读数为480480时,(时,()A.A.汞含量约为汞含量约为13.27mg/L 13.27mg/L B.B.汞含量高于汞含量高于13.27mg/L 13.27mg/L C.C.汞含量低于汞含量低于13.27mg/L 13.27mg/L D.D.汞含量一定是汞含量一定是13.27mg/L 13.27mg/L A9在对一组数据采用几种不同的回归模型进行回归分析时,得到下面的相应模型的相关指数的值,其中拟和
10、效果较好的是()A0.45 B0.89 C0.88 D0.86B这节课你有什么收获?课时小结课堂作业必做题必做题1 1对长期吃含对长期吃含三聚三聚氰氰胺胺的婴幼儿奶粉与患肾结石的婴幼儿奶粉与患肾结石这这两两个分个分类变类变量的量的计计算中,下列算中,下列说说法正确的是法正确的是 ()A.若若 的的值值大于大于 6.635,我我们们有有99%的把握的把握认为长认为长期期吃含吃含三聚三聚氰氰胺胺的三鹿的三鹿婴婴幼儿奶粉与患幼儿奶粉与患肾结肾结石石有关系,有关系,那么在那么在100个个长长期吃含期吃含三聚三聚氰氰胺胺的三鹿奶粉的三鹿奶粉的的婴婴幼儿幼儿中必有中必有99人患有人患有肾结肾结石石病病;B
11、.从独立性从独立性检验检验可知有可知有99%的把握的把握认为认为吃含吃含三聚三聚氰氰胺胺的三鹿的三鹿婴婴幼儿奶粉与患幼儿奶粉与患肾结肾结石石有关系有关系时时,我,我们说们说某某一一个个婴婴幼儿吃含幼儿吃含三聚三聚氰氰胺胺的三鹿的三鹿婴婴幼儿奶粉幼儿奶粉,那么他有,那么他有99%的可能患的可能患肾结肾结石石病病;C.若从若从统计统计量中求出有量中求出有95%的把握的把握认为认为吃含吃含三聚三聚氰氰胺胺的三鹿的三鹿婴婴幼儿奶粉与患幼儿奶粉与患肾结肾结石石有关系,是指有有关系,是指有5%的的可能性使得推判出可能性使得推判出现错误现错误;D.以上三种以上三种说说法都不正确。法都不正确。C2 2为为了研
12、究色盲与性了研究色盲与性别别的关系,的关系,调查调查了了1 000人,调查结果如下表所示:人,调查结果如下表所示:性别是否色盲男男女女正常正常442514色盲色盲386根据上述数据,根据上述数据,试问试问色盲与性色盲与性别别关系关系是是()A.A.相互独立相互独立 B.B.不不相互独立相互独立 C.C.有有99.9.9以上以上的把握的把握认为认为色盲与性色盲与性别别有有关关 D.只有只有0.1的把握的把握认为认为色盲与性色盲与性别别有关有关C3 3 给给出出222列列联联表如下:表如下:是否优秀班级优优秀秀不不优优秀秀总计总计甲班甲班202545乙班乙班182745总计总计385290根据表格
13、提供的数据,估根据表格提供的数据,估计计“成绩与班级有关系成绩与班级有关系”犯错误的概率约是(犯错误的概率约是()A.0.40.4 B.0.50.5 C.0.750.75 D.0.850.85B4.4.一个研究机构向某大学的毕业生发放调查一个研究机构向某大学的毕业生发放调查表,下面是回收情况(单位:人)表,下面是回收情况(单位:人)学位学位 寄回寄回不寄回不寄回学士学士78781111博士和硕士博士和硕士61611313问:调查表的寄回与否和学历的高低有关吗问:调查表的寄回与否和学历的高低有关吗?是否寄回是否寄回 选做题(2011.山东)某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程 当 为9.4时,据此模型预测广告费用为6万元时的销售额为()A.63.6万元;B.65.5万元;C.67.7万元;D.72万元广告费用广告费用x(万元)(万元)4 42 23 35 5销售额销售额y(万元)(万元)4949262639395454B
限制150内