《2022年统计案例教案.docx》由会员分享,可在线阅读,更多相关《2022年统计案例教案.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 1.1 回来分析的基本思想及其初步应用一教学要求 :通过典型案例的探究,进一步明白回来分析的基本思想、方法及初步应用 . 教学重点 :明白线性回来模型与函数模型的差异,明白判定刻画模型拟合成效的方法相关指数和残差分析 . 教学难点 :说明残差变量的含义,明白偏差平方和分解的思想 .教学过程 :一、复习预备 :1. 提问: “ 名师出高徒” 这句彦语的意思是什么?出名气的老师就肯定能教出厉害的同学吗?这两者之间是否有关?2. 复习: 函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回来分析是对具有相关关系的两个. 变量进行统计分析的一种
2、常用方法,其步骤: 收集数据作散点图求回来直线方程利用方程进行预报二、讲授新课:1. 教学例题: 例 1 从某高校中随机选取8 名女高校生,其身高和体重数据如下表所示:7 8 . 分析编号1 2 3 4 5 6 身高 /cm 165 165 157 170 175 165 155 170 43 59 体重 /kg 48 57 50 54 64 61 求依据一名女高校生的身高预报她的体重的回来方程,并预报一名身高为172cm 的女高校生的体重思路老师演示同学整理7060/kg 重 体50 40 3020100150155160165170175180身高/cm第一步:作散点图 其次步:求回来方程
3、 第三步:代值运算 提问:身高为 172cm 的女高校生的体重肯定是吗?不肯定,但一般可以认为她的体重在左右 . 说明线性回来模型与一次函数的不同事实上, 观看上述散点图, 我们可以发觉女高校生的体重 y和身高x之间的关系并不能用一次函数 y bx a来严格 刻画由于全部的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系. 在数据表中身高为 165cm 的 3 名女高校生的体重分别为48kg、57kg 和 61kg,假如能用一次函数来描述体重与身高的关系,那么身高为 165cm 的 3 名女在同学的体重应相同 . 这就说明体重不仅受身高的影响仍受其他因素的影响,把这种影响的结果 e即残
4、差变量或随机变量引入到线性函数模型中,得到线性回来模型 y bx a e,其中残差变量 e 中包含体重不能由身高的线性函数说明的全部部分 . 当残差变量恒等于 0 时,线性回来模型就1 名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 变成一次函数模型 . 因此, 一次函数模型是线性回来模型的特别形式,线性回来模型是一次函数模型的一般形式 . 2. 相关系数 :相关系数的肯定值越接近于 1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回来模型拟合这组数据就越好,此时建立的线性回来模型是有意义 . 3. 小结:
5、求线性回来方程的步骤、线性回来模型与一次函数的不同 .1.1 回来分析的基本思想及其初步应用二教学要求 :通过典型案例的探究,进一步明白回来分析的基本思想、方法及初步应用. .教学重点 :明白评判回来成效的三个统计量:总偏差平方和、残差平方和、回来平方和教学难点 :明白评判回来成效的三个统计量:总偏差平方和、残差平方和、回来平方和.教学过程 :一、复习预备 :1由例 1 知,预报变量体重的值受说明变量身高或随机误差的影响 . 2为了刻画预报变量体重的变化在多大程度上与说明变量身高有关?在多大程度上与随机误差有关?我们引入了评判回来成效的三个统计量:总偏差平方和、残差平方和、回来平方和 . 二、
6、讲授新课:1. 教学 总偏差平方和、残差平方和、回来平方和:2SSTi . ny iy2. 1总偏差平方和:全部单个样本值与样本均值差的平方和,即残差平方和: 回来值与样本值差的平方和,即SSEiny i i y i. i 11y iy 2回来平方和: 相应回来值与样本均值差的平方和,即SSRni12学习要领: 留意iy 、iy 、 y 的区分; 预 报 变 量 的 变 化 程 度 可 以 分 解 为 由 解 释 变 量 引 起 的 变 化 程 度 与 残 差 变 量 的 变 化 程 度 之 和 , 即iny iy2 i ny iy i2 i ny iy2;1i 1i 1当总偏差平方和相对固定
7、时,残差平方和越小,就回来平方和越大,此时模型的拟合成效越好;n2 y i y i 对于多个不同的模型,我们仍可以引入相关指数 R 21 in 1 来刻画回来的成效,它表示说明变量2 y i y i 1对预报变量变化的贡献率 . R的值越大,说明残差平方和越小,也就是说模型拟合的成效越好 2.2. 教学例题:2 名师归纳总结 - - - - - - -第 2 页,共 8 页精选学习资料 - - - - - - - - - 例 2 关于 x 与 Y 有如下数据:x2 4 5 6 6.5 x17.58 7x17,试比较哪一个y30 40 60 50 70 y,y为了对 x、 Y 两个变量进行统计分
8、析,现有以下两种线性模型:模型拟合的成效更好. 分析: 既可分别求出两种模型下的总偏差平方和、残差平方和、回来平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论,R. 1 i5y iy i211800.82,84.5%82%,所以甲选用的模型拟合5答案 :2 R 11i1y iiy i211550.845215yy 225y iy2 10001000i1i1成效较好 . 3. 小结: 分清总偏差平方和、残差平方和、回来平方和,初步明白如何评判两个不同模型拟合成效的好坏 . 1.1 回来分析的基本思想及其初步应用三教学要求 :通过典型案例的探究,进一步明白回来分析的基本思想、
9、方法及初步应用 .教学重点 :通过探究使同学体会有些非线性模型通过变换可以转化为线性回来模型,明白在解决实际问题的过程中查找更好的模型的方法 .教学难点 :明白常用函数的图象特点,挑选不同的模型建模,并通过比较相关指数对不同的模型进行比较 . 教学过程 :一、复习预备 :1. 给出 例 3:一只红铃虫的产卵数y和温度x有关,现收集了7 组观测数据列于下表中,试建立y与x之间的回来方程 . 温度x/C个21 23 25 27 29 32 35 产卵数y/7 11 21 24 66 115 325 同学描述步骤,老师演示2. 争论 :观看右图中的散点图,发觉样本点并没有分布在某个带状区域数 卵35
10、0010203040300内,即两个变量不呈线性相关关系,所以不能直接用线性回来方程来建250200150产立两个变量之间的关系. 100500二、讲授新课:温度1. 探究非线性回来方程的确定: 假如散点图中的点分布在一个直线状带形区域,可以选线性回来模型来建模;假如散点图中的点分布在一个曲线状带形区域,就需挑选非线性回来模型来建模. y=CC 1e2x的四周其中c c是待定的 依据已有的函数学问,可以发觉样本点分布在某一条指数函数曲线参数,故可用指数函数模型来拟合这两个变量. 3 名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - -
11、在上式两边取对数,得lnyc x 2lnc,再令 1zlny,就zc x 2lnc,而z与x间的关系如下:X 21 23 25 27 29 32 35 z7z 观看 z与 x的散点图,可以发觉变换后样本点分布在一条直线的邻近,因654此可以用线性回来方程来拟合. 3210010203040x 利用运算器算得 a 3.843, b 0.272, z 与 x 间的线性回来方程为z 0.272 x 3.843,因此红铃虫的产卵数对温度的非线性回来方程为 y e 0.272 x 3.843 . 利用回来方程探究非线性回来问题,可按“ 作散点图 建模 确定方程” 这三个步骤进行 . 其关键在于如何通过适
12、当的变换,将非线性回来问题转化成线性回来问题 . 2. 小结: 用回来方程探究非线性回来问题的方法、步骤 . 三、稳固练习:为了争论某种细菌随时间x 变化,繁衍的个数,收集数据如下:5 6 天数 x/天1 2 3 4 繁衍个数 y/个6 12 25 49 95 190 1用天数作说明变量,繁衍个数作预报变量,作出这些数据的散点图;2试求出预报变量对说明变量的回来方程.答案: 所求非线性回来方程为0.69 .y=ex.1.112. 1.1回来分析的基本思想及其初步应用四教学要求 :通过典型案例的探究,进一步明白回来分析的基本思想、方法及初步应用教学重点 :通过探究使同学体会有些非线性模型通过变换
13、可以转化为线性回来模型,明白在解决实际问题的过程中查找更好的模型的方法,明白可用残差分析的方法,比较两种模型的拟合成效 .教学难点 :明白常用函数的图象特点,挑选不同的模型建模,并通过比较相关指数对不同的模型进行比较 . 教学过程 :一、复习预备 :1. 提问:在例3 中,观看散点图,我们挑选用指数函数模型来拟合红铃虫的产卵数y和温度x间的关系,仍 1225 325 可用其它函数模型来拟合吗?t441 529 625 729 841 1024 y7 11 21 24 66 115 2. 争论:能用二次函数模型y2 c xc来拟合上述两个变量间的关系吗?令t2 x ,就yc tc ,此时 y与t
14、间的关系如400300名师归纳总结 y2000500t100015004 1000第 4 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 下:观看 y 与 t 的散点图,可以发觉样本点并不分布在一条直线的四周,因此不宜用线性回来方程来拟合它,即不宜用二次曲线 y c x 2 c来拟合y与x之间的关系 . 小结: 也就是说,我们可以通过观看变换后的散点图来判定能否用此种模型来拟合 . 事实上,除了观看散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏 . 二、讲授新课:1. 教学残差分析: 残差: 样本值与回来值的差叫残差,即e
15、iy iy. 残差分析 :通过残差来判定模型拟合的成效,判定原始数据中是否存在可疑数据,这方面的分析工作称为残差分析 . 残差图: 以残差为横坐标,以样本编号,或身高数据,或体重估量值等为横坐标,作出的图形称为残差图. 观看残差图,假如残差点比较匀称地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回来方程的预报精度越高 . 2. 例 3 中的残差分析:运算两种模型下的残差一般情形下,比较两个模型的残差比较困难某些样本点上一个模型的残差的肯定值比另一个模型的小,而另一些样本点的情形就相反,故通过比较两个模型的残差的平方和的大小来判定模型的拟合成效 .
16、残差平方和越小的模型,拟合的成效越好 .由于两种模型下的残差平方和分别为1450.673 和 15448.432,应选用指数函数模型的拟合成效远远优于选用二次函数模型 . 当然,仍可用 相关指数 刻画回来成效3. 小结: 残差分析的步骤、作用1.2 独立性检验的基本思想及其初步应用一教学要求 :通过探究“ 吸烟是否与患肺癌有关系” 引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展现在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让同学亲身体验独立性检验的实施步骤与必要性. 教学重点 :懂得独立性检验的基本思想及实施步骤 . 5 名师归纳总结 - - - - - - -第 5 页
17、,共 8 页精选学习资料 - - - - - - - - - 教学难点 :明白独立性检验的基本思想、明白随机变量 K 的含义 . 2教学过程 :一、复习预备 :回来分析的方法、步骤,刻画模型拟合成效的方法相关指数、残差分析、步骤 . 二、讲授新课:1. 教学与列联表相关的概念: 分类变量:变量的不同“ 值” 表示个体所属的不同类别的变量称为分类变量 . 分类变量的取值肯定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等 . 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义 . 如用“0” 表示“ 男”
18、,用“1” 表示“ 女”. 不患肺癌 患肺癌 总计 列联表:分类变量的汇总统计表频数表. 一般我们只争论每 不吸烟 7775 42 7817 个分类变量只取两个值,这样的列联表称为 2 2. 如吸烟与患肺癌 吸 烟 2099 49 2148 的列联表:总 计 9874 91 9965 2. 教学三维柱形图和二维条形图的概念:由列联表可以粗略估量出吸烟者和不吸烟者患肺癌的可能性存在差异.老师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导同学观看这两类图形的特点,并分析由图形得出的结论3. 独立性检验的基本思想: 独立性检验的必要性为什么中能只凭列联表的数据和图形下结论?:列联表中的数据
19、是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体 . 独立性检验的步骤略及原理与反证法类似:反证法 假设检验要证明结论 A 备择假设 H1在 A 不成立的前提下进行推理 在 H1不成立的条件下,即 H 0 成立的条件下进行推理推出冲突,意味着结论 A 成立 推出有利于 H 1 成立的小概率大事概率不超过 的大事发生,意味着 H 1 成立的可能性可能性为1很大没有找到冲突,不能对 A 下任 推出有利于 H 1 成立的小概率大事不发生,接受原假设何结论,即反证法不胜利 上例的解决步骤第一步:提出假设检验问题KH 0 :吸烟与患肺癌没有关系dH 1
20、:吸烟与患肺癌有关系其次步:挑选检验的指标2n adbc2它越小,原假设“H 0 :吸烟与患肺癌没有关ab cdacb6 名师归纳总结 - - - - - - -第 6 页,共 8 页精选学习资料 - - - - - - - - - 系” 成立的可能性越大;它越大,备择假设“H 1 :吸烟与患肺癌有关系” 成立的可能性越大. 第三步:查表得出结论Pk 2k k1.2 独立性检验的基本思想及其初步应用二教学要求 :通过探究“ 吸烟是否与患肺癌有关系” 引出独立性检验的问题,并借助样本数据的列联表、柱形 图和条形图展现在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让同学亲身体验独立性检验的实施
21、 步骤与必要性 . 教学重点 :懂得独立性检验的基本思想及实施步骤. 2 K 的含义 . 教学难点 :明白独立性检验的基本思想、明白随机变量教学过程 :教学过程 :一、复习预备 :独立性检验的基本步骤、思想 二、讲授新课:1. 教学例 1:例 1 在某医院,由于患心脏病而住院的 665 名男性病人中,有 214 人秃顶;而另外 772 名不是由于患心脏病 而住院的男性病人中有 175 名秃顶 . 分别利用图形和独立性检验方法判定秃顶与患心脏病是否有关系?你所 得的结论在什么范畴内有效? 第一步: 老师引导同学作出列联表,并分析列联表,引导同学得出“ 秃顶与患心脏病有关” 的结论;其次步: 老师
22、演示三维柱形图和二维条形图,进一步向同学说明所得到的统计结果;2 第三步: 由同学运算出 K 的值;第四步: 说明结果的含义 . 通过第 2 个问题,向同学强调“ 样本只能代表相应总体” ,这里的数据来自于医院的住院病人,因此题 目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体就可能会显现错误,除非有其 它的证据说明可以进行这种推广 . 2. 教学例 2:例 2 为考察高中生的性别与是否喜爱数学课程之间的关系,在某城市的某校高中生中随机抽取 300 名同学,得到如以下联表:男喜爱数学课程不喜爱数学课程总计37 85 122 7 名师归纳总结 - - - - - - -第 7
23、 页,共 8 页精选学习资料 - - - - - - - - - 女35 143 178 总计72 k4.513228 300 由表中数据运算得到2 K的观看值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?同学自练,老师总结强调: 使得P K23.8410.05成立的前提是假设“ 性别与是否喜爱数学课程之间没有关系”. 假如这个前提不成立,上面的概率估量式就不肯定正确;结论有 95%的把握认为“ 性别与喜爱数学课程之间有关系” 的含义;在娴熟把握了两个分类变量的独立性检验方法之后,可直接运算 应的图形,但是图形的直观性也不行无视 . 3. 小结: 独立性检验的方法、原理、步骤 三、稳固练习:2 K 的值解决实际问题,而没有必要画相不健康健康总计某市为调查全市高中生学习状况是否对生理健康有影响,随不优秀41 626 667 机进行调查并得到如下的列联表:请问有多大把握认为“ 高优秀37 296 333 中生学习状况与生理健康有关” ?总计78 922 1000 8 名师归纳总结 - - - - - - -第 8 页,共 8 页
限制150内