《轻松学统计课件.docx》由会员分享,可在线阅读,更多相关《轻松学统计课件.docx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、轻松学统计(1)1.刻版印象 现代人其实离不开统计,但是现代人却又普遍有统计很难学的刻版印象,所以在学校上统计课时,学生翘课或上课打瞌睡就成了思空见惯的现象,而相对的老师也就只好搬出活当、死当来以儆效尤,这种怨憎会的场景真的是学统计的宿命吗? 曾经也被统计公式搞的七晕八素,曾经也在统计课堂中无聊入眠,但是没想到自己居然会成为教统计的老师,因此我一直希望自己的学生不要重入自己当年的恶梦,我立志要让学生轻松学统计。但是如果他们已有统计难学的刻版印象,那该如何先让他们放轻松呢?第一招当然是要打破心结,因此统计的第一节课需要先发制人,先问学生一个问题:统计难学吗?学生几乎都异口同声的哀叫难! 我沉默以
2、对,让他们迟疑30秒之后再问:有没有听过常态分配?学生们几乎都会略为安心地说有! 我微笑以对,在他们安心30秒之后再问:请问是先有常态分配,所以人长的不高不矮,还是先有身高的事实再有常态分配?同学一阵交头接耳之后,几乎全数举手赞成是先有身高的事实,再有常态分配。 既然这是大家的共识,当然要乘胜突破他们的心防,和颜悦色的告诉大家:既然统计学是事实在先,理论在后,那么我们何苦要自己吓自已,认为统计很难呢? 当大家默默点头之后,就可以继续向他们挑战:既然统计是前人将事实归纳出的结论,那么让我们也一起重新走过这段寻幽访胜的趣味古道好不好? 欢呼声中,我们开始了寻幽访胜之旅。2.寻幽访胜 寻幽访胜的第一
3、个问题是:统计必备的原料是什么?几乎立刻会有人想到统计的原料是数据,这当然是正确的答案,在兴奋之余再向他们挑战, 请问是不是有数据就是统计? 老师,那可不见得! 那你认为除了数据,还需要加上什么才可能让统计更完整呢? 一阵沉思之后,有人提出要将数据拿来计算 Good!但是要算出什么东西呢? 譬如要算出平均身高 对!平均身高是最重要的统计量之一,一般用表示,是代表集中趋势的统计量 这就上路了,这群学生已渐渐会寻幽访胜了, 除了计算平均值,这些数据还可以算出那些名堂? 还可以算出差距 请问你说的差距是什么意思? 就是指最高身高减最低身高嘛! OK!你所谓的差距就是统计学上所说的全距,一般用R来表示
4、,R是代表离中趋势的一种统计量 这群学生现在已能慢慢体会到推理的自信与学习的乐趣了,这时不妨给他们一点更Tough的问题: 那么请问是不是有了这些计算(等)就算是统计呢? 学生由兴奋陷入沈思,沉思之后有些学生开始轻轻的摇头, 那你们是不是认为原始数据加上计算并不完全等于统计呢? 他们如释重负地拼命点头,但是为了帮他们更趋于严谨而成熟,这时候不但不能丢救生圈给他们,反而要用铁石心肠来逼问那么统计倒底是什么碗糕?3.柳暗花明 虽然他们还不能立即回答这个难题,但是他们至少已明白统计中少不了数据与计算,而那仍然不足的部分倒底是什么呢?换言之,计算若不是统计的终点,那么统计最终的目的倒底是什么呢?慢慢地
5、有学生会说: 统计的目的是要让我们得到有意义的情报! 对!但是什么才是有意义的情报呢? 有位同学在经过连番追问后,若有所悟,他突然反守为攻, 请问老师能不能举几个有关情报的例子,这样我们就可以回答什么是有意义的情报了。 真是孺子可教,既然问的合情合理,那就先举一个例子让他们揣摩。 例:请问“拉力强度很好”算不算是有意义的情报? 老师,不算! 为什么不算? 老师,因为“拉力强度很好”太笼统了,它根本没有任何数据可作判断的参考。 既然初生之犊不畏唬,那就只有加一点料,再来试试他们。 例2:好,那么我们加上数据“拉力强度平均为5kg/cm2”,请问这算不算有意义的情报? 老师,这样的情报虽然有意义,
6、但是仍不理想。 为什么? 因为只有提到平均值是5kg/cm2,但是我们并不知道这是0与10的平均,还是4.99与5.01的平均,所以很难单凭平均值来判断此一情报是否有意义。 这些学生真是成材,他们的思绪已愈来愈严谨了,居然已能从推理中体会到集中趋势并无法完全代表统计量的事实,不偾不启古有明训,所以只有再为他们指点迷津。 例3:你们的考虑没错,既然如此,那么我们就再加上范围“大多数产品的拉力强度在5kg0.6kg之内”,这样你们满意了吗? 不满意!学生齐哄, 为什么? 因为大多数太不明确了! 得天下英才而教之的喜乐这时一起涌现,这群学生真的太可爱了, 那我们把大多数更明确化一点好不好? 好! 例
7、4:如果修改成“99.73%的产品拉力强度在5kg0.6kg/cm2之内”,你们满意吗? 一些参与度较高的同学马上表示满意,但仍有一部分没有表示意见,为了确认全班的认知程度,所以再一次改采主动,请全班同学从例1到例4中,要挑出一个他认为最有意义的情报,经过两分钟的表决,结果全班同学一致认为例4才是相对而言最有意义的情报。4.水落石出 经过这一连串的讨论,需要帮学生将思绪重新整理一下,于是在黑板上先画了下面这张图: 然后向学生解释,这是一般生产系统简单的示意图,I代表Input也就是指原料,P代表Production也就是指加工,O代表Output也就是成品,接着我请大家想一下如果统计也是一个系
8、统,那么就统计而言上图中的I、P、O分别代表什么呢? 有一位同学立刻自告奋勇的冲上黑板,在上图的每一个框框下分别填上 数据 算有意义的情报等一下!当他要冲回座位时我大叫一声,一面把另一枝粉笔交给他,一面向他说: 谢谢您刚才的答案,这的确是很恰当的答案,但是可否请您再将您的答案作一点整合,能否试试看将“数据”、“计算”及“有意义的情报”整理成一个关系式? 这位同学考虑了一下,重新在黑板上写了一个关系式。他一面写、我一面替他高兴,当他写完后,我请他向全班同学解释一下,他充满自信地说: 这个公式的意思是说,数据经过计算后若能产生出有意义的情报,那就是统计。 不待我的邀请,全班同学已对他的解释报以热烈
9、的掌声,一面欣赏地看着他走回座位,一面向全班同学说你们看,只要大家肯不断地发挥创意、努力思考,我们就可以自己体会出统计的真谛,所以我们为什么要怕统计呢? 但是,下课之前最后我要请各位从大家例4中,归纳出有意义的情报应包括那些构成要素? 老师,5kg代表集中趋势甲同学说 那0.6kg应该是代表离中趋势乙同学接着说 但是,剩下的99.73%呢?我反问 老师,那是指含盖在50.6kg这个范围之内的机率 完全正确,所以希望各位同学能将刚才讨论的例子一般化,其实就统计学而言,任何有意义的情报都有三个构成要素,分别是: 1.集中趋势(通常以作代表) 2.离中趋势(通常以作代表) 3.被含盖在特定范围内的机
10、率为了加深同学的印象,所以下课之前才请他们翻开课本上的常态分配图 然后请问他们, 如果成年男子的身高平均值()是167cm,标准差()是8cm,那么请问大约有多少成年男子的身高在159至175cm之间? 立刻有学生回答:68.26% 为什么? 因为159cm等于167-8,175cm等于167+8,所以,老师举的例子正好是1 的范围,而参考上图,落在1的机率正好是68.26% 太好了,所以统计就是这么简单也这么好玩对不对? 同学非常兴奋地大声说对! 在兴趣盎然中,正好下课钟声响起,看着他们快乐地走出教室,我知道他们已变成了一群喜爱统计的新朋友。轻松学统计(2) 作者:张忠朴1.深入浅出 上课钟
11、一响,这群统计学子已经就座,这个现象与上一节课的姗姗来迟成鲜明对比,他们似乎想用行动来说明他们已开始喜欢统计了。 为了验证上一节的学习效果,先考考他们统计的定义是什么?统计就是数据透过计算产生出有意义的情报。 异口同声的响应,真令人饱尝得天下英才而教之的喜悦! 那么有意义情报的构成要素是什么呢? 1. 集中趋势(通常以作代表) 2. 离中趋势(通常以作代表) 3. 被含盖在特定范围内的机率 这么正确而流畅的回答,令人一则以喜,一则以忧,喜的是他们学的实在真好,忧的是过分的熟练,会不会也是另一种形式的僵化呢? 于是决定帮他们在热忱与理想之间均衡一下,使他们在熟练中仍不失应变的弹性,于是反问他们你
12、们的答案完全正确,但是这样的答案对于没有学过统计的人有没有帮助呢?换句话说,你所计算的与,如何才能让没学过统计的人一目了然呢? 大家彼此对看,热忱的脸上慢慢多了一抹沉思,学而不思则罔真是必要的提醒,有些有学问的人却没有影响力,根本问题也许并非怀才不遇,而是掉入了孤芳自赏的陷阱,以致于他的学问不但不能用来服务人群,反倒让他与许多局外人壁垒分明。因此真有必要帮这群学生将思绪拉出教室,让他们多想一想如何运用统计知识,才能帮助更多没有学过统计的人。 思索中,有一位学生鼓起勇气回答 老师,我们可不可以把那些情报(,)转换成图形? 当然可以啊!但是为什么要转换成图形呢? 因为图形比较容易一目了然啊! 太好
13、了,你这种想法与古早时统计大师构思直方图(Frequency Histogram)时的想法正好不谋而合。 然后用投影机打了一张直方图的范例在屏幕上 图1:直方图 请问对一般没学过统计的人是与比较容易懂呢?还是直方图比较容易懂呢? 直方图!异口同声的回答 对,那我们开始学直方图好不好? 好! 2.走过从前 传统做直方图之前要先斟酌 (1) 样本数,然后依据样本数来决定 (2) 分组数,然后再决定 (3) 每组之组距与组界,而后根据上述(1)(2)(3)来设计 (4)次数分配表,最后再依据次数分配表来绘制(5)直方图 如果我们有一组数据如下: 63 60 64 62 63 64 63 62 66
14、64 60 62 61 65 62 63 66 63 67 64 63 62 65 63 65 61 62 64 63 61那么依据上述(1)(2)(3)(4)的步骤,我们可以得到它的次数分配表 组别下组界上组界组中值次数累积次数at orbelow59.5000159.5060.5060.0022260.5061.5061.0035361.5062.5062.00611462.5063.5063.00819563.5064.5064.00524664.5065.5065.00327765.5066.5066.00229866.5067.5067.00130above67.50=63.1=1.
15、72906根据这张次数分配表,就可以得到图(1)的直方图。为了让局外人明白统计量的意义,直方图真是帮了大忙,但是相对的为了作直方图,前辈们就必须研究分组法与下功夫作次数分配表,这都是很累人的事,所以其实不可小看深入浅出,因为它也是须要下一番功夫的。 所幸在计算机普及后,如今借助计算机软件包,上述(1)(2)(3)(4)那些繁琐的程序都可以用计算机来代劳,而事半功倍地获得直方图。 3.学以致用 既然我们现在可以事半功倍的获得直方图,那么我们就应该将省下的时间,更多花在应用上,换句话说我们不妨要多想一想: 直方图的目的是什么? 直方图可能有那些基本模式? 每一种基本模式透露了那些重要的讯息? 如何
16、运用直方图来改善品质?直方图是目的吗?再一次用问题刺激学生去思想。 不是!那你们认为直方图的目的该是什么? 我并不确定,但是能不能与上一节课学过的常态分配图作一些结合? 很好啊!但是你想怎样结合呢? 我想看一下每组数据所呈现的直方图是否与标准常态分配的形式相吻合。 如果吻合,那代表什么意义呢? 如果吻合,那似乎证明这组数据是出自于一组近似常态分配的制程。 这样的推理逻辑真令人激赏,但是若要打通任督二脉就必须狠心将他再逼到死角。 好极了,但是如果直方图与常态分配不吻合呢? 如果不吻合. 他果然陷入了苦思。苦思中,他似乎又回想起上节课中反守为攻绝处逢生的那一招,灵光一闪他开始平心静气地反问。4.参
17、透玄机 老师,过去的统计学家是不是已经发现了一些不吻合常态分配的基本模式? 没错,直方图中的确有许多不吻合常态分配的案例,经过统计学家的整理,他们将这些案例归纳成三大类型,这也就成了直方图研判的理论架构。 老师,请问用这三大另类直方图来作研判时,有公信力吗? 这些学生真的很另类,用词很另类,旁敲侧击的功夫更另类,明明想学三大另类直方图,却不肯明讲,既然如此,那也不必明说,不妨先让他们伤脑筋一下。 在回答你的问题以前,请你先告诉我,在直方图(如图一)中的高度与宽度分别代表那些统计意义?高度应该是代表集中趋势,宽度则应该是代表离中趋势,不知道这种想法对不对? 完全正确,所以正常的直方应该长什么样子
18、呢? 应该是中间一个主峰,左右对称下降吧! 没错,正常的直方图理当如此,所以某一张直方图若与正常情况明显不同,那就表示这组数据大有玄机,现在我们来参透一下如何? 好啊! 4.1来源混杂多峰并起 打开投影机,将下面这张直方图投在屏幕上 图2A:多峰型直方图(层别前)等大家看过之后,请问大家 这张直方图有何特殊之处? 这张直方图怪怪的,它有两个主峰耶! 没错它为什么会有两个主峰呢? 埋头苦思的表情又出现了,苦思中开始自言自语.突然,若有所悟 主峰代表集中趋势,所以两个主峰似乎是说有两个集中趋势混杂在同组数据之中,难道说这张直方图.? 对的,这张直方图的原始数据的确是混合了两个供货商的资料,所以在直
19、方图研判上,一般人看到多峰型就应该先用层别法来分析,至于该如何层别呢?请大家一起来想一下。 有时数据可能来自不同的设备,所以可以用设备来层别。甲说, 如果照此逻辑研判,那么班次也可以用来层别。乙举一反三。 是的,一般最常用的层别就是原料别,设备别,班次别,人员别等,以双峰型直方图为例,经过成功的层别后,图二就可一分为二了。 图2B:多峰型直方图(层别后)在大家若有所悟时,进一步提醒大家 如果该层别的直方图而没有加以层别,这样得到的及会有意义吗? 没有意义! 为什么呢? 因为会失真,它会变成一个既不是也不是的怪物 好极了,但是这种未经层别的数据仅会造成失真这一种副作用吗? 一阵沉思之后,有学生举
20、手不,除了失真外,更严重的后果可能反倒是会造成的虚胖。 太棒了,这个问题也正是统计学家最担心的问题,因为统计学家早已证明虚胖后的,因此多峰型的直方图若不先予层别就会造成的虚胖,进而造成管制界限浮滥及制程能力低估等后遗症,因此今后一看到多峰型直方图请大家切记一定先要 作层别!异口同声的回答。4.2特殊原因形成离岛 趁着他们兴趣盎然,再在屏幕上投出一张直方图 图3:离岛型直方图请问这张直方图有何特殊之处?老师,这张直方图右边好象怪怪的! 你说怪怪的是什么意思呢? 我觉得右边偏离出去的这一小撮产品似乎大有玄机。 很好的观察,所以统计学家才将这一类型的直方图叫做离岛型直方图,顾名思义,研判的重点当然要
21、放在离岛上,换言之,这一小撮产品不会没代没志的从本岛游离出去,把它拉扯出去的力量可能就是统计学所谓的非机遇原因(Assignable Cause),而遇到离岛型直方图就一定要将这些隐藏的特殊原因找出来。 请问老师,如何去找这些特殊原因呢? 在此情形下要找出真因需要运用专业技术,而非统计逻辑,这也提醒我们诊断问题的统计逻辑与解决问题的专业技术是需要相辅相成的。不过用专业技术找出的原因是否正确,倒可用统计方法来研判,那就是以后要教的统计的检定,在下课前请大家还是回到今天的主题,请想一想,特殊型的直方图可概分为几种? 三种! 版权所有寻智专业顾问有限公司 那么剩下的时间让我们来学最后一种。4.3偏向
22、一边洞烛机先 请各位先看投影片,这就是最后一型的特殊直方图 图4:右偏型直方图 这一类的直方图既与管理疏失所造成的数据混杂无关(详见4.1),又与技术原因造成的离岛问题无涉(详见4.2)。它反而可说是一种难以避免的自然现象,统计学家特别将它称为偏态型直方图,换言之它就是会慢慢偏向一边,请各位想想看,在我们生活周遭,有那些类似的现象? 老师,血压愈来愈高算不算?真是乌鸦嘴,那壸不开提那壸。 不算!再想想别的例子故意给他吐糟 老师,汽车老了就会愈来愈耗油这算不算? 这还差不多,其实这一类型的直方图的确大部分都与老化有关,换言之它反映了某些品质特性的寿命曲线,例如冲模使用久了,冲出来的对象就会愈来愈
23、粗糙,电池使用久了,能量就会逐渐衰减等等,这些现象几乎无法避免,但是若活用偏态型直方图却可将损失降到最小,请各位想一想为什么?并与大家分享你认为该如何做? 老师,我们可不可以先订一个界限,一旦数据接近这个界限,我们就采取预先订好的保养计划,以避免问题恶化到不可收拾。 太好了,这个想法,正是许多公司在预防保养上实际有效的作法,让我们给这位活用统计的同学热烈的掌声好吗? 在热烈的掌声中,我看到的不祗是一群喜欢追求知识的学生,我看到的更是一群热爱将知识用来为别人服务的学生。 得英才如此,夫复何求? 轻松学统计(3)作者:张忠朴1.学以致用 第三次上课的进度是统计的推定,以前作菜鸟老师时,一上课一定先
24、正经八百的在黑板上先写下这五个字,这是什么东东?学生暗自滴咕,这一滴咕教室的气氛马上凉了一半,等到学生们的学习热情被浇熄之后,才再来冷灶热烧,那就累了。 教书教久了,才体会到一上课最好先把场子炒热,这样教到主题才会事半功倍,所以先丢个可以暖场的问题给他们。 你们知不知道在美国统计专家密度最高的城市是那一个? ?!大家既有兴趣却又茫然。 猜猜看嘛!试着再鼓励他们 老师,可不可以给一点提示?又开始讨价还价了。 好,那个城市在沙漠之中,虽然不大但国际驰名 是不是拉斯维加斯?马上有人兴奋抢答。 答对了,但是为什么那个鸟不生蛋的地方会吸引一票统计专家呢? 是不是和赌有关? 对!但是赌和统计有什么关系呢?
25、 如果能设计一种游戏让大家都认为自己很容易赢,那就会吸引一票傻蛋。 没错,那些在赌城的统计专家,其实就是专门帮赌场设计那些表面看起来吸引力十足,但事实上庄家最后必赢的游戏,由此可见统计并不只是艰深的理论,它更可以应用在生活之中,所以今天就让我们来想一想如何将统计用在工厂之中好吗? 好!大家都显得兴奋莫名,这十足表现了中国人见赌心喜的本性。 那你们认为在工厂中会赌那些事呢? 赌“席芭啦”!这个回答马上引起全班哄堂大笑。 赌“席芭啦”,你疯啦!工厂不但不感激你还会开除你,如果你不想被开除那么还是趁早赌点正经的。 再逼着刚才那位捣蛋鬼把聪明用上正途,他把手上的原子笔当作竹蜻蜒转了两圈之后,若有所悟
26、在生管单位决定发料数量时,他们是不是会先赌一下这批产品的良品率? 没错,这是正经赌法之一,但是统计还有没有其它的用途呢?同学又陷入了沈思,沉思后有人灵光一闪 老师,会不会有的公司要赌一下产品出厂后的平均使用寿命,以免将来客户抱怨连连? 太棒了,这件事不但要赌,而且还要算的非常精确,不然很可能就会大祸临头,归纳刚才两位同学的想法,我们可以发现一个共同点,那就是他们都在想一个如何用统计来作预测的问题,这种用统计来作预测的问题,术语就叫做“推定”(Estimation)。2.未卜先知 在统计应用上,推定占了一席非常重要的地位,尤其像在订货生产的公司,如果生管无法推定出报废率来作发料宽放的依据,那么不
27、是会造成无效良品的麻烦,就是会搞出数量不足延误出货的飞机,前者会造成资金的浪费,后者会引起客户的抱怨,都很糟糕的事,为了不要将来倒霉,所以让我们现在就来学推定好不好? 好!学生的眼睛慢慢亮了起来,但是我却反而不想马上让他们如愿以偿,因为Easy Coming, Easy Go本来就是教学大忌。所以决定先拿一个问题来钓他们 请问推定和凭空瞎猜有什么不同? 凭空瞎猜可以毫无根据,但是推定可能需要严谨一点 请问您说严谨是什么意思? 就是说推定的值要先有一些根据 你的意思是不是说,被推定的未知状况必须要先根据一些看得见的己知结果而来? 对!我就是这种想法 好极了,刚才这位同学的想法其实就是推定的起点,
28、任何推定都必须先根据一些样本的数据来作推衍的基础,我们不妨先来看一个例子 某公司希望能预测其产品厚度之范围,试问应如何下手?及考虑那些因素?假设已量测25个成品,其厚度分别为(单位:mm): 53 48545148 5246505149 4755525347 5150504852 5048524947 参考此数据在若95%的把握下,请问该公司成品平均厚度在何范围内?现在我们有了25组数据,那么请问下一步我们该怎么办? 计算他们已很清楚的了解统计就是数据透过计算产生出有意的情报。 没错,此例经过计算之后我们得到= 50.12 = 2.403 接下来下一步该怎么辨呢? 老师,下一步是不是就要回答9
29、5%的产品厚度范围有多宽了? 没错,但是这该如何推测 老师,如果您能够告诉我们95%的产品被含盖在几个之内,我们就可以推测出它的范围 利害!利害!这个学生不但学会了用反问法来脱身这一招,而且反问的还是一个命中要害的问题,但是老姜当然自有辣法,所以仍要四两拨千金一下 这位同学的想法的确很高明,他的想法是机率和多少个之间一定会有关系,而且彼此一定可以换算,这个想法其实就是常态分配机率论的基础,因此现在让我们来看一下常态分配机率表(如附表一),这个表的纵轴是到小数点第一位的个数值,横轴则是小数点第二位的个数值,而表内的数字就是图中斜线区的机率,现在请大家一起来想一想95%的产品应含盖在多少个之内?
30、同学们纷纷努力思索,个个都想拔头筹,结果居然还是刚才反问我的学生找到了答案。 老师,是1.96个他与奋的大叫。 没错,但是您是如何找到的呢? 老师,我先算出斜线的机率是2.5%也就是0.025,然后我就查表. 等一下我先打断他的话,能不能请你先说明一下0.025的来龙去脉? 老师,因为这个题目要预测的范围95%,而斜线区正代表此范围之外的机率,因此两边斜线区加起来的机率应该是5%(100% - 95%),而如果我们假设左右斜线区各占一半,那么单一斜线区的机率,就是2.5%也就是0.025 很好,然后呢? 然后我就先在常态分配机率表中找到0.025这个数字。从这个数字往左看对应的纵轴数字是1.9
31、,而往上对应的横轴数字是6.0,参考老师刚才的说明,我就得到了1.96个的答案。 他一面说明,其它的同学纷纷点头,看到这种感人的场景,我不禁明白其实在学习中导引学生领悟,反而比口沫横飞的填鸭法还更有效呢! 看到学生都若有所悟,这时该给他们更大的成就感,既然,大家都已明白95%的产品是被含盖在1.96个之内,所以我们现在可以更确实地回答原来的问题了吗? 老师,95%产品的平均厚度会落在 50.12 1.96x2.403 之间大家几乎是异口同声地回答了这个在15分钟之前还摸不着头绪的问题,这真是学习的一大兴趣。 3.康庄大道 用实例可以帮助我们走过前人推理的思维过程,但是实例仍然有它的限制性,因此
32、若要能举一反三触类旁通,那就必须在大家明白实例之后,再将其中的精华从表象中抽离出来(这就所谓的抽象),成为一种可以反复运用的模型,因此,必须利用学生破解例子后兴高彩烈的时刻,顺便将他们带入推定的理论模型。 同学们,你们希望将来无论遇到任何统计推定的问题时都能迎刃而解吗? 希望兴奋的响应。 那我们来重新整理一下刚才的过程好吗? 好! 请回想一下,刚才这个过程和我们的第一节统计课有什么关系? 老师,整个讨论好象还是延着IPO 的过程在进行嘛!一位平常蛮沈默的同学倒先发言了。 好极了,这是正确的观察,于是又在黑板上画出了。 IPO程序图,只是比以前又多加上三个空的框框 然后,反身问同学 你们猜老师刚
33、才多加的框框内该填什么? 老师,答对了有没有奖品?教室气氛一好,同学居然会开始撒娇了。 跟我来这套!当然有奖品啊!答对的,下课时,可以先来擦黑板。吐嘈回去,反而逗得全班同学大乐。 请问您还要不要先抢答? 老师,如果擦黑板是奖品,那擦黑板也没有关系,我猜第一个框框内应该填“样本值”也就是刚才那个例子中的25个样本的厚度值。 答对了,请大家给这位自告奋勇擦黑板的同学掌声鼓励好不好?热烈的掌声让那位同学好不得意。 那么第二个框框内该填什么呢? 马上有同学举手,我故意逗他你也想来擦黑板啊?他嘿嘿傻笑,真是老实的可爱,于是帮他解围 好,那请你先告诉大家你认为第二个框框内该填什么? 该填统计量就是和连回答
34、都很老实。 又答对了!这时同学的掌声己自动响起,真是一群会互相鼓励的学生。 那第三个框框该填什么呢?这个问题似乎让有些同学很为难,看到他们痛苦的表情,不免又大动侧隐之心,于是说:老师也想擦黑板,所以最后一个框框可不可以由老师替大家来回答? 老师,没有关系,你替我答,我替你擦黑板一位同学马上很阿莎力的响应。 好,那我们一言为定,第三个框框请填“推定结论”也可直接写成“95%的产品厚度在1.96的范围内”顺便我又在黑板的另一边写下“推定的步骤”五个大字,然后转身告诉同学 刚才三个框框的推理过程其实就是统计推定的步骤。 然后我转身在黑板上写上: 步骤1. 随机抽取样本 步骤2. 计算统计量(,) 步
35、骤3. 作出推定结论,下结论时可再细分成两步骤 步骤3A.决定信赖水准(Level of Confidence ,此例为95%) 步骤3B.决定信赖区间(Confidence interval ,此例即为1.96) 请各位记得这几个步骤,那么将来无论你们遇到什么推定的问题都可以很容易地迎刃而解了 由于各位上课很认真尤其又肯热烈参与讨论,所以我再送各位一套锦囊,好不好? 老师,那我也替你来擦黑板严肃的班长居然也学会幽默了,这下非倾囊相授不可,打开投影机,影幕上出现了 常用信赖区间与个数对照表 信赖水准 含盖个数 信赖区间 90%1.6451.645 95%1.961.96 99%2.5752.5
36、75 99.73% 33 这张表其实就是从刚才的常态分配机率表上整理出来的,如果将来各位碰上一些特殊的信赖水准,只要回去查表也一定会得到答案的。 4.精益求精 虽然下课时间快到了,但是看着他们眼眸中的热情,我就舍不得不再多教他们一点,使他们能真正成为善用推定的高手。 同学们,统计的推定好不好玩啊? 粉好玩!居然有人学董月花。 粉好玩的事有时候反而粉危险,其中最大的危险就是说不定您的推定会贡姑,换句话说实际结果与您的推定可能会有很大的出入,请各位想想看,为什么会出现这种状况? 老师,会不会是样本有问题? 你认为样本可能会出现什么问题? 会不会所谓的样本其实不太具有代表性? 能不能举例说明? 譬如
37、样本是工程师在实验室作出来的,而将来实际大量生产的产品却是由生产线上的作业员生产的,这两者之间有许多不同,不知道这是不是就会造成推定贡姑? 太好了,这位同学的想法正是推定步骤1在样本抽取上的大忌,像刚才他举的例子,如果我们要推定一般的量产能力,结果却选取了工程师的特制产品来作样本,这种样本就叫做偏差样本(Biased Sample),用已有偏差的样本来作推定,那当然会缪以千里了 老师,那我们该怎么办? 最具体可行的办法,就是随机抽样(Random Sampling),换言之,以刚才的例子我们其实应该让生产线的所有在制品都有相同被抽中的机会,这样抽出的样本就可称为不偏样本(Unbiased Sa
38、mple),从不偏样本得到的推论才会具有代表性,这就是统计学家为何一再强调必须随机抽样(Random Sampling)的原因了。 当大多数同学正陶醉在若有所悟时,却有一位同学狡黠地问了另一个问题 老师,偏差样本是推定中唯一的陷阱吗? 那你认为呢?反将他一军。 我猜应该还有别的。 别的又会是什么呢?再用一次不偾不启的老招。 刚才老师提到的第一个陷阱是有关样本品质(Quality)的问题,所以我推想可能也有与品质相对的样本数量(Quantity)问题,不知道这种猜测是否合理? 当一群学生学会思考,而且肯深入思考时,其实他们本来就有机会无师自通的,眼前就是一个最佳例证。 好极了,你的推论的确有道理
39、,但是能不能再想一想是样本大时推定比较准?还是样本小时推定比较准? 当然是样本愈大愈准啰! 为什么? 因为如果样本量愈来愈大,大到与全部产品一样多时,那么推定结果其实就和实际结果完全一样了嘛!这样当然最准啰! 他那种无师自通的悟道神情,条条有理的陈述,不禁引爆了全班同学的掌声。 太好了,推定的精确性(Precision)的确是由样本大小(n)来决定的,但是我们真的能让样本不断加大吗? 版权所有寻智专业顾问有限公司 不行! 为什么? 因为这样成本会愈来愈高。 答对了,如果有成本限制而我们又不太希望牺牲推定的精确性,那这就是统计学家所研究的最小样本数的问题,一般如果是用计量值(如上例的厚度)来作推定,那么最小样本数不应小于25(n25),是一个应该被遵循的游戏规则。 下课钟声正好又在高潮中响起,这次学生倒没有匆匆赶出教室,有几位反倒跑上讲台来抢擦黑板,这真是一群可爱的学生。 黑板要擦的粉干净才可以下课哦!故意再开个玩笑来表达对这群可爱学生的欣喜。
限制150内