统计与概率分布基础.ppt
《统计与概率分布基础.ppt》由会员分享,可在线阅读,更多相关《统计与概率分布基础.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2004绿带先行课程培训绿带先行课程培训统计与概率分布统计与概率分布基础基础2004绿带先行课程培训“有三种类型的谎言:谎言、该死的谎言和统计数字有三种类型的谎言:谎言、该死的谎言和统计数字。”-马克吐温马克吐温统计是工具。和其他工具一样,错误使用统计也会引起误解、歪曲或错误的结论。统计是工具。和其他工具一样,错误使用统计也会引起误解、歪曲或错误的结论。只会计算是不够的,我们必须能对计算做出正确的解释。统计学统计学“统计是从数据中交流信息。统计是从数据中交流信息。”-Schilling2004绿带先行课程培训最重要的分析工具绘出数据绘出数据坚持 坚持 坚持 再坚持“只通过看就能有惊人的发现”-
2、Yogi Berra2004绿带先行课程培训弹弓发射60次的点图84 85 86 87 88 89 9078 79 80 81 82 8377点图能使实验者迅速了解:大体位置 观测值的范围2004绿带先行课程培训直方图直方图弹弓发射60次的直方图直方图是一组测量值的直观显示直方图是一组测量值的直观显示直方图表明:大体位置范围 数据分布的一般形状 2004绿带先行课程培训观察弹弓发射600次由于样本变差,频率图中凹凸部分逐渐消失。如果可以绘出所有的弹弓发射结果,结果又将如何?随着观察数量的增加随着观察数量的增加2004绿带先行课程培训想象直方图的分组组段越来越小,直到形成连续分布。弹弓发射结果的
3、理论母群体2004绿带先行课程培训样本统计量 估算 总体参数总体总体总体参数总体参数一组假设的N个观察值,从中取得样本。(N通常为无穷大)m =总体均值s2=总体方差s =总体标准差SAMPLE样本统计量样本统计量样本为一组实际的n个观察值,而统计量则是描述样本的数值。X =样本均值s2 =样本方差s =样本标准差样本样本母群体母群体样本样本(子集子集)2004绿带先行课程培训居中趋势的居中趋势的计量计量 均值均值:一组数值的算术平均值反映所有数值的影响受极值影响很大你希望你的收入为均值还是中位数?中位数中位数:反映数列的一半从小到大排列的一组数的中间数值。计算时不包含所有数值几乎不受数列中极
4、大值或极小值的影响在过程改进中,为什么采用均值,而不是中位数?在过程改进中,为什么采用均值,而不是中位数?2004绿带先行课程培训基本统计术语作用总体统计量样本统计量名称符号名称符号表示分布位置总体平均值样本平均值样本中位数表示分布形状和范围总体方差样本方差总体标准差样本标准差样本极差2004绿带先行课程培训样本均值样本均值均值均值=平均值平均值例:涂层平均重量=4击球表现:0,0,1,0,1 (0=未击中,1=击中)击球表现平均值=0+0+1+0+1 5对于离散函数S y 意思是“把所有Y值相加”2004绿带先行课程培训样本中位数样本中位数假设x1,x2,xn 是组升序数列样本,则:X=中间
5、数值(如果n是奇数)两中间数值的平均值(如果n是偶数)找出下面两组数据的均值和中位数:X:第一组数据:10,12,11,14,11,13,12,14,16,13X=X=Y:第二组数据:10,12,11,14,11,13,12,14,44,13Y=Y=2004绿带先行课程培训均值与中位数的关系均值与中位数的关系11 0100908 070605 040302 0100500正态频率均值均值,中位数中位数8 07 0605 04 03 0201 003002001000负偏态 均值均值中位数中位数对称的 y=y左偏 y y末端在右侧频率频率2004绿带先行课程培训X公司每年要新招8个工程师。今年新
6、招人员中,有4人起薪20,000美元,2人起薪30,000 美元,另外2人为专家,薪金为120,000美元!X公司印发了招聘手册,宣传他们为新员工提供富有竞争力的优厚薪金。“我公司为本科毕业生开出的平均起薪近我公司为本科毕业生开出的平均起薪近50,000美元!来吧,加入我们!美元!来吧,加入我们!”一个数字绝不足以说明一组数据。2004绿带先行课程培训散布的计量散布的计量极差=最大值-最小值12345X12345Y12345ZRx=Ry=Rz=2004绿带先行课程培训变差的计量变差的计量计算时每个数据都要用到。方差是数据值与其均值离差平方和的平均数。方差的平方根,可以反映数据与均值的标准间隔标
7、准间隔。方差方差:(s2的估计值)2004绿带先行课程培训sx2=sy2=sz2=练习练习计算下表中三组数据的方差和标准差。2004绿带先行课程培训标准差标准差偏差偏差是指测定值与测定平均值之差。偏差值偏差值=观察值-真实均值方差方差=偏差值平方和的均值或平均数 表示方差的符号标准差标准差=方差的平方根 表标准差的符号标准差是变化程度的计量。标准差是变化程度的计量。m m=总体均值总体均值i i偏差(偏离均值的大小)偏差(偏离均值的大小)s s2 2s s 2004绿带先行课程培训总体与样本总体与样本总体均值总体均值样本均值样本均值总体标准差总体标准差样本标准差样本标准差2004绿带先行课程培
8、训 如果我们要选取3个样本(n=3),样本均值为10。那么,在选择可以组成样本的3个数时,我们有几种“自由”选择?如果已知X1=8,X2=10,则X3 应为多少?X3的选择受前两个数据与均值的限制。因此,自由度为2而不是3,或者说等于n-1。自由度自由度自由度自由度=n-1 2004绿带先行课程培训Population总体总体SAMPLE样本样本总体参数总体参数m =84s2=9s =3样本统计量样本统计量约等于约等于总体参数。总体参数。样本统计量样本统计量X =84.6s2 =8.27s =2.7_2004绿带先行课程培训方差的加法性质方差的加法性质两自变量自变量之和或差的方差之和或差的方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 概率 分布 基础
限制150内