数据模型与决策统计模型.ppt
《数据模型与决策统计模型.ppt》由会员分享,可在线阅读,更多相关《数据模型与决策统计模型.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据模型与决策统计模型现在学习的是第1页,共79页针对的主要问题(1)参数估计(包括点估计和区间估计)(2)假设检验(3)类别判断(4)群体特征识别现在学习的是第2页,共79页(1)一个很熟悉的问题某种产品的合格率为p,检测了100 件产品,合格88件,试用统计的方法估计该产品的合格率。合格率:88%是否可信?现在学习的是第3页,共79页(2)常见的买卖纠纷有消费者投诉某企业的某种产品有欺诈行为(缺斤短两、内质成分结构与标准不符),工商质检部门如何处理?现在学习的是第4页,共79页(3)复杂事物的分类以人的血液中各种指标值为基础,可以把人群分成多种类型。材料也是如此。组织是否也可如此?现在学习
2、的是第5页,共79页(4)内隐特征识别70后、80后、90后行为特征清华、北大、东北大学大学毕业生的知识与行为特征。中性特征;优势特征;劣势特征现在学习的是第6页,共79页概率论的有关概念和知识复习现在学习的是第7页,共79页2.1 参数估计模型(1)点估计的矩法 1)原理 2)估计质量(2)区间估计现在学习的是第8页,共79页(1)点估计的矩法矩估计依据:大数定律 结论:对于简单随机子样,样本数量趋向于无穷时,均值以概率1保证趋近于数学期望。现在学习的是第9页,共79页随机变量的k阶原点矩含参数的表达式现在学习的是第10页,共79页例如:在 上均匀分布随机变量现在学习的是第11页,共79页由
3、大数定律,有依此,矩法直接令右侧是含待定参数的表达式左侧是实测数据的表达式现在学习的是第12页,共79页据此,可以得到矩估计的一般过程0)选择适合具体问题的随机变量1)确定具体问题所包含的待估计参数的数量2)依据问题的特点及大数定律构造含待估参数的等式方程组3)求解方程组的估计器4)分析估计器的可信程度5)采样、测试并计算现在学习的是第13页,共79页现有一批某种产品,如何依据相关的质量标准。估计其合格率为p。前面熟悉的问题应该是现在学习的是第14页,共79页统计方法分析:用表示群体产品中单件产品的合格与不合格的状态,则是随机的,可表述为产品状态不合格合格01概率(不合格率)1-p(合格率)p
4、实际上,0-1是人为规定的,也可另行规定现在学习的是第15页,共79页合格产品的数量 用容量为n的子样估计产品合格率,即估计p。由于随机变量的数学期望为p,因此,估计产品的合格率p就是估计随机变量的参数数学期望。现在学习的是第16页,共79页由于单个随机变量的方差其最大值为0.25,而均值的方差为构造估计器现在学习的是第17页,共79页因此,有对于容量为100样本,最保守的考虑,估计器的误差方差也不会超过现在学习的是第18页,共79页如果比照正态分布的情形,就是以99.9999%的把握保证,实际的合格率在即:现在学习的是第19页,共79页另行规定的尝试:用表示群体产品中单件产品的合格与不合格的
5、状态,则是随机的,可表述为产品状态不合格合格ab概率(不合格率)1-p(合格率)p现在学习的是第20页,共79页依照相应的处理过程,有因此,有矩估计方程现在学习的是第21页,共79页解方程,得即因此,选a=0,b=1是最简练,也是最直接的。现在学习的是第22页,共79页再如:正态分布母体的均值与方差的估计由正态分布的一阶矩和二阶矩现在学习的是第23页,共79页求解方程组得现在学习的是第24页,共79页以后记称为样本方差。现在学习的是第25页,共79页可应用的背景很多,例:若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差
6、应服从正态分布N(,2),试估计,2。现在学习的是第26页,共79页解:由有现在学习的是第27页,共79页关于a,b均匀分布随机变量的参数估计由分布函数,可得现在学习的是第28页,共79页令解方程组,可得现在学习的是第29页,共79页还有其它方法构造估计器,比如最大似然估计,而且所得估计器的结构不尽相同。现在学习的是第30页,共79页(2)可信程度估计的质量1)无偏估计2)一致估计现在学习的是第31页,共79页均值的估计质量定理:设母体服从分布F(x),(x1,x2,xn)是来自母体的容量为n的简单子样,如果F(x)存在二阶矩,则有现在学习的是第32页,共79页证明现在学习的是第33页,共79
7、页定理:如果F(x)存在四阶矩,则有其中现在学习的是第34页,共79页因此,用估计方差是不合适的!现在学习的是第35页,共79页但可依此得到方差的无偏估计:有时直接记须留意规定!现在学习的是第36页,共79页由此,前面例子若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差应服从正态分布N(,2),试估计,2。现在学习的是第37页,共79页(2)参数的区间估计区间估计例1 某制造厂质量管理部门的负责人确信包装后的原材料总体标准差为15千克。希望以95的把握(置信度)估计移交给接受部门的5500包原材料的平均重量的区间。现在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 决策 统计 模型
限制150内