北大光华-决策量化方法准备知识(2).pptx
第二章第二章 决策量化方法准备知识决策量化方法准备知识商业电子表格制模(商业电子表格制模(Excel)概率与统计简介概率与统计简介基础运筹学基础运筹学数据挖掘技术数据挖掘技术概率与概率分布概率与概率分布(1)数权归纳:更易理解、直观、总体状态与趋势,比较结果,应用于量化方法。(2)平均数 mean =中位数 众 数 变动幅度:最大数值最小数值 绝对商差均值:标准差=方差i=1nABSxi-xin=i=1nnxi-2ni=1n 误差平均均值 =数据-原始数值数据-有用形式信息处理数据解释概率与概率分布概率与概率分布(3)概率:事件A发生概率P(A)独立事件概率:P(AB)=P(A)+P(B)(A、B独立事件)P(AB)=P(A)P(B)条件概率(贝叶斯定律):P(A/B)=P(A)=0P(A)=10P(A)1P(B/A)P(A)P(B)概率与概率分布概率与概率分布实例:购买的二手车,也许会好,也许会不好。如果买的车好,70%的会耗油量较低,20%的会有中等的耗油量。如果买的车不好,50的会耗油量较高,30%的会有中等耗油量。对一辆二手车的实验表明该车耗油量较低。如果成交的二手车有60%是好的,那么,这辆车属于好的概率为多少?概率与概率分布概率与概率分布 概率与概率分布概率与概率分布 概率与概率分布概率与概率分布概率树:P(HOC)=0.26P(MOC)=0.24P(LOC)=0.50P(GB/HOC)=0.23P(BB/HOC)=0.77P(GB/MOC)=0.5P(BB/MOC)=0.5P(GB/LOC)=0.84P(BB/LOC)=0.16P=0.06P=0.20P=0.12P=0.12P=0.42P=0.08概率分布概率分布二项分布:特征:每次实验有两种可能的结果,可以称之为成功和失败;两种结果是互斥的;成功和失败的概率都是一个固定的常数,分别为P和q=1-P;连续实验的结果之间是独立的。P(n次实验中有r次成功)=Crnprqn-r=prqn-r 均值=np方差=2=n.p.q标准差=(n.p.q)1/2n!r!(n-r)!柏松分布柏松分布(pocsson distribution)柏松分布的特征:试验次数n较大(大于20);成功的概率P较小。P(r次成功)=其中e=2.7183,=平均成功次数=n.p 均值=n.p 方差=2=n.p 标准差=(n.p)1/2 *只用到成功的概率e-rr!正态分布正态分布特征:连续的是关于均值对称的均值、中位数及众数三者相等曲线下总面积为1 f(x)观察值x正态分布正态分布f(x)=e-(x-)2/22=e-其中x-变量值,-均值,-标准差,=3.14159 e=2.7183 Z=商开均值的标准差个数P(x1 x x2)=z1=z2=1 21 2Z221-P(x x2),x1P(xx1)-P(xx2),x1X1-X2-x1 x2X-概率分布实例概率分布实例一个中型超市日销售500品脱牛奶,标准差为50品脱。(a)如果在一天的开门时,该超市有600品脱的牛奶存货,这一天牛奶脱销的概率有多少?(b)一天中牛奶需求在450到600品脱之间的概率有多大?(c)如果要使脱销概率为0.05,该超市应该准备多少品脱的牛奶存货?(d)如果要使脱销概率为0.01,应准备多少品脱的牛奶存货?0.02280.15870.8185f(x)x450 500 600统计抽样与检验方法统计抽样与检验方法系统可靠性分析 可靠性:1-(1-R)2 可靠性:R2RRRR统计抽样与检验方法统计抽样与检验方法 抽样:目的是通过收集式考察少数几个观察值(样本),而不是全部可能的观察值(总体),得出可靠的数据。抽样分布:由随机样本得出的分布。中心极限定理(central limit theorem):无论原来总体的分布如何,总体中抽样取大量的随机样本,样本的均值符合正态分布。假设总体:个数N,均值,标准差;样本:个数n,均值X,标准差S;则:X=,S=/n1/2-(抽样标准误差)统计抽样与检验方法统计抽样与检验方法置信区间:总体均值在某一范围内的可信水平。总体均值的95%置信区间为:(X-1.96 S,X+1.96 S)统计抽样与检验方法统计抽样与检验方法案例:全面质量管理 传统上,有大量的抽样方法应用于质量控制。近年来,许多组织改变了他们对质量的认识。他们不再设定一个残次品水平,出不再认为达到了这样一个水平就说明组织运转良好。相反,他们代之以“零残次品”为目标,其实施方法是全面质量管理(Total Quality Management,TQM),这要求整个组织一起努力,系统改进产品质量。爱德华戴明(Edward Deming)是开创了全面质量管理工作的专家之一,他将自己的实践经验总结为以下14条。1 将产品质量作为一贯性的目的。2 杜绝即使是客户允许的差错、延误、残次和误差。3 停止对于成批检验的依赖,从生产开始的第一步就树立严格的质量意识。4 停止依据采购价格实施奖励的作法-筛选供应商,坚持切实有效的质量检测。5 开发成本、质量、生产率和服务的持续改进项目。6 对全体职员进行正规培训。7 监督工作的焦点在于帮助职员把工作做得更好。8 通过倡导双向沟通,消除各种惧怕。9 打破部门间的障碍,提倡通过跨部门的工作小组解决问题。10 减少以至消除那些并不指明改进和实现目标方法的数字目标、标语和口号。11 减少以至消除会影响质量的武断的定额。12 消除有碍于职员工作自豪的各种障碍。13 实现终身教育、培训和自我改进的正规的有活力的项目。14 引导职员为实现上述各条而努力工作。有许多应用TQM后获得成功的实例。例如,在广岛的日本钢铁厂(Japan Steel Works),实施TQM后,在人员数量减少20%的情况下,产量增长50%,同时,残次品费用由占销售额的1.57%下降到0.4%。美国福特公司实施TQM后,减少了保修期内实际修理次数45%,根据用户调查,故障减少了50%。惠普公司实施TQM后,劳动生产率提高了40%,同时,在集成电路环节减少质量差错89%,在焊接环节减少质量差错98%,在最后组装环节减少质量差错93%。统计抽样与检验方法统计抽样与检验方法假设检验:对总体的某种认识是否得到样本数据的支持。检验的步骤:定义一个关于实际情况的简明、准确的表述(假设)。从总体中取出一个样本。检验这个样本,看一看它是支持假设,还是证明假设不大可能。如果证明假设情况是不大可能的,拒绝这一假设,否则,接受这一假设。实例:一种佐料装在包装盒中,名义重量为400克。实际重量与这一名义重量可能略有出入,呈正态分布,标准差为20克。通过在生产线上定期抽取样本的方法确保重量均值为400克。一个作为样本抽出的盒子中佐料重量为446克。这能说明现在佐料填装过量了吗?统计抽样与检验方法统计抽样与检验方法假设检验的误差(增大样本,减少误差)假设检验的误差(增大样本,减少误差)原假设实际上是 对的 错的 不拒绝 正确的决策 第二类错误 拒 绝 第一类错误 正确的决策决 策统计抽样与检验方法统计抽样与检验方法实例:实例:据说,某行业从业人员平均工资为每周300英镑,标准差为60英镑。有人认为这一数据已经过时了,为检验实际情况究竟如何,一个36份工资的随机样本从该行业中抽取出来。研究确定如果样本工资均值小于270英镑或大于330英镑,就拒绝原假设。犯一类错误的概率有多大?统计抽样与检验方法统计抽样与检验方法 显著水平:是根据观察值证明样本是取自某一假设总体 的最低可接受概率。(5%)0.955%0.025(拒绝)(拒绝)0.025接受假设统计抽样与检验方法统计抽样与检验方法假设检验的步骤:假设检验的步骤:表述原假设和备选假设。表述原假设和备选假设。确定拟采用的显著性水平。确定拟采用的显著性水平。计算待检验变量的可接受范围。计算待检验变量的可接受范围。取得待检验变量的样本值。取得待检验变量的样本值。决定是否拒绝原假设。决定是否拒绝原假设。说明结论。说明结论。统计抽样与检验方法统计抽样与检验方法实例:实例:某地区公布的人均收入为某地区公布的人均收入为15,000英镑。一个英镑。一个45人人的样本的平均收入是的样本的平均收入是14,300英镑,标准差为英镑,标准差为2000英英镑。按照镑。按照5%的显著性水平检验公布的数字。按的显著性水平检验公布的数字。按1%的的显著性水平检验结果又如何?显著性水平检验结果又如何?统计抽样与检验方法统计抽样与检验方法 (a)双边检验 (b)单边检验f(x)xf(x)0.0250.025-1.96-1.96-0.05x-1.64-统计抽样与检验方法统计抽样与检验方法实例:实例:一个邮递公司对某客户按平均每份邮件1.75公斤,标准差为0.5公斤的情况确定每份邮件的收费水平。邮费现在很高,而有人提出该客户邮件重量均值不止1.75公斤。随机抽取该客户100份邮件的样本,平均重量为1.86公斤。这是否说明重量均值确实已超过1.75公斤?f(x)x1.75 1.83 1.861%5%5%显著性1%显著性2.331.64基础运筹学基础运筹学(OR Software)线性规划线性规划 运输问题运输问题 存存 贮贮 论论整数规划整数规划 指派问题指派问题 决策分析决策分析0-1 规划规划 非线性规划非线性规划 对对 策策 论论动态规划动态规划 目标规划目标规划 排排 队队 论论预预 测测 模模 拟拟 排排 序序 论论基础运筹学基础运筹学(OR Software)运筹学软件运筹学软件1)Excel 2000 (Optimization option);2)Lindo or Lingo package;3)Cplex;4)CUTE,LANCLOT for research;5)ERP;6)教学软件;7)其他。数据挖掘技术数据挖掘技术(Data-mining)数据挖掘:构造和使用数据仓库的过程。数据仓库达到不同层次用户可需的最详细的有用数据、信息(1)使公司取得更大的市场(2)更好的形象(3)更强的竞争力等数据挖掘技术过程数据挖掘技术数据挖掘技术(Data-mining)数据挖掘过程业务数据提取、滤液、清除、聚集统计学、心理学、叠加数据数据库装入程序数据仓库RDBMS数据提取用于数据挖掘数据挖掘技术数据挖掘技术(Data-mining)数据挖掘中的数据及信息流数据提取用于数据挖掘结合规则生成简要表其它数据挖掘供业务决策的信息数据挖掘技术数据挖掘技术(Data-mining)数据挖掘的有关技术数据挖掘的有关技术(1)统计分析系统统计分析系统(SAS,SPSS)(2)DSS,EIS,ES(3)多维电子表格及数据库多维电子表格及数据库(4)神经网络神经网络(5)数据可视化数据可视化数据挖掘技术数据挖掘技术(Data-mining)数据挖掘的应用商品销售制造金融服务/信用卡远程通信数据库