评价与决策模型.pptx
综合评价的基本概念和步骤综合评价的基本概念和步骤1用用Matlab求解综合评价模型求解综合评价模型3评价与决策模型评价与决策模型综合评价的建模方法综合评价的建模方法2全国赛题全国赛题3第1页/共80页引例:学生综合测评(综合评分)u评价指标:德育总分、智育总分、体育 总分(加分:CET)u权重:方案1:德育0.3 智育0.6 体育0.1 方案2:德育0.1 智育0.8 体育0.1 方案3:德育0.3 智育0.6 体育0.1 加分u评价模型:评分法、总分为100,加分不封顶,累加法。u评价结果:学生甲:德育90 智育70 体育80 学生乙:德育70 智育80 体育70第2页/共80页第3页/共80页一、综合评价方法的基本概念一、综合评价方法的基本概念 综合评价的问题综合评价的问题:对被评价对象所进行的客观、对被评价对象所进行的客观、公正、合理的全面评价。通常的综合评价问题都是公正、合理的全面评价。通常的综合评价问题都是有若干个同类的被评价对象有若干个同类的被评价对象(或系统或系统),每个被评价,每个被评价对象往往都涉及到多个属性(或指标)。对象往往都涉及到多个属性(或指标)。综合评价的目的综合评价的目的:根据系统的属性判断确定这些根据系统的属性判断确定这些系统的运行(或发展)状况哪个优,哪个劣,即按系统的运行(或发展)状况哪个优,哪个劣,即按优劣对各被评价对象进排序或分类。这类问题又称优劣对各被评价对象进排序或分类。这类问题又称为为多属性(或多指标)的综合评价问题多属性(或多指标)的综合评价问题。综合评价的应用综合评价的应用:研究多目标决策问题的前提,研究多目标决策问题的前提,因此研究解决这类问题在实际中是很有意义的,特因此研究解决这类问题在实际中是很有意义的,特别是在政治、经济、社会及军事管理、工程技术及别是在政治、经济、社会及军事管理、工程技术及科学决策等领域都有重要的应用价值。科学决策等领域都有重要的应用价值。第4页/共80页 构成综合评价问题的构成综合评价问题的五个要素五个要素分别为分别为:被评价对象被评价对象、评价指标、权重系数、综合评价模型和评价者。、评价指标、权重系数、综合评价模型和评价者。1 1 构成综合评价问题的五个要素构成综合评价问题的五个要素 第5页/共80页 (2 2)评价指标)评价指标 评价指标评价指标是反映被评价对象是反映被评价对象(或系统或系统)的运行的运行(或发展或发展)状况状况的基本要素。通常的问题都是有多项指标构成,每一项指标都的基本要素。通常的问题都是有多项指标构成,每一项指标都是从不同的侧面刻画系统所具有某种特征大小的一个度量。是从不同的侧面刻画系统所具有某种特征大小的一个度量。一个综合评价问题的评价指标一般可用一个一个综合评价问题的评价指标一般可用一个向量向量表示,其表示,其中每一个分量就是从一个侧面反映系统的状态,即称为中每一个分量就是从一个侧面反映系统的状态,即称为综合评综合评价的指标体系价的指标体系。第6页/共80页 注注意意到到:当当各各被被评评价价对对象象和和评评价价指指标标值值都都确确定定以以后后,问问题题的的综综合合评评价价结结果果就就完完全全依依赖赖于于权权重重系系数数的的取取值值了了,即即权权重重系系数数确确定定的的合合理理与与否否,直直接接关关系系到到综综合合评评价价结结果果的的可可信度,甚至影响到最后决策的正确性。信度,甚至影响到最后决策的正确性。第7页/共80页 (4 4)综合评价模型)综合评价模型 对于多指标(或多因素)的综合评价问题对于多指标(或多因素)的综合评价问题,就是要就是要通过建立合适的综合评价数学模型将多个评价指标综合通过建立合适的综合评价数学模型将多个评价指标综合成为一个整体的综合评价指标,作为综合评价的依据,成为一个整体的综合评价指标,作为综合评价的依据,从而得到相应的评价结果。从而得到相应的评价结果。第8页/共80页 (5 5)评价者)评价者 评价者是直接参与评价的人,可以是某一个人,评价者是直接参与评价的人,可以是某一个人,也可以是一个团体。对于评价目的选择、评价指标体也可以是一个团体。对于评价目的选择、评价指标体系确定、评价模型的建立和权重系数的确定都与评价系确定、评价模型的建立和权重系数的确定都与评价者有关。者有关。第9页/共80页2 2、综合评价的一般步骤、综合评价的一般步骤对某事件进行多因素综合评价的过程,实质上就是科学研究与决策的过程,原则上应包括设计、收集资料和分析资料几个基本阶段,实施中应着重注意以下几个基本环节。选择恰当的评价指标选择恰当的评价指标(evaluation indicator)(evaluation indicator)确定各评价指标权重确定各评价指标权重合理确定各单个指标的评价等级合理确定各单个指标的评价等级(evaluation grade)(evaluation grade)及其界限及其界限建立综合评价模型建立综合评价模型(synthetical evaluation model)(synthetical evaluation model)确定多指标综合评价的等级数量界限,并根据实践对已建立模确定多指标综合评价的等级数量界限,并根据实践对已建立模 型考察、修改及完善。型考察、修改及完善。研研究究目目的的第10页/共80页2.2 综合评价一般步骤示例研制新生儿缺氧状况的Apgar评分方法研究目的据专业知识,选择5个指标 心率 呼吸肌张力 反射 皮肤颜色 5个指标具有相等权重选择指标确定权重以累加法累计总分:810分为正常;47分为轻度缺氧;03分为重度缺氧。确定指标评价等级及界限建立模型第11页/共80页综合评价过程的流程综合评价过程的流程第12页/共80页3、几种常用综合评价方法、几种常用综合评价方法1.1.现有的统计方法:主要为多元统计方法,如多元回归、逐步回归分析、判别分析、因子分析、时间序列分析等。2.2.模糊多元分析方法:由模糊数学发展而来,包括模糊聚类、模糊判别、模糊综合评价等方法。3 3简易方法:主要包括综合评分法、综合指数法、层次分析法、TopsisTopsis法、秩和比法等。特点:简单实用;适用于各种资料;存在一定的局限性。第13页/共80页3.1 评价指标的基本要求基本要求 代表性:各层次指标能最好地表达所代表的层次。确定性:指指标值确定,其高低在评价中有确切含义。区别能力/灵敏性:即指标值有一定的波动范围,而且其高低在评价中有确切的含义。独立性:即选入的指标各有所用,相互不能替代。选择综合评价指标第14页/共80页3.2 系统分析法及文献资料分析优选法筛选指标缺乏有关历史资料,或指标难以数量化时 系统分析法(systematic analysis method):是一种常用的凭经验挑选指标的方法,首先将所有备选指标按系统(或属性、类别)划分,再通过座谈或填调查表的方法获得对各指标的专家评分,确定主次,再从各系统内挑选主要的指标作为评价指标。文献资料分析优选法:即全面查阅有关评价指标设置的文献资料,分析各指标的优缺点并加以取舍。第15页/共80页3.3 常用客观筛选指标方法逐个指标进行假设检验的方法:是在掌握有关历史资料基础上,依照可能的评价结果将评价对象分组,并对各指标进行假设检验,挑选有统计意义的指标作为评价指标。多元回归与逐步回归法:多元回归分析挑选标准化偏回归系数绝对值较大或偏回归系数假设检验有显著性的指标作为评价指标;逐步回归有自动挑选主要影响指标的功能,是目前最常用的指标挑选方法。指标聚类法:在存在众多指标的情况下,可将相似指标聚成类,再从每类中找一个典型指标作为代表,从而用少量几个典型指标作为评价指标来代表原来众多的指标建立评价模型。第16页/共80页3.4 指标筛选建议在实际工作中,往往综合使用多种方法进行指标筛选,在获得较为满意的专业解释的基础上,优先考虑那些被多种方法同时选入的指标。第17页/共80页3.5 评价指标的权重估计 确定指标权重方法主观定权法客观定权法专家评分法成对比较法Saaty权重法秩和比法相关系数法其它方法模糊定权法熵权法 定权带有一定的主观性,用不同方法确定的权重分配,可能不尽一致,这将导致权重分配的不确定性,最终可能导致评价结果的不确定性。因而在实际工作中,不论用哪种方法确定权重分配,都应当依赖于较为合理的专业解释。第18页/共80页3.6 专家评分法评分方式1)专家个人判断专家个人判断 即分别征求专家个人意见,在专家各自单独给评价指标的相对重要性打分的基础上,进行统计处理,以确定各指标的权重。优点优点:专家打分时不受外界影响,没有心理压力,可以最大限度地发挥个人创造能力。缺点缺点:仅凭个人判断,易受专家知识深度与广度的影响,难免带有片面性。2)专家会议专家会议 即召开所有被挑选专家,以集体讨论的方式进行评分,然后再以统计手段确定各指标的权重。优点优点:可以交换意见,相互启发,弥补个人之不足。缺点缺点:主要表现在易受心理因素的影响,如屈从于权威和大多数人的意见,受劝说性意见的影响,不愿公开修正已发表的意见等等。第19页/共80页6个专家对个专家对4个评价指标的评价结果得分个评价指标的评价结果得分不考虑专家权威程度:权重分别是0.41,0.31,0.18,0.10第20页/共80页3.7专家评分法可靠性评估常用指标 在实际工作中,常用专家的擅长系数和专家意见一致性系数等指标来估计专家评分方法所定权重分配的相对合理性。1)擅长系数:某一评估专家的水平可用对擅长领域中所提问题作出正确应答的概率,即所谓“擅长系数”。计算公式为:其中,q为擅长系数,p为错答率。理想的“绝对正确”评估专家,p=0,q=1。通常在选择评估专家时,其擅长系数q不应低于0.80。第21页/共80页6个专家对4个评价指标的评价结果的一致性系数计算表第22页/共80页2)专家意见一致性系数:设参与权重评估的专家数为m,待评价指标数为n,则反映m个专家对全部n个指标权重评估的一致程度的指标称为一致性系数一致性系数,以w表示,其计算公式为:一致性系数在01之间取值,越接近于1,表示所有专家对全部评价指标评分的协调程度越好。当然,一致性系数越大越好,这说明各评价因子的权重估计较为稳定可靠。当有相同秩时,要对w进行校正:式中 第23页/共80页3.7 常用的客观定权方法某些统计方法分析结果,可提供有关因素权重分配的客观信息:1)1)多元回归分析及逐步回归分析中,各自变量的标准化偏回归系数值以及由此而推算的贡献率;2)2)计数资料判别分析中的指数,计量资料判别分析中各因子的贡献率;3)3)主成分分析中得到的因子载荷和贡献率。某些特定的统计方法 例如去某死因后期望寿命的增量、减寿年数(Potential Years of Life Potential Years of Life LostLost,PYLL),PYLL)都可为各死因的相对重要性提供有关权重分配的信息献率。第24页/共80页3.8 组合权重及其计算方法组合权重(combined weight)(combined weight)当评价指标可分层时,即某项或某几项评价指标可再分为次级评价指标时,则次级评价指标的权重既应考虑其本身在所有次级评价指标中的权重分配,又要考虑其高层评价指标在所有评价指标中的权重分配。组合权重有两种求法:1)1)代数和法 2)2)乘积法 第25页/共80页组合权重计算表第26页/共80页3.9 权重估计注意事项权重估计仍不是很完美,权重估计结果应满足专业解释;尽量在专业领域中寻找专业评分方法;尽量排除试验者和受试者的主观性,尽量选用客观方法;采用多种方法进行权重,在获得较为满意的专业解释的基础上,优先考虑多个方法同时选入的指标。第27页/共80页二、几种常用综合评价方法1.1.现有的统计方法:主要为多元统计方法,如多元回归、逐步回归分析、判别分析、因子分析、时间序列分析等。2.2.模糊多元分析方法:由模糊数学发展而来,包括模糊聚类、模糊判别、模糊综合评价等方法。3 3简易方法:主要包括综合评分法、综合指数法、层次分析法、TopsisTopsis法、秩和比法等。特点:简单实用;适用于各种资料;存在一定的局限性。第28页/共80页2.1 层次分析法概念 层次分析法(Analytic Hierarchy Process,简称AHP):由美国科学家T.L.Saaty于20世纪70年代提出,是用系统分析的方法,对评价对象依评价目的所确定的总评价目标进行连续性分解,得到各级(各层)评价目标,并以最下层指标作为衡量目标达到程度的评价指标。然后依据这些指标计算出一综合评分指数对评价对象的总评价目标进行评价,依其大小来确定评价对象的优劣等级。第29页/共80页2.2 层次分析法示例例:拟采用层次分析法建立一个评价综合医院工作质量的综合指标,并采用该指标对某市6 6所综合医院的工作质量进行综合评价。医院工作质量综合评价的基本步骤:1)对总评价目标进行连续性分解以得到不同层次的评价目标,将各层评价目标用图有机地标示出来,即建立目标树图,见图1。第30页/共80页2.3 建立目标图第31页/共80页2.4 计算权重系数2)对目标树自上而下分层次一一对比打分,建立对目标树自上而下分层次一一对比打分,建立成对比较判断优成对比较判断优选矩阵选矩阵。各层评分标准见表3,表4为第一层子目标成对比较判断优选矩阵。表3 目标树图各层次评分标准 对比打分对比打分 相对重要程度相对重要程度 说说 明明1同等重要同等重要 两者对目标的贡献相同两者对目标的贡献相同3略为重要略为重要 根据经验一个比另一个评价稍有利根据经验一个比另一个评价稍有利5基本重要基本重要 根据经验一个比另一个评价更为有利根据经验一个比另一个评价更为有利7确实重要确实重要 一个比另一个评价更有利,且在实践中证明一个比另一个评价更有利,且在实践中证明9绝对重要绝对重要 重要程度明显重要程度明显两相邻程度的两相邻程度的中间值中间值 需要折衷时采用需要折衷时采用表4 第一层子目标成对比较判断优选矩阵 医疗工作医疗工作护理工作护理工作膳食供应膳食供应医疗工作医疗工作1(a11)3(a12)5(a13)护理工作护理工作1/3(a12)1(a22)3(a23)膳食供应膳食供应1/5(a13)1/3(a23)1(a33)第32页/共80页2.4 计算权重系数(续1)(2)按公式 计算初始权重系数 得(3)按公式 计算归一化权重系数 得 用同样方法可获得其他分层中各项目指标的权重系数,现以医疗工作一项为例说明,见表5。第33页/共80页2.4 计算权重系数(续2)表表5 医疗工作第二层、第三层子目标权重系数医疗工作第二层、第三层子目标权重系数 层层 次次评价目标及权重系数评价目标及权重系数 第二层第二层医疗制度医疗制度医疗质量医疗质量病床使用病床使用0.16340.53960.2970第三层第三层疗疗 效效重症收容重症收容0.66700.3330(4)计算各个评价指标的组合权重系数,见图2。膳食供应优良率的组合权重系数 C1=0.1047 护理制度优良执行率的组合权重系数C2=0.2583 治疗有效率的组合权重系数 C6=0.2292第34页/共80页2.4 计算权重系数(续3)图2 乘积法求各层次评价指标的组合权重 第35页/共80页2.5 求综合评分指数(5)对评价对象的总评价目标进行综合评估。综合评分指数GIGI的计算公式如下:其中Pi为第i个评价指标的测量值,为评价指标的个数。例某市有6所综合医院,试对其医院工作质量进行综合评价,医院的6项评价指标分别为病床使用率(P1)95%,治疗有效率(P2)88.1%,重症收容率(P3)15.4%,医疗制度执行优良率(P4)74.7%,护理制度执行优良率(P5)54.7%,膳食供应优良率(P6)41.3%,其综合评分指数为:其他医院综合评分指数GI的计算结果见表6。第36页/共80页2.5 求综合评分指数(续1)由表6工作质量顺位可见,A医院工作质量最佳,D医院工作质量最差。表6 某市6所医院工作质量的综合评价表 评价指标评价指标 组合权重组合权重 医医 院院 A ABCDEF病床使用率病床使用率0.189295.092.094.895.689.177.4治疗有效率治疗有效率0.229288.191.290.094.093.692.2重症收容率重症收容率0.114515.48.37.93.19.53.7医疗制度执行优良率医疗制度执行优良率0.104174.753.461.950.061.967.1护理制度执行优良率护理制度执行优良率0.258354.720.726.120.027.435.5膳食供应优良率膳食供应优良率0.104741.341.422.820.034.030.3综合评分指数综合评分指数66.254.555.052.556.555.5工作质量顺位工作质量顺位154623第37页/共80页2.6 层次分析法评价1、应用层次分析法时,注意在计算归一化权重系数后,应检验所计算得出的权重系数是否符合逻辑权重系数是否符合逻辑。通常用一致性指标检验该项目的相对优先顺序有无逻辑混乱,一般认为,当CI0.10时,可能无逻辑混乱,即计算得的各项权重可以接受。按下述公式可计算 一致性指标 :其中m为受检验层次的子目标数,为最大特征根,为该层子目标成对比较判断优选矩阵的特征根。第38页/共80页2.6 层次分析法评价(续1)2、为了度量不同阶判断矩阵是否具有满意的一致性,我们还需引入判断矩阵的平均随机一致性指标值。对于1,2阶判断矩阵,只是形式上的,因为1,2阶判断矩阵总具有完全一致性。当阶数大于2时,判断矩阵一致性指标与同阶平均随机一致性指标之比称为随机一致性比率随机一致性比率,记为CR,其计算公式为:如本例第一层:第39页/共80页2.6 层次分析法评价(续2)对于19阶判断矩阵,RI值见表7。表 7 19阶平均随机一致性指标的取值 阶数 123456789RI0.000.000.580.901.121.241.321.411.45 当CR0.10时,即认为判断矩阵具有满意的一致性,否则就需要调整判断矩阵,并使之具有满意的一致性。以本例第一层为例:认为第一层子目标各项权重判断无逻辑错误。依此类推,运用此法逐步检测每一层子目标权重系数,判断它们是否都合乎逻辑。第40页/共80页3.1 Topsis 法TopsisTopsis法法(Topsis methodTopsis method):是系统工程中有限方案多目标决策分析的一种常用方法,可用于效益评价、卫生决策和卫生事业管理等多个领域。本法对样本资料无特殊要求,使用灵活简便,故应用日趋广泛。第41页/共80页3.2 Topsis 法示例&例5 5个煤矿煤尘对呼吸系统危害的研究资料见表8,拟综合粉尘几何平均浓度、游离SiO2含量和煤肺患病率3个指标进行综合评价。表表8 5个煤矿测定结果与煤肺患病率个煤矿测定结果与煤肺患病率 厂矿厂矿 粉尘几何平均粉尘几何平均浓度(浓度(mg/m3)游离游离SiO2含量含量(%)煤肺患病率煤肺患病率(%)白沙湘永煤矿白沙湘永煤矿 50.84.38.7沈阳田师傅煤矿沈阳田师傅煤矿 200.04.97.2抚顺龙凤煤矿抚顺龙凤煤矿 71.42.55.0大同同家山煤矿大同同家山煤矿 98.53.72.7扎诺尔南山煤矿扎诺尔南山煤矿 10.22.40.3第42页/共80页3.3 Topsis 法基本步骤1、评价指标同趋势化,Topsis法进行评价时,要求所有指标变化方向一致(即所谓同趋势化),将高优指标转化为低优指标,或将低优指标转化为高优指标,通常采用后一种方式。转化方法常用倒数法,即令原始数据中低优指标Xij(i=1,2,n;j=1,2m),通过 变换而转化成高优指标,然后建立同趋势化后的原始数据表,如表9。表9 指标转化值 厂矿 粉尘几何平均浓度(mg/m3)游离SiO2含量(%)煤肺患病率(%)白沙湘永煤矿 1.968523.255811.4943沈阳田师傅煤矿 0.500020.408213.8889抚顺龙凤煤矿 1.400640.000020.0000大同同家山煤矿 1.015227.027037.0370扎诺尔南山煤矿 9.803941.666733.3333第43页/共80页3.3 Topsis 法基本步骤(续1)2、对同趋势化后的原始数据矩阵进行归一化处理,并建立相应矩 阵。其指标转换公式为:或 式中Xij表示第i个评价对象在第j个指标上的取值,表示经倒数转换后的第i个评价对象在第j个指标上的取值。由此得出经归一化处理后的A矩阵为:如本例对白沙湘永煤矿粉尘几何平均浓度归一化处理如下:第44页/共80页3.3 Topsis 法基本步骤(续2)表10 归一化矩阵值 厂矿 粉尘几何平均浓度(mg/m3)游离SiO2含量(%)煤肺患病率(%)白沙湘永煤矿 0.19370.32810.0342沈阳田师傅煤矿 0.04920.28790.0413抚顺龙凤煤矿 0.13780.56430.0594大同同家山煤矿 0.09990.38130.1101扎诺尔南山煤矿 0.96490.58790.9907归一化处理后的结果矩阵见下表:3据A矩阵得到最优值向量和最劣值向量,即有限方案中的最优方案和最劣方案为:第45页/共80页3.3 Topsis 法基本步骤(续3)4.分别计算诸评价对象所有各指标值与最优方案及最劣方案的距离 与 :式中 与 分别表示第 i个评价对象与最优方案及最劣方案的距离;表示某个评价对象 i 在第j 个指标的取值。例如,大同同家山煤矿如下,其余结果见表11。第46页/共80页表11 不同厂矿指标值与最优值的相对接近程度及排序结果 厂矿排序结果 白沙湘永煤矿1.22580.15000.10673沈阳田师傅煤矿1.35270.00710.00525抚顺龙凤煤矿1.24570.29140.18962大同同家山煤矿1.25150.13060.09454扎诺尔南山煤矿0.00001.35771.000013.3 Topsis 法基本步骤(续4)5计算诸评价对象与最优方案的接近程度Ci,其计算公式如下:在0与1之间取值,愈接近1,表示该评价对象越接近最优水平;反之,愈接近0,表示该评价对象越接近最劣水平。6按 大小将各评价对象排序,值越大,表示综合效益越好。如表11所示,以扎诺尔南山煤矿最优,即对呼吸系统危害最小;而沈阳田师傅煤矿最劣。第47页/共80页3.4 加权Topsis法以上例子是在等权或没有考虑权重的情况下计算所得的,当我们进行权重估计时,各指标与最优方案及最劣方案距离的计算公式应改为:其中 为第j个指标的权重系数。第48页/共80页基本思想:基于归一化后的原始数据矩阵,找出有限方案中的最优方案和最劣方案(分别用最优向量和最劣向量表示),然后分别计算诸评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。基本步骤:指标同趋势化;归一化处理;寻找最优方案与最劣方案;计算评价对象与最优方案和最劣方案间的距离;计算各评价对象与最优方案的接近程度;依接近程度对各评价对象进行排序,确定评价效果。3.5 Topsis法总结第49页/共80页4.1 秩和比法的概念秩和比(Rank Sum Ratio,RSR)指行(或列)秩次的平均值,是一个非参数统计量,具有01连续变量的特征。在综合评价中,秩和比综合了多项评价指标的信息,表明多个评价指标的综合水平,RSR值越大越优。秩和比法指利用RSR进行统计分析的一组方法。其基本思想基本思想是:在一个行列矩阵中,通过秩转换,获得无量纲统计量;在此基础上,运用参数统计分析的概念与方法,研究的分布;以RSR值对评价对象的优劣直接排序或分档排序。第50页/共80页4.2 RSR的计算公式1在一个n行(n个评价对象)m列(m个评价指标)矩阵中,RSR的计算公式为:式中=1,2n;j=1,2m,第 i行第 j列元素的秩。2当各评价指标的权重不同时,计算加权秩和比,其计算公式为:其中,i=1,2n;j=1,2m,为第 i行第 j列元素的秩,为第 j个评价指标的权重,。第51页/共80页4.3 秩和比法基本步骤示例 例 某省10个地区孕产妇保健工作的产前检查率X1(%)、孕产妇死亡率X2(1/10万)、围产儿死亡率X3()资料见表13第(1)、(3)、(5)栏,拟综合上述3个指标进行综合评价。第52页/共80页秩和比法的基本步骤基本步骤:(1)列原始数据表:将个评价对象的个评价指标列成行列的原始数据表,见表13第(1)、(3)、(5)栏。(2)编秩:编出每个指标各对象的秩,其中高优指标从小到大编秩,低优指标从大到小编秩,同一指标数值相同者编平均秩。根据专业知识,产前检查率为高优指标,指标值越大其秩越高;孕产妇死亡率、围产儿死亡率均为低优指标,指标值越大其秩越低。编秩结果见表13第(2)、(4)、(6)栏。4.3 秩和比法基本步骤示例(续1)第53页/共80页4.3 秩和比法基本步骤示例(续2).表表13 某省某省10个地区孕产妇保健工作的各项指标值个地区孕产妇保健工作的各项指标值 地区地区编码编码 产前检查产前检查率率(%)孕产妇死亡率孕产妇死亡率(1/10万)万)围产儿死亡率围产儿死亡率()RSR排序排序X1R1X2R2X3R3(1)(2)(3)(4)(5)(6)(7)(7)A99.541060.27216.1560.60004B96.52759.67320.1020.40008C99.36943.91715.6070.76672D92.83358.99417.0450.40008E91.71235.40815.0180.60004F95.35544.71613.9390.66673G96.09649.81517.4340.50007H99.27831.69913.89100.90001I94.76422.911019.8730.56676J84.80181.49123.6310.100010第54页/共80页4.3 秩和比法基本步骤示例(续3)(3 3)计计算算秩秩和和比比 根据RSRRSR值对评价对象的优劣进行直接排排序序:根据以下公式计算孕产妇保健工作的RSRRSR,结果见表1212第(7)(7)栏。例如对A A地区:余类推。据第(7)栏数据,可直接对10个地区的孕产妇保健工作排序。显然,孕产妇保健工作综合评价相对最劣的为J地区,其次为B、D地区,相对最优的为H地区。第55页/共80页4.3 秩和比法基本步骤示例(续4)(4)确定RSR的分布 RSR的分布是指用概率单位Probit表达的值特定的向下累计频率。其方法为:编制RSR频数分布表,列出各组频数,计算各组累计频数 ;确定各组RSR的秩次范围R及平均秩次 ;计算向下累计频率 ;将百分率P换算为概率单位Probit,ProbitProbit为为百百分率分率P P对应的标准正态离差对应的标准正态离差u u(可查第520页u界值表)加)加5 5。例如 百分率P=0.0250对应的标准正态离差u=-1.96,其相应的概率单位Probit为5-1.96=3.04;百分率P=0.9750对应的标准正态离差u=1.96,其相应的概率单位Probit为 5+1.96=6.96。孕产妇保健工作的RSR分布见表14。第56页/共80页4.3 秩和比法基本步骤示例(续5)(5)计算回归方程:以累计频率所对应的概率单位值Probit为自变量,以RSR值为应变量,计算回归方程:Probit。表14 RSR值的分布值的分布 RSR RProbit(1)(2)(3)(4)(5)(6)(7)0.1000111110.03.720.4000232,32.525.04.330.5000144440.04.750.5667155550.05.000.6000276,76.565.05.390.6667188880.05.840.7667199990.06.280.9000110=n101097.56.96第57页/共80页4.3 秩和比法基本步骤示例(续6)本例据表14第(1)、(7)栏求得方程::(6)分档排序 根据值对评价对象进行分档排序。分档依据为标准正态离差,其范围以设定-33为宜。常用分档情况下的百分位数临界值及其对应的概率单位Probit值见表15。依据各分档情况下概率单位Probit值,按照回归方程推算所对应的RSR估计值对评价对象进行分档排序。具体分档数由研究者根据实际情况决定。第58页/共80页 本例将孕产妇保健工作拟分上、中、下三档。参照表本例将孕产妇保健工作拟分上、中、下三档。参照表15,以相应概率单位,以相应概率单位Probit值代入上述回归方程推算所对应值代入上述回归方程推算所对应的估计值。根据估计值进行分档排序。的估计值。根据估计值进行分档排序。如本例如本例 J地区的地区的RSRj=0.1000,概率单位,概率单位Probit=3.72;代入上述代入上述回归方程回归方程得:得:因此因此J地区分地区分档等级为下,余类推,结果见表档等级为下,余类推,结果见表16。4.3 秩和比法基本步骤示例(续7)第59页/共80页4表15 常用分档情况下的百分位数P临界值及其对应的概率单位Probit值 分档数 百分位数P Probit 分档数 百分位数PProbit 3 P P15.86615.866446 P2.2753P P15.866 15.866 4 4 P2.275 3 P P84.134 84.134 6 6 P615.866 4 4 P6.6813.5P50 5 P6.681 3.5 P84.134 6 P50 5 P97.725 7 P93.319 6.5 7 7 P P1.6181.6182.862.865 P3.59350%预报有雨明天有雨概率50%预报无雨 正确率正确率0.57正确率正确率0.71正确率正确率0.81正确率正确率0.93第69页/共80页计数模型计数模型从实用角度看,更重要的是误报率.预报无雨而实测有雨的概率P2 预报有雨而实测无雨的概率P1 预报预报C2175预报预报实测实测有雨有雨有雨有雨无雨无雨无雨无雨3预报预报D26预报预报实测实测有雨有雨有雨有雨无雨无雨无雨无雨 0216预报预报实测实测有雨有雨有雨有雨无雨无雨无雨无雨10311预报预报A设两种后果的损失之比为1:2P1=10/16P2=3/14误报率P=P1/3+2P2/3=0.35 误报率P=0.20 误报率P=0.06 造成预防费用浪费 预防不足导致损失 误报率P=P1/3+2P2/3 缺点缺点:未考虑预报概率的具体值未考虑预报概率的具体值 第70页/共80页记分模型记分模型将预报有雨概率与实测结果比较并记分 模型1 pk第k天预报有雨概率vk=1第k天有雨,vk=0无雨第k天的预报得分 对k 求和得到预报的分数S1 S1(A)=1.0,S1(B)=2.6,S1(C)=7.0,S1(D)=6.7 预报有雨概率0.5 得到相应的正分 S1越大越好 第71页/共80页记分模型记分模型模型2pk第k天预报有雨概率vk=1第k天有雨,vk=0无雨第k天的预报得分 对k 求和得到预报的分数S2 S2越小越好 S2(A)=14.5,S2(B)=12.9,S2(C)=8.5,S2(D)=8.8 模型3第k天的预报得分 对k 求和得到预报的分数S3 S3越小越好 S3(A)=8.95,S3(B)=6.39,S3(C)=4.23,S3(D)=3.21 第72页/共80页记分模型记分模型S2(A)=14.5,S2(B)=12.9,S2(C)=8.5,S2(D)=8.8 S3(A)=8.95,S3(B)=6.39,S3(C)=4.23,S3(D)=3.21 S1(A)=1.0,S1(B)=2.6,S1(C)=7.0,S1(D)=6.7 模型1,2对4种预报的优劣排序、相对分差都相同f理论上的有雨概率 模型3的期望分数 p预报有雨概率v=1有雨,v=0无雨P(v=1)=f,P(v=0)=1-f 比较模型比较模型3 3与模型与模型2 2的优劣的优劣 p=f 时时E(S)最小最小等价!考察一般模型 求E(S)的极值 此意义下模型此意义下模型3 3最佳!最佳!仅当n=2时p=f才能E(S)最小 第73页/共80页图形模型图形模型(1)(1)(1)(3)(1)(2)*(1)(1)(2)(3)(3)(1)(3)(2)(4)(2)*0 0.2 0.4 0.6 0.8 1pv=1v=0预报预报A(1)(1)(2)(1)(1)(3)*(5)(6)(4)(1)(1)(2)(3)*0 0.2 0.4 0.6 0.8 1pv=1v=0预报预报C(2)(4)(4)(6)(5)(1)*0 0.2 0.4 0.6 0.8 1pv=1v=0 (2)(1)(1)(2)(3)*预报预报D (22)*0 0.2 0.4 0.6 0.8 1pv=1v=0预报预报B(9)*号几乎随机分布,预报效果很差 模型1*号的p没有变化,毫无用途 v=0*号在p=0.6左边,无雨预报较好;v=1*号分散,有雨预报较差 v=0*号在p=0.5左边,v=1*号在p=0.4右边,无雨、有雨预报都好*上()中数字是坐标在*的天数 第74页/共80页图形模型图形模型模型2 0.5*0.5p0q预报预报A*0.50.5p0q预报预报B *0.50.5p0q预报预报C *0.50.5p0q预报预报Dp 预报有雨概率,q实测有雨天数比例p和q越接近越好*离对角线越近越好*几乎均匀分布,明显不好 只有一个*,几乎在q=p上 比A好一些 未显示出优势 模型缺陷模型缺陷 不能用于预报B的情况 数据量小可能是预报D未得到正确评价的原因 用*与q=p的竖直距离度量模型的优劣,并考虑各个*的权重,模型2可量化为分数模型.第75页/共80页深入讨论深入讨论 评价预报的优劣,需制定评价标准 没有统一看法,提出三类层次、内涵不但相互关联的标准 第一类标准:预报者本身的一致性第一类标准:预报者本身的一致性 指预报者根据知识、信息和经验对预报的事件做出的判断,与他对外发布的预报之间的关系.不完全一致 预报者没有利用全部判断,只从使用者的需要出发.出于预报效益等考虑,对判断作了适当改变.一致性受预报者控制,外界通常难以掌握一致性受预报者控制,外界通常难以掌握 在预报以概率形式给出的情况下,当预报与预报者的判断一致时,才会得到与实际观测最相符的结果.第76页/共80页深入讨论深入讨论 第二类标准第二类标准:根据预报和实测间的关系根据预报和实测间的关系,评价预报的品质评价预报的品质 利用预报(随机变量x)与观测(随机变量y)的联合分布F(x,y)可靠性可靠性 决定性决定性 将特定预报x下观测y的条件均值与x之差对所有x平均,作为可靠性的数量指标.由条件分布F(y x)和边际分布F(x)计算得到 将特定预报x下观测y的条件均值与y的无条件均值之差对所有x平均,作为决定性的数量指标.越小越好 越大越好 第77页/共80页深入讨论深入讨论 第二类标准第二类标准:根据预报和实测间的关系根据预报和实测间的关系,评价预报的品质评价预报的品质 分辨度分辨度 敏锐性敏锐性 将特定观测y下预报x的条件均值与y之差对所有y平均,作为分辨度的数量指标.越小越好 将这个条件均值与y的无条件均值之差对所有y平均,作为分辨度的又一数量指标.越大越好 预报本身的敏锐,与事件无关.由边际分布F(x)决定.如预报有雨概率多数接近1或0.由条件分布F(x y)和边际分布F(y)计算得到 第78页/共80页 四、历年赛题:四、历年赛题:(1 1)CUMCM1993-B:CUMCM1993-B:足球队排名问题;足球队排名问题;(2 2)CUMCM2001-B:CUMCM2001-B:公交车调度问题;公交车调度问题;(3 3)CUMCM2002-B:CUMCM2002-B:彩票中的数学问题;彩票中的数学问题;(4 4)CUMCM2004-D:CUMCM2004-D:公务员招聘问题;公务员招聘问题;(5 5)CUMCM2005-A:CU