秩和比法RSR00088学习.pptx
什么是“秩和比”(RSR)秩:样本秩 注意:不同于线性代数中矩阵的秩和:求和 秩的和:Rank-Sum 比:一种运算 Ratio 秩和比是行(或列)秩次的平均值,是一个内涵丰富的统计量,表明不同计量单位多个指标的综合水平第1页/共37页创始人:田凤调教授于1988年提出应用领域:医疗卫生领域的多指标综合评价统计预测预报统计质量控制等方面。第2页/共37页 秩和比综合评价法基本原理是秩和比综合评价法基本原理是:在一个在一个n行行m列列矩阵中矩阵中,通过对每个元素的秩进行运算通过对每个元素的秩进行运算,获得获得无量纲无量纲统计量统计量RSR;在此基础上在此基础上,运用运用 参数统计分析参数统计分析的的概念与方法概念与方法,研究研究RSR的分布的分布;以及以及RSR值对评价对值对评价对象的优劣直接排序或分档排序象的优劣直接排序或分档排序,从而对评价对象做从而对评价对象做出综合评价出综合评价.第3页/共37页什么是无量纲统计量:1.量纲和单位的区别:单位是物理学基本量的不同级别 量纲是多个基本量之间的组合例如:长度的基本量 是 m 长度的单位有 mm cm m km 例如:速度v 是长度单位和时间单位的组合 v=l/t 速度的量纲是m/s 但速度的单位却有许多种组合第4页/共37页2.有量纲量和无量纲量 物理量分为两类:有量纲:有量纲量大小与量度所选单位有关 如:长度 时间 速度 无量纲:无量纲量与量度所选的单位无关 如:角度 应变:RSR就是一个无量纲量无量纲量并不无量纲量并不是没有单位,是没有单位,它的单位是它的单位是1 1第5页/共37页 样本秩样本秩 rank 的概念的概念:则称k 是 在样本中的秩,记作 ,第6页/共37页 例如例如,对样本数据对样本数据-0.8,-3.1,1.1,-5.2,4.2顺序统计量是顺序统计量是-5.2,-3.1,-0.8,1.1,4.2而秩统计量是而秩统计量是3,2,4,1,5第7页/共37页1.编秩编秩将将n个评价对象的个评价对象的m个评价指标排列成个评价指标排列成n行行m列的原列的原始数据表始数据表.编出每个指标各评价对象的秩。编出每个指标各评价对象的秩。秩和比综合评价法的步骤:第8页/共37页 如何编秩:RSR法在最初创立时 就是简单地用样本秩次来编秩,得到秩矩阵。这种方法简单易懂,操作方便,但也有很大缺点:1.第一是在指标转化为秩次时会使一些信息发生改变。2.第二是编秩时如何正确区分高优指标、低优指标及其组合(偏高优、稍高优、偏低优、稍低优等)第9页/共37页改进编秩方法:对于第一个缺点:1.高优指标从小到大编秩2.低优指标从大到小编秩 高优就是越越好的量,一般对应效益型指标,一个公司盈利越多越好,效益就是高优;低优就是越少越好的量,一般对应成本性指标,一个公司成本越低越好,成本就是低优。第10页/共37页3.同一指标数据相同者,成为相持,编平均秩.例如,对样本数据-0.8,-3.1,1.1,-5.2,1.1顺序统计量是-5.2,-3.1,-0.8,1.1,1.1而秩统计量是3,2,4.5,1,4.5第11页/共37页对于第二个缺点:解决较为复杂:见文章 RRS法中各指标按任意系数进行编秩的探讨 所以处理一般评价问题时,只解决第一个缺点就足够了第12页/共37页2.计算秩和比(RSR):秩和比的计算常需按行(R)或按列(C)分别进行计算:公式1或公式2,式中m为指标数,n为分组数。一般都是使用 行秩和比进行评价第13页/共37页当给每一个样本秩附一个权值是,就可以求得加权秩和比(RSRw):式中w 为权重系数。几个RSR的合并:各组RSRR合并RSR 第14页/共37页3.计算概率单位计算概率单位.编制得到编制得到RSR(或或WRSR)频率分布表频率分布表,列出各组频数列出各组频数fi计算各组的累计频数计算各组的累计频数cf和累计频率和累计频率p,将将p转换为概率转换为概率单位单位Probiti,Probiti为标准正态分布的为标准正态分布的pi分位数加分位数加5.秩矩阵加权秩矩阵第15页/共37页4.计算直线回归方程计算直线回归方程.以累积频率所对应的概率单以累积频率所对应的概率单位位Probiti 为自变量为自变量,以以RSRi(或或WRSRi)值为因值为因变量变量,计算直线回归方程计算直线回归方程,即即5.分档排序分档排序.按照回归方程推算所对应的按照回归方程推算所对应的RSR(WRSR)估计值对评价对象进行分档排序估计值对评价对象进行分档排序.第16页/共37页请对某省10个地区孕产妇保健工作就3个指标进行综合评价第17页/共37页第一步:编秩1.编秩标准:高优指标从小到大编秩,低优指标从大到小编秩,同一指标数据相同者编平均秩。2.根据专业知识:“产前检查率”为高优指标 “孕产妇死亡率”和“围产儿死亡率”为低优指标第18页/共37页编秩结果:第19页/共37页第二步:计算秩和比并直接排序使用行秩和比:使用行秩和比:当计算指标权重不同时,计算加权秩和比当计算指标权重不同时,计算加权秩和比:通过秩和比通过秩和比RSRRSR值的大小,就可以对评价对象进行综值的大小,就可以对评价对象进行综合排序,这种利用合排序,这种利用RSRRSR综合评价指标进行排序的方法称为综合评价指标进行排序的方法称为直接排序。但是在通常情况下还需要对评价对象进行分档,直接排序。但是在通常情况下还需要对评价对象进行分档,特别是当评价对象很多时,如十几个或几百个评价对象,特别是当评价对象很多时,如十几个或几百个评价对象,就需要通过分档排序找出就需要通过分档排序找出RSRRSR的分布。的分布。第20页/共37页RSR值及直接排序 表第21页/共37页第三步:确定RSR的分布、计算概率单位(Probit)RSR的分布是指概率单位Probit表达的值特定的累计频率。步骤:1.编制RSR频数分布表,列出各组的频数f,计算各组的累计频数f;2.确定各组RSR的秩次范围R及平均秩次3.计算累计频率(/n)100%,最后的累计值按照 (1-1/4n)校正;4.将百分率p换成概率单位probit:probit为p对应的标准正太分布的分位数u+5第22页/共37页标准正太分布与分位数标准正态分布的密度函数与图像:分位数:当随机变量X的分布函数为 F(x),实数满足0 1 时,分位数是使PX u=F(u)=的数uProbit=u+5第23页/共37页RSR分布与对应的probit值:按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果标准正太分布表第24页/共37页第四步:计算直线回归方程以累积频率所对应的概率单位Probit 为自变量,以RSR(或WRSR)值为因变量,计算直线回归方程。用Excel中的interceptintercept函数求截距,slopeslope函数求斜率即可可得:RSR=-0.61+0.22probit第25页/共37页第五步:分档排序按照回归方程推算对应的按照回归方程推算对应的RSRRSR估计值对评价对象进行分档排序估计值对评价对象进行分档排序分档标准为标准正态分布的分位数,其范围在分档标准为标准正态分布的分位数,其范围在-3-3到到3 3之间最好之间最好根据各分档情况下概率单位根据各分档情况下概率单位probitprobit值,按照回归方程推算对应值,按照回归方程推算对应的的RSRRSR估计值对评价对象进行分档排序,具体分档数根据实际情估计值对评价对象进行分档排序,具体分档数根据实际情况而定况而定第26页/共37页第27页/共37页 由分档结果可看出,10个地区中孕妇保健工作做的最好的差的是J地区,中档的是B、E、G、I、F,而C、H为上档第28页/共37页 某市人民医院某市人民医院1983年年-1992年工作质量统计指标年工作质量统计指标及权重系数见表及权重系数见表1,其中,其中 为治愈率,为治愈率,为病为病死率,死率,为周转率,为周转率,为平均病床工作日,为平均病床工作日,病床使用率,病床使用率,为平均住院日,这里为平均住院日,这里 和和 是成本型指标,其余为效益型指标。是成本型指标,其余为效益型指标。第29页/共37页年度年度x1x2x3x4x5x6198375.23.538.2370.1101.510.0198476.13.336.7369.6101.010.3198580.42.730.5309.784.810.0198677.82.736.3370.1101.410.2198775.92.338.9369.4101.29.61198874.32.436.7335.391.99.2198974.62.237.5356.297.69.3199072.11.840.3401.7101.110.0199172.81.937.1372.8102.110.0199272.11.533.2358.197.810.4权重系数权重系数0.0930.4180.1320.1000.0980.159表1 统计指标及权重系数第30页/共37页年度年度x1x2x3x4x5x6WRSRi19836187.595.50.453851984824.56520.35821985103.51115.50.35975198693.537.5830.470719877695780.68051988454.522100.504219895773390.634019901.59101065.50.768419913869105.50.7169519921.51024410.55345表2 编秩和加权秩和比的计算结果第31页/共37页年度年度ficfipiprobitiWRSRfiti排序排序1983110.13.71840.4093101984120.2 4.15840.451291985130.3 4.47560.481481986140.4 4.74670.507271987150.5 50.531361988160.6 5.25330.555551989170.7 5.52440.581341990180.8 5.84160.611531991190.9 6.28160.6534219921100.975 6.960.71801表3 各组频数,累计频数,累积频率,概率单位,加权秩和比估计值第32页/共37页求得一元线性回归方程为:求得一元线性回归方程为:WRSR=0.0552+0.0952probit计算得到的计算得到的WRSR的估计值见表的估计值见表3,各年份工作质,各年份工作质量排序见表量排序见表3最后一列。最后一列。第33页/共37页计算过程如下:clearaw=load(zhb.txt);%导入数据w=aw(end,:);%提取权重向量a=aw(1:end-1,:);%提取指标数据a(:,2,6)=-a(:,2,6);%把成本型指标转换成效益型指标ra=tiedrank(a);%对每个指标值分别编秩,%即对a的每一列分别编秩n,m=size(a);%计算矩阵的维数RSR=mean(ra,2)/n;%计算秩和比第34页/共37页w=repmat(w,n,1);%计算加权秩和比WRSR=sum(ra.*w,2)/n;p=1:n/n;%计算累计频率p(end)=1-1/(4*n);%修正最后一个累计频率%最后一个累积频率按1-1/(4n)估计probit=norminv(p,0,1)+5;%计算标准正态分布的p分位数+5第35页/共37页X=ones(n,1),probit;%构造一元线性回归分析的数据矩阵ab,abint,r,rint,stats=regress(WRSR,X);%一元线性回归分析WRSRfit=ab(1)+ab(2)*probit;%计算WRSR的估计值sWRSRfit,ind=sort(WRSRfit,descend);%对WRSR的估计值从大到小排序第36页/共37页谢谢您的观看!第37页/共37页