《秩和比法RSR.ppt》由会员分享,可在线阅读,更多相关《秩和比法RSR.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、秩和比法秩和比法RSRRSR什么是什么是“秩和比秩和比”(RSR)n秩:样本秩秩:样本秩 注意:不同于线性代数中矩阵的秩注意:不同于线性代数中矩阵的秩n和:求和和:求和 秩的和:秩的和:Rank-Sum n比:一种运算比:一种运算 Ratio 秩和比是行秩和比是行(或列或列)秩次的平均值,是一个内涵秩次的平均值,是一个内涵丰富的统计量,表明不同计量单位多个指标的丰富的统计量,表明不同计量单位多个指标的综合水平综合水平创始人:田凤调教授于1988年提出应用领域:医疗卫生领域的多指标综合评价统计预测预报统计质量控制等方面。秩和比综合评价法基本原理是秩和比综合评价法基本原理是:在一个在一个n行行m列
2、列矩阵中矩阵中,通过对每个元素的秩进行运算通过对每个元素的秩进行运算,获得获得无量纲无量纲统计量统计量RSR;在此基础上在此基础上,运用运用 参数统计分析参数统计分析的的概念与方法概念与方法,研究研究RSR的分布的分布;以及以及RSR值对评价对值对评价对象的优劣直接排序或分档排序象的优劣直接排序或分档排序,从而对评价对象做从而对评价对象做出综合评价出综合评价.什么是无量纲统计量:n1.量纲和单位的区别:量纲和单位的区别:单位是物理学单位是物理学基本量基本量的的不同级别不同级别 量纲是多个基本量之间的组合量纲是多个基本量之间的组合例如:长度的基本量例如:长度的基本量 是是 m 长度的单位有长度的
3、单位有 mm cm m km 例如:速度例如:速度v 是长度单位和时间单位的组合是长度单位和时间单位的组合 v=l/t 速度的量纲是速度的量纲是m/s 但速度的单位却有许多种组合但速度的单位却有许多种组合n2.有量纲量和无量纲量有量纲量和无量纲量 物理量分为两类:物理量分为两类:有量纲:有量纲:有量纲量大小与量度所选单位有关有量纲量大小与量度所选单位有关 如:长度如:长度 时间时间 速度速度 无量纲:无量纲:无量纲量与量度所选的单位无关无量纲量与量度所选的单位无关 如:角度如:角度 应变:应变:RSR就是一个无量纲量就是一个无量纲量无量纲量并不无量纲量并不是没有单位,是没有单位,它的单位是它的
4、单位是1 1 样本秩样本秩 rank 的概念的概念:则称k 是 在样本中的秩,记作 ,例如例如,对样本数据对样本数据-0.8,-3.1,1.1,-5.2,4.2顺序统计量是顺序统计量是-5.2,-3.1,-0.8,1.1,4.2而秩统计量是而秩统计量是3,2,4,1,51.编秩编秩将将n个评价对象的个评价对象的m个评价指标排列成个评价指标排列成n行行m列的原列的原始数据表始数据表.编出每个指标各评价对象的秩。编出每个指标各评价对象的秩。秩和比综合评价法的步骤秩和比综合评价法的步骤:如何编秩:如何编秩:nRSR法在最初创立时法在最初创立时 就是简单地用就是简单地用样本秩次样本秩次来编秩,得到秩矩
5、阵。来编秩,得到秩矩阵。n这种方法简单易懂,操作方便,但也有很大这种方法简单易懂,操作方便,但也有很大缺点:缺点:1.第一是在指标转化为秩次时会使一些信息发生改变。第一是在指标转化为秩次时会使一些信息发生改变。2.第二是编秩时如何正确区分高优指标、低优指标及第二是编秩时如何正确区分高优指标、低优指标及其组合其组合(偏高优、稍高优、偏低优、稍低优等偏高优、稍高优、偏低优、稍低优等)改进编秩方法:改进编秩方法:n对于第一个缺点:对于第一个缺点:1.高优指标从小到大编秩高优指标从小到大编秩2.低优指标从大到小编秩低优指标从大到小编秩 高优就是越越好的量,一般对应效益型指标,一个公高优就是越越好的量,
6、一般对应效益型指标,一个公司盈利越多越好,效益就是高优;司盈利越多越好,效益就是高优;低优就是越少越好的量,一般对应成本性指标,一个低优就是越少越好的量,一般对应成本性指标,一个公司成本越低越好,成本就是低优。公司成本越低越好,成本就是低优。3.同一指标数据相同者,成为相持,编平均秩同一指标数据相同者,成为相持,编平均秩.例如例如,对样本数据对样本数据-0.8,-3.1,1.1,-5.2,1.1顺序统计量是顺序统计量是-5.2,-3.1,-0.8,1.1,1.1而秩统计量是而秩统计量是3,2,4.5,1,4.5n对于第二个缺点:对于第二个缺点:解决较为复杂:解决较为复杂:见文章见文章 RRS法
7、中各指标按任意系数进行编秩的探讨法中各指标按任意系数进行编秩的探讨 所以处理一般评价问题时,只解决第一个缺点就足所以处理一般评价问题时,只解决第一个缺点就足够了够了2.计算秩和比计算秩和比(RSR):秩和比的计算常需按行秩和比的计算常需按行(R)或按列或按列(C)分别进行分别进行计算:计算:公式公式1或公式或公式2,式中,式中m为指标数,为指标数,n为分组数为分组数。一般都是使用一般都是使用 行秩和比进行评价行秩和比进行评价n当给每一个样本秩附一个权值是,就可以求得当给每一个样本秩附一个权值是,就可以求得加权秩和比加权秩和比(RSRw):式中:式中w 为权重系数。为权重系数。n几个几个RSR的
8、合并:各组的合并:各组RSRR合并合并RSR 3.计算概率单位计算概率单位.编制得到编制得到RSR(或或WRSR)频率分布表频率分布表,列出各组频数列出各组频数fi计算各组的累计频数计算各组的累计频数cf和累计频率和累计频率p,将将p转换为概率转换为概率单位单位Probiti,Probiti为标准正态分布的为标准正态分布的pi分位数加分位数加5.秩矩阵秩矩阵加权秩矩阵加权秩矩阵4.计算直线回归方程计算直线回归方程.以累积频率所对应的概率单以累积频率所对应的概率单位位Probiti 为自变量为自变量,以以RSRi(或或WRSRi)值为因值为因变量变量,计算直线回归方程计算直线回归方程,即即5.分
9、档排序分档排序.按照回归方程推算所对应的按照回归方程推算所对应的RSR(WRSR)估计值对评价对象进行分档排序估计值对评价对象进行分档排序.请对某省请对某省10个地区孕产妇保健工作个地区孕产妇保健工作就就3个指标进行综合评价个指标进行综合评价第一步:编秩第一步:编秩n1.编秩标准编秩标准:高优指标从小到大编秩,低优指标高优指标从小到大编秩,低优指标从大到小编秩,同一指标数据相同者编平均秩。从大到小编秩,同一指标数据相同者编平均秩。n2.根据专业知识:根据专业知识:“产前检查率产前检查率”为高优指标为高优指标 “孕产妇死亡率孕产妇死亡率”和和“围产儿死亡率围产儿死亡率”为低优指标为低优指标编秩结
10、果:编秩结果:第二步:第二步:计算秩和比并直接排序计算秩和比并直接排序使用行秩和比:使用行秩和比:当计算指标权重不同时,计算加权秩和比当计算指标权重不同时,计算加权秩和比:通过秩和比通过秩和比RSRRSR值的大小,就可以对评价对象进行综值的大小,就可以对评价对象进行综合排序,这种利用合排序,这种利用RSRRSR综合评价指标进行排序的方法称为综合评价指标进行排序的方法称为直接排序。但是在通常情况下还需要对评价对象进行分档,直接排序。但是在通常情况下还需要对评价对象进行分档,特别是当评价对象很多时,如十几个或几百个评价对象,特别是当评价对象很多时,如十几个或几百个评价对象,就需要通过分档排序找出就
11、需要通过分档排序找出RSRRSR的分布。的分布。RSR值及直接排序值及直接排序 表表第三步:确定RSR的分布、计算概率单位(Probit)nRSR的分布是指概率单位的分布是指概率单位Probit表达的值特定的累表达的值特定的累计频率。计频率。n步骤:步骤:n1.编制编制RSR频数分布表,列出各组的频数频数分布表,列出各组的频数f,计算各组的累计,计算各组的累计频数频数f;n2.确定各组确定各组RSR的秩次范围的秩次范围R及平均秩次及平均秩次n3.计算累计频率计算累计频率(/n)100%,最后的累计值按照,最后的累计值按照 (1-1/4n)校正;校正;n4.将百分率将百分率p换成概率单位换成概率
12、单位probit:probit为为p对应的标准正对应的标准正太分布的太分布的分位数分位数u+5标准正太分布与分位数n标准正态分布的密度函数与图像:n分位数:当随机变量X的分布函数为 F(x),实数满足0 1 时,分位数是使PX u=F(u)=的数unProbit=u+5RSR分布与对应的分布与对应的probit值:值:按照(按照(1-1/4n)校正后的结果)校正后的结果按照(按照(1-1/4n)校正后的结果)校正后的结果按照(按照(1-1/4n)校正后的结果)校正后的结果按照(按照(1-1/4n)校正后的结果)校正后的结果按照(按照(1-1/4n)校正后的结果)校正后的结果按照(按照(1-1/
13、4n)校正后的结果)校正后的结果按照(按照(1-1/4n)校正后的结果)校正后的结果标准正太分布表标准正太分布表第四步:第四步:计算直线回归方程计算直线回归方程n以累积频率所对应的概率单位以累积频率所对应的概率单位Probit 为自变为自变量量,以以RSR(或或WRSR)值为因变量值为因变量,计算直线计算直线回归方程。回归方程。n用用Excel中的中的interceptintercept函数求截距,函数求截距,slopeslope函函数求斜率即可数求斜率即可n可得:可得:RSR=-0.61+0.22probit第五步:第五步:分档排序分档排序n按照回归方程推算对应的按照回归方程推算对应的RSR
14、RSR估计值对评估计值对评价对象进行分档排序价对象进行分档排序n分档标准为标准正态分布的分位数,其分档标准为标准正态分布的分位数,其范围在范围在-3-3到到3 3之间最好之间最好n根据各分档情况下概率单位根据各分档情况下概率单位probitprobit值,按照回值,按照回归方程推算对应的归方程推算对应的RSRRSR估计值对评价对象进行估计值对评价对象进行分档排序,具体分档数根据实际情况而定分档排序,具体分档数根据实际情况而定 由分档结果可看出,由分档结果可看出,10个地区中孕妇保健个地区中孕妇保健工作做的最好的差的是工作做的最好的差的是J地区,中档的是地区,中档的是B、E、G、I、F,而,而C
15、、H为上档为上档 某市人民医院某市人民医院1983年年-1992年工作质量统计指标年工作质量统计指标及权重系数见表及权重系数见表1,其中,其中 为治愈率,为治愈率,为病为病死率,死率,为周转率,为周转率,为平均病床工作日,为平均病床工作日,病床使用率,病床使用率,为平均住院日,这里为平均住院日,这里 和和 是成本型指标,其余为效益型指标。是成本型指标,其余为效益型指标。年度年度x1x2x3x4x5x6198375.23.538.2370.1101.510.0198476.13.336.7369.6101.010.3198580.42.730.5309.784.810.0198677.82.73
16、6.3370.1101.410.2198775.92.338.9369.4101.29.61198874.32.436.7335.391.99.2198974.62.237.5356.297.69.3199072.11.840.3401.7101.110.0199172.81.937.1372.8102.110.0199272.11.533.2358.197.810.4权重系数权重系数0.0930.4180.1320.1000.0980.159表表1 统计指标及权重系数统计指标及权重系数年度年度x1x2x3x4x5x6WRSRi19836187.595.50.453851984824.5652
17、0.35821985103.51115.50.35975198693.537.5830.470719877695780.68051988454.522100.504219895773390.634019901.59101065.50.768419913869105.50.7169519921.51024410.55345表表2 编秩和加权秩和比的计算结果编秩和加权秩和比的计算结果年度年度ficfipiprobitiWRSRfiti排序排序1983110.13.71840.4093101984120.2 4.15840.451291985130.3 4.47560.481481986140.4
18、4.74670.507271987150.5 50.531361988160.6 5.25330.555551989170.7 5.52440.581341990180.8 5.84160.611531991190.9 6.28160.6534219921100.975 6.960.71801表表3 各组频数,累计频数,累积频率,概各组频数,累计频数,累积频率,概率单位,加权秩和比估计值率单位,加权秩和比估计值求得一元线性回归方程为:求得一元线性回归方程为:WRSR=0.0552+0.0952probit计算得到的计算得到的WRSR的估计值见表的估计值见表3,各年份工作质,各年份工作质量排序见
19、表量排序见表3最后一列。最后一列。计算过程如下:clearaw=load(zhb.txt);%导入数据w=aw(end,:);%提取权重向量a=aw(1:end-1,:);%提取指标数据a(:,2,6)=-a(:,2,6);%把成本型指标转换成效益型指标ra=tiedrank(a);%对每个指标值分别编秩,%即对a的每一列分别编秩n,m=size(a);%计算矩阵的维数RSR=mean(ra,2)/n;%计算秩和比w=repmat(w,n,1);%计算加权秩和比WRSR=sum(ra.*w,2)/n;p=1:n/n;%计算累计频率p(end)=1-1/(4*n);%修正最后一个累计频率%最后一个累积频率按1-1/(4n)估计probit=norminv(p,0,1)+5;%计算标准正态分布的p分位数+5X=ones(n,1),probit;%构造一元线性回归分析的数据矩阵ab,abint,r,rint,stats=regress(WRSR,X);%一元线性回归分析WRSRfit=ab(1)+ab(2)*probit;%计算WRSR的估计值sWRSRfit,ind=sort(WRSRfit,descend);%对WRSR的估计值从大到小排序结束结束
限制150内