医用SAS统计分析二.ppt
《医用SAS统计分析二.ppt》由会员分享,可在线阅读,更多相关《医用SAS统计分析二.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医用SAS统计分析第二讲医用SAS统计分析第二讲12/7/202212/7/20221 1一、单变量的统计描述一、单变量的统计描述q统计分析内容回顾v统计描述:集中趋势、离散趋势v统计推断:l参数估计:总体参数估计(可信区间)l假设检验q资料类型v计量资料-数值变量v计数资料-分类变量q资料的分布正态分布和偏态分布12/7/202212/7/20222 2一般统计描述一般统计描述-MEANS过程过程qMEANSMEANS过过程程除除了了能能对对数数值值型型变变量量进进行行一一般般的的统统计计描描述述之之外外,还还可可以以作作配配对设计资料的对设计资料的t t检验。检验。q语句格式语句格式:Pr
2、oc means Proc means 操作选项操作选项统计量列表统计量列表;VAR VAR;/*指定分析的变量名列,缺省为所有数值变量*/BY BY;/*按变量名列分组统计,要求已按变量名列排序*/CLASS CLASS;/*按变量名列分组统计,不要求排序*/FREQ FREQ;/*表明该变量为分析变量的频数*/OUTPUT OUTPUT OUT=关关键键字字=;/*/*指指定定统统计计量的输出数据集名和统计量对应的新变量名量的输出数据集名和统计量对应的新变量名*/*/Run;Run;12/7/202212/7/20223 3vProc means Proc means 操作选项:操作选项:
3、data=指定要分析的数据集名 maxdec=指定输出结果最大的小数位数,默认为7位 noprint 禁止统计结果在output窗输出 alpha=设定计算可信区间的水平,默认为0.05 注:在proc语句中的选项直接跟在proc名后,以空格分隔,中间不加“/”,其他命令语句的选项需以“/”分隔。统计量列表选项:统计量列表选项:(缺省时只输出(缺省时只输出N N、MEANMEAN、STDSTD、MINMIN、MAXMAX)12/7/202212/7/20224 4例1书中例3-1例2某克山病区测得11名克山病患者与13名健康人的血磷值(mmol/L)如下,试求两组的平均血磷值和标准差。data
4、 L12;input g x;cards;1 0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.531 1.67 1 1.80 1 1.87 1 2.07 1 2.112 0.54 2 0.64 2 0.64 2 0.75 2 0.76 2 0.81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.58 2 1.87;proc means;var x;by g;run;12/7/202212/7/20225 5AnalysisVariable:X-G=1-NMeanStdDevMinimumMaximum-111.52090910.4217
5、9270.84000002.1100000-G=2-NMeanStdDevMinimumMaximum-131.08615380.42405850.54000001.8700000-12/7/202212/7/20226 6例3书中例3-3:几何均数的计算,SAS程序没有直接计算几何均数的模块。datalogmean;inputxf;y=log10(x);cards;20240380616013201;procmeans;vary;freqf;procprintdata=outmean;datageomean;setoutmean;g=10*logmean;procprintdata=geom
6、ean;varg;run;outputout=outmeanmean=logmean;12/7/202212/7/20227 7TheSASSystemAnalysisVariable:YNMeanStdDevMinimumMaximum-131.81046540.33396281.30103002.5051500-TheSASSystemOBS_TYPE_FREQ_LOGMEAN10131.81047TheSASSystemOBSG164.634612/7/202212/7/20228 8详细统计描述详细统计描述-UNIVARIATE过程过程Univariate过程可对数值变量进行详细的统计
7、描述。除了提供means过程所有的统计描述外,还可以给出了变量的峰度、偏度、众数、中位数及四分位数等更详尽的统计描述,同时还可进行正态性检验,以及几个描述分布的图。12/7/202212/7/20229 9PROC UNIVARIATE PROC UNIVARIATE 操作选项操作选项 ;VAR VAR ;指定分析的变量名列表,缺省为所有数值变量 BY BY;按变量名列分组按变量名列分组统计,要求排序 FREQ FREQ;表明该变量为分析变量的频数OUTPUT OUTPUT OUT=关关键键字字=;/*/*指指定定统统计计量的输出数据集名和统计量对应的新变量名量的输出数据集名和统计量对应的新变
8、量名*/*/Run;Run;proc univariate 语句的操作选项;data=指定要分析的数据集名 noprint 禁止统计结果在output窗输出 freq 详细的频数表 normal 进行正态性检验 plot 生成统计图:茎叶图,盒状图,正态概率图 12/7/202212/7/20221010例4程序3-2dataunil;inputx;cards;39865573108104;procunivariatenormalplot;run;12/7/202212/7/20221111 Moments N(样本含量)12 Sum Wgts(总权重)12 Mean(均数)6.5 Sum(合
9、计)78 Std Dev(标准差)2.54058 Variance(方差)6.454545 Skewness(偏度 g1)0 Kurtosis(峰度 g2)-1.39044 USS(平方和)578 CSS(离均差平方和)71 CV(变异系数)39.08584 Std Mean(标准误)0.733402 T:Mean=0(均数是否为0的检验)8.862804 Pr|T|(t值对应的p值)0.0001 Num=0(不等于0的样本数)12 Num 0(大于0的样本数)12 M(Sign)(符号检验)6 Pr=|M|(符号检验的p值)0.0005 Sgn Rank(符号秩和检验)39 Pr=|S|(符
10、号秩和检验的p值).0005 W:Normal(正态性检验W检验)0.932772 PrW(正态性检验的p值)0.384312/7/202212/7/20221212Quantiles(Def=5)100%Max1099%1075%Q38.595%1050%Med6.590%1025%Q14.510%30%Min35%31%3Range7Q3-Q14Mode312/7/202212/7/20221313ExtremesLowestObsHighestObs3(8)8(3)3(1)8(10)4(12)9(2)5(6)10(9)5(5)10(11)StemLeaf#Boxplot10002|901
11、|8002+-+701|601*-+-*5002|401+-+3002|-+-+-+-+12/7/202212/7/20221414NormalProbabilityPlot10.5+*+*+|*+|*+|*+|*+|*+*+|+*+3.5+*+*+-+-+-+-+-+-+-+-+-+-+-2-10+1+212/7/202212/7/20221515频数分布表数据的输入例5程序3-5datauni2;inputxf;cards;6536756987111732575247710797816830851;procunivariate;varx;freqf;run;12/7/202212/7/20
12、221616频数表的编制方法1:语句格式:procunivariatefreq;例6王洁贞主编DATASG;INFILEd:sassas2psb.txt;INPUTX;PROCMEANSmeanstdMINMAX;RUN;DATAFSH;SETSG;IFX164THENY=163;IFX=164THENY=165;IFX=166THENY=167;IFX=168THENY=169;IFX=170THENY=171;IFX=172THENY=173;IFX=174THENY=175;IFX=176THENY=177;IFX=178THENY=179;IFX=180THENY=181;IFX=18
13、2THENY=183;PROCUNIVARIATEFREQ;VARY;RUN;12/7/202212/7/20221717AnalysisVariable:XMeanStdDevMinimumMaximum-172.67100004.0756308162.9000000183.5000000-univariate过程略FrequencyTablePercentsPercentsValueCountCellCumValueCountCellCum16311.01.01751515.081.016544.05.017788.089.016777.012.017977.096.01691212.02
14、4.018133.099.01711818.042.018311.0100.01732424.066.012/7/202212/7/20221818方法2:语句格式:procfreq;tables变量名;说明:该语句是根据定义的变量产生频数分布表。例7:上例资料DATApsb1;INFILEd:sassas2psb.txt;INPUTX;L=162;/*定义第一组的下限值*/i=2;/*定义组距*/z=(x-mod(x-L,i)+(i/2);/*z值就是将原始变量转化成该数据所在组段的组中值*/procfreq;/*根据z值产生频数分布表*/tablesz;procunivariatenorm
15、alplot;varz;RUN;vmod(x,y)为算术函数,求x/y的余数。如mod(10,3)=1,mod(6,2)=012/7/202212/7/20221919CumulativeCumulativeZFrequencyPercentFrequencyPercent-16311.011.016544.055.016777.01212.01691212.02424.01711818.04242.01732424.06666.01751515.08181.017788.08989.017977.09696.018133.09999.018311.0100100.012/7/202212/7
16、/20222020UnivariateProcedureVariable=ZMomentsQuantiles(Def=5)N100SumWgts100100%Max18399%182Mean172.7Sum1727075%Q317595%179StdDev4.013865Variance16.1111150%Med17390%179Skewness0.102995Kurtosis-0.1005625%Q117110%167USS2984124CSS15950%Min1635%166CV2.324183StdMean0.4013861%164T:Mean=0430.2586Pr|T|0.0001
17、Range20Num=0100Num0100Q3-Q14M(Sign)50Pr=|M|0.0001Mode173SgnRank2525Pr=|S|0.0001W:Normal0.9671Pr|T|-6.80000005.2042717-1.30661890.2237-程序中如无vard;TheSASSystemVariableMeanStdErrorTProb|T|-X1125.90000005.162794224.38601930.0001X2132.70000003.415812938.84873200.0001D-6.80000005.2042717-1.30661890.2237-12
18、/7/202212/7/20222727成成组组t检验检验原理:原理:H0:SAS程序:程序:procttest;proc ttest;proc ttest;/*过程名 */class class ;/*分组变量名 */var var;/*分析变量名*/run;run;12/7/202212/7/20222828 例9:程序4-3data ttest3;do c=1 to 2;/*c循环开始,循环次数为2*/input n;/*输入n值*/do i=1 to n;/*i循环开始,循环次数为n*/input x;/*输入x 值,注意的合理使用*/output;/*output将x输出,循环语句中
19、必须使用。*/end;/*i循环结束*/end;/*c循环结束*/cards;5 279 334 303 338 198 3 229 274 310 ;proc print;proc ttest;class c;var x;run;12/7/202212/7/20222929/*循环的结果*/OBSCNIX11512792152334315330341543385155198623122972322748233310TTESTPROCEDUREVariable:XCNMeanStdDevStdError-15290.4000000056.9938593225.4884287523271.000
20、0000040.5832477823.43074903VariancesTDFProb|T|-Unequal0.56035.60.5971Equal0.50996.00.6284ForH0:Variancesareequal,F=1.97DF=(4,2)ProbF=0.727212/7/202212/7/20223030两样本含量相等时,可去除inputn;例10:data t;do c=1 to 2;do i=1 to 5;input x;output;end;end;cards;279 334 303 338 198 229 274 310 345 344 ;proc print;proc
21、 ttest;class c;var x;run;12/7/202212/7/20223131OBSCIX1112792123343133034143385151986212297222748233109243451025344TTESTPROCEDUREVariable:XCNMeanStdDevStdError-15290.4000000056.9938593225.4884287525300.4000000049.4398624622.11017865VariancesTDFProb|T|-Unequal-0.29647.80.7747Equal-0.29648.00.7745ForH0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医用 SAS 统计分析
限制150内