《概率统计SAS应用.doc》由会员分享,可在线阅读,更多相关《概率统计SAS应用.doc(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、直方图 横向直方图把 vbar 改成 hbardata ex;input x ;cards;70 72 94 24 68 57 90 185 95 93;proc gchart;vbar x/type=pct;run;计算数字特征(均值Mean 方差Variance 标准差Std Deviation 偏度Skewness 峰度Kurtosis 众数Mode 中位数Median 极差Range)(1) 不需要输入频数data ex;input x ;cards;1 2 2 3 3 3 4 5 6 7 8;proc univariate vardef=n;run;(2)需要输入频数data ex;
2、input x f ;cards;5.5 4 7.5 11 9.5 17 11.5 23 13.5 18 15.5 14 17.5 10 19.5 3;proc univariate vardef=n;var x;freq f;run;计算标准正态分布的概率data ex; input x;p=probnorm(x); cards;1.645 1.96 2.576;proc print;run;计算标准正态分布分位数data ex; input p; u=probit(p);cards;0.025 0.05 0.1 0.9 0.95 0.975;proc print;run;计算标准正态分布双
3、侧分位数data ex;input x;p=1-x/2;u=probit(p);cards;0.1 0.05 0.01;proc print;run;计算卡方分布分位数data ex;input p df;c=cinv(p,df);cards;0.025 4 0.05 4 0.1 4 0.9 4 0.95 4 0.975 4;proc print;run;计算t分布分位数(在log窗口看数据)data ex;do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975;t=tinv(p,df);put p df t;end;end;run;计算F分布分位数 data e
4、x;input p df1 df2;f=finv(p,df1,df2);cards;0.025 3 4 0.05 3 4 0.1 3 4 0.9 3 4 0.95 3 4 0.975 3 4;proc print;run;一个正态总体均值的置信区间data ex;input x ;cards;6.6 4.6 5.4 5.8 5.5;proc means mean std clm;proc means mean std clm alpha=0.1;run;两个正态总体均值差的置信区间data ex;do a=1 to 2;input n ;do i=1 to n;input x ;output;
5、end;end;cards;6 2.1 2.35 2.39 2.41 2.44 2.564 2.03 2.28 2.58 2.71;proc anova;class a;model x=a;means a/lsd cldiff;means a/lsd cldiff alpha=0.1;run;一个正态总体均值假设检验 原假设是x的均值为15data ex;input x ;y=x-15;cards;10.4 12 13.2 13.7 14.6 15.1 15.5 15.9;proc means mean std t prt;var y;run;两个正态总体均值假设检验 Pr |t|对应原假设是
6、两均值相等Pr F对应原假设是两方差相等data ex;do a=1 to 2;do i=1 to 8;input x ;output;end;end;cards;8.6 8.7 5.6 9.3 8.4 9.3 7.5 7.9 8 7.9 5.8 9.1 7.7 8.2 7.4 6.6;proc ttest;class a;var x;run;两个配对样本均值假设检验data ex;input x1 x2 ;d=x1-x2;cards;114 94 117 114 155 125 114 98 119 121 102 95 140 104 91 95 135 106 114 92;proc m
7、eans t prt;var d;proc print;run;总体分布的卡方检验 原假设是X总体服从某个指定的分布 k的最后一个值比c小则接受原假设data ex;input n np;k+(n-np)*2/np;c=cinv(0.95,6);cards;6 7.8 16 13.23 17 18.52 26 19.44 11 16.33 9 11.43 9 6.86 6 6.26;proc print;var k c;run;正态性检验 原假设是总体X服从正态分布 看 Pr F对应原假设是各组均值相等,置信区间后的 Pr F对应原假设是各组方差相等(1) 不等重复的情形data ex;do
8、a=1 to 3;input n ;do i=1 to n;input x ;Output;end;end;cards;8 21 29 24 22 25 30 27 26 10 20 25 25 23 29 31 24 26 20 21 6 24 22 28 25 21 26;proc anova;class a;model x=a; means a/lsd duncan cldiff;means a/hovtest;run;(2) 等重复的情形data ex;do a=1 to 4;do i = 1 to 4;input x;output;end;end;cards;19 23 21 13
9、21 24 27 20 20 18 19 15 22 25 27 22;proc anova;class a;model x=a; means a/lsd duncan cldiff;means a/hovtest;run;双因素试验方差分析 原假设是按a、b分组各组均值都相等data ex;do a =1 to 4; do b=1 to 5;input x ; output; end; end;cards;53 56 45 52 49 47 50 47 47 53 57 63 54 57 58 45 52 42 41 48;proc anova; class a b; model x=a b;means a b/duncan alpha=0.01; run; 线性回归 Pr F对应原假设是回归系数等于0,也就是假设x与Y不是线性关系 然后Intercept和x分别对应回归方程的a和b值 方程为y=a+bxdata ex;input x y ;cards;1.5 4.8 1.8 5.7 2.4 7 3 8.3 3.5 10.9 3.9 12.4 4.4 13.1 4.8 13.6 5 15.3 2; proc gplot;plot y*x;symbol i=rl v=dot;proc reg;model y=x/cli;run;
限制150内