sas数据分析结果.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《sas数据分析结果.doc》由会员分享,可在线阅读,更多相关《sas数据分析结果.doc(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 SAS结课论文 SAS是在1960年代末期由两位北卡州立大学(North Carolina State University)统计系的教授开发第一版的SAS只含一般线性模型的分析法,而且只适用于IBM的主机;1976年成立SAS公司负责软件的发展、维护并提供相关服务PC版本的SAS于1987年推出(V6.02),1989年推出SAS/PC(V6.04)版本;1997年下半年推出适用于多种操作系统的V6.12版本(Windows版);2000年2月又推出SAS系统V8版本,2001年推出SAS系统V8.2版本;目前SAS最新版本为V9.01在众多的统计软件中,SAS以运行稳定、功能强大而著称。
2、近20年来,SAS一直占据着统计软件的高端市场,用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。 SAS的功能模块:SAS系统由三十几个模块组成,其分析功能散布在几乎所有的模块之中,较为集中的具有统计分析功能的是SAS/BASE、SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS等一些模块,通过编程可以调用各种分析功能。 对于常用的一些统计分析方法,SAS系统
3、中的如下三种方法可以达到同样的目的: INSIGHT(“交互式数据分析”) Analyst(“分析家”) 直接编程方法一:区间分析1. 点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。 点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参数的置信区间的方法称为参数的区间估计。2. 参数的置信区间 在区间估计中,对于总体的未知参数,需要求出两个统计量1(X1,X2,.,Xn)和2(X1,X2,.,Xn)来
4、分别估计总体参数的上限和下限,使得总体参数在区间(1,2)内的概率为P1 2 = 1 其中1 称为置信水平,而(1,2)称为的置信区间,1,2分别称为置信下限和置信上限。置信水平为1 的含义是随机区间(1,2)以1 的概率包含了参数。3. 正态总体均值和方差的置信区间 参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。4. 总体比例与比例差的置信区间 实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记和P分别表示总体比例和样本比例,则当样本容量n很大时(一般当nP和n(1 P)均大于5时,就
5、可以认为样本容量足够大),样本比例P的抽样分布可用正态分布近似。分析步骤如下:1.对成交量做一个线图趋势统计:选择菜单“Analyze(分析)”“Line Plot (Y X)(分布)”,打开“Line Plot (Y X)”对话框。在数据集sryzc的变量列表中,选择DATA变量,单击“X”按钮,DATA变量被选定为X轴,然后选择RQMCL变量,单击“Y”按钮,如图左所示。单击“OK”按钮,即可得到线图如图所示。有线图可以看出成交量和成交额的关系2.成交量直方图: 首先在INSIGHT中打开数据集Mylib.sryzc 选择菜单“Analyze(分析)”“Histogram/Bar Char
6、t (Y)(直方图/条形图)”,打开“Histogram/Bar Chart (Y)”对话框。在数据集的变量列表中,选择Income变量,然后单击“Y”按钮。成交额的统计量这是一个(成对匹配)双样本均值检验问题,若1和2分别表示两套试卷的平均成绩,则检验的是: H0:1 2 = 0,H1:1 2 0;1) 在“分析家”中打开数据集Mylib.sjdf;2) 选择菜单“Statistics(统计)”“Hypothesis Tests(假设检验)”“Two Sample Paired t - Test for Means(均值的成对双样本t - 检验)”;3) 在打开的“Two Sample Pa
7、ired t - Test for Means”对话框中,并设置双样本均值检验,然后单击Plotsan按钮,在打开的对话框中选中 t distribution plot。两次单击“OK”按钮,得到结果如下图所示 结果显示,无论两总体的方差是否相等,t统计量的p值 = 0.0005 0.05,所以在95%的置信水平下,拒绝原假设,两总体的均值有显著差异。结果表明可以95%的把握认为股票中最新和昨收有显著差异。方法二:回归分析1. 回归模型变量Y与其他有关变量X1,X2,Xk的关系Y = f (X1,X2,Xk) + 称为“回归模型”,其中为均值为0的随机变量。当f为线性函数时,回归模型:Y =
8、0 + 1X1 + 2X2+ kXk+ 称为线性回归模型,本章主要讨论线性回归模型。特别地,当k = 1时称为一元线性回归模型。2. 回归分析的内容与目的 建立变量Y与X1,X2,Xk的经验公式(回归方程,预测公式),即从一组样本数据出发,确定出变量之间近似的数学关系式; 对经验公式的可信度进行检验; 判断每个自变量Xi(i = 1,2,k)对Y的影响是否显著; 对经验公式进行回归诊断(诊断经验公式是否适合这组数据); 利用合适的经验公式,根据自变量的取值对因变量的取值进行预测。3. 线性回归模型(Line Regression model)线性回归模型的一般形式为:Y = 0 + 1X1 +
9、 + kXk + 其中0,1,k,是未知的参数,是不可观测的随机变量,称为误差项,假定 N(0,2)。如果有n次独立的观测数据(xi1,xi2,xik;yi)i = 1,2,n,则线性回归模型可以表示成如下形式:其中1,2,n相互独立且服从N(0,2)分布。上式可以简写成如下矩阵形式:Y = X + 其中(1) 分析步骤选择主菜单“Statistics” “Regression” “Linear”,打开“Linear Regression(线性回归)”对话框,按顺序进行多元线性回归分析;此时显示的分析结果表明模型的作用是显著的(F统计量的值为1.072E7,p值0.00010.05 = )。参
10、数估计部分表明拟合的回归方程为:Chengjiaoe=-+chengjiaoliang+28998maiyijia1-3865.91895maiyijia2+0.14257maiyiliang1-0.09443maiyiliang2 (2) 逐步回归“分析家”中选择变量的方法很多,在上述步骤的“Linear Regression”对话框中,单击Model按钮,打开“Linear Regression:Model”对话框。 在“Method”选项卡中包含多种变量的选择方法,选择其中一种,例如选择“Backward elimination. 此时显示的分析结果为:参数估计部分表明拟合的回归方程为:
11、Chengjiaoe=-+chengjiaoliang+28998maiyijia1-3865.91895maiyijia2+0.14257maiyiliang1-0.09443maiyiliang2模型的R2为1.0000,C(p)值较小(仅为6.0000);方差分析中模型的作用也是显著的(F统计量的值为1.072E7,p值0.00010.05 = )。chengjiaoechengjiaoliangmaiyijia1maiyijia2maiyiliang1maiyiliang28.618.6211075618080630388.618.62241756942038.618.62268707
12、482168.618.622387078.618.62163695124578.618.6217375511178.618.62228290442438.618.621422898.628.637141388655208.628.636431383871578.628.6353313828624582108.628.63595138453448526678.628.6378113908.628.6378110038.628.63208919284948.618.6217082670704471638.618.621610138.618.621610163620328.618.621569122
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sas 数据 分析 结果
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内