数据分析实验报告分析解析.doc
《数据分析实验报告分析解析.doc》由会员分享,可在线阅读,更多相关《数据分析实验报告分析解析.doc(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实验课程:实验课程: 数据分析数据分析 专专 业:业: 信息与计算科学信息与计算科学 班班 级:级: 学学 号:号: 姓姓 名:名: 中北大学理学院2实验一 SAS 系统的使用【实验目的】了解 SAS 系统,熟练掌握 SAS 数据集的建立及一些必要的 SAS 语句。【实验内容】1. 将 SCORE 数据集的内容复制到一个临时数据集 test。SCORE 数据集NameSexMathChineseEnglish Alicef908591 Tomm958784 Jennyf939083 Mikem808580 Fredm848589 Katef978382 Alexm929091 Cookm757
2、876 Bennief827984 Hellenf857484 Wincelet f908287 Buttm778179 Geogem868582 Todm898484 Chrisf898487 Janetf866587 2将 SCORE 数据集中的记录按照 math 的高低拆分到 3 个不同的数据集:math大于等于 90 的到 good 数据集,math 在 80 到 89 之间的到 normal 数据集,math 在 80 以下的到 bad 数据集。3将 3 题中得到的 good,normal,bad 数据集合并。【实验所使用的仪器设备与软件平台】SAS【实验方法与步骤】1:DATA S
3、CORE; INPUT NAME $ Sex $ Math Chinese English; CARDS;3Alicef908591 Tom m958784 Jennyf939083 Mikem808580 Fredm848589 Katef978382 Alexm929091 Cookm757876 Bennief827984 Hellenf857484 Wincelet f908287 Buttm778179 Geogem868582 Tod m898484 Chrisf898487 Janetf866587 ; Run;PROC PRINT DATA=SCORE; DATA test;
4、SET SCORE;2:DATA good normal bad;SET SCORE;SELECT;when(math=90) output good;when(math=80when(math80) output bad;end;Run;PROC PRINT DATA=good;PROC PRINT DATA=normal;PROC PRINT DATA=bad;3:DATA All;SET good normal bad;PROC PRINT DATA=All;Run;4【实验结果】结果一:结果二:5结果三:6实验二 上市公司的数据分析【实验目的】通过使用 SAS 软件对实验数据进行描述性
5、分析和回归分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表 2 是一组上市公司在 2001 年的每股收益(eps) 、流通盘(scale)的规模以及 2001 年最后一个交易日的收盘价(price). 表 2 某上市公司的数据表代码流通盘每股收益股票价格00009685000.05913.2700009960000.02814.200015012600-0.0037.12000151105000.02610.0800015325000.05622.7500015513000-0.0096.8500015636000.03314.95000157100000.0612.
6、65000158100000.0188.3800015970000.00812.15000301153650.047.3100048877000.10113.2600072560000.04412.3300083513380.0722.5800086932000.19418.290008777800-0.08412.550008856000-0.07312.48000890169340.0319.12000892120000.0317.88000897141660.0026.91000900214230.0588.5900090148000.00527.950009026500-0.03110
7、.9200090360000.10911.7900090595000.0469.2900090666500.00714.4700090889880.0068.2800090960000.0029.9900091080000.0368.900091172800.0679.01000912150000.1128.0600091384500.06211.8600091545990.00114.4000916340000.0385.15000917118000.08616.230009186000-0.04510.1271、对股票价格1)计算均值、方差、标准差、变异系数、偏度、峰度;2)计算中位数,上
8、、下四分位 数,四分位极差,三均值;3)作出直方图;4)作出茎叶图;5)进行正态性检验(正态 W 检验) ;6)计算协方差矩阵,Pearson 相关矩阵;7)计算 Spearman 相关矩阵;8)分析各指标间的相关性。2、1)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估 计值及残差;2)给定显著性水平 =0.05,检验回归关系的显著性,检验各自变量对因 变量的影响的显著性;3)拟合残差关于拟合值的残差图及残差的正态 QQ 图。分析1212,Y XXX X及这些残差,并予以评述。【实验所使用的仪器设备与软件平台】SAS【实验方法与步骤】data prices;input num
9、 scale eps price;cards;000096 85000.05913.27000099 60000.02814.2000150 12600-0.003 7.12000151 105000.02610.08000153 25000.05622.75000155 13000-0.009 6.85000156 36000.03314.95000157 100000.0612.65000158 100000.0188.38000159 70000.00812.15000301 153650.047.31000488 77000.10113.26000725 60000.04412.330
10、00835 13380.0722.58000869 32000.19418.298000877 7800-0.084 12.55000885 6000-0.073 12.48000890 169340.0319.12000892 120000.0317.88000897 141660.0026.91000900 214230.0588.59000901 48000.00527.95000902 6500-0.031 10.92000903 60000.10911.79000905 95000.0469.29000906 66500.00714.47000908 89880.0068.28000
11、909 60000.0029.99000910 80000.0368.9000911 72800.0679.01000912 150000.1128.06000913 84500.06211.86000915 45990.00114.4000916 340000.0385.15000917 118000.08616.23000918 6000-0.045 10.12run;PROC PRINT DATA=prices;run;proc means data=prices mean var std skewness kurtosis cv;var price;output out=result;
12、run;proc univariate data=prices plot freq normal;var price;output out=result2;run;proc capability data=prices graphics noprint;histogram price/normal;run;proc corr data=prices pearson spearman cov nosimple;var price;with price;run;proc reg data=prices;model price=scale eps/selection=backward noint p
13、 r;output out =prices p=p r=r;proc print data=prices;9run【实验结果】101112对于问题二结果:131415实验三 美国 50 个州七种犯罪比率的数据分析【实验目的】通过使用 SAS 软件对实验数据进行主成分分析和因子分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表 3 给出的是美国 50 个州每 100 000 个人中七种犯罪的比率数据。这七种犯罪是:Murder(杀人罪) ,Rape(强奸罪) ,Robbery(抢劫罪) , Assault(斗殴罪) ,Burglary(夜盗罪) ,Larceny(偷盗罪)
14、 ,Auto(汽车犯罪) 。表 3 美国 50 个州七种犯罪的比率数据StateMurderRapeRobberyAssaultBurglaryLarcenyAutoAlabama14.225.296.8278.31135.51881.9280.7Alaska10.851.696.8284.01331.73369.8753.3Arizona9.534.2138.2312.32346.14467.4439.5Arkansas8.827.683.2203.4972.61862.1183.4California11.549.4287.0358.02139.43499.8663.5Colorado6.
15、342.0170.7292.91935.23903.2477.1Connecticut4.216.8129.5131.81346.02620.7593.2Delaware6.024.9157.0194.21682.63678.4467.0Florida10.239.6187.9449.11859.93840.5351.4Georgia11.731.1140.5256.51351.12170.2297.9Hawaii7.225.5128.064.11911.53920.4489.4Idaho5.519.439.6172.51050.82599.6237.6Illinois9.921.8211.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 实验 报告 解析
限制150内