《实验数据的计算机分析综合性实验 cfl.doc》由会员分享,可在线阅读,更多相关《实验数据的计算机分析综合性实验 cfl.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实验数据的计算机分析综合性实验一、 目的本综合性实验包括试验数据的整理、描述性统计分析、方差分析、回归分析及SAS的编程。做完本实验可使学生系统掌握数据分析技术及常用的统计分析软。二、 实验内容1. 用EXCEL对数据进行整理和描述性统计分析1) 用EXCEL对下表数据进行分组,列出次数分布表并作次数分布图。1772151979712315924511911913114915216710416121412517521911819217617595136199116165214951588313780138151187126196134206137989712914317917415916513
2、6108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159组限组中值(X)次数(f)67.582.575182.597.5902
3、97.5112.510510112.5127.512010127.5142.513515142.5157.515020157.5172.516525172.5187.518022187.5202.519514202.5217.52109217.5232.52257232.5247.52403247.5262.52552合计140次数分布图:2) 分别用分组数据和未分组数据计算平均数、方差、标准差等统计数,在EXCEL中所用到的函数分别为:AVERAGE()、VAR()和STDEV()等。样本平均数157.4786方差1313.115标准差36.236922. 用EXCEL进行常用统计分析如用E
4、XCEL可用加载宏功能,把“分析工具库”模块加载便可进行有关分析。1) 成对数据(相关样品)和成组数据(独立样品)的假设测验NO123456789101112131415A3.74.25.36.42.83.43.85.43.34.74.13.24.63.32.9B4.35.24.15.53.45.74.25.14.63.75.54.63.75.43.3d-0.6-1.01.20.9-0.6-2.3-0.40.3-1.31.0-1.4-1.40.9-2.1-0.4用下表数据分别作成对数据和成组数据的T测验,并分析其结果的异同。 成对数据的T假设检验:根据资料可以算得:n=15,=-0.48,=1
5、.2889,=1.1353,=0.2931,t=1.6377AB平均4.07334.553方差1.07070.664观测值1515泊松相关系数0.2644假设平均差0df14t Stat-1.638P(T=t) 单尾0.0619t 单尾临界1.7613P(T0.05, 即可认为A、B两组数据均数差异不显著。 成组数据的T假设检验:已知 =15,=4.07,=,=15,=4.55,=。可以算得:-=-0.48F-检验 双样本方差分析 AB平均4.07334.553方差1.07070.664观测值1515df1414F1.6122P(F0.05, 即可认为两总体方差相等。所以可以用t-检验: 双样
6、本等方差假设AB平均4.0733334.553333方差1.0706670.664095观测值1515合并方差0.867381假设平均差0df28t Stat-1.41145P(T=t) 单尾0.084563t 单尾临界1.701131P(T0.05, 说明两总体方差相等,差异不显著。两种方法都可检验,只是所得结果数值有差异。2) 单向分类和两向分类数据的方差分析番茄无土栽培试验的产量数据如下表,请分别作单向和两向分类资料的方差分析:培养液(A)观察值品种(B)B1B2 B3 B4A12430282624302826A22524212625242126A33027253030272530A42
7、122162121221621把分析结果分别填到下面两个方差分析表中,并作比较:单向分类方差分析:变因自由度平方和均方F值概率组间3155516666783783780002838误差1274616667总变异15229两向分类方差分析:变因自由度平方和均方F值概率A因素3155516666710.21978000295B因素3285951879121020355误差94555055556总变异152293) 简单和多元回归分析用以下数据分别作一元回归及多元回归分析并计算他们之间的相关系数。x1 x2 y26.7 73.4 50431.3 59 48030.4 65.9 52633.9 58.
8、2 51134.6 64.6 54933.8 64.6 55230.4 62.1 49627 71.4 47333.3 64.5 53730.4 64.1 51531.5 61.1 50233.1 56 49834 59.8 523一元回归分析(关于x1) 方差分析表:变因自由度平方和均方F值概率回归128092972809297724553300209633误差114265013877282总变异127074308回归方程:y=325.23+5.94 x1相关系数r=0.630169一元回归分析(关于x2) 方差分析表:变因自由度平方和均方F值概率回归11.1460431.1460430.0
9、017820.967082误差117073.162643.0147总变异127074.308回归方程:y=508.82+0.062 x2相关系数r=0.01272795多元回归分析(关于x1与x2) 方差分析表:变因自由度平方和均方F值概率回归25958.0412979.0226.687359.78183E-05误差101116.267111.6267总变异127074.308回归方程:y=-176.24+12.416x1+4.682 x2相关系数r=0.91771914) 卡平方测验三种职业的人在一次传染病流行中的发病人数如下表,请测验这种病是否与职业有关? 职业发病情况教师小贩司机发病健康3(19 )50(34 )20(18 )30(32)40(25 )30(45)Df=2 上表格中括号里的数据是理论值的话,可以求得2 = 35.35032 2 0.05 = 5.991465 2 0.01 =9.21034,可以判断差异极显著,即这种病的发病率与职业有关。另一种算法:若没有括号里的数据,则可以求得2 = 34.91612 2 0.05 = 5.991465 2 0.01 =9.21034,也可以判断差异极显著,即这种病的发病率与职业有关。7
限制150内