最新R语言统计分析作业.docx
《最新R语言统计分析作业.docx》由会员分享,可在线阅读,更多相关《最新R语言统计分析作业.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品资料R语言统计分析作业.T- read.table(G:/学习文件夹/R语言/R语言作业/5/住房状况调查.csv,header=TRUE,sep=,)1、对变量计划户型制作一张频数分布表,并绘制相应的图形,写出相应的结论(请写出R代码)table(T$计划户型)2、请对变量计划面积选择正确的图形进行描述,写出相应的结论(请写出R代码); hist(T$计划面积, col = lightgreen)3、对变量计划面积,计算样本数、平均值、中位数、修剪均值、样本标准差、偏态系数、峰态系数、最大值、最小值、上下四分位数,并对计划面积的分布特征进行综合分析(请写出R代码);t-na.omit(T
2、$计划面积)summary(t)library(psych)describe(t)根据第二题的直方图显示,计划面积的数据分布是非对称分布,其中位数为100,平均数为101.6,上四分位数为80.0,下四分位数为120.0,分位数之差是40.04、请选用合适的图形来展示变量计划户型和变量从业状况之间的关系,并进行独立性检验;(请写出R代码);t- na.omit(T)b-data.frame(t$从业状况,t$计划户型)a-table(b)barplot(a,main=从业状况与计划户型的关系,ylab=频数,col=c(rainbow(6),beside=TRUE)summary(assocs
3、tats(a) H0:计划户型与从业状况独立,即两个变量不关联;H1:计划户型与从业状况不独立,即两个变量关联;Pearson卡方检验结果表明,n=719,X-squared = 129.270, df = 50, p-value = 6.0761e-09,小于0.05, 拒绝原假设,Cramers V = 0.19,有证据表明计划户型与从业状况不独立。5、请选用合适的图形来展示变量户口状况和变量现住面积之间的关系;如果想分析变量户口状况是否对变量现住面积产生显著性影响,应该采取哪种统计分析方法?户口状况是否对变量现住面积产生显著性影响?为什么?(请写出R代码)c0.5)。本案例不满足单因素方
4、差分析的正态性条件。leveneTest(家庭收入文化程度,data=T)总体方差齐性可以使用levene检验,根据levene检验,F值为22.908,p值为1.168e-14,拒绝原假设,有证据证明不同教育水平的家庭收入的总体方差不相等。因此本案例不符合单因素方差分析的应用条件,故采用非参数中的Kruskal-Wallis检验。原假设:不同文化程度的人民其家庭收入的中位数相等;备择假设:不同文化程度人民的家庭收入的中位数不全相等;检验统计量Chi-Square为452.43,p值非常小,小于0.05,拒绝原假设,有证据证明不同文化程度人民的家庭收入的中位数不全相等。7、请选用合适的图形来展
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 语言 统计分析 作业
限制150内