-*
实验5 R绘图(二)
一、 实验目的:
1. 熟练掌握描述性统计分析中常用的统计量;
2. 掌握R语言的高水平作图命令;
3. 掌握R语言的低水平作图命令;
4. 掌握多元数据的三个数据特征:均值向量、协方差矩阵、相关系数矩阵。
二、 实验内容:
练习:
要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“1305543109张立1”,表示学号为1305543109的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。
截图方法:
法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。
法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)
1. 自行完成教材P130页开始的3.3-3.4节中的例题。
2. (习题3.5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下表所示,试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?
白鼠试验数据
菌型
存活天数
1
2
4
3
2
4
7
7
2
2
5
4
2
5
6
8
5
10
7
12
12
6
6
3
7
11
6
6
7
9
5
5
10
6
3
10
注:平均存活天数其实应该是均值,但当不知道总体的分布时,通常是比较中位数。因此,这里考虑用箱线图中的中位数来进行比较。
解:源代码:
y<-c(2,4,3,2,4,7,7,2,2,5,4,
5,6,8,5,10,7,12,12,6,6,
7,11,6,6,7,9,5,5,10,6,3,10)
f<-factor(c(rep(1,11),rep(2,10),rep(3,12)))
plot(f,y)
A<-c(2,4,3,2,4,7,7,2,2,5,4)
B<-c(5,6,8,5,10,7,12,12,6,6)
C<-c(7,11,6,6,7,9,5,5,10,6,3,10)
boxplot(A,B,C)
运行截图:
结论:
从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异
3. (习题3.6)绘出习题3.16关于3项指标的离散图,从图中分析例3.16的结论的合理性。
序号
硬度X1
变形X2
弹性X3
1
65
45
27.6
2
70
45
30.7
3
70
48
31.8
4
69
46
32.6
5
66
50
31.0
6
67
46
31.3
7
68
47
37.0
8
72
43
33.6
9
66
47
33.1
10
68
48
34.2
注:1.绘出的图形类似教材P133页的图3.8。
2. 把上述表格分复制到记事本中即可实现表格转化为文本,再用read.table()函数存入到数据框中即可,避免输入麻烦。
解:源代码:
> df<-read.table("例3.6_data", header=T)
> df
> pairs(df)
运行截图:
结论:
具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系)。但从上图可知所有的图中都没有这样的趋势,故均不相关。
4. (习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),具体数据如下表所示。
(1) 试绘出体重对于身高的散点图;
(2) 绘出不同性别情况下,体重与身高的散点图;(coplot(a~b|c))
(3) 绘出不同年龄段的体重与身高的散点图;
(4) 绘出不同性别和不同年龄段的体重与身高的散点图。(coplot(a~b|c+d))
学号
姓名
性别
年龄
身高
体重
01
Alice
F
13
56.5
84.0
02
Becka
F
13
65.3
98.0
03
Gail
F
14
64.3
90.0
04
Karen
F
12
56.3
77.0
05
Kathy
F
12
59.8
84.5
06
Mary
F
15
66.5
112.0
07
Sandy
F
11
51.3
50.5
08
Sharon
F
15
62.5
112.5
09
Tammy
F
14
62.8
102.5
10
Alfred
M
14
69.0
112.5
11
Duke
M
14
63.5
102.5
12
Guido
M
15
67.0
133.0
13
James
M
12
57.3
83.0
14
Jeffrey
M
13
62.5
84.0
15
John
M
12
59.0
99.5
16
Philip
M
16
72.0
150.0
17
Robert
M
12
64.8
128.0
18
Thomas
M
11
57.5
85.0
19
William
M
15
66.5
112.0
解:源代码:
> ef<-read.table(file.choose(),header=T);ef
> attach(ef)
> plot(体重~身高)
> coplot(体重~身高|性别)
> coplot(体重~身高|年龄)
> coplot(体重~身高|年龄+性别)
运行截图:
5. (习题3.8)画出函数z = x4 − 2x2y + x2 − 2xy + 2y2 + 9x/2 − 4y + 4 在区域 −2 ≤ x ≤ 3,−1 ≤ y ≤ 7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100,共15条。(注:在三维图形中选择合适的角度)
解:源代码:
x<-seq(-2,3,0.05)
y<-seq(-1,7,0.05)
f<-function(x,y) x^4-2*x^2*y+x^2-2*x*y+2*y^2+9*x/2-4*y+4
z<-outer(x,y,f)
contour(x,y,z,levels=c(0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100),col="black")
> persp(x,y,z,theta=30,phi=30,expand=0.7,col="lightblue")
运行截图:
6. (习题3.9)用Pearson相关检验法检验习题3.7中的身高与体重是否相关。
解:源代码:
cor.test(身高,体重)
运行截图:
结论:
其P值为7.887e-07<0.05,拒绝原假设,认为变量身高与体重相关。
7. (习题3.10)绘出例3.17中48号求职者数据的星图。(数据见文档最后)
(1) 以15项自变量FL,APP,…,SUIT为星图的轴;
(2) 以G1,G2,…,G5为星图的轴。(提示:先)
通过这些星图,能否说明应选哪6名应聘者。为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数。
提示:第(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:
G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7
G2<-(FL+EXP+SUIT)/3
G3<-(LA+HON+KJ)/3
G4<-AA
G5<-APP
再将G1,…,G5这5个列向量(即48行5列数据)赋值一个新的数据框,再按第(1)小题的方法绘出星图。
解:源代码:
> X<-read.csv("applicant.csv")
> stars(X)
> attach(X)
> X$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7
>X$G2<-(FL+EXP+SUIT)/3
> X$G3<-(LA+HON+KJ)/3
> X$G4<-AA
> X$G5<-APP
>rt<-scale(X[,17:21])
>stars(rt)
运行截图:
思考:
1. R语言的高水平作图函数与低水平作图函数的主要区别是什么?
所谓高水平函数是与低水平作图函数相对应的,即所有的绘图函数均可产生图形,可以有坐标轴,以及图和坐标轴的说明文字。
2. plot()函数除了能画出散点图外,还能画什么图?能画出曲线图吗?
曲线图,箱线图;能
3. 多元数据主要有哪三个数据特征指标?
均值向量、协方差矩阵、相关系数矩阵
4. 相关检验的原假设是什么?
总体X,Y不相关
5. 多元数据的图形表示方法主要有哪几种图?
轮廓图,星图,调和曲线图
三、 实验小结(必写,但字数不限)
本次实验,主要是在星图方面有些阻碍,用不同的函数读取的结果会不一样,有时还读不出来,最终还是把数据存入excel中,才能成功。要学会描述性统计分析中常用的统计量,高水平作图函数与低水平图函数的区别。
附:
48名应聘者的得分情况
ID
FL
APP
AA
LA
SC
LC
HON
SMS
EXP
DRV
AMB
GSP
POT
KJ
SUIT
1
6
7
2
5
8
7
8
8
3
8
9
7
5
7
10
2
9
10
5
8
10
9
9
10
5
9
9
8
8
8
10
3
7
8
3
6
9
8
9
7
4
9
9
8
6
8
10
4
5
6
8
5
6
5
9
2
8
4
5
8
7
6
5
5
6
8
8
8
4
4
9
5
8
5
5
8
8
7
7
6
7
7
7
6
8
7
10
5
9
6
5
8
6
6
6
7
9
9
8
8
8
8
8
8
10
8
10
8
9
8
10
8
9
9
9
8
9
9
8
8
10
9
10
9
9
9
10
9
9
9
7
8
8
8
8
5
9
8
9
8
8
8
10
10
4
7
10
2
10
10
7
10
3
10
10
10
9
3
10
11
4
7
10
0
10
8
3
9
5
9
10
8
10
2
5
12
4
7
10
4
10
10
7
8
2
8
8
10
10
3
7
13
6
9
8
10
5
4
9
4
4
4
5
4
7
6
8
14
8
9
8
9
6
3
8
2
5
2
6
6
7
5
6
15
4
8
8
7
5
4
10
2
7
5
3
6
6
4
6
16
6
9
6
7
8
9
8
9
8
8
7
6
8
6
10
17
8
7
7
7
9
5
8
6
6
7
8
6
6
7
8
18
6
8
8
4
8
8
6
4
3
3
6
7
2
6
4
19
6
7
8
4
7
8
5
4
4
2
6
8
3
5
4
20
4
8
7
8
8
9
10
5
2
6
7
9
8
8
9
21
3
8
6
8
8
8
10
5
3
6
7
8
8
5
8
22
9
8
7
8
9
10
10
10
3
10
8
10
8
10
8
23
7
10
7
9
9
9
10
10
3
9
9
10
9
10
8
24
9
8
7
10
8
10
10
10
2
9
7
9
9
10
8
25
6
9
7
7
4
5
9
3
2
4
4
4
4
5
4
26
7
8
7
8
5
4
8
2
3
4
5
6
5
5
6
27
2
10
7
9
8
9
10
5
3
5
6
7
6
4
5
28
6
3
5
3
5
3
5
0
0
3
3
0
0
5
0
29
4
3
4
3
3
0
0
0
0
4
4
0
0
5
0
30
4
6
5
6
9
4
10
3
1
3
3
2
2
7
3
31
5
5
4
7
8
4
10
3
2
5
5
3
4
8
3
32
3
3
5
7
7
9
10
3
2
5
3
7
5
5
2
33
2
3
5
7
7
9
10
3
2
2
3
6
4
5
2
34
3
4
6
4
3
3
8
1
1
3
3
3
2
5
2
35
6
7
4
3
3
0
9
0
1
0
2
3
1
5
3
36
9
8
5
5
6
6
8
2
2
2
4
5
6
6
3
37
4
9
6
4
10
8
8
9
1
3
9
7
5
3
2
38
4
9
6
6
9
9
7
9
1
2
10
8
5
5
2
39
10
6
9
10
9
10
10
10
10
10
8
10
10
10
10
40
10
6
9
10
9
10
10
10
10
10
10
10
10
10
10
41
10
7
8
0
2
1
2
0
10
2
0
3
0
0
10
42
10
3
8
0
1
1
0
0
10
0
0
0
0
0
10
43
3
4
9
8
2
4
5
3
6
2
1
3
3
3
8
44
7
7
7
6
9
8
8
6
8
8
10
8
8
6
5
45
9
6
10
9
7
7
10
2
1
5
5
7
8
4
5
46
9
8
10
10
7
9
10
3
1
5
7
9
9
4
4
47
0
7
10
3
5
0
10
0
0
2
2
0
0
0
0
48
0
6
10
1
5
0
10
0
0
2
2
0
0
0
0
展开阅读全文