统计学专业课程第一章课后复习资料.doc
|第一章 描述性统计1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。1171221241291391071171301221251081311251171221331261221181081101181231261331341271231181121121341271231191131201231271351371141201281241151391281241211.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。数据特征:大多数人的日加工零件数在120到125之间。2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析原材料供应商员工编号1234567甲0.3790.3310.2590.2330.2230.2890.396甲0.4000.3050.2770.2310.4340.4750.329乙0.2670.3250.2990.3720.1570.2570.399乙0.0980.6170.2360.2190.3050.2120.334丙0.2660.4510.3040.4230.2740.2990.173丙0.2990.5460.3920.4340.3120.3180.218丁0.1220.3420.1760.2420.4270.2650.136丁0.2480.2580.2690.1720.3030.3900.034由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:考试成绩人数甲班乙班优36良615中189及格98不及格42 (1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。(2)比较两个班考试成绩分布的特点。(3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。 (1) (2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。(3)从上图可知,甲乙两班考试成绩的分布不相似。4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下:网民年龄151617181919192020212222232323242425272930313438(1)计算众数、中位数。(exlce数据分析:众数19,中位数22.5)(2)根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。(3)计算平均数和标准差(平均数是23.29,标准差是5.75)。(4)计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。(5)对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:min)如下: 排队时间5.56.66.76.87.17.37.47.87.8()计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。()比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离散系数是0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。() 如果让你选择一种排队方式,你会选择哪一种?试说明理由(选择第二种,因为平均等待时间短,而且离散程度小)。6. 在某地区抽取的120家企业按利润额进行分组,结果如下 按利润额分组企业数20030019300400304005004250060018600以上11合计120 (1)计算120家企业利润额的均值和标准差;(2)计算分布的偏态系数和峰态系数;() 画直方图,阶段企业利润的分布特性。(1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公式,得标准差为116。(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式得,峰度系数为2.29(3) 由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较小的企业占较大比重7. 2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位:辆)如下:国产车销售排行前10名销售量进口车销售排行前10名销售量福美来556丰田149夏利541现代102捷达370日产68松花江298奔驰30富康277宝马30哈飞路宝200大众汽车23高尔夫190克莱斯勒17东方之子181本田16长安奥拓145雷克萨斯10爱丽舍117奥迪6(1)画出国产汽车和进口汽车销售量的对比条形图和环形图。(2)分别画出国产汽车和进口汽车销售量的帕累托图。(1)(2)首先计算出各车的累计频率。然后制图。频数累计频率频数累计频率福美来556287519.34%19.34%丰田14945133.04%33.04%夏利541287518.82%38.16%现代10245122.62%55.65%捷达370287512.87%51.03%日产6845115.08%70.73%松花江298287510.37%61.39%奔驰304516.65%77.38%富康27728759.63%71.03%宝马304516.65%84.04%哈飞路宝20028756.96%77.98%大众汽车234515.10%89.14%高尔夫19028756.61%84.59%克莱斯勒174513.77%92.90%东方之子18128756.30%90.89%本田164513.55%96.45%长安奥拓14528755.04%95.93%雷克萨斯104512.22%98.67%爱丽舍11728754.07%100.00%奥迪64511.33%100.00%8. 对10名成年人和10名幼儿的身高(单位:cm)进行抽样调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?(1)离散系数,因为它消除了不同组数据水平高低的影响。(2)利用离散系数的公式,得成年组身高的离散系数:0.024 幼儿组身高的离散系数:0.035。由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
收藏
编号:2625348
类型:共享资源
大小:662.02KB
格式:DOC
上传时间:2020-04-25
8
金币
- 关 键 词:
-
统计学
专业课程
第一章
课后
复习资料
- 资源描述:
-
|
第一章 描述性统计
1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。
117
122
124
129
139
107
117
130
122
125
108
131
125
117
122
133
126
122
118
108
110
118
123
126
133
134
127
123
118
112
112
134
127
123
119
113
120
123
127
135
137
114
120
128
124
115
139
128
124
121
1.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。
数据特征:大多数人的日加工零件数在120到125之间。
2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析
原材料供应商
员工编号
1
2
3
4
5
6
7
甲
0.379
0.331
0.259
0.233
0.223
0.289
0.396
甲
0.400
0.305
0.277
0.231
0.434
0.475
0.329
乙
0.267
0.325
0.299
0.372
0.157
0.257
0.399
乙
0.098
0.617
0.236
0.219
0.305
0.212
0.334
丙
0.266
0.451
0.304
0.423
0.274
0.299
0.173
丙
0.299
0.546
0.392
0.434
0.312
0.318
0.218
丁
0.122
0.342
0.176
0.242
0.427
0.265
0.136
丁
0.248
0.258
0.269
0.172
0.303
0.390
0.034
由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。
3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩
人数
甲班
乙班
优
3
6
良
6
15
中
18
9
及格
9
8
不及格
4
2
(1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。
(2)比较两个班考试成绩分布的特点。
(3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。
(1)
(2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。
(3)
从上图可知,甲乙两班考试成绩的分布不相似。
4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下:
网民年龄
15
16
17
18
19
19
19
20
20
21
22
22
23
23
23
24
24
25
27
29
30
31
34
38
(1) 计算众数、中位数。(exlce数据分析:众数19,中位数22.5)
(2) 根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。
(3) 计算平均数和标准差(平均数是23.29,标准差是5.75)。
(4) 计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。
(5) 对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)
5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:min)如下:
排队时间
5.5
6.6
6.7
6.8
7.1
7.3
7.4
7.8
7.8
(1) 计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。
(2) 比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离散系数是0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。
(3) 如果让你选择一种排队方式,你会选择哪一种?试说明理由(选择第二种,因为平均等待时间短,而且离散程度小)。
6. 在某地区抽取的120家企业按利润额进行分组,结果如下
按利润额分组
企业数
200—300
19
300—400
30
400—500
42
500—600
18
600以上
11
合计
120
(1)计算120家企业利润额的均值和标准差;
(2)计算分布的偏态系数和峰态系数;
(3) 画直方图,阶段企业利润的分布特性。
(1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公式,得标准差为116。
(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式得,峰度系数为2.29
(3)
由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较小的企业占较大比重
7. 2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位:辆)如下:
国产车销售排行前10名
销售量
进口车销售排行前10名
销售量
福美来
556
丰田
149
夏利
541
现代
102
捷达
370
日产
68
松花江
298
奔驰
30
富康
277
宝马
30
哈飞路宝
200
大众汽车
23
高尔夫
190
克莱斯勒
17
东方之子
181
本田
16
长安奥拓
145
雷克萨斯
10
爱丽舍
117
奥迪
6
(1) 画出国产汽车和进口汽车销售量的对比条形图和环形图。
(2) 分别画出国产汽车和进口汽车销售量的帕累托图。
(1)
(2)首先计算出各车的累计频率。然后制图。
频数
累计频率
频数
累计频率
福美来
556
2875
19.34%
19.34%
丰田
149
451
33.04%
33.04%
夏利
541
2875
18.82%
38.16%
现代
102
451
22.62%
55.65%
捷达
370
2875
12.87%
51.03%
日产
68
451
15.08%
70.73%
松花江
298
2875
10.37%
61.39%
奔驰
30
451
6.65%
77.38%
富康
277
2875
9.63%
71.03%
宝马
30
451
6.65%
84.04%
哈飞路宝
200
2875
6.96%
77.98%
大众汽车
23
451
5.10%
89.14%
高尔夫
190
2875
6.61%
84.59%
克莱斯勒
17
451
3.77%
92.90%
东方之子
181
2875
6.30%
90.89%
本田
16
451
3.55%
96.45%
长安奥拓
145
2875
5.04%
95.93%
雷克萨斯
10
451
2.22%
98.67%
爱丽舍
117
2875
4.07%
100.00%
奥迪
6
451
1.33%
100.00%
8. 对10名成年人和10名幼儿的身高(单位:cm)进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
172
174
168
173
幼儿组
68
69
68
70
71
73
72
73
74
75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?
(2)比较分析哪一组的身高差异大?
(1)离散系数,因为它消除了不同组数据水平高低的影响。
(2))利用离散系数的公式,得成年组身高的离散系数:0.024 幼儿组身高的离散系数:0.035。由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
展开阅读全文
![提示](https://www.taowenge.com/images/bang_tan.gif)
淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。