统计学课程实验指导书.doc
《统计学课程实验指导书.doc》由会员分享,可在线阅读,更多相关《统计学课程实验指导书.doc(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实验一 统计数据的搜集与整理一、实验目的培养学生处理数据的基本能力。通过本实验,学生应开始了解Excel 2003的操作界面,在有效搜集数据资源的基础上,利用软件完成数据的输入、导入、保存、编码、分类(组)、筛选、排序等数据整理工作。二、实验手段计算机、Excel 2003三、实验要求(1)熟悉Excel 2003的基本操作界面;(2)熟悉间接数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据;(3)了解直接数据的搜集;(4)掌握不同类型的数据的处理方法,尤其是注意Excel 2003在数据输入、导入等方面的区别,掌握数据文件的建立和保存方法。(5)掌握数据的编码、分类(组)、筛选、排序等整
2、理操作的方法。四、实验内容(一)数据的搜集统计数据主要来源于两种渠道:一种是来源于别人的调查或实验数据,称为间接数据;另一种是来源于科学实验或者直接的调查数据,称为直接数据。1.间接数据的搜集间接统计数据主要是公开出版或报道的数据,可以通过年鉴、期刊、报纸、广播、电视等途径搜集获取。在网络广泛普及的今天,通过网络搜集间接数据已经成为了一种主流手段。一般,在网络上搜集数据可以采用两种方式。一种方式是直接进入网站查询数据。比如,要搜集四川省成都市2008年经济数据,你可以进入网址图1-1进入统计数据页面,选择其中的统计年鉴,如图1-2所示。图1-2进入统计年鉴页面,点击2008年年度数据,就可以下
3、载和查看成都市2008年的年鉴经济数据文件了。如图1-3所示。图1-3常见的统计数据获取网站可见表1-1。表1-1 常见的统计数据网站网站名称网址简介中华人民共和国国家统计局提供全国的月度数据、季度数据、年度数据、普查数据、专题数据、部门数据和国际数据各地方统计局及国外统计网站可以从国家统计局的网站链接目录,链接进入各地方统计局及国外统计网站,获取统计数据中国人口信息网提供有关人口统计的公报、专题抽样调查数据、常用人口数据等中国经济信息网提供宏观经济信息、地区经济信息、行业经济信息、国际经济信息、专业统计数据等中宏数据库涵盖了20世纪90年代以来宏观经济、区域经济、产业经济、投资消费、统计数字
4、、研究报告等方面的详尽内容第二种通过网络获取二手数据的方式是使用搜索引擎。比如,我们可以使用谷歌网站,搜索四川省成都市2008年经济数据。在浏览器地址栏中输入.hk ,进入谷歌搜索网站,在搜索框中输入“成都市2008年经济数据”,如图1-4所示。图1-4单击“Google 搜索”按钮,获得搜索结果如图1-5所示,可以在搜索显示出的结果中,选择链接进入查看是否符合自己的搜索目标。图1-5实例操作:例:查询北京市2008年的人口数。方法一:查询2009年北京统计年鉴,可通过纸质年鉴,也可以通过网络获取。如果通过网络获取,步骤如下:第一步:浏览器中输入地址第二步:选择“统计数据年度数据”,在年度选择
5、下拉框中选择2009年,点击查询,进入北京市2009年度统计年鉴,界面如图1-6所示;图1-6第三步:在年鉴中点击“3-1人口状况(1978-2008年)”,内容如图1-7所示。图1-7第四步:查询得到北京市2008年常住人口1695.0万人,户籍人口1229.9万人。方法二:通过搜索网站。步骤如下: 第一步:浏览器中输入地址,进入谷歌搜索网站;第二步:在搜索框中输入“北京市2008年人口数”;第三步:单击“Google 搜索”按钮,获得搜索结果,如图1-8所示;图1-8第四步:点击“2008年中国各城市人口数量 广阔天地 新浪博客”这一搜索结果,得到北京市2008年人口数为1633万人(如图
6、1-9所示)。图1-92.直接数据的搜集直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。本实验主要介绍抽样调查取得直接数据的方法。抽样调查的步骤如图1-10所示:调查方案设计调查问卷设计问卷发放问卷收回数据初步整理图1-10实例操作:例:大学生生活费收支状况调查步骤一:调查方案设计一、调查方案:(一)调查目的:通过了解大学生日常收入和消费的主要状况,为学校的助学政策提供参考,同时为大学生消费市场的开发提供一定的参考。(二)调查对象:西南科技大学经济管理学院在校本科大学生(三
7、)调查单位:抽取的样本学生(四)调查程序:1.设计调查问卷,明确调查方向和内容2.分发调查问卷。随机抽取该大学大一至大四的在校本科大学生,每一年级随机抽出男、女生各30人左右作为调查单位3.根据回收的有效问卷进行分析,具体内容如下:(1)根据样本的生活费来源、分布状况的均值、方差等分布的数字特征,推断西南科技大学经济管理学院大学生总体分布的相应参数;(2)根据性别进行男女两个总体生活费均值之差的比较以及方差比的区间估计;(3)对四个年级的在校本科生进行四个总体生活费均值之差及方差比的区间估计;(4)绘制统计图形使样本数据直观化并对统计量进行分析。(五)调查时间:年月日年月日步骤二:问卷设计在明
8、确了调研的目的后,应该思考数据搜集的方法,确定问题的回答方式和问题的用词方式,使得问卷易于回答且不会产生歧义。完成初步问卷的设计和编排后,征询相关方面的意见,通过小范围测试或反复修订,得到最终的问卷,用于实施发放。大学生收支调查问卷同学:您好,请配合我们完成以下调查问卷,请在符合您的实际情况的选项下画“”Q1.您的性别:A.男 B.女Q2.您的年级:A.大一 B.大二 C.大三 D.大四Q3.您的月生活费支出在: A.300元以下 B.300-400元 C.400-500元D.500-600元 E.600-700元 F.700元以上Q4.您的生活费主要来源依次是: A.父母 B.勤工俭学 C.
9、助学贷款 D.其他 (请注明)请排序:Q5.您的各项开支为(单位:元) A.伙食费 B.衣着 C.学习用品 D.日化用品 E.娱乐休闲 F.其他 非常感谢您的合作!步骤三:问卷的发放与收回本次调查采取分层抽样,对在校本科生各个年级男、女各发放问卷30份左右;共发放问卷份,回收问卷份,其中有效问卷份。各年级男女生回收有效问卷具体情况:大一: (男生)份 (女生)份大二: (男生)份 (女生)份大三: (男生)份 (女生)份大四: (男生)份 (女生)份(二)数据的整理1.Excel的数据整理及数据文件的建立首先,大家应该熟悉Excel的操作界面。(1)数据的编码 编码是对数据进行初步分组和确定数
10、字代码的过程。它可以把复杂的文字用简单的代码代替,有利于简化数据输入和处理。一般直接数据如果是由封闭式问题获取,那么涉及问题的时候就已经对答案进行了预编码。如果数据是由开放式的问题来获取的,那么,需要对答案进行罗列、合并、设码三个过程来完成编码工作。(2)数据的录入 数据的录入是将搜集到的数据直接输入到数据库文件中。数据录入既要讲究效率,又要保证质量。Excel的数据录入操作比较简单,一般只要在工作表中,单击激活一个单元格就可以录入数据了。单元格的切换可以使用鼠标,也可以在激活一个单元格以后用Enter键(或者Tab)键,向下(或者向右)切换单元格。在单元格内部的换行可以使用“Alt+Ente
11、r”。当然,数据录入中最重要的还是要保证数据形式完整和性质正确。这就需要通过“格式-单元格格式”(Ctrl+1)菜单来实现。对于录入重复数据,大家一般都习惯使用复制功能(Ctrl+C),但是Excel在简单复制数据时不能保证格式的完整性,这个时候,就需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。对于未输入(或未确定格式)的数据,想要实现和已经输入数据相同的格式要求,则可以使用工具栏中的“格式刷”。 (3)数据文件的导入 Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。这样,大家就不必要掌握那么多纷繁复杂的软件,方便提高工作效率,也方便
12、协同处理数据。Excel支持文本文件、Office数据库文件、网页文件、Dbase文件、Paradox文件、Xml文件等多种外部数据源的导入。导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。(4)数据的筛选 数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。“自动筛选”使用“数据-筛选-自动筛选”菜单,通过下拉箭头的选择来实现筛选。一般用于简单的条件筛选,筛选时将不满足条件的数据暂时隐藏起来,只显示符合条件的数据。如果在下拉箭头中选
13、择“自定义”,自动筛选还可以根据条件筛选出数据在某一范围内符合条件的记录,自定义中可以用“与”、“或”来约束区分条件。此外,使用“自动筛选”还可同时对多个字段进行筛选操作,此时各字段间限制的条件只能是“与”的关系。“高级筛选” 使用“数据-筛选-高级筛选”菜单,调用对话框来实现筛选。一般用于条件较复杂的筛选操作,其筛选的结果可显示在原数据表格中,不符合条件的记录被隐藏起来;也可以在新的位置显示筛选结果,不符合的条件的记录同时保留在数据表中而不会被隐藏起来,这样就更加便于进行数据的比对了。高级筛选需要在单元格或区域内输入筛选条件,由于Excel的筛选只认列数据,所以列标题成为筛选的标题依据。列标
14、题下可以输入筛选的条件,条件放在同一行表示“与”的关系,条件不在同一行表示“或”的关系。(5)数据的排序 数据的排序是将数据的次序排列整理并显示出来的过程。排序在显示数据的序数排列结果的同时,也有利于方便的查询某些数据,比如:最大、最小等。 Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。“数据-排序”菜单可进行最多三级的条件排列。同时,“数据-排序”菜单还可进行自定义排序,来实现那些直观从数据、时间、文本或字母上排序无意义的数据排序特殊要求。一般要自定义特
15、殊的排序要求,需要先使用“工具-选项-自定义序列”,手工输入新的排序序列,然后在“数据-排序”菜单打开的排序对话框中点击“选项”,在新弹出的对话框的“自定义排序次序”下拉框中选择手工输入的排序次序。 此外,Excel分析工具库宏中的“排位与百分比排位”工具,也能部分实现显示排序结果的功能。其调用菜单为“工具-数据分析-排位与百分比排位”。(6)数据文件的保存 保存经过初步处理的Excel数据文件。可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。实验二 描述数据的图表方法一、实验目的通过软件辅助,将数据转化成为直观的统计表和生动形象的统计图。二、实验手段计算机、
16、Excel 2003三、实验要求(1)熟练掌握Excel 2003的统计制表功能;(2)熟练掌握Excel 2003的统计制图功能;(3)掌握各种统计图、表的功能,并能准确的根据不同对象的特点加以应用。四、实验内容(一)制作频数频率表1.使用Frequency 函数语法:FREQUENCY(data_array,bins_array)参数:data_array是用来计算频率一个数组,或对数组单元区域的引用。bins_array 是数据接收区间,为一数组或对数组区域的引用,设定对data_array 进行频率计算的分段点。Frequency函数以一列垂直数组返回某个区域中数据的频率分布。它可以计
17、算出在给定的值域和接收区间内,每个区间包含的数据个数。Frequency函数要求按组距上限分组,输入的组限数据比每组的上限少1,并且不接受非数值字符的分组。分组条件可以数组公式;的形式直接输入,也可以输入在先一列单元格中来调用。一般实现完整的频数表,Frequency函数需要按“Shift+Ctrl+Enter”来得到结果,并且还要手工输入并整理表头。例:如果A1=2,A2=5,A3=8,A4=11,A5=12,A6=19,A7=21,A8=32,A9=45,A10=48,B1=10,B2=20,B3=30,B4=40,选中C1至C5单元格,输入“=FREQUENCY(A1:A10,B1:B4
18、)”,然后使用Ctrl+Shift+Enter输入该公式作为数组公式。返回C1=3,C2=3,C3=1,C4=1,C5=2。2. “直方图”工具可以进行统计分组,还可以计算频数和频率,绘制直方图和折线图等。其调用菜单为“工具-数据分析-直方图”。例如,在一个有 50 名学生的班级里,可以通过直方图确定考试成绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区域”框中。(1)操作步骤用鼠标点击表中待分析数据的任一单元格。选择“工具”菜单的“数据分析”子菜单。用鼠标双击数据分析工具中的“直方图”选项。出现“直方图”对话框
19、,对话框内主要选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在各个相邻边界值之间的数据出现的次数。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除该复选框,Excel将在输出表中生成适宜的数据标志。输出区域:在此输入结果输出表的左上角单元格的地址。如果输出表将覆盖已有的数据,Excel会自动确定输出区
20、域的大小并显示信息。柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。按需要填写完“直方图”对话框之后,按“确定”按扭即可。(2)结果说明:完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。(二)制作统计图1.直方图由“直方图”工具制作出的直方图矩形图形之间有间
21、隔,不符合一般直方图形式,应作修正。修正的方法是鼠标左键双击任一矩形弹出“数据系列格式”框,在其中的“选项”卡片下,将“分类间距”修改为“0”,确定即可。2.散点图散点图是观察两个变量之间关系程度最为直观的工具之一,利用Excel的图表向导,可以非常方便的创建并且改进一个散点图,也可以在一个图表中同时显示两个以上变量之间的散点图。(1)操作步骤数据如下图所示,可按如下步骤建立变量x-y,x-z的散点图。拖动鼠标选定数值区域A2:C12 ,不包括数据上面的标志项。选择“插入”菜单的“图表”子菜单,进入图表向导。选择“图表类型”为“散点图”,然后单击“下一步”。确定用于制作图表的数据区。Excel
22、将自动把你前面所选定的数据区的地址放入图表数据区内。在此例之中,需要建立两个系列的散点图,一个是x-y系列的散点图,一个是x-z系列的散点图,因此,必须单击“系列”标签,确认系列1的“X 值”方框与“数值方框”分别输入了x,y 数值的范围,在系列2的“X 值”方框与“数值方框”分别输入了x,z 数值的范围。在此例中,这些都是Excel已经默认的范围,所以,可忽略第5 步,直接单击“下一步”即可。填写图表标题为“X-Y与X-Z散点图”,X 轴坐标名称为“X”与Y 轴坐标名称“Y/Z”,单击“下一步”。选择图表输出的位置,然后单击“完成”按扭即生成下的图表。(3)结果说明如图所示,Excel中可同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课程 实验 指导书
限制150内