excel与spss在统计中应用.pdf
《excel与spss在统计中应用.pdf》由会员分享,可在线阅读,更多相关《excel与spss在统计中应用.pdf(111页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、用Sxcd也SPSS图A 0酉Ch.1绪 论1.1 Excel的主要统计功能及其不足1.2 常用统计软件简介1.3 使用统计软件学习统计学的儿点建议1.1 E xcel的主要统计功能及其不足Excel的基本功能中包括了比较强大的数据处理功能,还提供了丰富的工作表函数,可以完成很多类型的数据处理和分析任务。除了工作表函数以外,Excel还提供了 一 个称 为“分析工具库”的加载宏。1.1.1 Excel分析工具库的安装和调用安装分析工具库可以采用以下三种方式。1、在 Office的默认安装中分析工具库并没有安装到你的计算机中,第一次使用“分析工具库”时需要从安装盘安装。操作步骤是:单 击“工具”
2、菜单中的“加载宏”命令,在弹出的“加载宏”对话框中选择“分析工具库”,单 击“确定”按 钮(如 图 1-1所示),此时系统要求插入Office安装盘,安装完成后,在“工具”菜单就多出了一个“数据分析”命 令(图 1-2)。“数据分析”模块提供了对数据进行描述统计、假设检验、相关和回归分析、方差分析等分析工具。我们在以后的章节中将会逐步讲解这些方法。可用加载宏Q):rInternet Assistant VBA查阅向导祝文俅解欧元工具口条件求和向导分析工具摩为金融元科学数蹇分析提供界面和相应功能图 1-1 加载分析工具库的界面i i (I息检索(R).AltKHck共享工作区(R).*v选项(。
3、敷据分析).图1-2加载分析工具库后的菜单top T2、如果希望在第一次安装Office时 就 安 装“分析工具库”,则需要在安装Office时选择自定义安装,再 选 中“选择应用程序的高级自定义”选择框,选 择“下一步”,会弹出一个对话框,在Excel的加载宏中把“分析工具库”的安装方式改为“从本机运行”(图 1-3)oS 1 匕!Microsoft Offict A X w|Microsoft 0fic S-Plus许多人认为S-Plus是介于SAS和SPSS之 间 的 个软件,它也可以完成绝大部分统计分析,具有菜单式的操作界面,同时提供了强大的编程语言。你可以很容易地把自己编写的函数集成
4、到S-Plus中去。S-Plus的绘图能力特别出色,灵活性强。4、RR是一套很像S-Plus的免费统计软件,其语法与图形功能几乎跟S-Plus 模 样,大多数的S-Plus程序也可在R上面顺利执行。R可以在R project的网页免费取得,不足之处是没有实现菜单式的图形用户界面,对于初学者来说学习起来较为困难。5、Stata经济学和社会科学领域的许多学者喜欢使用Stata软件。这一软件也有菜单式的操作界面,同时提供了强大的编程能力,易学易用,扩展性强,更新速度快,很容易将自己编写或者网上下载的程序加入到软件中。Stata的回归分析和回归诊断部分功能非常强大,几乎能估计统计学和计量经济学中的所有
5、回归模型,而在多元统计分析方面的功能稍弱。Stata可以用菜单或程序做出高质量的图形,但完成后的图形不能再进行编辑。6、MinitabMinitab也是一个简单易学的统计软件,其统计功能和图形功能都比较全面,在统计学的教学中应用广泛。这一软件突出特色是提供的质量改进分析工具非常全面易用。top t1.3使用统计软件学习统计学的几点建议1.3.1 我应该选择哪个软件?每个软件都有自己的优势和劣势。就统计学原理涉及的统计方法而言几乎所有的统计软件都可以胜任,但对于一些具体的实际问题可能有的软件会比其它软件更适合。例如 在进行一些多元统计分析时你可能会选择SAS,处理抽样调查数据可能会选择Stata
6、,做方差分析可能会选择SPSS,进行质量改进统计分析可能会选择Minitab,希望进行统计应用开发时可能会选择SAS或S-plus。因此,如果你需要经常进行统计分析,我们的建议是你把这些软件都纳入到你的工具箱中。作为入门的软件,易学易用的SPSS或 者Minitab可能是较好的选择,一开始就学习复杂的统计软件可能令人沮丧。Excel为我们处理数据和对数据进行初步的分析提供了良好的条件,但Excel至少在2003以前版本的部分统计函数中有一些缺陷,而 且Excel的统计功能有限,如果你正进行的分析工作牵涉到重大的决策、对计算结果的准确性有很高的要求,我们建议你采用专门的统计软件。许 多 用 户(
7、包括作者)喜欢用Excel准备数据,然后用专门的统计软件进行统计分析,有时候还会把结果转回Excel中作图。1.3.2 使用统计软件学习统计学的一些建议1、如果你要做统计分析的话,一定要正确的去做!使 用Excel以及其它统计软件获得一些分析结果易如反掌,但要获得正确的答案并不容易,这要求你对相应的统计方法有透彻的理解。2、在开始学习一种统计方法时,不要试图立即搞清楚软件的全部输出结果。即使你只希望计算一下数据的平均值,统计软件也可能有数页的输出结果:搞清楚所有输出结果的努力可能使你很沮丧,因为有些内容可能已经大大超出了你的学科范围。3、不要试图使用你还不理解的统计方法,这很容易导致统计方法的
8、误用;但要勇于学习新的方法,新的方法可能更适合你所研究的问题。4、不要不加分析的把软件的全部输出结果直接复制到分析报告中,这只能说明你并没有真正理解软件的输出结果。可能对你研究的问题而言软件的大部分输出都是不必要的。此外,软件生成的图表往往也需要进行一些编辑工作才能使用。5、学习统计软件的最好方法是在应用中学习。6、软件的帮助文件可能是软件最好的使用说明书,许多软件还附有简明的例子。7 uG a rb a g e in,g a rb a g e outn:如果你输入的是垃圾,得到的也只能是垃圾。你要反复检查数据的准确性,任何软件都不可能基于错误的数据得出可靠的结论。用 E x c e l和 S
9、 P S S 进行描述统计分析C h.3用 E x c e l和S P S S 进行描述统计3.1用E x c e l和S P S S 计算常用的描述统计指标3.2用 E x c e l和 S P S S 进行分组汇总C h.4 用 E x c e l和 S P S S 制作统计图4.1 用 E x c e l和 S P S S 制作常用统计图4.2 描述数据分布状况的统计图在某学期的统计学教学中,教师在教学中使用了英文教材,并采用了案例教学的方法。在学期结束时,采用以下问卷对3 5 名学生进行了调查。调查问卷如下:1、你的性别:()0=男,1=女2、你的年龄为 周岁。3.写出对于以下三种说法
10、的观点(1=完全不同意,2=比较不同意,3=无所谓,4=比较同意,5=完全同意)(1 )“我对统计学很感兴趣”()(2)“英文原版教材的使用对我的学习帮助很大”()(3)“案例对我掌握相关知识非常重要”()4、你 概 率 论 课 程 的 考 试 成 绩 是。5、你上个月的生活费支出为()元。1=3 0 0 以下,2=3 0 0-4 0 0,3=4 0 0-5 0 0,4=5 0 0-6 0 0,5=6 0 0-7 0 0,6=7 0 0-8 0 0,7=8 0 0-9 0 0,8=9 0 0 以上6、你的身高=c m,体重=kg otop T在考试结束后在调查数据又增加了学生的统计学考试成绩,
11、最后得到的数据如表3-1。在本书接下来的章节中我们将这次调查称为“学生调查”,并对调查结果进行相关的统计分析。表 3-1学生调查得到的数据表编号性别年龄兴趣英文教材案例教学概率成绩统计成绩月支出身高体重1021545748341728()2020255827861736230221214938518367412141280878162495120545909131594961224347178616145712125592973166518020233676021747491223256365816552101204247883316354111214259089416050120221557
12、869516855130212246855217365140202358782317260151222239189516552160213357870117053170202157268116460181215458885615852191213158781416348201212448688715953210225557480717578221201247375616242231213356865516549241224257678516453251215458592416151261224347169316349271214257565515855281221456455616550290
13、2232562641169513002055577682180753102135478802171623212124587883161503302042466681167703402255579832178653502134575775168622.1 用 Exc e l 输入数据2.1.1 数据录入的列表格式在绝大部分情况下统计软件都要求以“列表格式(L i stf o r m a t)存储数据,而不能用其它格式存储。“列表格式”可用表2-1 来说明,表 2-2 则不是“列表格式”。可能只有Exc e l中的方差分析仍然需要使用表2-2 的格式。在表2-1 中,每一行称为一个观测,每一列称为
14、一个变量。表 2-1 以列表格式的存储的数据序号性别学历工资111 2 6 0 02I1 2 7 0 0312 4 1 0 0412 4 0 0 0521 3 2 0 0621 2 5 0 0622 5 3 0 0822 5 5 0 0表 2-2 不是以列表格式的存储的数据性别 学历1(本科)2 (研究生)1 6 0 04 1 0 01 (女)1 7 0 04 0 0 03 2 0 05 3 0 02 (男)2 5 0 05 5 0 0tOD t2.1.2 用 Exc e l 录入数据的基本规则为了保证其它软件能够直接读入用Exc e l 录入的数据进行分析,在用Exc e l 录入数据时要尽
15、量遵循以下规则:1、从一次调查中得出的所有的数据要存储在一个电子表格中。2、在数据表的第一行中输入变量名。如果你还需要借助于不能识别中文的统计软件对数据进行分析,变量名要以字母开头,并且不超过8 个字符;变量名中不能有空格,但可以用卜划线。这是因为很多软件都对变量名都有类似的规定(在 Exc e l 中可以使用汉字作为变量名,S P S S 1 3.0 中也允许用汉字作变量名,长度不超过3 2 个汉字或6 4 个字符)。3、数据表中应避免出现其它文本行,例如标题。4、数据中应避免出现空行。5、在原始数据中设置个标识 变 量(I D va r i a b l e),例如观测的序号、问卷的编号、学
16、生证号、身份证号等等,以便在检查数据录入错误时易于查找原始问卷。有的分析中我们会对数据进行排序,这会打乱原来的数据顺序。这时要查找原始问卷就只能依靠标识变量了。6、如果数据包含多个组,需要设置一个变量来表示每个观测的分组(见表2-1的例子)。7、尽量使用数字编码来表示分类变量。例如我们可以用1来表示“党员”,2 表 示“团员,3 表 示“群众”。如果只有两个组,将其编码为0 和 1可能会使一些分析易于进行。8、对于缺失值(missing values),将相应的单元格保留为空白,这样其他统计软件才能正确地识别缺失值。9、Excel允许在同一列中(对应着同一个变量)输入不同类型的数据,如数值型、
17、字符型、H 期型等等。这虽然是给了我们一定的灵活性,但在同一列中输入不同类型的数据在分析时会造成极大的不便,使用中应尽量避免。10、对数据的编码和计算过程要做好记录,以免日后忘记了每个变量或数值对应的含义,例 如“0”是代表男性还是女性,某个新变量是如何计算得到的等等。11、注意Excel的一些限制条件。Excel只能正确处理1900年 1 月 1 日以后的日期型数据;最多允许256个变量,65536行数据。2.1.3使 用 Excel的有效性检查防止数据输入中的错误Excel提供了一个“有效性”检查的功能,可以在我们输入数据时实时检查录入的数据是否符合要求。如果输入的数据量很小,这种有效性检
18、查并非必要,但如果你要输入成千上万条数据,“有效性”检查可以帮助我们避免许多录入错误。例 2.1我们以一个简单的例子来说明“有效性”检查功能的使用方法。假设需要输入的数据如表2-3。表 2-3 需要录入的数据编号班级性别考试成绩1108521190320874216953078631937408384191我们先在Excel数据表的第一行输入四个变量名:编号,性别,班级,考试成绩。(1)、“编号”的取值我们借助Excel的自动填充功能来实现:先在单元格A2、A 3中输 入 1,2。用鼠标选中区域A 2:A 3,把鼠标移至该区域右下角的填充柄(其形状为黑色的小方块),鼠标指针变为一个实心的黑色十
19、字(图 2-1)。按住鼠标左键向下拖动至A 9单元格,完成数据的自动填充。(2)、对于班级变量,我们用1表示统计班,2 表示经济班,3 表示金融班,4 表示会计 班(同时在另一个工作表中记录这一编码规则,以免日后遗忘)。班级的取值只有1、2、3、4,其他取值都是错误输入,我们可以利用Excel的“有效性”检查对输入的数据进行限定。图2-1自动填充指针t O D t具体操作步骤如下:先选中列B,然后选择菜单栏中的“数据”少“有效性”,会弹出图2-2的对话框。单 击“允许”下面的下拉箭头,选 择“整数”,再在新的对话框中把最小值设为1,最大值设为4。然后我们在“出错警告”选项卡的错误信息中输入“请
20、输入1-4之间的整数”,这样在输入了 1-4以外的数值时,E x c e l会弹出出错信息,并提示“请输入1-4之间的整数二设置 检入信息 出借警告 的入法模式百戏性条件允 许 ,|金部清除0)1 I 喉 I 断清 图2-2数据的有效性检查对话框(3)、对于取值非常有限的数据,我们还可以为变量的取值定义一个序列,如果输入的数据不在这个序列中,即为非法输入。下面我们用性别变量(0表示男性,1表示女性)加以说明。选中列C,然后选择菜单栏中的“数据”今“有效性”,在图2-2的对话框中选择序列,在“来源”对话框中输入“1,2”(数值用英文状态下的逗号隔开)(图2-3),单击确定按钮。这时,在列C的单元
21、格中输入数据时,E x c e l会提供一个下拉箭头使我们能够从事先确定的序列中选择数值(当然我们也可以直接输入)(图2-4)。在输入大量数据时,使用下拉箭头输入数据会大大影响输入速度。全部清除)I*定 I|取清|图2-3数据的有效性检查:定义序列图2-4 Excel提供的卜拉框(4)、对于考试成绩这一变量,我们只要使用“有效性”把数据限定为0-100之间的整数就可以了。注意数据的有效性检查并不能帮助我们避免其它类型的录入错误:如果你把“60”错输成了“90”,Excel不会给你任何警告。too f2.1.4处理多项选择问题要正确录入和分析从多项选择问题中得到的数据需要一定的技巧。下面我们以一
22、个简单的例子加以说明。例2.2在一次对失业者的调查中有以下问题。在以下8个因素中,哪些是你重新就业的重大障碍?(最多选3项)()1、文 化 水 平 低2、专业不对口 3、缺少工作经脸 4、缺少工作岗位5.歧 视6、工 资 水 平 低7、工 作 条 件 差8、缺少创业资金我们的分析目的是要找出以上8个因素对失业者再就业的影响程度,在分析中可以分别看作-.个单独的问题。如果被调查者选中了这个选项,其值就等于1,未选中则等于0。也就是说,问卷中的 个变量在分析中被处理成了8个二分变量。在选项非常多,而每个被调查者只能选择少数儿项时,以下方法会更有效率(以上面的问题为例):设定3个变量,分别记录被调查
23、者的第一、第二和第三选择,取值为1-8。在分析时,将这三个变量的对应选项合并,就能得到需要的分析结果了。例如,假设在第 个变量中有15人选择了 1,在第二个变量中20人选择了 1,在第三个变量中5人选择了 1,则选 择 1 的人总共有15+20+5=40人。如果有些人只选择了一项或两项,则其第二和第三个变量的取值可以设为空值(缺失值)或者另外给定的一个特定值(例如等于0),在分析中只要处理得当就能得到正确的结果。2.2 用 Excel处理数据2.2.1 用 Excel对数据进行排序和筛选用 Excel可以方便的对数据进行排序和筛选。需要特别注意的是,如果你只对某一列进行排序,则整个数据集都会被
24、破坏,每一个数据行对应的不再是同一个观测的取值。因此,使用Excel排序时要格外小心。下面我们通过个例子说明用Excel进行排序和筛选的操作方法。例2.3将表2-3的数据按照考试成绩排序。单击数据区域的任何一个单元格,使其成为活动单元格。然后选择菜单栏中的“数据”分“排序”,会弹出图2-5的对话框。图 2-5 排序对话框在这个对话框中将主要关键字设为考试成绩,按降序排列。单击确定后就可以完成排序工作了。你也可以在“选项”中定义其他的排序规则。注意在对文本进行排序时,由于排序的规则不同,使用不同的软件得到的排序结果可能有差异。例2.4从表2-3的数据中筛选出所有男生的资料。单击数据区域的任何一个
25、单元格,使其成为活动单元格。然后选择菜单栏中的“数据”个“筛选”)“自动筛选”,在每列数据的顶端会出现一个下拉箭头(图 2-6)。图 2-6 自动筛选的界面单 击“性别”变量的下拉箭头,选 择“0,则 Excel 2003会筛选出所有男生的资料。当“性别”变量是一个有效的筛选变量时,该变量的下拉箭头是蓝色的。在此基础上还可以进行进步的筛选,例如筛选出成绩在85分以上的男生的资料。如果希望显示全部数据,则要在下拉框中选择“(全部”要取消筛选,再一次选择菜单栏中的数据f筛选好自动筛选就可以了。自动筛选功能还可以帮助我们发现和修改数据输入中的错误。如果在变量下拉箭头打开的下拉框中有异常值,我们可以利
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- excel spss 统计 应用
限制150内