《统计分析综合实验》PPT课件.ppt
《《统计分析综合实验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计分析综合实验》PPT课件.ppt(144页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 四川大学工商管理学院 刘 馨 副教授 (L)(L)2 统计学常用计算软件统计学常用计算软件SPSS (Statistical Package of the Social Sciences)(社会科学统计软件包)(社会科学统计软件包)SAS (Statistical Analysis System)(统计分析系统)(统计分析系统).Excel统计学统计学3SPSS的统计功能的统计功能z样本数据的描述和预处理样本数据的描述和预处理z假设检验(包括参数检验、非参数检验和其他检验)假设检验(包括参数检验、非参数检验和其他检验)z方差分析(包括一般的方差分析和多元方差分析)方差分析(包括一般的方差分
2、析和多元方差分析)z相关分析相关分析z回归分析回归分析z聚类分析和判别分析聚类分析和判别分析z因子分析因子分析z时间序列分析时间序列分析z可靠性分析可靠性分析4主要内容z建立数据集建立数据集z数据的描述性分析数据的描述性分析z参数估计参数估计z假设检验假设检验z方差分析方差分析z相关与回归分析相关与回归分析z统计分析报告统计分析报告5参考书目参考书目z统计学统计学刘馨刘馨 编著编著 四川大学出版社四川大学出版社 2006年年z统计学实验统计学实验 冯力冯力 主编主编 东北财经大学出版社东北财经大学出版社 2008年年管 理 统 计 刘 馨6关于考试关于考试 以小组为单位,针对某一实际问题,用以
3、小组为单位,针对某一实际问题,用SPSS软件分析数据,写出统计分析报告。软件分析数据,写出统计分析报告。若设计问卷收集数据,每组最多由若设计问卷收集数据,每组最多由6位位同学组成,若在网上下载数据,每组最多同学组成,若在网上下载数据,每组最多由由4位同学组成。位同学组成。7统计分析报告的文本格式统计分析报告的文本格式z标题标题z调查研究的背景与现实意义调查研究的背景与现实意义z调查方案的设计(数据来源)调查方案的设计(数据来源)z数据分析数据分析z调查结论及相应的建议调查结论及相应的建议z附件附件实验一实验一8 建建 立立 数数 据据 集集9 一、一、SPSS 窗口介绍窗口介绍z启动后,显示数
4、据编辑器(启动后,显示数据编辑器(Data Editor)窗口窗口10编辑窗口简要介绍编辑窗口简要介绍z主菜单栏:将主菜单栏:将SPSS常用的数据编辑、加工和常用的数据编辑、加工和分析的功能列出来。用户可以通过单击菜单完分析的功能列出来。用户可以通过单击菜单完成相应操作。成相应操作。z工具栏:将一些常用的功能用图形按钮的形式工具栏:将一些常用的功能用图形按钮的形式组织在工具栏中,使操作更加快捷和方便。组织在工具栏中,使操作更加快捷和方便。z数据编辑栏:显示和管理数据编辑栏:显示和管理SPSS数据结构和内数据结构和内容。容。z系统状态栏:显示系统的当前运行状态。系统状态栏:显示系统的当前运行状态
5、。11SPSS输出窗口输出窗口主菜单主菜单工具栏工具栏分析结果显示区分析结果显示区状态显示区状态显示区12 二、二、变量类型和定义变量:变量类型和定义变量:定义变量是输入数据的前提。定义变量是输入数据的前提。启动后,显示数据编辑器窗口,弹出一个菜启动后,显示数据编辑器窗口,弹出一个菜单窗口,点击该窗口下方的变量视图,打开如单窗口,点击该窗口下方的变量视图,打开如下窗口。下窗口。1314名称名称:输入变量名。输入变量名。类型:定义变量类型。分为字符型(类型:定义变量类型。分为字符型(String)、日期型、日期型(Date)、数值型、数值型(Numeric)。标签:进一步说明有关变量的详细含义。
6、标签:进一步说明有关变量的详细含义。数值:对变量值的进一步说明,主要用于对名义级变量数值:对变量值的进一步说明,主要用于对名义级变量和顺序级变量的和顺序级变量的“值值”的说明。的说明。缺失缺失:缺失值选择。:缺失值选择。列列:在屏幕上,变量的显示宽度。在屏幕上,变量的显示宽度。对齐对齐:显示的对齐方式。显示的对齐方式。测量测量:选择测度级别,分为刻度级、序次级、名义级。选择测度级别,分为刻度级、序次级、名义级。15定义变量类型定义变量类型通常选用数值型:包括正负符通常选用数值型:包括正负符号、小数点和小数在内。号、小数点和小数在内。逗号型:整数部分从个位开始逗号型:整数部分从个位开始每每3位以
7、一个逗号分隔。位以一个逗号分隔。字符型:由一个字符串组成。字符型:由一个字符串组成。16 说明有关变量的含义说明有关变量的含义17 缺失值选择缺失值选择对字符型或数值型,用户对字符型或数值型,用户缺失值可以是缺失值可以是13个特定个特定的离散值。的离散值。对数值型,用户缺失值可对数值型,用户缺失值可以在一个连续的闭区间内以在一个连续的闭区间内并同时再附加一个区间外并同时再附加一个区间外的离散值。的离散值。18 数据的保存与读取(数据的保存与读取(点击:文件点击:文件)19三、读入其他格式的数据三、读入其他格式的数据点击:文件点击:文件 打开打开 数据数据 系统弹出一个窗口:系统弹出一个窗口:选
8、择文件类型选择文件类型 文件名文件名 打开打开20 进一步选择需要的数据:进一步选择需要的数据:21 实例:实例:z某证劵公司从某城市有关营业所抽样调某证劵公司从某城市有关营业所抽样调查得到散户股民买进、卖出和投资的有查得到散户股民买进、卖出和投资的有关数据关数据22练习:某高校练习:某高校10名教师基本情况名教师基本情况序号序号姓名姓名性别性别校内单位校内单位年龄年龄婚否婚否职称职称籍贯籍贯基本工资基本工资1王大明王大明男男化工学院化工学院32已婚已婚讲师讲师四川省四川省13802李大兴李大兴男男中文学院中文学院26未婚未婚助教助教陕西省陕西省1050.53王平王平女女数学学院数学学院47已
9、婚已婚副教授副教授辽宁省辽宁省15804方成方成男男化工学院化工学院54已婚已婚教授教授四川省四川省20105吴明吴明女女经济学院经济学院46已婚已婚副教授副教授海南省海南省15806张莹张莹女女管理学院管理学院28未婚未婚助教助教北京市北京市13807刘静刘静女女数学学院数学学院34已婚已婚讲师讲师甘肃省甘肃省13808黄元黄元男男管理学院管理学院27未婚未婚助教助教山东省山东省1050.59赵山赵山男男管理学院管理学院42已婚已婚副教授副教授山西省山西省158010郭庆郭庆男男中文学院中文学院25未婚未婚助教助教四川省四川省1050实验实验二二23数据的描述性分析数据的描述性分析24 一、
10、数据特征的描述性分析一、数据特征的描述性分析1、反映集中趋势的统计量:、反映集中趋势的统计量:众数(众数(Mode):):全部数据中出现次数最多的全部数据中出现次数最多的数值。数值。中位数(中位数(Median):将全部数据按其大小顺序排将全部数据按其大小顺序排列,处于中间位置的数值。列,处于中间位置的数值。四分位数(四分位数(Quartiles):按顺序排列的一组数按顺序排列的一组数据被划分为四个相等部分的分割点的数值。据被划分为四个相等部分的分割点的数值。平均数(平均数(Mean):将全部数据求其平均数。将全部数据求其平均数。252、反映离中趋势的统计量:、反映离中趋势的统计量:极差(极差
11、(Range):全部数据中最大值与最小值的离差。全部数据中最大值与最小值的离差。标准差(标准差(Std.deviation):衡量全部数据与其平均数衡量全部数据与其平均数离差程度的重要标准。离差程度的重要标准。方差(方差(Variance)Variance):标准差的平方。标准差的平方。263、反映分布特征的统计量:、反映分布特征的统计量:偏度(偏度(Skewness)Skewness):是指变量分布非对称的偏态是指变量分布非对称的偏态方向程度。方向程度。数据关于均值对称,斜度为数据关于均值对称,斜度为0,否则为右偏,否则为右偏(大于(大于0)或左偏。或左偏。峰度峰度(Kurtosis):(K
12、urtosis):是指分布曲线顶峰的尖平程度,是指分布曲线顶峰的尖平程度,即数据集中在平均数周围的变量值的多寡程度。即数据集中在平均数周围的变量值的多寡程度。=0,=0,为标准峰度;为标准峰度;0,0,为尖顶峰度为尖顶峰度;0,0,为为平顶峰度。平顶峰度。27z 频数分析表:频数分析表:z 交叉列联表:交叉列联表:列列联表(表(cross tabulations)是用来描述两)是用来描述两个或个或两个两个以上以上变量的量的联合分布的合分布的统计表。表。从中可从中可以分析变量之间的相关关系。以分析变量之间的相关关系。4、常用的统计表、常用的统计表28z 条形图(条形图(Bar ChartBar
13、Chart)用宽度相同的条形的高用宽度相同的条形的高度和长度表示次数分布。度和长度表示次数分布。z 饼图(饼图(Pie ChartPie Chart)用圆形及圆内扇形的面积来用圆形及圆内扇形的面积来表示次数分布表示次数分布z 直方图(直方图(Histogram Histogram)用直方图的宽度表示不用直方图的宽度表示不同的区间(组),用竖立于区间上的矩形条,表同的区间(组),用竖立于区间上的矩形条,表示相应区间的数值的频次或频率。示相应区间的数值的频次或频率。5 5、统计图、统计图29 z箱形图(箱形图(Boxplot)综合表述样本数据的中心)综合表述样本数据的中心特征和离散特征,显示数据的
14、中心、范围、分特征和离散特征,显示数据的中心、范围、分布的主要特征。布的主要特征。z箱形图的基本构造:箱形图的基本构造:下下四四分分点点中中位位数数上上四四分分点点极差极差本本体体极极大大值值本本体体极极小小值值二、用二、用SPSS作描述性分析作描述性分析1、给变量值排序:、给变量值排序:在读入数据后,从主菜单在读入数据后,从主菜单数据数据开始,依开始,依次点击:次点击:数据数据 对个案排序对个案排序 系统弹出一个窗口系统弹出一个窗口3031 从左边框中的变量清单中,选取所要排序的变量送从左边框中的变量清单中,选取所要排序的变量送入右边的框中,在窗口的下部,选升序或降序。入右边的框中,在窗口的
15、下部,选升序或降序。32 2、给变量值排名次:、给变量值排名次:z在读入数据后,从主菜单在读入数据后,从主菜单转换转换开始,依次点击:开始,依次点击:转换转换 个案排秩个案排秩 系统弹出一个窗口系统弹出一个窗口z可直接排名次,也可分组排名次可直接排名次,也可分组排名次33 选取所要排序的变量,送入右边上面的变量框选取所要排序的变量,送入右边上面的变量框,可直接排名次,若选取所要分类的变量,送入右边标可直接排名次,若选取所要分类的变量,送入右边标准框,可分类排名次。准框,可分类排名次。34实例:实例:3.6根据某班学生的数据,进行身高排序;根据某班学生的数据,进行身高排序;将学生的身高数据,按不
16、同性别分组排名次。将学生的身高数据,按不同性别分组排名次。练习:练习:根据某地区推销员的销售数据,进行排序;根据某地区推销员的销售数据,进行排序;将推销员的销售数据,按不同地区分组排名次。将推销员的销售数据,按不同地区分组排名次。353、频次、频率分析,中心描述与离散描述:、频次、频率分析,中心描述与离散描述:z频次分析摸块(频次分析摸块(Frequency Process)不仅能不仅能分析样本数据的频次、频率,还可以统计出样分析样本数据的频次、频率,还可以统计出样本数据的均值、中位数、众数,极大值、极小本数据的均值、中位数、众数,极大值、极小值、上下四分点、极差、方差、标准差、均值值、上下四
17、分点、极差、方差、标准差、均值标准差,以及斜度、峰度等。标准差,以及斜度、峰度等。z在读入数据后,依次点击:在读入数据后,依次点击:分析分析 描述统计描述统计 频率频率 系统弹出一个窗口系统弹出一个窗口36点击该窗口下面的统计量按钮,弹出一个新窗口点击该窗口下面的统计量按钮,弹出一个新窗口3738在主窗口,点击图表按钮,弹出一个新窗口在主窗口,点击图表按钮,弹出一个新窗口上块为图形类上块为图形类型选择块;型选择块;下块为图的纵下块为图的纵轴值选择块;轴值选择块;39在主窗口,点击格式按钮,弹出一个新窗口在主窗口,点击格式按钮,弹出一个新窗口40实例:实例:从某城市抽出来的从某城市抽出来的30个
18、商店中,查出某商品个商店中,查出某商品的价格数据(刻度级数据),进行频次分析。的价格数据(刻度级数据),进行频次分析。练习:练习:抽样调查某单位抽样调查某单位16人的受教育程度的数据人的受教育程度的数据(顺序级数据),进行频次分析。(顺序级数据),进行频次分析。41 4 4、列联表分析、列联表分析z读入数据后:读入数据后:点击分析点击分析 描述性统计描述性统计 交叉表交叉表 系统弹出一个对话窗口。系统弹出一个对话窗口。4243点击单元格按钮,弹出一个新窗口点击单元格按钮,弹出一个新窗口44 实例:实例:z用用AB两套方案对两套方案对170余人进行培训,然后余人进行培训,然后对培训后的业绩是否有
19、明显改善做了统计,对培训后的业绩是否有明显改善做了统计,考察不同培训方案是否与业绩改进相关。考察不同培训方案是否与业绩改进相关。45 5、箱形图:、箱形图:在读入数据后点击:在读入数据后点击:分析分析 描述统计描述统计 探索,探索,系统弹出一个窗口系统弹出一个窗口46点击主窗口下面的图表按钮,弹出一个新窗口点击主窗口下面的图表按钮,弹出一个新窗口47 实例:实例:z某单位女职工某单位女职工160人,男职工人,男职工206人,对相应的年薪作箱人,对相应的年薪作箱形图。形图。48 6 6、变量重新赋值变量重新赋值z对应于组距式的频数分析表可以通过对应于组距式的频数分析表可以通过SPSSSPSS的变
20、量的变量重新赋值功能来完成重新赋值功能来完成z在读入数据后,依次点击:在读入数据后,依次点击:转换转换 重新编码重新编码 成相同变量成相同变量 或成不同变量或成不同变量 系统弹出一个窗口系统弹出一个窗口49 从左框中选择一变量移如中间框从左框中选择一变量移如中间框,显示显示”变量名变量名?”,右右边输出变量边输出变量框被击活,框被击活,输入新变量名称,单击旧值和新值输入新变量名称,单击旧值和新值按钮,弹出一个新窗口按钮,弹出一个新窗口50 在旧值栏中选择一项输入原值在旧值栏中选择一项输入原值,在新值栏中输入新值在新值栏中输入新值,单击添加按钮。单击添加按钮。51 实实 例:例:3.8z对某班学
21、生的身高数据作统计分组对某班学生的身高数据作统计分组.思考思考:操作步骤操作步骤?52练习练习z某某公公司司准准备备开开发发一一楼楼盘盘“美美丽丽家家园园”,主主力力户户型型为为两两室室两两厅厅一一卫卫和和三三室室两两厅厅双双卫卫的的多多层层住住宅宅,现现对对在在该该片片区区所所开开发发楼楼盘盘的的目目标标客客户户群群作作一调查。一调查。z客客户户基基本本情情况况:客客户户性性别别、年年龄龄、家家庭庭人人口口数数、学历以及家庭月收入水平。学历以及家庭月收入水平。z试试分分析析相相关关数数据据,为为公公司司确确定定开开发发方方案案和和制制定定销售策略提供依据。销售策略提供依据。实验实验三三53参
22、参 数数 估估 计计54一、参数估计的基本思想一、参数估计的基本思想1 1、统计量:、统计量:统计量统计量是不含任何未知参数的、随机样本是不含任何未知参数的、随机样本X X1 1,X X2 2,X Xn n的函数。的函数。常用的统计量常用的统计量:55 根据样本根据样本X X1 1,X X2 2,X Xn n构造一个统计量构造一个统计量T T(X(X1 1,X X2 2,X Xn n)作为参数作为参数 的估计,的估计,T T称为称为 的的估计量估计量。z常见的最优估计量常见的最优估计量:2 2、点估计:、点估计:56 3 3、区间估计、区间估计 设总体分布中含有未知参数设总体分布中含有未知参数
23、,根据样本根据样本 X X1 1,X,X2 2,X,Xn n构造两个统计量构造两个统计量T T1 1、T T2 2 如果对于如果对于(00 11)有)有 p(T1 T2)=1-则称则称(T T1 1,T T2 2)为为 的(的(1-)的)的置信区间。置信区间。(1-)称为置信水平或概率保证程度称为置信水平或概率保证程度 57二二、用用SPSS作参数估计作参数估计1、和和 2的点估计的点估计:用频次分析模块来计算:用频次分析模块来计算:在读入数据后,从主菜单分析开始,依次点击:在读入数据后,从主菜单分析开始,依次点击:分析分析 描述统计描述统计 频数分析频数分析 系统弹出一个窗口系统弹出一个窗口
24、 58点击该窗口下面的统计量按钮,弹出一个新窗口点击该窗口下面的统计量按钮,弹出一个新窗口59602 2、总体均值的置信区间的计算:、总体均值的置信区间的计算:在读入数据后点击:在读入数据后点击:分析分析 描述统计描述统计 探索,探索,系统弹出一个窗口系统弹出一个窗口61点击主窗口下面的统计量按钮,弹出下面的窗口点击主窗口下面的统计量按钮,弹出下面的窗口置信度置信度95%可修改可修改62实例:实例:5.95.9 根据某组学生的数据,估计总体(同年级的学根据某组学生的数据,估计总体(同年级的学生身高)均值、方差,计算总体均值生身高)均值、方差,计算总体均值 的置信区的置信区间。间。练习:练习:在
25、对一项广告的效应进行的电话追踪调查在对一项广告的效应进行的电话追踪调查中,中,30名被追踪者中有名被追踪者中有20名会连同产品一起想起名会连同产品一起想起新广告用语。试求在看过该广告的所有人中会想新广告用语。试求在看过该广告的所有人中会想起新广告用语的所占的比重的置信区间。起新广告用语的所占的比重的置信区间。实验四实验四63假假 设设 检检 验验64一、假设检验的基本思想一、假设检验的基本思想 为了解总体的某些性质,做出某种为了解总体的某些性质,做出某种假设,然后抽取样本,构造适当的统计假设,然后抽取样本,构造适当的统计量去检验这种假设是否合理(是接受还量去检验这种假设是否合理(是接受还是拒绝
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析综合实验 统计分析 综合 实验 PPT 课件
限制150内