《第一章统计数据分析概述.ppt》由会员分享,可在线阅读,更多相关《第一章统计数据分析概述.ppt(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学应用统计学经济管理学院张明亲课程教学目的及要求 应用统计学作为经管类研究生的专业基础课,是一门研究如何应用统计方法去解决实际问题的一门方法论科学,设置本课程的目的旨在为学生解决商务与经济中的各类问题提供有力工具。通过本课程的学习使学生能够运用统计分析工具阐释商务与经济活动中的各类问题,能够熟练运用统计分析软件对商务与经济活动中的各种数据进行分析。学完本课程要求学生达到以下要求:1.掌握商务与经济活动过程中统计分析活动的程序;2.熟练掌握各种高级统计分析方法;3.熟练使用各种统计分析软件进行数据处理;4.了解统计分析方法的发展趋势。课程主要内容及学时分配序号 主要内容 学时1统计数据分
2、析概论22假设检验基本问题63一个总体的假设检验 44两个总体的假设检验45拟合优度检验和独立性检验 46方差分析与实验设计 67回归分析 68非参数方法 4教材:戴维R.安德森等著,张廉华等译,商务与经济统计(第8版),北京:机械工业出版社,2003.9主要参考书:1葛新权、王斌.应用统计,北京:社会科学文献出版社,2006.62马庆国,管理统计数据获取、统计原理、SPSS工具和应用研究,北京:科学出版社,20023柯惠新.沈浩,调查研究中的统计分析法,北京:中国传媒大学出版社,20054李时.应用统计学,北京:清华大学出版社;北京大学出版社,2005.95胡平、催文田、徐青川.应用统计分析
3、教学实践案例集,北京:清华大学出版社,2007.106朱建平、殷瑞飞,SPSS在统计分析中的应用,北京:清华大学出版社,2007.1 第一章 统计数据分析概论1数据信息分析的四个范畴应用统计学是一门搜集、整理和分析统计数据的方法论科学,其核心内容是统计数据的加工和分析推断。对统计数据的加工和分析推断可以划分为四个阶段:1数据的描述性分析统计数据描述性分析的目的,是要在大规模原始数据群中,迅速将重要信息提取出来,对系统的主要特征进行认识性描述。表1-1数据描述性分析方法静态单张数据表主要因素分析 分类分析定量变量 定性变量 样本点分类 变量分类变量数=2变量数2系统聚类法动态聚类法有序样本聚类变
4、量聚类法主成分分析对应分析多元对应分析时序立体数据表时序立体数据表的最佳综合简化,内涵开发,动态轨迹2数据的解析性分析 所谓的解析性分析是指一类模型的数据分析方法。是对系统变量因果关系、相随变动关系或数据分布状况进行更加准确化、数量化的一种分析方法。表1-2数据解析分析方法因变量自变量定量变量定性变量一元 多元定量变量一元简单回归偏最小二乘回归 判别分析多元 多元回归3预测性分析:是将数据系统内涵认识性研究与动态规律性研究相结合的分析方法。如时间序列分析法等。4决策性分析:在我国的经济管理领域,决策性分析方法是最先被引入和普及的定量化分析方法。最典型的如运筹学中的数学规划、图网络分析技术、排队
5、论、存储论、决策论及对策论等。第二节 数据的基本概念一、数据的类型一般来说,多元统计数据分析所处理的是截面样本数据,即样本点变量类型的平面数据表。表1-3关于色调喜好的统计样本号身高/cm体重/kg年龄 性别 工作性质喜好色调体质NO1 166 56 31女 工人红好NO2 168 60 45女 行政人员蓝 中NO3 173 6 38男 工人 绿 好NO4 175 62 42男 干部 黄 差NO5 169 59 50男 技术人员蓝 中变量可以分为定性变量(性别、工作性质、喜好色调、体质)和定量变量(身高、体重、年龄)如果更细致地划分,变量的类型有三种尺度:1定类尺度。变量用数种状态来表示,这些
6、状态之间既没有数量关系,也没有等级关系,如表中的性别、工作性质、色调喜好。2定序尺度。变量用有序等级来表示,如职工体质状态有好、中、差三个等级。3间隔尺度。变量用实数来表示,如长度、重量等。(定距尺度、定比尺度)二、数据表的类型在多元数据分析中,平面数据表的类型,最基本的有如下三种:1.样本点定量变量型的数据表np维的实数矩阵(n个样本p个指标)2.列联表,往往是为了分析两个定性变量间的关系。表1-4所示。(对592名调查对象的头发颜色和眼睛颜色进行的统计)表1-4头发颜色与眼睛颜色的联系眼睛颜色头发颜色行和棕色 栗色 红棕色 金黄色栗色 68 119 26 17 220蓝色 20 84 17
7、 94 215黑色 15 54 14 10 93绿色 5 29 14 16 64列和 108 286 71 127 5923.多元定性数据表,如表1-5表1-5喜好色调的统计表样本号性别 工作性质 喜好色调男 女 工人 干部 技术人员行政人员红 绿 黄 蓝1 0 1 1 0 0 0 1 0 0 02 0 1 0 0 0 1 0 0 0 13 1 0 1 0 0 0 0 1 0 04 1 0 0 1 0 0 0 0 1 05 1 0 0 0 1 0 0 0 0 1三、数据的基本描述1.集中趋势的描述均值中位数:处在中间位置的变量值众数:出现次数最多的变量值2.离散程度的描述方差、标准差3.变量之间关系的描述相关系数客户价值评价指标体系当前价值评价指标月消费支出单位时间资费支出非语言业务支出比例未来价值评价指标网外通话比例月均享受的优惠额度月均使用的热线次数在网时长(使用年限)信用度(过往缴费情况)客户对企业的满意度客户的社会地位及影响力月均消费增长率客户未来的业务发展潜力四、数据的预处理1.标准化处理(最常用的一种方法)2.同趋势化处理第三节
限制150内