第一讲数据整理与描述精选文档.ppt
《第一讲数据整理与描述精选文档.ppt》由会员分享,可在线阅读,更多相关《第一讲数据整理与描述精选文档.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一讲 数据整理与描述本讲稿第一页,共三十四页第一部分:各讲学习概要n第一讲:数据的整理与描述n第二讲:统计指数n第三讲:动态数列n第四讲:抽样调查及估计n第五讲:假设检验n第六讲:相关分析与回归分析本讲稿第二页,共三十四页第一讲 数据整理与描述 在日常用语中,术语“统计学”称为数字事实。然而,统计学所涉及到的领域或学科比数字事实要多得多。从广义上来说,统计是收集、分析、列示和解释数据的一门艺术和科学。特别是在商务和经济中,对数据进行收集、分析、列示和解释的一个主要原因,是它可以使经理和决策者们更好地理解商业和经济环境,得到更多的信息,做出更好的决策。n一、统计在商务中经济中的应用 在当代全球
2、性商务和经济环境中,可以获取大量的统计信息。最成功的管理者和决策者是那些能够理解和有效地运用统计信息的人。本讲稿第三页,共三十四页n(一)会计 当会计师事务所为其客户进行审计时,他们要利用统计抽样方法。例如,假定一家会计师事务所想要确定某客户资产负债表中所显示的应收账款余额是否公允地反映了其真实的应收账款余额。通常,审计人员抽取一个样本。在对被抽取账户的正确性进行了审查后,审计人员就可以得出关于该客户资产负债表中所列示的应收账款余额是否属实的结论。n(二)金融 金融顾问们利用各种统计数据来引导投资。拿股票投资来说,顾问们检查包括市盈率和红利在内的一系列金融数据。通过将某只个股的数据与股票市场平
3、均数进行比较,金融顾问们就能够判断该只股票的价值是被高估还是低估了。将帮助顾问们做出买入、卖出还是继续持有该股的建议。本讲稿第四页,共三十四页n(三)营销 装在零售收银台的电子扫描设备是用来为各种各样的营销研究的应用收集资料的。例如,像尼尔森公司和数据资源公司等数据提供商从杂货商店购买关于销售的扫描数据,然后将其加工成综合的统计数据卖给生产商。扫描获得的统计数据和促销活动获得的统计住处来更好地了解促销活动的销售两者之间的关系。这种分析对于各种产品将来的营销策略很有帮助。n(四)生产 由于现在非常强调产品的质量,因此质量控制是统计在生产中的一个重要应用。许多统计质量控制图被用来控制某生产过程的产
4、量,尤其是可以用条形图来控制平均产量。本讲稿第五页,共三十四页n(五)经济 人们经常要求经济学家们对将来的经济以及其他方面进行预测。在进行这些预测时,他们要用到各种各样的统计信息。例如,在预测通货膨胀率时,经济学家们就要用到诸如生产者价格指数、失业率和生产利用能力等方面的统计住处通常这些统计住处指标被输入到计算预测模型中来预测通货膨胀率。n二、数据的类型 根据描述事物所采用的不同度量尺度,数据可分为分类型数据和数量型数据。分类型数据描述的是事物的品质特征。例如,人的性别、民族、职业等。数据型数据说明的是事物的数量特征。例如,产品的产量和寿命、企业的营业额、股票的价格、产品的市场占有率、国民总产
5、值、国家的人口等等,都是数量型数据。数量型数据用数值形式表示。本讲稿第六页,共三十四页 数据按照被描述的对象与时间的关系分为截面数据、时间序列数据与平行数据。截面数据描述的是事物在某一时刻的变化情况,即所谓横向数据。时间序列数据描述的是事物在一定的时间范围内的变化情况,即所谓纵向数据。平行数据是截面数据与时间序列数据的组合 在统计中,我们把对事物现象特征的描述称为变量。如果它是分类型数据,称为分类型变量;如果它是数量型数据,则称为数量型变量。很多情况下,我们所研究的变量都是数量型变量,大多数的统计分析方法也都是对于数量型变量的分析,因此有时把数量型变量简称为变量。本讲稿第七页,共三十四页n三、
6、数据的整理与图表显示 (一)数据的分组与频率直方图 统计分组是数据整理的一项初步工作,它是根据实际需要,将数据按照数据的某种特征或标准分成不同的组别。按照数据的某种特征对数据进行分组后,再计算出所有类别或数据在各组中出现的次数或频数,就形成了频数分布表。我们称全部数据在各组内的分配状况为数据的频数分布,分配在各组内的数据个数为频数,频数与全体数据个数之比称为频率。分类型数据按类计算出各类的频数或频率,就形成了频数或频率分布表。分类型数据按类分组时,一定要注意既不能重数也不能漏数,这应要求所有类别必须有明确的界定。对于数量型数据,我们只简单介绍两种方法单变量值分组法和组距分组法。本讲稿第八页,共
7、三十四页 单变量值分组法就是把每一个变量值作为一个组。n例:某单位有职工20人,下面是六月份该单位职工请假天数的记录:0,0,1,0,2,1,0,0,0,1,2,0,5,1,1,0,0,0,10,0 观察这个记录,我们不难发现,所有不同的请假天数一共只有5个,即0、1、2、5和10。因此,采用单变量值分组方法分组的话,应该发成5个组。请假天数 频数(人)频率(%)累积频率(%)0 11 55 55 1 5 25 80 2 2 10 90 5 1 5 95 10 1 5 100 合计 20 100本讲稿第九页,共三十四页 在数据较多且比较分散的情况下,单变量值分组法由于组数过多,不便于观察数据的
8、分布特征和规律。因此,单变量值分组方法适用于数据较少或分布比较集中的情形。对于变量值较多的情况,可以采用组距分组法。确定组数的一般原则为:数据个数n 分组数 50以下 56 50100 610 100250 712 250以上 1020本讲稿第十页,共三十四页 我国各地区2000年死亡率频率分布表组号 分组界限 频数 频率(%)组中值 1 4.9,5.6 3 10.00 5.25 2 5.6,6.3 8 26.67 5.95 3 6.3,7.0 12 40.00 6.65 4 7.0,7.7 5 16.67 7.35 5 7.7,8.4 1 3.33 8.05 6 8.4,9.1 1 3.33
9、 8.75本讲稿第十一页,共三十四页n(二)、数据的图形显示 除去频率直方图以外,还有许多数据的图形显示方法。我们在这里主要介绍饼形图、条形图、柱形图、散点图、折线图、曲线图和茎叶图。n1.饼形图 饼形图一般用来描述和表现各成分或某一成分占全部的百分比。使用饼形图时必须注意以下三点:第一,饼形图中的成分最好不要多于6个,如果成分多于6个的话,一般的做法是从这些成分中选出5个最重要的,然后把剩下的成分全部合并成一个称做“其他”的成分。第二,各成分份额的和必须是100%。第三,成分比例必须与扇形区域的面积比例一致。本讲稿第十二页,共三十四页本讲稿第十三页,共三十四页n2.条形图和柱形图 条形图是用
10、来对各项数据进行比较的。对于条形图来说,它的纵坐标没有尺度,只用来标注各项信息的名称,比如:国家、行业、公司等等。n例:2001年日本、美国、韩国和港澳台地区来某市旅游的人数(单位:10万人)如下:地区013245日本美国韩国港澳台本讲稿第十四页,共三十四页n例:下表列出的是2004-2010年某市接待的旅游人数(包括外国人、华侨、港澳台胞)(单位:万人),用柱形图显示这些数据。年份2004200520062007200820092010人数10.0113.2117.4820.2720.2920.6921.892520151050040506070809102004-2010年某市接待的旅游人
11、数本讲稿第十五页,共三十四页n3.折线图 由柱形图,我们可以大致地看出纵坐标变量随横坐标变量变化的趋势。一个更明显的表示趋势的图示方法是折线图法。2004-2010年来某市旅游人数的折线图。折线图的优点是简单、容易理解,并且对于同一组数据,折线图具有唯一性(两点间有且只有一条直线)。92321171304050607080910本讲稿第十六页,共三十四页n4.曲线图 商务和金融领域中许多事物不但其自身是逐渐变化的,而且连其变化的速度也是逐渐变化的。折线图虽然展示了变量间变化的趋势,但是我们不难发现,在各实心点处,数据变化的速度(线段的倾斜程度)会发生突变。曲线图弥补了折线图的这一不足,采用光滑
12、的曲线段连接各实心点,形成一条整体光滑的曲线。曲线图虽然有更加自然的特点,但是“光滑地连接各实心点”的方法很多,因此带有一定的随意性,即不是唯一的。n5.散点图 散点图一般表现两个变量之间的相互关系。两个变量的任何一对取值都在平面直角坐标系上代表一个点。在平面坐标系上将所有这样的点描画出来便形成了散点图。本讲稿第十七页,共三十四页n四、数据集中趋势的度量下面将介绍数据集中趋势(即数据集的中心位置)以及离散趋势(即数据集的分散程度)的各种度量。这些度量是反映数据集主要特点的一些综合数据,掌握这些方法的定义和优缺点就能使我们在大量的数据中抓住事物的本质,不至于毫无头绪地迷失在数据的海洋中。数据集中
13、趋势主要介绍平均数,中位数,众数的定义(计算),以及它们的应用。n(一)、平均数n1.数据未分组时(简单平均数)数据集中趋势的最常用的度量就是平均数,即若数据为,则这组数据的平均数,记为为:本讲稿第十八页,共三十四页n【例1】某工商管理硕士班30名学生“管理统计分析方法”课期末考试成绩如下:866584957269697063968773828885678186837772739370718290828787求他们的平均成绩。解:这些学生的平均成绩为平均数的优点在于它容易理解,易于计算;它不偏不倚地对待数据集中的每一个数据;它是数据集的“重心”,即:如果我们在数轴上各数据点处放置一个单位的重量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一讲 数据整理与描述精选文档 第一 数据 整理 描述 精选 文档
限制150内