欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第2章_统计数据的描述.ppt

    • 资源ID:73167841       资源大小:3.79MB        全文页数:154页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第2章_统计数据的描述.ppt

    华南理工大学精品课程华南理工大学精品课程统计学统计学统计数据的描述统计数据的描述第二章第二章华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述京东苏宁价格大战京东苏宁价格大战 20122012年年8 8月,京东商城月,京东商城CEOCEO刘强东在微刘强东在微博称,京东所有大家电将在未来三年博称,京东所有大家电将在未来三年内保持零毛利,并将派员进驻苏宁国内保持零毛利,并将派员进驻苏宁国美店面。苏宁易购随后跟进表示,其美店面。苏宁易购随后跟进表示,其所有产品价格将低于京东。如此京东所有产品价格将低于京东。如此京东苏宁价格大战拉开了序幕。苏宁价格大战拉开了序幕。下面收集了下面收集了8 8月月1515号当天,号当天,4646款冰箱分款冰箱分别在苏宁和京东的价格。别在苏宁和京东的价格。引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述引例:引例:苏苏宁京宁京东东冰箱价格(冰箱价格(单单位:元)位:元)苏苏宁宁1260 1404 6399 23.1 4854 699 1199 5999 2700 16322 1260 1404 6399 23.1 4854 699 1199 5999 2700 16322 1999 9491999 9491449 4299 799 2482 2645 4230 5799 26625 2099 4499 1449 4299 799 2482 2645 4230 5799 26625 2099 4499 5999 25995999 25992991 4299 3298 1199 2798 17998 17999 21799 26.2 2991 4299 3298 1199 2798 17998 17999 21799 26.2 2209 2438 2209 2438 1199 3592 7999 2888 2779 4599 5599 6398 1420 1149 1199 3592 7999 2888 2779 4599 5599 6398 1420 1149 66996699京京东东1049 1699 4999 499 4599 699 1299 5699 6999 16999 1049 1699 4999 499 4599 699 1299 5699 6999 16999 1999 9991999 9991599 3999 799 2199 2699 4490 5999 26626 2049 4499 1599 3999 799 2199 2699 4490 5999 26626 2049 4499 6199 24996199 24992799 4399 3199 1299 2750 18707 18707 22666 599 2799 4399 3199 1299 2750 18707 18707 22666 599 2219 2359 1399 3499 7999 2999 2699 4199 5599 5899 2219 2359 1399 3499 7999 2999 2699 4199 5599 5899 1399 1299 61991399 1299 6199数据来源于百度文库。华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述 有人就认为苏宁的平均冰箱价格比京有人就认为苏宁的平均冰箱价格比京东的低,因为苏宁的平均冰箱价格为东的低,因为苏宁的平均冰箱价格为4987.88元(这里是算术平均数),比元(这里是算术平均数),比京东的为京东的为5088.83元低;而有些人却不元低;而有些人却不那么认为,两者价格没有显著差异,因那么认为,两者价格没有显著差异,因此他们认为苏宁冰箱价格的中位数为此他们认为苏宁冰箱价格的中位数为2843元,众数为元,众数为1199元,对应地与京元,对应地与京东冰箱价格的中位数东冰箱价格的中位数2899元和众数元和众数1299元相差不大。那究竟哪个对呢?元相差不大。那究竟哪个对呢?引例:引例:华南理工大学精品课程华南理工大学精品课程5 5引例提问引例提问京东和苏宁哪个的平均价格低?京东和苏宁哪个的平均价格低?Q1Q2Q3统计学怎样对数据进行有效分析统计学怎样对数据进行有效分析?怎样理解不同统计量对总体描述怎样理解不同统计量对总体描述的影响?的影响?华南理工大学精品课程华南理工大学精品课程6 6本章学习内容本章学习内容p1.1.统计数据的类型统计数据的类型p2.2.统计数据的来源统计数据的来源p3.3.如何评价数据质量如何评价数据质量 p4.4.如何对获取的数据进行整理如何对获取的数据进行整理p5.5.数据分布的集中趋势和离散程度数据分布的集中趋势和离散程度p6.6.非正态总体的分布偏态和峰度非正态总体的分布偏态和峰度p7.7.统计表及统计图统计表及统计图华南理工大学精品课程华南理工大学精品课程7 7本章学习目标本章学习目标p 了解统计数据的类型了解统计数据的类型p 了解统计数据的来源和数据的质量要求了解统计数据的来源和数据的质量要求p 掌握数值型数据的整理方法掌握数值型数据的整理方法p 掌握数据集中趋势和离散程度的测度方法掌握数据集中趋势和离散程度的测度方法p 掌握茎叶图和箱线图的制作方法掌握茎叶图和箱线图的制作方法p 了解非正态总体的分布偏态和峰度了解非正态总体的分布偏态和峰度p 掌握统计表和统计图的使用掌握统计表和统计图的使用华南理工大学精品课程华南理工大学精品课程8 8第一节第一节 统计数据的描述统计数据的描述2.12.22.32.42.5第二章具体章节结构第二章具体章节结构 第二节第二节 统计数据的来源统计数据的来源第三节第三节 统计数据的质量统计数据的质量第四节第四节 统计数据的整理统计数据的整理第五节第五节 分布集中趋势的测度分布集中趋势的测度华南理工大学精品课程华南理工大学精品课程9 9第六节第六节 分布离散程度的测度分布离散程度的测度2.62.72.8第七节第七节 分布偏态与峰度的测度分布偏态与峰度的测度第八节第八节统计表与统计图统计表与统计图第二章具体章节结构第二章具体章节结构 第一节第一节 统计数据的描述统计数据的描述什么是统计数据?什么是统计数据?什么是统计数据?什么是统计数据?统统计计数数据据是是表表示示某某一一地地理理区区域域自自然然经经济济要要素素特特征征、规规模模、结结构构、水水平平等等指指标标的的数数据据,是是定性、定位和定量统计分析的基础数据。定性、定位和定量统计分析的基础数据。华南理工大学精品课程华南理工大学精品课程1010第一节第一节 统计数据的描述统计数据的描述华南理工大学精品课程华南理工大学精品课程1111统计数据的分类:统计数据的分类:统计数据的类型按计量尺度按时间状况按收集方法分类数据顺序数据等距型数据等比型数据观测数据实验数据截面数据时间序列数据图1-3 统计数据的分类1.1.分类数据分类数据分类数据分类数据(categorical data)(categorical data)(categorical data)(categorical data)对事物进行分类的结果对事物进行分类的结果数据表现为类别,用文字表述或数值标识数据表现为类别,用文字表述或数值标识如,人口按性别分为男、女两类,用如,人口按性别分为男、女两类,用0 0、1 1标识标识2.2.顺序数据顺序数据顺序数据顺序数据(ordinal data)(ordinal data)(ordinal data)(ordinal data)对事物类别顺序的测度对事物类别顺序的测度数据表现为类别,用文字来表述数据表现为类别,用文字来表述如,产品分为一等品、二等品、三等品等如,产品分为一等品、二等品、三等品等 华南理工大学精品课程华南理工大学精品课程1212一、按计量尺度划分一、按计量尺度划分华南理工大学精品课程华南理工大学精品课程13133.3.等距型数据等距型数据(interval data)(interval data)对事物间隔的精确测度对事物间隔的精确测度结果表现为具体的数值结果表现为具体的数值如:如:2020到到1818之差与之差与1010到到8 8之差都相差之差都相差2 2;0 0表示某一个数值,不表示表示某一个数值,不表示“没有没有”或或“无无”适合于适合于“+,-”运算运算4.4.等比型数据(等比型数据(ratio dataratio data)对事物比值的精确测度对事物比值的精确测度结果表现为具体的数值结果表现为具体的数值如:如:0 0表示表示“没有没有”或或“无无”适合于适合于“+,-,”运算运算华南理工大学精品课程华南理工大学精品课程1414四种计量尺度的比较四种计量尺度的比较定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度 定比尺度定比尺度 分分类类(=(=,)排序排序()间间距距(+(+,-)-)比比值值(,)“”表示该尺度所具有的特性表示该尺度所具有的特性表示该尺度所具有的特性表示该尺度所具有的特性表表2-1 2-1 四种计量尺度的比较四种计量尺度的比较二、按收集方法划分二、按收集方法划分华南理工大学精品课程华南理工大学精品课程15151.1.观测数据观测数据观测数据观测数据(observational data)(observational data)(observational data)(observational data)通过调查或观测而收集到的数据通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据有关社会经济现象的统计数据几乎都是观测数据2.2.实验数据实验数据实验数据实验数据(experimental data)(experimental data)(experimental data)(experimental data)在实验中控制试验对象而收集到的数据在实验中控制试验对象而收集到的数据如,对一种新药疗效的试验,对一种新的农作如,对一种新药疗效的试验,对一种新的农作 物品种的试验等物品种的试验等医学、自然科学领域的数据大多都为实验数据医学、自然科学领域的数据大多都为实验数据三、按时间状况划分三、按时间状况划分华南理工大学精品课程华南理工大学精品课程16161.1.截面数据截面数据截面数据截面数据(cross-sectional data)(cross-sectional data)(cross-sectional data)(cross-sectional data)在相同或近似相同的时间点上收集的数据在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况描述现象在某一时刻的变化情况如如,20102010年年中中国国各各省省自自治治区区直直辖辖市市特特别别行行政政区的国民生区的国民生产总值产总值数据数据2.2.时间序列数据时间序列数据时间序列数据时间序列数据(time series data)(time series data)(time series data)(time series data)在不同时间上收集到的数据在不同时间上收集到的数据描述现象随时间变化的情况描述现象随时间变化的情况如如2005-20112005-2011年年中中国国各各省省自自治治区区直直辖辖市市特特别别行行政区的国民生政区的国民生产总值产总值数据数据华南理工大学精品课程华南理工大学精品课程1717本节提问本节提问数据的计量尺度分为哪几种?数据的计量尺度分为哪几种?Q1Q2Q3不同计量尺度各有什么特点?不同计量尺度各有什么特点?按收集方法可划分为哪几种类型按收集方法可划分为哪几种类型?按时间状况可划分为哪几种类型按时间状况可划分为哪几种类型?Q4华南理工大学精品课程华南理工大学精品课程第二节第二节 统计数据的来源数据的来源 统计数据来源于直接组织的调查、统计数据来源于直接组织的调查、观察和科学试验,我们称之为观察和科学试验,我们称之为第一手第一手数据数据或或直接的数据直接的数据;或者来源于已有或者来源于已有的数据,我们称之为的数据,我们称之为第二手数据第二手数据或或间间接的数据接的数据。一、间接获取的数据一、间接获取的数据 二、直接获取的数据二、直接获取的数据华南理工大学精品课程华南理工大学精品课程1919一、间接取得的数据一、间接取得的数据1.1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如如各各类类统计年鉴统计年鉴2.2.各各类类经经济济信信息息中中心心、信信息息咨咨询询机机构构、专专业业调调查查机构等提供的数据机构等提供的数据3.3.各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料4.4.各各种种会会议议,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性、学术性研讨会上交流的有关资料性、学术性研讨会上交流的有关资料5.5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料中国中国中国中国统计统计统计统计年鉴年鉴年鉴年鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社华南理工大学精品课程华南理工大学精品课程2020提供统计数据的部分网站提供统计数据的部分网站表表2-3 2-3 提供统计数据的部分网站提供统计数据的部分网站中国政府及相关机构中国政府及相关机构网址网址数据内容数据内容国家统计局国家统计局http:/统计统计年年鉴鉴、统计统计月月报报等等中国经济信息网中国经济信息网http:/经济经济信息及各信息及各类类网站网站华通数据中心华通数据中心http:/国家国家统计统计局授局授权权的数据中的数据中心心中国决策信息网中国决策信息网http:/决策知识及案例决策知识及案例三农数据网三农数据网http:/三农信息、论坛及相关网三农信息、论坛及相关网站站中国人口网中国人口网http:/人口、市场指标人口、市场指标中国人民银行中国人民银行http:/国际储备、汇率及相关网国际储备、汇率及相关网站站财政部财政部http:/中央政府预算及各类网站中央政府预算及各类网站华南理工大学精品课程华南理工大学精品课程2121提供统计数据的部分网站提供统计数据的部分网站美国政府机构美国政府机构 网址网址数据内容数据内容人口普查局人口普查局http:/www.census.govhttp:/www.census.gov人口和家庭等人口和家庭等联邦储备局联邦储备局http:/www.federalreserve.http:/www.federalreserve.govgov货币供应、信誉、货币供应、信誉、汇率等汇率等预算编制办公室预算编制办公室http:/www.whitehouse.ghttp:/www.whitehouse.gov/ombov/omb财政收入、支出、财政收入、支出、债券等债券等商务部商务部http:/www.doc.govhttp:/www.doc.gov商业、工业等商业、工业等表表2-3 2-3 提供统计数据的部分网站(续表)提供统计数据的部分网站(续表)提供统计数据的部分网站提供统计数据的部分网站华南理工大学精品课程华南理工大学精品课程2222表表2-3 2-3 提供统计数据的部分网站(续表)提供统计数据的部分网站(续表)国外数据统计网站国外数据统计网站网址网址数据内容数据内容Monthly Bulletin of Statistics Onlinehttp:/unstats.un.org/unsd/mbs/app/DataSearchTable.aspx各个国家统计局和组织各个国家统计局和组织的统计数据的统计数据World Development Indicatorshttp:/data.worldbank.org/indicator世界银行的数据世界银行的数据CIA world factbookhttps:/www.cia.gov/library/publications/the-world-factbook/中央情报局收集的数据,中央情报局收集的数据,包括人口、社会、军事包括人口、社会、军事等等IPUMShttp:/www.ipums.org/普查数据集成网站,包普查数据集成网站,包括人口、地理、居民收括人口、地理、居民收入等入等华南理工大学精品课程华南理工大学精品课程2323二、直接取得的数据:二、直接取得的数据:普查普查 (census)(census)1.1.为特定目的专门组织的非经常性全面调查为特定目的专门组织的非经常性全面调查2.2.通常是一次性或周期性的通常是一次性或周期性的3.3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间4.4.数据的规范化程度较高数据的规范化程度较高5.5.应用范围比较狭窄应用范围比较狭窄总体总体华南理工大学精品课程华南理工大学精品课程2424二、直接取得的数据:二、直接取得的数据:抽样调查抽样调查 (sampling survey)(sampling survey)1.1.从总体中随机抽取一部分单位作为样本进从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体行调查,并根据样本调查结果来推断总体特征的数据收集方法特征的数据收集方法 2.2.2.2.具有经济性、时效性强、具有经济性、时效性强、具有经济性、时效性强、具有经济性、时效性强、适应面广、准确性高适应面广、准确性高适应面广、准确性高适应面广、准确性高 等特点等特点等特点等特点3.3.3.3.根据样本抽取原则的不同,抽样方法有概根据样本抽取原则的不同,抽样方法有概率抽样和非概率抽样率抽样和非概率抽样总总总总体体体体随机样本随机样本随机样本随机样本二、直接取得的数据二、直接取得的数据:统计报表(统计报表(statistical report formsstatistical report forms)统计报表是以国家有关法规为准则,按统计报表是以国家有关法规为准则,按照统一的表式、统一的指标、统一的报照统一的表式、统一的指标、统一的报送时间和报送程序,自上而下地统一布送时间和报送程序,自上而下地统一布置、自下而上地逐级提供基本统计数据置、自下而上地逐级提供基本统计数据的一种调查方式。的一种调查方式。华南理工大学精品课程华南理工大学精品课程2525华南理工大学精品课程华南理工大学精品课程2626本节提问本节提问简要说明统计数据的来源?简要说明统计数据的来源?Q1Q2获取直接统计数据的渠道主要有哪些?获取直接统计数据的渠道主要有哪些?第三节第三节 统计数据的质量数据的质量质量评价标准质量评价标准1 1)精度,即最低的抽样误差或随机误差;)精度,即最低的抽样误差或随机误差;2 2)准确性,即最小的非抽样误差或偏差;)准确性,即最小的非抽样误差或偏差;3 3)关联性,即满足用户决策、管理和研究的需要;)关联性,即满足用户决策、管理和研究的需要;4 4)及时性,即在最短的时间里取得并公布数据;)及时性,即在最短的时间里取得并公布数据;5 5)一致性,即保持时间序列的可比性;)一致性,即保持时间序列的可比性;6 6)最低成本,即在满足以上标准前提下以最经济的)最低成本,即在满足以上标准前提下以最经济的方式取得数据。方式取得数据。华南理工大学精品课程华南理工大学精品课程2727华南理工大学精品课程华南理工大学精品课程第三节第三节 统计数据的质量数据的质量 统计数据的误差:统计数据的误差:一、登记性误差一、登记性误差二、代表性误差二、代表性误差华南理工大学精品课程华南理工大学精品课程2929一、登记性误差一、登记性误差1.1.由于调查者或被调查者的人为因素所造成的误由于调查者或被调查者的人为因素所造成的误差差2.2.调查者所造成的登记性误差主要是由调查方案调查者所造成的登记性误差主要是由调查方案中有关的规定或解释不明确导致的填报错误、中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误等引起的。抄录错误、汇总错误等引起的。3.3.被调查者造成的登记性误差主要是由故意虚报被调查者造成的登记性误差主要是由故意虚报或瞒报引起的。或瞒报引起的。4.4.理论上讲,登记性误差是可以消除的。理论上讲,登记性误差是可以消除的。华南理工大学精品课程华南理工大学精品课程3030二、代表性误差二、代表性误差1.1.用样本推断总体时,样本单位不能完全反映总用样本推断总体时,样本单位不能完全反映总体的性质,它同总体的实际指标有一定的差异。体的性质,它同总体的实际指标有一定的差异。2.2.代表性误差按照产生的原因可分为随机误差和代表性误差按照产生的原因可分为随机误差和系统误差。系统误差。3.3.代表性误差即代表性误差即抽样误差抽样误差的客观存在和不可避免的客观存在和不可避免性,并不意味着可以任其存在或对其无所作为性,并不意味着可以任其存在或对其无所作为,相反,对抽样误差的控制是十分必要的。,相反,对抽样误差的控制是十分必要的。华南理工大学精品课程华南理工大学精品课程3131误差的控制误差的控制1.1.正确制定调查方案,力求调查的范围明确、调查项目正确制定调查方案,力求调查的范围明确、调查项目解释清楚、方法科学适用;解释清楚、方法科学适用;2.2.加强调查人员培训,提高调查技术水平;加强调查人员培训,提高调查技术水平;3.3.做好思想教育工作,坚持实事求是,加强法律观念;做好思想教育工作,坚持实事求是,加强法律观念;4.4.严格要求调查人员认真细致,多加审查及时更正;严格要求调查人员认真细致,多加审查及时更正;5.5.完善各种计量、测量工具;完善各种计量、测量工具;6.6.调查过程进行控制,对调查结果进行检验、评估,现调查过程进行控制,对调查结果进行检验、评估,现场调查人员进行奖惩的制度。场调查人员进行奖惩的制度。华南理工大学精品课程华南理工大学精品课程3232本节提问本节提问简要说明登记性误差和代表性误差?简要说明登记性误差和代表性误差?Q1Q2误差的控制有哪些途径?误差的控制有哪些途径?华南理工大学精品课程华南理工大学精品课程第四节第四节 统计数据的整理数据的整理一、统计数据整理的概述一、统计数据整理的概述二、统计分组二、统计分组三、分配数列三、分配数列四、洛伦茨曲线四、洛伦茨曲线华南理工大学精品课程华南理工大学精品课程3434统计数据整理的概述统计数据整理的概述 统计数据整理是根据统计研究任务的要求,统计数据整理是根据统计研究任务的要求,对统计调查阶段所收集到的大量原始资料进对统计调查阶段所收集到的大量原始资料进行加工与汇总,使其系统化、条理化、科学行加工与汇总,使其系统化、条理化、科学化,最后形成能够反映现象总体综合特征的化,最后形成能够反映现象总体综合特征的统计资料的统计工作过程。统计资料的统计工作过程。统计数据整理的概述统计数据整理的概述统计数据整理的程序:统计数据整理的程序:1 1)统计资料的审核)统计资料的审核2 2)进行统计分组)进行统计分组3 3)进行加工汇总,编制分配数列)进行加工汇总,编制分配数列4 4)编制统计表和绘制统计图)编制统计表和绘制统计图5 5)统计数据资料的积累、保管和公布)统计数据资料的积累、保管和公布华南理工大学精品课程华南理工大学精品课程3535统计分组统计分组 统计分组是根据统计研究的需要,按照某种标统计分组是根据统计研究的需要,按照某种标志将统计总体区分为若干性质不同而又有联系志将统计总体区分为若干性质不同而又有联系的几个部分的一种统计方法的几个部分的一种统计方法。统计分组的种类:统计分组的种类:(1 1)按照分组标志的多少可分为简单分组和复)按照分组标志的多少可分为简单分组和复合分组。合分组。(2 2)按分组标志的性质可分为品质分组和变量)按分组标志的性质可分为品质分组和变量分组。分组。华南理工大学精品课程华南理工大学精品课程3636统计分组统计分组穷尽原则穷尽原则 总体中的每一个单位都有组可归,无一遗漏。总体中的每一个单位都有组可归,无一遗漏。互斥原则互斥原则 总体中的任何一个单位只能归属于某一组,而总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。不能同时归属于几个组。华南理工大学精品课程华南理工大学精品课程3737统计分组统计分组分组标志的注意问题分组标志的注意问题1 1)根据统计研究的目的进行选择)根据统计研究的目的进行选择2 2)若干个标志中,要选择最能反映事物本质特)若干个标志中,要选择最能反映事物本质特征的标志作为分组标志征的标志作为分组标志华南理工大学精品课程华南理工大学精品课程3838统计分组统计分组统计分组的方法统计分组的方法1 1)品质分组的方法)品质分组的方法2 2)变量分组的方法)变量分组的方法p单项式分组:一个数值作为一组,如按家庭人单项式分组:一个数值作为一组,如按家庭人口数进行分组口数进行分组p组距式分组:一个区间作为一组组距式分组:一个区间作为一组等距分组等距分组与与不等距分组不等距分组。组限组限与与组中值组中值。华南理工大学精品课程华南理工大学精品课程3939分配数列分配数列分配数列也称次数分布或次数分配,是统计资料经分配数列也称次数分布或次数分配,是统计资料经过对某一标志分组后按一定的分组顺序,列出各组过对某一标志分组后按一定的分组顺序,列出各组的总体单位,形成一个反映总体单位在各组间分配的总体单位,形成一个反映总体单位在各组间分配情况的统计数列,分布在各组的总体单位数叫情况的统计数列,分布在各组的总体单位数叫次数次数,又称,又称频数频数;各组次数与总次数之比称为;各组次数与总次数之比称为频率频率。华南理工大学精品课程华南理工大学精品课程4040文化程度文化程度职职工人数(人)工人数(人)占占总总人数的比重(人数的比重(%)本科及以上本科及以上35017.5大大专专及以上及以上80040.0中中专专及高中及高中60030.0初中及以下初中及以下25012.5合合计计20000100.00分配数列分配数列按选用的分组标志性质不同可分为品质数列和变按选用的分组标志性质不同可分为品质数列和变量数列。量数列。变量数列的编制方法变量数列的编制方法第一步,将原始资料按数字大小依次进行排列。第一步,将原始资料按数字大小依次进行排列。第二步,确定定量的类型和分组的方法(如单项第二步,确定定量的类型和分组的方法(如单项式或组距式分组)。式或组距式分组)。第三步,确定组数和组距。第三步,确定组数和组距。第四部,确定组限及其表示方法。第四部,确定组限及其表示方法。第五步,汇总各组的次数,并计算频率。第五步,汇总各组的次数,并计算频率。华南理工大学精品课程华南理工大学精品课程4141华南理工大学精品课程华南理工大学精品课程4242案例分析案例分析 次数分配表的编制次数分配表的编制【例例例例】20112011年全国各省区人均年全国各省区人均GDPGDP数如下(单位:万元),请数如下(单位:万元),请编制各省区市人均编制各省区市人均GDPGDP数列。数列。5.88 4.70 5.03 4.74 5.05 5.67 6.10 1.61 5.88 4.70 5.03 4.74 5.05 5.67 6.10 1.61 1.90 1.96 2.99 2.88 2.02 2.54 2.54 2.87 1.90 1.96 2.99 2.88 2.02 2.54 2.54 2.87 2.90 2.60 2.61 8.652.90 2.60 2.61 8.65 3.79 3.47 3.42 3.03 3.79 3.47 3.42 3.03 3.08 8.04 3.26 3.27 3.32 8.26 3.373.08 8.04 3.26 3.27 3.32 8.26 3.37华南理工大学精品课程华南理工大学精品课程4343案例分析案例分析 次数分配表次数分配表人均人均GDP分分组组次次 数数频频率率%1.5 3.0万元万元12393.0 4.5万元万元9294.5 6.0万元万元6196.0 7.5万元万元137.5 9.0万元万元310合合计计31100表表2-6 2011年全国年全国31个省区市人均个省区市人均GDP统计表统计表华南理工大学精品课程华南理工大学精品课程4444次数分配的类型次数分配的类型对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J JJ型分布型分布型分布反反反J JJ型分布型分布型分布U UU型分布型分布型分布图图图图2-2 2-2 2-2 2-2 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布华南理工大学精品课程华南理工大学精品课程4545洛伦茨曲线洛伦茨曲线1.1.2020世世纪纪初初美美国国经经济济学学家家、统统计计学学家家洛洛伦伦茨茨(M.E.(M.E.Lorentz)Lorentz)根根据据意意大大利利经经济济学学家家巴巴雷雷特特(V.(V.Pareto)Pareto)提出的收入分配公式绘制而成提出的收入分配公式绘制而成2.2.描述收入和财富分配性质描述收入和财富分配性质的曲线,分析该国家或地区的曲线,分析该国家或地区分配的平均程度分配的平均程度AB累积的人口百分比累积的人口百分比累积的人口百分比累积的人口百分比 绝对公平线绝对公平线绝对公平线绝对公平线 累累累累积积积积的的的的收收收收入入入入百百百百分分分分比比比比 华南理工大学精品课程华南理工大学精品课程4646基尼系数基尼系数1.1.2020世世 纪纪 初初 意意 大大 利利 经经 济济 学学 家家 基基 尼尼(G.(G.Gini)Gini)根根据据洛洛伦伦茨茨曲曲线线给给出出了了衡衡量量收收入入分分配配平平均均程度的指标程度的指标2.2.A A表示实际收入曲线与绝对平均线之间的面积表示实际收入曲线与绝对平均线之间的面积3.3.B B表示实际收入曲线与绝对不平均线之间的面积表示实际收入曲线与绝对不平均线之间的面积4.4.如果如果A=0A=0,则基尼系数,则基尼系数=0=0,表示收入绝对平均,表示收入绝对平均华南理工大学精品课程华南理工大学精品课程4747基尼系数基尼系数5.5.如果如果B=0B=0,则基尼系数,则基尼系数=1=1,表示收入绝对不平均,表示收入绝对不平均6.6.基尼系数在基尼系数在0 0 和和1 1之间取值之间取值7.7.一般认为:一般认为:基尼系数若小于基尼系数若小于0.20.2,表明分配平均;,表明分配平均;基尼系数在基尼系数在0.20.2至至0.40.4之间是比较适当的,之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;即一个社会既有效率又没有造成极大的分配不公;基尼系数在基尼系数在0.40.4被认为是收入分配不公平的警戒线,被认为是收入分配不公平的警戒线,超过了超过了0.40.4应该采取措施缩小这一差距。应该采取措施缩小这一差距。AB华南理工大学精品课程华南理工大学精品课程4848本节提问本节提问描述次数分配表的编制过程。描述次数分配表的编制过程。Q1Q2Q3解释洛伦茨曲线及其用途。解释洛伦茨曲线及其用途。说明基尼系数的含义和用途。说明基尼系数的含义和用途。华南理工大学精品课程华南理工大学精品课程第五节第五节 分布集中趋势的测度分布集中趋势的测度一、众数一、众数二、中位数二、中位数三、算术平均数三、算术平均数四、调和平均数四、调和平均数五、几何平均数五、几何平均数六、众数、中位数和均值的比较六、众数、中位数和均值的比较七、四分位数七、四分位数八、切尾均值八、切尾均值华南理工大学精品课程华南理工大学精品课程5050众数众数 (modemode)1.1.一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.2.适合于数据量较多时使用适合于数据量较多时使用3.3.不受极端值的影响不受极端值的影响4.4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.5.主要用于分类数据,也可用于顺序数据和数值主要用于分类数据,也可用于顺序数据和数值型数据型数据华南理工大学精品课程华南理工大学精品课程5151众数众数 (不惟一性不惟一性)无众数无众数原始数据原始数据:11 3 7 12 9 8:11 3 7 12 9 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:7 :7 :7 :7 4 4 4 4 6 13 6 13 6 13 6 13 4 4 4 4 4 4 4 4多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据:17 :17 :17 :17 15151515 15151515 33 33 33 33 24 24 24 24 24242424众数众数 组距分组数据的众数:组距分组数据的众数:设众数组的频数为设众数组的频数为 f f,众数组前一组的频数为,众数组前一组的频数为 f f-1-1 ,众数组后一组的频数为,众数组后一组的频数为f f+1+1,从众数组直方图的两个顶角向相邻两组直方图的,从众数组直方图的两个顶角向相邻两组直方图的两个顶角引直线,再由交叉点向横轴引垂线,与横两个顶角引直线,再由交叉点向横轴引垂线,与横轴相交的点即为众数。轴相交的点即为众数。华南理工大学精品课程华南理工大学精品课程5252众数众数组距分组的众数组距分组的众数华南理工大学精品课程华南理工大学精品课程5353华南理工大学精品课程华南理工大学精品课程5454中位数中位数 (medianmedian)1.1.排序后处于中间位置上的值排序后处于中间位置上的值2.2.不受极端值的影响不受极端值的影响3.3.主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据4.4.4.4.当次数分布偏态时,中位数的代表性会受到影响当次数分布偏态时,中位数的代表性会受到影响5.5.5.5.缺乏敏感性缺乏敏感性MMe e50%50%华南理工大学精品课程华南理工大学精品课程5555中位数中位数 (位置的确定位置的确定)对于未分组的原始资料:对于未分组的原始资料:由分组资料确定中位数由分组资料确定中位数华南理工大学精品课程华南理工大学精品课程5656中位数中位数 (位置的确定位置的确定)中位数中位数所在组下限中位数所在组上限中位数所在组的次数总次数中位数所在组的组距中位数所在组以下的累计次数中位数所在组以下的累计次数华南理工大学精品课程华南理工大学精品课程5757案例分析案例分析 (9(9个数据的算例个数据的算例)【例例例例】9 9 9 9个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1400 750 760 1050 870 950 2100 1450 15401400 750 760 1050 870 950 2100 1450 1540 排排排排 序序序序:750 760 870 950 750 760 870 950 10501050 1400 1450 1540 21001400 1450 1540 2100位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 7 8 9 6 7 8 9中位数中位数中位数中位数 =1050=1050=1050=1050华南理工大学精品课程华南理工大学精品课程5858案例分析案例分析 (10(10个数据的算例个数据的算例)【例例例例】10 10 10 10个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据 排排排排 序序序序:635635 690 770 820690 770 820 930 1078930 1078 1230 1450 1690 21501230 1450 1690 2150 位位位位 置置置置:1 2 3 4 1 2 3 4 5 65 6 7

    注意事项

    本文(第2章_统计数据的描述.ppt)为本站会员(qwe****56)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开