《统计学基础任务数据整理.pptx》由会员分享,可在线阅读,更多相关《统计学基础任务数据整理.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1统计学基础任务数据整理统计学基础任务数据整理2/58l数据整理的程序l数据预处理l数据分类或分组l数据的汇总和图表显示 编码 审核 筛选 排序完整性、准确性、时效性3.1 数据整理的程序 任务三 数据整理与显示第1页/共57页3/583.2 数据的分组 任务三 数据整理与显示l 3.2.1 统计分组的概念l 3.2.2 品质数据分组l 3.2.3 数值型数据分组l 3.2.4 统计分组的形式学习要点重点第2页/共57页4/58n统计分组的原则:第一,各组之间有性质上的差别;第二,坚持互斥和穷尽的原则,“互斥”是指一个个体只能 归属于某一组,而不能同时归属于几个组;“穷尽”是指总 体中的
2、每一个个体都必须有组可归;第三,反映出总体的分 布特征。n统计分组:根据研究的目的,选择合适的分组标志将 原始数据分成几个不同的组。任务三 数据整理与显示3.2.1 统计分组的概念 任务三 数据整理与显示3.2.1 统计分组的概念第3页/共57页5/58n分组标志的类型:品质标志和数量标志n分组标志的选择 任务三 数据整理与显示3.2.1 统计分组的概念品质标志数量标志性别、专业、年级、年龄、成绩、工资、文字表示数字表示第4页/共57页6/58 任务三 数据整理与显示3.2.2 品质数据分组n按品质标志分组,就是选择反映事物属性差 异的品质标志作为分组标志。n品质标志有两种表现:分类数据和顺序
3、数据 民族职业专业文化程度 任务三 数据整理与显示3.2.2 品质数据分组 任务三 数据整理与显示3.2.2 品质数据分组第5页/共57页7/58 任务三 数据整理与显示3.2.3 数值型数据分组n数值型数据分组有两种形式:单项式分组和组距式分组 n单项式分组(要点)l用一个变量值作为一组l适合于变量值较少的离散变量 任务三 数据整理与显示3.2.3 数值型数据分组第6页/共57页8/58按家庭成员人数分组(人)按家庭成员人数分组(人)家庭数(个)家庭数(个)1234及及4以上以上合计合计离散型变量一个变量值作为一组变量值较少 任务三 数据整理与显示3.2.3 数值型数据分组第7页/共57页9
4、/58n组距分组(要点)l用变量值的一个区间作为一组l适合于连续变量和变量值较多的离散变量 任务三 数据整理与显示3.2.3 数值型数据分组第8页/共57页10/58按成绩分组(分)按成绩分组(分)人数(人)人数(人)比重比重(%)60以下以下76.3660701919.0970802828.1880903426.36901002220.00合计合计110100.00连续型变量变量值的一个区间作为一组不管变量值多还是少 任务三 数据整理与显示3.2.3 数值型数据分组第9页/共57页11/58按加工量分组(件)按加工量分组(件)频数(人)频数(人)频率(频率(%)15以下以下15-2020-2
5、525-3030-3535-4040-4545以上以上5820332311734.557.2718.1830.0020.9110.006.362.73合计合计110100.00离散型变量变量值的一个区间作为一组变量值较多 任务三 数据整理与显示3.2.3 数值型数据分组第10页/共57页12/58l组距式分组的几个要素l 组数l 组距l 组限l 组中值 任务三 数据整理与显示3.2.3 数值型数据分组第11页/共57页13/58u 组 数根据经验,组数在515为宜美国学者斯特斯基于1926年提出了一种计算组数 的参考公式为组数,为数据个数 任务三 数据整理与显示3.2.3 数值型数据分组第12
6、页/共57页14/58在等距数列中,可以根据极差和事先确定的组数推算:u 组 距 组距宜取整数 每组上限和下限之间的差额 任务三 数据整理与显示3.2.3 数值型数据分组组距第13页/共57页15/58组 限下限:一个组的最小值 上限:一个组的最大值重叠组限:用同一变量值作为相临两组的上下限;使用重叠 组限时,坚持“上限不在内”的原则不重叠组限:用顺序两个变量值作为相邻两组的上限和下限u 组 限 每个组的最大值和最小值 任务三 数据整理与显示3.2.3 数值型数据分组第14页/共57页16/58重叠组限按零件数分组(件)按零件数分组(件)人数(人)人数(人)110110以下以下3 3110-1
7、15110-1155 5115-120115-1208 8120-125120-1251414125-130125-1301010130-135130-1356 6135135以上以上4 4合计合计5050按零件数分组(件)按零件数分组(件)人数(人)人数(人)109109以下以下3 3110-114110-1145 5115-119115-1198 8120-124120-1241414125-129125-1291010130-134130-1346 6135135以上以上4 4合计合计5050不重叠组限 离散型变量 任务三 数据整理与显示3.2.3 数值型数据分组第15页/共57页17/
8、58重叠组限按成绩分组(分)按成绩分组(分)人数(人)人数(人)6060以下以下3 360-7060-707 770-8070-80181880-9080-90141490-10090-1008 8合计合计5050按成绩分组(分)按成绩分组(分)人数(人)人数(人)5959以下以下3 360-6960-697 770-7970-79181880-8980-89141490-10090-1008 8合计合计5050不重叠组限 连续型变量 任务三 数据整理与显示3.2.3 数值型数据分组第16页/共57页18/58u 组 中 值 任务三 数据整理与显示3.2.3 数值型数据分组第17页/共57页1
9、9/58u 数值型数据分组实例 任务三 数据整理与显示3.2.3 数值型数据分组第18页/共57页20/58 简单分组、平行分组或复合分组n统计分组的形式按一个标志分组按两个或两个以上标志分组 任务三 数据整理与显示3.2.4 统计分组的类型l平行分组 l 简单分组l复合分组 将总体按两个或两个以上的标志结合起来进行层叠分组 对同一总体同时选择两个或两个以上的标志分别进行简单分组 任务三 数据整理与显示3.2.4 统计分组的类型第19页/共57页21/583.3 频数分布 任务三 数据整理与显示l 3.3.1 频数分布的概念l 3.3.2 频数分布的编制l 3.3.3 频数分布的常见形式l 3
10、.3.4 统计分组与频数分布的Excel操作 学习要点重点第20页/共57页22/58 任务三 数据整理与显示3.3.1 频数分布的概念n频数分布,又称次数分布或次数分布数列 在分组的基础上,计算出各类别或数据在各组中出现的次数或频数,就形成了频数分布。n频数分布的两个要素 l各组的频数 频数是统计分组后各组数据出现的次数 频率是某一类别或组出现的次数占总次数的比重,通常用百分数(%)表示,各组频率之和等于1或100%。l总体分组 任务三 数据整理与显示3.3.1 频数分布的概念第21页/共57页23/58按成绩分组(分)按成绩分组(分)人数(人)人数(人)比重比重(%)60以下以下76.36
11、60701919.0970802828.1880903426.36901002220.00合计合计110100.00 任务三 数据整理与显示3.3.1 频数分布的概念频数频率分 组频数分布表第22页/共57页24/58n累积频数和累积频率l累积频数(cumulative frequencies):各组别频数的逐级累加l累积频率(cumulative percentages):各类别频率(百分比)的逐级累加 任务三 数据整理与显示3.3.1 频数分布的概念l累积方法有两种:向上累积、向下累积 任务三 数据整理与显示3.3.1 频数分布的概念第23页/共57页25/58人数(人)人数(人)比重(比
12、重(%)很不满意很不满意较不满意较不满意一般一般较满意较满意很满意很满意1462564424731282212合计合计200100甲地对某通讯公司服务的满意程度 任务三 数据整理与显示3.3.1 频数分布的概念第24页/共57页26/58人数人数(人)(人)比重比重(%)向上累积向上累积向下累积向下累积人数人数(人)(人)比重比重(%)人数人数(人)(人)比重比重(%)很不满意很不满意不满意不满意一般一般较满意较满意满意满意146256442473128221214761321762007386688100200186124682410093623412合计合计200100甲地对某通讯公司服务
13、的满意程度 任务三 数据整理与显示3.3.1 频数分布的概念第25页/共57页27/583.3.2 频数分布的编制 任务三 数据整理与显示l计算各组的频数 l总体分类或分组编制频数分布的步骤:l形成频数分布表 第26页/共57页28/583.3.2 频数分布的编制 任务三 数据整理与显示例3-3-1 分类数据频数分布的编制例3-3-2 顺序数据频数分布的编制例3-3-3 数值型数据频数分布的编制第27页/共57页29/583.3.3 频数分布的类型 任务三 数据整理与显示频数分布图:横轴是总体分组 纵轴是频数或频率 频数分布主要形态:钟形分布 J形分布 U形分布 第28页/共57页30/583
14、.3.4 常用Excel操作 任务三 数据整理与显示在Excel中分组并形成频数分布的途径有4种:1分类汇总2数据透视表4数据分析直方图3函数“FREQUENCY”第29页/共57页31/583.4 统计表和统计图 任务三 数据整理与显示n 3.4.1 统计表 统计表的构成、种类、应注意的问题n 3.4.2 统计图 常用统计图及其适用条件n 3.4.3 Excel的绘图操作 学习要点第30页/共57页32/58 任务三 数据整理与显示 任务三 数据整理与显示3.4.1 统计表统计资料的两种表现形式:统计表和统计图l统计表是以纵横交叉的线条绘制出的用以 表现数据资料的表格。任务三 数据整理与显示
15、3.4.1 统计表第31页/共57页33/582011年年末人口数及其构成年年末人口数及其构成单位:万人单位:万人指标指标年末数年末数比重比重%全国总人口全国总人口134735100.0其中:城镇其中:城镇6907951.3乡村乡村6565648.7其中:男性其中:男性6906851.3女性女性6566748.7其中:其中:0-14岁岁2216416.515-59岁岁9407269.860岁及以上岁及以上1849913.7其中:其中:65岁岁及以上及以上122889.1l统计表的构成横栏标题总标题纵栏标题数字资料 任务三 数据整理与显示3.4.1 统计表第32页/共57页34/58简单汇总表分
16、组表l统计表的种类 任务三 数据整理与显示3.4.1 统计表l 简单分组表l 复合分组表l 交叉分组表第33页/共57页35/58l合理安排统计表的结构l总标题内容应满足3W 要求l数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明l表中的上下两条横线一般用粗线,其他线用细线l通常情况下,统计表的左右两边不封口l表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一l对于没有数字的表格单元,一般用“”表示l必要时可在表的下方加上注释n绘制统计表的注意事项 任务三 数据整理与显示3.4.1 统计表第34页/共57页36/58 任务三 数据整理与显示
17、3.4.2 统计图n统计图是指利用几何图形(点、线、面、形)或其 他图形来表现研究对象的特征、内部结构、相互关系等的一种图形。n选择统计图时应考虑数据的类型第35页/共57页37/58n常用的统计图圆形图或称饼图条形图或柱形图直方图茎叶图箱线图曲线图散点图 任务三 数据整理与显示3.4.2 统计图 任务三 数据整理与显示3.4.2 统计图第36页/共57页38/58 任务三 数据整理与显示3.4.2 统计图第37页/共57页39/58圆形图条形图 任务三 数据整理与显示3.4.2 统计图第38页/共57页40/58图表向导 插入-图表 任务三 数据整理与显示3.4.2 统计图第39页/共57页
18、41/58选择所需图形 任务三 数据整理与显示3.4.2 统计图第40页/共57页42/58l饼图(pie Chart)l也称圆形图,用圆形及圆内扇 形的角度来表示数值的大小,表示总体或样本中各组成部分 所占的比例。l 适合显示研究对象的内部结构 任务三 数据整理与显示3.4.2 统计图第41页/共57页43/58饼图 任务三 数据整理与显示3.4.2 统计图第42页/共57页44/58l条形图 (bar Chart)l用宽度相同的条形的高度或长短来表示各类别数据的大小l条形图可以横置或纵置,纵置时也称为柱形图。l有简单条形图和复式条形图等形式。任务三 数据整理与显示3.4.2 统计图第43页
19、/共57页45/58柱状图 任务三 数据整理与显示3.4.2 统计图第44页/共57页46/58条形图 任务三 数据整理与显示3.4.2 统计图第45页/共57页47/58l环形图(annular chart)l环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示l环形图可用于结构比较研究 任务三 数据整理与显示3.4.2 统计图l环形图与圆形图类似,但又有区别p圆形图只能显示一个总体各部分所占的比例p环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环第46页/共57页48/58甲乙两地对某通讯公司服务的满意程度 甲 地区乙 地区环形图 任务三 数据整理与显示3.4
20、.2 统计图 任务三 数据整理与显示3.4.2 统计图第47页/共57页49/58 l茎叶图 任务三 数据整理与显示3.4.2 统计图第48页/共57页50/58l箱线图l箱线图(Box-plot)又称为盒须图、盒式图或箱形图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。l箱线图提供了一种只用5个点对数据集做简单总结的方式。这5个点包括中位数、上四分位数、下四分位数、最大值和最小值。l最适宜提供有关数据的位置和分散的参考,尤其在不同的母体数据时更可表现其差异。最小值中位数上四分位数值最大值下四分位数值 任务三 数据整理与显示3.4.2 统计图第49页/共57页51/58l直方图
21、 任务三 数据整理与显示3.4.2 统计图直方图是用来显示分组后的数值型数据频数分布的图形。第50页/共57页52/58u直方图与条形图的区别1.条形图是用条形的长度(横置时)表示各类别频数的多少,直方图是用面积表示各组频数的多少2.直方图的各矩形通常是连续排列,条形图则是分开排列3.条形图主要用于展示品质数据,直方图则主要用于展示数值型数据 任务三 数据整理与显示3.4.2 统计图第51页/共57页53/58l时间序列线图 任务三 数据整理与显示3.4.2 统计图线图是在平面坐标上用折线表现数据变化特征和规律的图形。第52页/共57页54/58散点图l散点图 任务三 数据整理与显示3.4.2 统计图反映两个变量之间相关关系 第53页/共57页55/58散点图l统计地图 任务三 数据整理与显示3.4.2 统计图统计地图是借助于地图反映研究对象数量特征的一种图型。第54页/共57页56/58 任务三 数据整理与显示3.4.3 绘制统计图的Excel操作 例3-4-1 例3-4-2 例3-4-3 l利用图表向导l数据透视图利用Excel绘制统计图:第55页/共57页57/58 任务三 要点回顾 任务三 数据整理与显示第56页/共57页
限制150内