2022年数据分析复习资料 .pdf
《2022年数据分析复习资料 .pdf》由会员分享,可在线阅读,更多相关《2022年数据分析复习资料 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.数理统计1.1 数理统计:它通过对随机现象的观察收集一定量的数据,然后进行整理、分析,并应用概率论的知识作出合理的估计、推断、预测。1.2 总体抽样:总体:所研究的具有某些相同性质的全部单位或事件的整体。抽样:从总体中抽取部分单位所组成的整体,用以分析总体。1.3 收集:1.3.1 统计数据的来源分为直接来源和间接来源。1.3.2 统计调查的组织方式有普查,抽样调查,统计报表,重点调查,典型调查。1.3.3 统计数据的具体收集方法有:1.询问调查:访问调查,邮寄调查,电话调查,座谈会,个别深度访问,网上调查2.观察与实验:观察法,实现法。1.4 整理:统计数据的预处理:是数据分组处理的先前
2、步骤,包括审核,筛选,排序。审核:应用各种检查规则来辨别缺失、无效或不一致的录入。筛选:1.将某些不符合要求的或有明显错误的数据予以剔除。2.将符合某种特定要求的数据筛选出来。排序:把定量的数据按由大到小或由小到大的顺序排列,将定性的数据按习惯的文字顺序排列,便于我们研究其条理。1.5 统计分组:对于定性的数据就是依据属性的不同将数据划分成若干组,对于定量的数据就是依据属性数值的不同将数据分成若干组。特点:组内同质性,组间差异性。按数量标志分组的两类方法:1.单项式分组:每个组的变量值是一个值,适用于变量值不多,变化范围不大的离散变量(比如大学生按专业分组)2.组距式分组:将总体按照数据标志分
3、为几个区间,适用于连续型变量或变量值较多的离散型变量。(比如人口按年龄分组)1.6 频数分布:在对总体进行分组的基础上,将总体中所有单位按组归类整理,形成总体各单位在各组间的分布。3.数据的显示统计图:是用点、线、面、体来形象地表示数量资料的一种方式。2.1 条形图:是利用相同宽度条形的长短或高低表现各相互相对立的统计数据大小或变动的统计图。2.2 圆饼图:用来表示事物内部的构成情况(必须用相对数,且各项和为100% 图中扇形面积的大笑表示百分比数量)2.3 星形图:适用于同期性数据,如一年的月份或一天的小时,也适用于成分组成数据。名师资料总结 - - -精品资料欢迎下载 - - - - -
4、- - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 2.4 散步图:形象的反映出有内部关系的两个连续变量之间的变化趋势。2.5 拆线图:适用于表示两个或多个事物随着时间的推移,在速度上的变化快慢。2.6 层次图:在地理学中用来绘制等高线,在经济学中常用来画等值的利润曲线。2.7 三维图:必须指定三个三维图形变量才能产生。3.数据3.1 集中趋势:一组数据向中心值靠拢的趋势。3.2 绝对数:统计资料经过汇总整理后等到的反映总体规模和水平的总和指标。3.3 相对数:用两个有联系的指标进行对比的比值
5、。3.4 平均数:表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内观察值的代表性数值。3.5 常用的平均数:1.算术平均数:一个变量的所有观察值相加,再除以观察值的个数。2.几何平均数:几个变量的值连乘的n 次根。3.中位数:是一种位置平均数,数据按大小顺序排列,处于数据序列中间位置的数值即中位数。4.众数:是一种位置平均数,是一批数据中出现次数最多的数。3.6 平均数之间的关系:1.众数适用于所有定性数据和定量数据2.中位数适用于定性数据中的定量数据和定序数据3.算术平均数只适用于定量数据。3.7 离散趋势用一个特定的数值来反映一组数据相互之间的离散程度。标志变异指标:反映变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年数据分析复习资料 2022 数据 分析 复习资料
限制150内