第1章数据分析课件.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第1章数据分析课件.pptx》由会员分享,可在线阅读,更多相关《第1章数据分析课件.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第1111讲(第讲(第1414章)章)数据分析数据分析2v数据整理的程序一般如下:数据整理的程序一般如下:1.对原始原始资料料进行行审核、核、订正正2.编码3.数据的数据的录入入4.数据的清数据的清洁5.进行行统计预处理理6.制制订数据分析的初步方案数据分析的初步方案7.数学数学处理理上章与本章内容衔接3l在大量的调查工作结束后,就要对这些资料进行在大量的调查工作结束后,就要对这些资料进行统计归类、整理分析,即统计分析统计归类、整理分析,即统计分析l对调查资料进行整理统计l运用统计图进行描述性分析l进行分布分析和相对分析l集中量数分析与离中量数分析【本章的实质性工作】4Contents数据分
2、析的作用与要求1交叉列表分析2数据资料的概括技术3综合指标分析法4动态分析法55第一节数据分析的作用与要求一、数据分析的含义一、数据分析的含义v它是指对市场调研与预测过程中收集到的各种它是指对市场调研与预测过程中收集到的各种数据资料进行适当的处理数据资料进行适当的处理,使其显示一定的含义使其显示一定的含义,进而反映不同数据之间以及新数据与原数据之间进而反映不同数据之间以及新数据与原数据之间的联系的联系,并通过分析并通过分析,得出某些结论。得出某些结论。二、数据分析的作用二、数据分析的作用6l数据分析在数据收集之后进行,但应根据整个项数据分析在数据收集之后进行,但应根据整个项目的目的、特点预先设
3、计好数据分析技术,制订目的目的、特点预先设计好数据分析技术,制订数据分析计划。数据分析计划。l数据分析计划:数据分析计划:l确定所需变量l测量这些变量所用的方法l数据分析过程及所用的技术三、数据资料分析的要求三、数据资料分析的要求7Contents数据分析的作用与要求1交叉列表分析2数据资料的概括技术3综合指标分析法4动态分析法58统计描述v频数分布:在分组的基础上,把总体的所有单位频数分布:在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的按组归并排列,形成总体中各个单位在各组间的分布,称为频数分布。又称分布数列。分布,称为频数分布。又称分布数列。v两个要素:两个要素
4、:总体按其标志所分的组各组所分布的单位数9频数直方图10交叉列表分析v频数分布一次描述一个变量,而交叉表,或列联频数分布一次描述一个变量,而交叉表,或列联表(表(cross-tabulation)可同时描述两个或更多可同时描述两个或更多变量。变量。一、概念一、概念v交叉表交叉表(列联表列联表)分析法分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。11性别和互联网使用频率12v某保某保险公司公司对影响保影响保户开开车事故率的因素事故率的因素进行行调研,并研,并对各种因素各种因素进行了交叉表分析。行了交叉表分析
5、。v交叉表法的起点是交叉表法的起点是单变量数据,然后依研究目的量数据,然后依研究目的将将这些数据分成两个或多个些数据分成两个或多个细目。目。表1 驾驶员的事故率类 别比率,%无事故61至少有一次事故39样本总数,人17800二、交叉列表分析中变量的选择和确定二、交叉列表分析中变量的选择和确定13v然后,在性然后,在性别基基础上分解上分解这个信息,判断是否在个信息,判断是否在男女男女驾车者之者之间有差有差别。这样就出就出现了二了二维交叉交叉表表2。表2 男女驾驶员的事故率类 别男,%女,%无事故5666至少有一次事故4434样本总数,人93208480二、交叉列表分析中变量的选择和确定二、交叉列
6、表分析中变量的选择和确定14v这个表的结果令男士懊恼,因为他们的事故率较女士驾车时涉及的事故率要高。但人们会提出这样的疑问而否定上述判断的正确性,即男士的事故多,是因为他们驾驶的路程较长。这样就引出第三个因素驾驶距离,于是出现了三维交叉表3。表表3 不同不同驾驶距离下的事故率距离下的事故率类 别男,%女,%驾驶距离1万公里 1万公里1万公里无事故51735073至少有一次事故49275027样本总数,人7170215024306050二、交叉列表分析中变量的选择和确定二、交叉列表分析中变量的选择和确定15v结果表明:男士果表明:男士驾驶者的高事故率是由于他者的高事故率是由于他们的的驾驶距离距离
7、较女士女士长,但并没有,但并没有证明男士和女士哪明男士和女士哪个个驾驶得更好或更得更好或更谨慎,慎,仅证明了明了驾车事故率只事故率只与与驾驶距离成正比,而与距离成正比,而与驾驶者的性者的性别无关。无关。二、交叉列表分析中变量的选择和确定二、交叉列表分析中变量的选择和确定16二、交叉列表分析中变量的选择和确定二、交叉列表分析中变量的选择和确定v强调:变量的确定在资料收集之前。v确定列表中确定列表中变量的量的内容内容和和数量数量,由,由调研研项目的特目的特征决定。征决定。在描述性调研中,研究者有较大的自主权来选择这些变量。在探索性研究中,研究者凭主观意识选择所有的用于交叉表的变量。17三、双变量交
8、叉列表分析法三、双变量交叉列表分析法v最基本的交叉列表分析法。最基本的交叉列表分析法。1.把双把双变量交叉列表中各量交叉列表中各项绝对数的表示数的表示转换成百成百分数分数,能更清楚地能更清楚地显示相关关系。示相关关系。2.行百分比与列百分比的行百分比与列百分比的选择取决于哪个取决于哪个变量是因量是因变量哪个量哪个变量是自量是自变量。一般的量。一般的规则是,在自是,在自变量的方向上,量的方向上,对因因变量量计算百分比。算百分比。18例v研究城研究城镇居民在某地的居住居民在某地的居住时间与其与其对当地百当地百货商商场的熟悉程度之的熟悉程度之间的关系,的关系,对“居住居住时间”和和“熟熟悉程度悉程度
9、”这两个两个变量量进行交叉列行交叉列联分析。分析。表4.居住时间与对百货商场的熟悉程度的交叉列联分析(频数)熟悉程度居住时间合计13年以下13年30年30年以上不熟悉熟悉455234535527134132合计97878226619例v那么,到底居住那么,到底居住时间与与对商商场的熟悉程度有没有的熟悉程度有没有关系呢关系呢?进一步一步计算出百分比,算出百分比,则可以看得更直可以看得更直观一些。一些。表5.居住时间与对百货商场的熟悉程度的交叉列联分析(%)熟悉程度居住时间13年以下13年30年30年以上不熟悉熟悉46.453.639.160.967.132.9合计100.0100.0100.02
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内