数据统计分析法.pptx
《数据统计分析法.pptx》由会员分享,可在线阅读,更多相关《数据统计分析法.pptx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1、以上的图表、图形是怎样生成(制作)的?2、以上的展会分析报告是怎样制作的?根据怎样的逻辑思想?以什么样的方式呈现出来?第1页/共36页1、图表、图形的生成方式主要有两种:手动制表、用程序自动生成2、展会分析报告的生成方式:人工写作、程序生成3、展会报告是根据提取报告模型内分析点进行分析、生成一系列图表而形成的,展示给展商或者买家看,提供给他们有用的数据而对参展、参观做出选择的一种依据。第2页/共36页报告制作流程图报告模型操作方法数据源分析模型(分析点)数据字段报告工具分析生成 抽样读取形成注解第3页/共36页概述常用数据分析方法其它分析方法列举目录1342常用数据抽样方法数据呈现的方式5
2、第4页/共36页什么叫数据统计分析?1、数据科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值2、统计指对某一现象有关的数据的搜集、整理、计算和分析等的活动(汉语中的“统计”有合计、总计的意思)3、分析将研究对象的整体分为各个部分、方面、因素和层次,并分别地加以考察的认识活动4、数据统计分析对合计、总计的数值进行各部分、方面、因素和层次加以考察和认识的活动第5页/共36页常用统计抽样方法一、简单随机抽样法二、分层抽样法三、系统抽样法四、整群抽样第6页/共36页第7页/共36页1、简单随机抽样一般地,设一个总体的个体数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽
3、取时各个个体被抽到的概率相等,就称这样抽样为简单随机抽样。特点:1)总体中的个体数有限。2)从总体中逐个抽取,是不放回抽样。3)是一种等概率抽样。简单随机抽样的具体作法有:抽签法。将总体的全部单位逐一作签,搅拌均匀后进行抽取。随机数字表法。将总体所有单位编号,然后从随机数字表中一个随机起点(任一排或一列),开始从左向右或从右向左、向上或向下抽取,直到达到所需的样本容量为止。第8页/共36页第9页/共36页分层抽样法各层样本数的确定方法有 3种:分层定比。即各层样本数与该层总体数的比值相等。例如,样本大小n=50,总体N=500,则n/N=0.1即为样本比例,每层均按这个比例确定该层样本数。奈曼
4、法。即各层应抽样本数与该层总体数及其标准差的积成正比。非比例分配法。当某个层次包含的个案数在总体中所占比例太小时,为使该层的特征在样本中得到足够的反映,可人为地适当增加该层样本数在总体样本中的比例。但这样做会增加推论的复杂性。第10页/共36页实例操作例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取,过程:解:S1:100/500=0.2 S2:125*0.2=25(不到35岁)280*0.2=56(
5、35岁至49岁)95*0.2=19(50岁以上)S3:所以:35岁的抽25人 3549岁的抽56人 50岁的抽19人第11页/共36页第12页/共36页系统抽样法(等距抽样)3、系统抽样法当总体的个体数N较大时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本这种抽样叫做系统抽样。是纯随机抽样的变种特点:1、总体的个体数确定2、总体中个体较多但均衡;3、将总体分成几个均衡的部分。第13页/共36页整群抽样整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求
6、各群有较好的代表性,即群内各单位的差异要大,群间差异要小。整群抽样的优缺点:整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。第14页/共36页整群抽样的实施步骤先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:一、确定分群的标注 二、总体(N)分成若干个互不重叠的部分,每个部分为一群。三、据各样本量,确定应该抽取的群数。四、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1
7、h生产的全部产品进行检验等。第15页/共36页整群抽样与分层抽样的区别整群抽样与分层抽样在形式上有相似之处,但实际 上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本时从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。第16页/共36页常用的数据分析方法1 列表法 将实验数据按一定规律用列表方式表达出来是记录和处理实验数据最常用的方法。表格的设计要求对应关系清楚、简单明了、有利于发现相关量之间的物理关系;此外还要求在标题栏中注明物理量名称、符号、数量级和单位等;根据需要还可以
8、列出除原始数据以外的计算栏目和统计栏目等。最后还要求写明表格名称、主要测量仪器的型号、量程和准确度等级、有关环境条件参数如温度、湿度等。2 作图法 作图法可以最醒目地表达物理量间的变化关系。从图线上还可以简便求出实验需要的某些结果(如直线的斜率和截距值等),读出没有进行观测的对应点(内插法),或在一定条件下从图线的延伸部分读到测量范围以外的对应点(外推法)。此外,还可以把某些复杂的函数关系,通过一定的变换用直线图表示出来。例如半导体热敏电阻的电阻与温度关系为,取对数后得到,若用半对数坐标纸,以lgR为纵轴,以1T为横轴画图,则为一条直线。第17页/共36页第18页/共36页其他分析方法列举1、
9、加权平均法2、主成分分析法3、因子分析法4、聚类分析法5、判别分析法6、对应分析法7、典型相关分析法8、多维尺度分析法9、SWOT分析法10、对比分析法第19页/共36页1、加权平均法定义根据本期期初结存存货的数量和金额与本期存入存货的数量和金额,在期末以此计算本期存货的加权平均单价,作为本期发出存货和期末结存存货的价格,一次性计算本期发出存货的实际成 本。加权平均法又称“综合加权平均法”、“全月一次加权平均法”。加权平均法是指标综合的基本方法,具有两种形式,分别为加法规则与乘法规则。存货的加权平均单位成本=(月初结存货成本+本月购入存货成本)/(月初结存存货数量+本月购入存货数量)月末库存存
10、货成本=月末库存存货数量存货加权平均单位成本本期发出存货的成本=本期发出存货的数量存货加权平均单位成本 或=期初存货成本+本期收入存货成本-期末存货成本 加权平均法,在市场预测里,就是在求平均数时,根据观察期各资料重要性的不同,分别给以不同的权数加以平均的方法。其特点是:所求得的平均数,已包含了长期趋势变动。第20页/共36页举例说明A产品34元一个,买了10个,B产品45元一个,买了20个,问买了A产品和B产品的平均价格是多少?这时肯定不能用算术平均,直接(34+45)/2,因为他们买的数量不一样,因此要计算他们的平均价格,只能用所买的数量作为权数,进行加权平均:(3410+4520)/(1
11、0+20)=1240/30=41.33元/个第21页/共36页2、主成分分析法定义主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。应用在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。分析步骤1)数据标准化;2)求相关
12、系数矩阵;3)一系列正交变换,使非对角线上的数置0,加到主对角上;4)得特征根xi(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;5)求各个特征根对应的特征向量;6)用下式计算每个特征根的贡献率Vi;Vi=xi/(x1+x2+.)7)根据特征根及其特征向量解释主成分物理意义。第22页/共36页3、因子分析法因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出
13、影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。第23页/共36页4、聚类分析法聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有
14、针对性的对目标消费群体施加影响,合理地开展工作。第24页/共36页5、判别分析判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 统计分析
限制150内