最新定量分析----统计分析法PPT课件.ppt
《最新定量分析----统计分析法PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新定量分析----统计分析法PPT课件.ppt(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、定量分析定量分析-统计分析法统计分析法n统计分析法:运用建立在数学科学基础之上的各种方法去收集、整理和分析事物量的资料的工作方法。中数与众数n中数:位于一组数据中较大一半与较小一半中间位置的那个数。n众数:次数分布中出现次数最多的那个数的数值。(2)差异量数差异量数是描述一组数据离中趋势的量数,也就是数据的离散程度。常用的差异量数有:方差、标准差(Standard deviation)、全距、方差(s2或2)和标准差(s或)n样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。n样本中各数据与样本平均数的差的平方和的平均数叫做样本方差。n样本方差的
2、算术平方根叫做样本标准差。方差与标准差 A、B两组各有5位学生参加同一次能力测验,A组的分数为68、69、70、71、72,B组的分数为45、62、70、78、95。请问哪组学生能力差异小?A、B两组各有5位学生参加同一次能力测验,A组的分数为68、69、70、71、72,B组的分数为45、62、70、78、95。请问哪组学生能力差异小?n解答:求其标准差。这两组的平均数都是70,但A组的标准差为1.41,B组的标准差为16.6,说明A组比B组能力差异小。(3)地位量数n地位量数是描述单个数据在样本或总体中地位的量数。n地位量数有名次、百分等级、标准分数百分等级n某省考生的高考成绩单:考号 姓
3、名 语文 数学 外语 物理 理综 综合分 10050516 张华 592 598 642 581 619 636 百分等级 82.1 83.7 92.2 79.1 88.3 91.3 百分等级也称百分位,反映的是某个观测分数以下数据个数占总个数的比例,在0100之间取值。标准分数(z)标准分数(stardard score):一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置。在统计中,变量值与其平均数的离差除以标准差后的值,称为标准分数,也Z分数。某五名大学生参加公务员考试,其申论和行政职业能力测验的成绩如下:申论:82、79、90、88、66行政职业能力测验
4、:76、84、96、91、68其中,小王的申论成绩为88,行政职业能力测验成绩为91,请问小王哪门成绩好?解答:求其标准分数。该大学生两个分数的标准分数都是正数,说明他两门考课程考试成绩皆高于该组平均分数;因为申论标准分数的绝对值大于职业行政能力准标分数的绝对值,说明申论成绩距离平均分的差距要大于职业行政能力距离平均分的差距,即申论成绩更为突出。(4)相关系数 相关的界定:n函数关系两种现象或变量之间存在确定的严格的依存关系,这种关系可用函数关系式表达。n相关关系两种现象或变量之间存在不确定的不严格的依存关系。计件工资总额与零件数量身高与体重血压与年龄商品的销售量与单价数学成绩的好坏与物理成绩
5、的好坏商品销售与广告粮食生产与施肥量吸烟与身体健康这些变量中哪些是相关关系,哪些是函数关系?(4)相关系数 相关的分类:A 按相关的性质分,有正相关和负相关B 按相关的形式分,有线性相关和非线性相关 C 按影响因素多少分,有单相关和复相关 D 按相关的程度分,有完全相关、不完全相关和不相关(4)相关系数 相关的分类:A 按相关的性质分,有正相关和负相关。正相关:两个变量按照相同的方向变化负相关指:两个变量按照相反的方向变化(4)相关系数 相关的分类:B按相关的形式分,有线性相关和非线性相关 线性相关(直线相关):即当自变量变动时,因变量也随之发生大致均等的变动。非线性相关(曲线相关):即当自变
6、量发生变动时,因变量也发生变动,但其增加或减少不是均等的。散点图(散布图):变量X、Y的全部可能取值在直角坐标系中形成的图形。示例为研究学习时间与学习成绩之间的关系,测得出下数据:时间100110120130140150160170180190成绩45515461667074788589(4)相关系数 相关的分类:C按影响因素多少分,有单相关和复相关。单相关:两个变量之间的相关称为单相关;复相关:一个因变量与两个或两上以上自变量之间的相关称为复相关或多元相关。(4)相关系数 相关的分类:D按相关的程度分,有完全相关、不完全相关和不相关完全相关:指某变量的变化,另一变量有一确定的值对它对应。不完
7、全相关:指两个变量之间有数量联系,但是数量是不确定的关系。零相关:指两个现象在数量上完全独立,在一定的形式下,互不影响,互不相干的关系。(4)相关系数n相关系数n相关系数是描述两个变量之间相关关系的一种量数。用符号p或r表示。n相关系数的性质:有界性、方向性n有界性:相关系数的取值范围在-1,1r的绝对值取值范围意义0.00-0.19极低相关0.20-0.39低相关0.40-0.69中度相关0.70-0.89高度相关0.90-1.00极高相关方向性:两个变量之间相关关系的性质可以由其符号反映出来。r 0,正相关r 0,负相关r=0,零相关相关系数计算方法A 皮尔逊积差相关适用条件:两列数据都是
8、连续变量,且两列变量各自总体的分布呈正态分布;两列变量之间的关系是线性的。(4)相关系数n连续变量:在一定区间内可以任意取值的变量叫连续变量。正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。特征:正态分布的中央点(均数)最高,然后逐渐向两侧下降;以均数为中心,两端对称;永远不与x轴相交的钟形曲线;正态曲线下的面积分布有一定规律:正负一个标准差之间,包含总面积的68.26%;正负1.96个标准差之间,包含总面积的95%;正负2.58个标准差之间,包含总面积的99%。正态分布有两个重要参数:位置参数:均数,均数决定正态曲线的中心位置;形状参数:标准差,标准差决
9、定正态曲线的陡峭或扁平程度。均值相同,标准差不同的均值相同,标准差不同的正态分布曲线正态分布曲线标准差相同、均数不同的标准差相同、均数不同的正态分布曲线正态分布曲线正态分布的简单判断方式n绘制数据的条形图,如果数据来自正态分布,条形图呈现“钟形”分布。皮尔逊积差相关以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。公务员业绩评分资料表公务员编号领导评分群众评分1672763884655776667988659771087计算领导与群众评分之间的相关程度,以此判定领导与群众对公务人员测评的一致性程度。解答:设领导评分为X,群体评分为Y,用积差相关法测定二者之间的相关程度
10、。22相关系数计算方法B 斯皮尔曼等级相关(用符号rp表示)适用条件:A 适用于一列或两列变量皆为等级变量的数据资料;B 两列变量之间的关系是线性的。(4)相关系数斯皮尔曼等级相关计算公式D:成对数据的等级之差N:成对数据的个数10名学生的学习成绩与其品德等级统计表,计算二者的相关程度。学号学习成绩等级品德等级190优288中388中483良579良675中775良870中968良1062中赋予等级时注意:n 对两列变量赋予等级的方向要一致;n 对于相同的等级要以它们占等级位置的平均数赋予等级。10名学生的学习成绩与其品德等级统计表,计算二者的相关程度。学号学习成绩等级品德等级1901优128
11、82.5中83882.5中84834良3.55795良3.56756.5中87756.5良3.58708中89689良3.5106210中810名学生的学习成绩与其品德等级统计表,计算二者的相关程度。=1-6x108.510 x(102-1)=0.3425一、思想信息的获取方法二、思想信息的分析方法(一)思想信息分析的特点(二)思想信息分析的优化(三)思想信息的定量分析-统计分析法1、描述性统计2、推断性统计-假设检验n假设检验假设检验亦称“显著性检验显著性检验(Test of statistical significance)”,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质
12、差别造成的统计推断方法。(1)(1)什么是假设检验什么是假设检验(2)(2)假设检验的基本思想假设检验的基本思想 n假设检验的基本思想是小概率原理。n小概率原理是指小概率事件在一次试验中基本上不会发生。n显著性水平:即概率水平,统计检验中所规定的小概率的数量标准。一般用符号a表示。(3)(3)假设检验的基本步骤假设检验的基本步骤 第一第一,提出虚无假设提出虚无假设H H0 0。研究假设:H1:0 虚无假设:H0:=0 第二第二,计算统计量计算统计量。即选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如t值等。第三第三,确定显著性水平,并查出临界值。确定显著性水平,并查出临界值。显著性
13、水平:0.05或0.01 第四第四,作出推断统计:将统计量与临界值进行比较,从而作出作出推断统计:将统计量与临界值进行比较,从而作出拒绝还是接受虚无假设的判断。拒绝还是接受虚无假设的判断。n自由度(df):样本变量中可以自由取值的个数,一般为df=n-1。(3)(3)假设检验的基本步骤假设检验的基本步骤 第一第一,提出虚无假设提出虚无假设H H0 0 。研究假设:H1:0 虚无假设:H0:=0 第二第二,计算统计量。计算统计量。即选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如t值等。第三第三,确定显著性水平,并查出临界值。确定显著性水平,并查出临界值。显著性水平:0.05或0.0
14、1 第四第四,作出推断统计:将统计量与临界值进行比较,从而作出拒绝还是接受作出推断统计:将统计量与临界值进行比较,从而作出拒绝还是接受虚无假设的判断。虚无假设的判断。如果|t|t(df),则p 0.05或p 0.01,拒绝虚无假设H0,表明有显著差异;如果|t|0.05或p0.01,接受虚无假设H0,表明无显著差异。(4)平均数差异的t检验t 检验的应用条件:样本来自正态分布总体;两样本均数比较时,要求两样本相应的总体方差相等,即方差齐性。t检验的三种类型n单样本t检验(One-Sample T Test)n独立样本t检验(Independent-Sample T Test)n配对样本t检验(
15、Paires-Sample T Test)单样本单样本t t检验(检验(One-Sample T One-Sample T TestTest)n单样本t检验适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体已知总体0未知总体样本n以往通过大规模调查已知某地新生儿出生体重为3.30千克。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42千克,标准差为0.40,问该地难产儿出生体重是否与一般新生儿体重不同?单个样本单个样本t t检验检验案例分析案例分析单个样本单个样本t t检验检验检验步骤检验步骤nA 建立虚无假设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 定量分析 统计分析 PPT 课件
限制150内