《描述统计分析..ppt》由会员分享,可在线阅读,更多相关《描述统计分析..ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第15章 数据分析:描述统计分析评论人:刘彦彬评论人:刘彦彬本章主要内容一、频数分布二、交叉表三、变量的集中趋势四、差异性指标五、分布形状指标一、频数分布F概念F频率分析F统计图形频数分布有时营销调研人员需要了解有关单个变量的信息F本品牌的使用者中有多少称得上是品牌忠诚者?F有多少个顾客对新产品很熟悉?多少比较熟悉?F有多少顾客对饭菜的口味满意?多少非常满意?多少不满意?频数分布:了解对一个变量选择不同取值的调查对象数量。F变量中不同取值的出现频率以百分比的形式展现;F对一个变量的频数分布会产生频数、百分比、累积百分比几个数据。频数分布作用:F有助于明确未回答者的多少,同时也能显示不合格答案的
2、多少;F可以检验奇异值和极端值;F根据频数分布可以划出各种统计图形。频数分布频数分布所想购买的户型频数百分比有效百分比累积百分比一室一厅一卫3 2.13 2.19 2.19 两室一厅一卫39 27.66 28.47 30.66 两室两厅一卫12 8.51 8.76 39.42 两室两厅两卫9 6.38 6.57 45.99 三室一厅一卫32 22.70 23.36 69.34 三室一厅两卫15 10.64 10.95 80.29 三室两厅一卫4 2.84 2.92 83.21 三室两厅两卫10 7.09 7.30 90.51 四室两厅两卫1 0.71 0.73 91.24 措层2 1.42 1
3、.46 92.70 越层2 1.42 1.46 94.16 其他8 5.67 5.84 100.00 Total137 97.16 100.00 Missing4 2.84 Total141 100.00 频数分布频数分布频数分布内部居住环境频数百分率住宅标准4331.39 住宅类型3223.36 隔音8864.23 隔热与保湿7655.47 光照10979.56 日照8058.39 朝向8763.50 通风13195.62 频数分布二、交叉表F概念F频率分析交叉表使用行和列的形式对比表示数据本产品中男性消费者的满意比率是多少?女性消费者满意的比率是多少呢?有多少高收入消费者对新产品很熟悉呢?
4、多少比较熟悉、知道一些或者不熟悉该品牌呢?交叉表通常是由背景信息与题项作交叉分析获得。交叉表所想购买的户型2500-3499元3500-4999元5000-7999元8000-9999元10000元以上中高收入群体一室一厅一卫4.3 1.4 两室一厅一卫42.9 17.4 20.0 26.0 两室两厅一卫14.3 17.4 11.0 两室两厅两卫3.6 4.3 25.0 5.5 三室一厅一卫14.3 21.7 12.5 50.0 20.0 19.2 三室一厅两卫10.7 13.0 12.5 20.0 11.0 三室两厅一卫3.6 25.0 4.1 三室两厅两卫7.1 4.3 12.5 8.2
5、四室两厅两卫4.3 1.4 措层20.0 1.4 越层50.0 20.0 2.7 其他3.6 13.0 12.5 8.2 描述统计分析数据分布性质数据分布性质算术平均数算术平均数算术平均数算术平均数中位数中位数中位数中位数众数众数众数众数集中趋势集中趋势全距全距全距全距方差方差方差方差标准差标准差标准差标准差离中趋势离中趋势偏态偏态偏态偏态分布形态分布形态四分位距四分位距四分位距四分位距峰度峰度峰度峰度三、集中趋势指标F算术平均数F中位数F众数平均数平均数是将总体中所有个体的数量标志差异抽象化,用以反映现象在一定时间、地点条件下的一般水平或代表性水平.对象:个体单位的数量差异;手段:将数量差异
6、抽象化,即去差异;目的:反映各个个体现象数值的一般水平,代表性水平平均数F反映总体分布的集中趋势;F反映总体现象的共性特征;F是总体分布的重要数量特征值;F是现象规律性的数量表现。平均数F总体分布的集中趋势:-1000 发炮弹落点2121981921641551211339894中心点中心点中心点中心点平均数F总体现象的共性特征F捷达轿车:1F没有奖品:99999F集中趋势:没有奖品F明天下雨的可能性是:80%F明天不下雨的可能性:20%F集中趋势是:明天下雨骗人的“平均数”M:吉斯莫先生有一个小工厂,生产超级小玩意儿。M:管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10
7、个工人组成。工厂经营得很顺利,现在需要一个新工人。M:现在吉斯莫先生正在接见萨姆,谈工作问题。吉斯莫:我们这里报酬不错。平均薪金是每周300元。你在学徒期间每周得75元,不过很快就可以加工资。骗人的“平均数”M:萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,
8、对吧?骗人的“平均数”萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。萨姆:每周100元又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。萨姆:好,现在我可懂了。我我辞职!算术平均数算术平均数是集中趋势指标中最常用的一个统计量,用于评估一个用定距或定比尺度衡量的数据均值。数据都有一定的集中趋势,大部分回答应该分布在均值附近。中位数将总体中的各个个体数值按照大小顺序排列,居于中间位
9、置的数值,便是中位数。中位数中位数1.是一种集中趋势或平均指标2.位于中间位置的数值如果数据为奇数项,中位数是中间位置的数值如果数据为偶数项,中位数是中间位置两个数值的平均数是一种位置平均数 4.不受总体中极值的影响中间位置中间位置 n n1 12 2 中位数中间位置中位数n 126 123577 89830.数据数据 :10.3:10.34.94.98.98.911.711.76.36.37.77.7顺序顺序 :4.9:4.9 6.36.37.78.910.310.3 11.711.7位置位置 :1:12 2345 56 62中位数总体中出现次数最多的数值是众数。众数众数1.集中趋势测定指标
10、或平均指标2.出现次数最多的数值3.不受总体中极值的影响4.可以没有众数,也可以有几个众数众数无众数数据数据:10.310.3 4.94.98.98.911.711.76.36.37.77.7一个众数数据数据:6.36.34.98.98.9 6.3 6.3 4.94.9一个以上的众数数据数据:2121282841414343平均数指标教育程度均值中间值众数方差全距峰度偏度初中1.15 1.00 1.00 0.49 2.00 11.89 3.44 高中/技校1.23 1.00 1.00 0.58 2.00 5.12 2.50 中专1.48 1.00 1.00 1.04 4.00 5.31 2.3
11、3 大专1.79 1.00 1.00 1.52 5.00 3.08 2.01 大学本科或以上2.05 1.00 1.00 1.90 5.00 0.95 1.60 Total1.47 1.00 1.00 1.16 5.00 7.44 2.80 谢邦昌语录平均数不仅是一种计算,一种表述方法,还是人生行为的一种准则。人生一切行为,应以中庸为法则,既不可过分自分膨胀,也不宜过分自我矮化,亦即是无过与不及,适中而行,以保持心性的平衡,成功可期。因为唯有平衡的心性,才能乐观进取,发挥潜能。为人处世,以不偏不激为适当,“温、良、恭、俭、让“,是儒家智慧的结晶,此种中性观念,诚为我们人生的座右铭。对纷纭繁杂的
12、人生事务,各予清理出一个头绪,把握重点,以免治丝益棼,并尽量使之理性化、单纯化,不钻研牛角尖。如此自可收从容不迫,执简驭繁之效。平均数的局限性一个身高180的不会游泳的人想涉水过河,已知河的平均深度为1米,此人是否过河?为什么?某人想购买一台冰箱,现有如下信息:冰箱品牌 A B平均使用年限 10 10最多使用年限 20 12最少使用年限 2 8四、差异性指标F全距F方差和标准差差异性指标标志变异指标是测定总体中各个个体单位标志值差异的变动范围或差异程度的指标。集中趋势差异需要测定吗?孟子说“物之不齐,物之性也”。乃佛家之殊相差异来自于大量现象的异质性或多变性大量现象相异之外,有其相同的一面。但
13、经常是相异之处比相同之处更为显著。统计分析的主题,便是一套研究差异的技术。规律性的重要补充F首先要充分接受差异,接受现象之个性,使世界丰富多彩;F然后是认识差异,了解总体;F用集中趋势抽象差异,得到总体一般水平;F结合差异,全面认识现象。全距F测量的是数据的分散程度,就是样本中最大值与最小值之差。F全距直接到奇异值的影响F反映标志值的变动范围F全距计算简便,易于理解,应用普遍。F全距的计算:全距=最大标志值-最小标志值精确地描述差异-标准差F标准差是各单位标志值与其平均数的离差平方的算术平均数的平方根,它表示每个标志值与平均数的平均距离。差异性指标教育程度均值中间值众数方差全距峰度偏度初中1.
14、15 1.00 1.00 0.49 2.00 11.89 3.44 高中/技校1.23 1.00 1.00 0.58 2.00 5.12 2.50 中专1.48 1.00 1.00 1.04 4.00 5.31 2.33 大专1.79 1.00 1.00 1.52 5.00 3.08 2.01 大学本科或以上2.05 1.00 1.00 1.90 5.00 0.95 1.60 Total1.47 1.00 1.00 1.16 5.00 7.44 2.80 五、分布形状的指标F偏度F峰度偏度F理想的分布形态是对称的,但在现实生活中,现象之分布并不完全对称,而是或多或少地不同程度地存在着非对称情况
15、,在统计上将这个非对称分布称为偏态。偏度F如果偏度=0,则表明此分布为对称分布;F如果偏度0,则表明此分布为右偏态;F如果偏度3,则表明此分布为陡峭;F如果峰度3,则表明此分布为平缓;分布形状指标教育程度均值中间值众数方差全距峰度偏度初中1.15 1.00 1.00 0.49 2.00 11.89 3.44 高中/技校1.23 1.00 1.00 0.58 2.00 5.12 2.50 中专1.48 1.00 1.00 1.04 4.00 5.31 2.33 大专1.79 1.00 1.00 1.52 5.00 3.08 2.01 大学本科或以上2.05 1.00 1.00 1.90 5.00
16、 0.95 1.60 Total1.47 1.00 1.00 1.16 5.00 7.44 2.80 正态分布-人生之缩影F集中趋势是现象共性的反映,是现象规律性的数量表现,是我们用来执繁就简地认识事物的一种方法。F当我们评判一个人或一个事物时,应当用其集中趋势来评价,而不能用一个个别结论做出评价。F集中趋势忽略了现象的个性与差异。而与离中趋势结合,则可全面认识现象。F差异客观的,是人们必须承认的现象。F一个智者,勇于面对差异,善于处理差异,精于利用差异,在差异中享受其“弄潮儿”的成就感。谢邦昌语录:常态分布的由来顺其自然F人世间事事物物,都是相互依存的,此是常态现象。F如过分突出,或相互侵犯
17、,即为变态。所以吾辈立身处世,既不可傲慢骄泰,也不宜消沉失志,一切应顺应自然,以常态为依归。谢邦昌语录:常态分布的普遍性取道中庸F常态分布因为左右对称,更能表达集中趋势之特性。F不偏之谓中,不易之谓庸,人生既不宜躁进,也不可消极,凡事清心寡欲,中庸而为,自属正常。谢邦昌语录:常态分布的偏态及峰度不亢不卑F偏态系数为0,为对称分布,峰度系数均为3,为衡量之标准。F人之立身处世,应严守中正立场,凡事不亢不卑,心平气和,前途自能平稳发展。倘若性情偏傲,为了名利而迷失了自己;或一遇风雨,便两面而倒,必自取失败。谢邦昌语录:常态分布的所在范围有容乃大F常态分布中三倍标准差时几达100%,即已容纳所有的个体。F人生应具有如庄子所说:“天地与我并生,万物与我为一。”博大均衡的胸襟和真挚自然的性情,不矫揉造作,一本精诚,以容纳不同意见的人与事,有如沧海之不择细流,凡事包容,自易成大功大业。F尤其权位越高或有学术地位的人,越要有此涵养,常存宽厚感恩之心,祛除狭隘猜忌之想,以资更加充实、愉快,此自然之理。谢谢!
限制150内