统计课件精简版.ppt





《统计课件精简版.ppt》由会员分享,可在线阅读,更多相关《统计课件精简版.ppt(353页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、绪论统计含义(一)统计工作:是搜集、整理、分析统计数据的过程。例如:某统计师在回答自己的工种时,会说我是干统计的。这里所说的统计指的就是统计工作。(二)统计资料 统计工作中搜集的文字,数字和图表资料例如,电视台、电台和报纸杂志所说的“据统计”中的“统计”指的就是统计数据资料(三)统计学 统计学是搜集、整理、分析统计数据的科学。你这学期学的是什么,我学的是统计,这就是指统计学二 统计的三 大学派:(一)政治算术派 代表人物 威廉配第(英)二 国势学派 康 令(德)三、数理统计学派:拉普拉斯三、统计学的分科从统计方法的构成来看,分为(一)描述统计学和推断统计学;描述:对现象进行主观的反映。推断:对
2、未知的方面进行估计。(二)理论统计学和应用统计学理论统计学是指研究统计学的原 理,主要就应用数学 的方法。应用统计学是指统计学在各行各业 的应用生物统计学农业统计学医学统计学四、统计学与数学的关系:(一)对象上的区别:数学的研究对象是抽象的数量规律,统计学研究的是具体现象的数量规律。二 方法上的区别:数学使用演绎法统计学是演绎与归纳结合。第二章 统计数据搜集第一节 数据的计量与类型一 数据的计量尺度(一)定类尺度性别划分为男和女企业分为有国有企业 集体企业 私营企业(二)定序尺度 对事物进行顺序上的区别。产品分为一等品、二等品,三等品。一等品性能二等品性能三等品性能。考试成绩分为优秀,良好,中
3、等,及格,不及格优秀良好中等及格不及格 (三)定距尺度 它不仅能将事物进行排序,而且可以指出它们之间的差距是多少。特点:0测度有实际意义,不能作为因子或分母进行乘除运算。如温度,海拔,气压,分数。温度2度比0度高2度。温度2度是0度的无穷大倍海拔50米比海拔0米高50米海拔50米是海拔0米的无穷大倍昨天的温度是零度,而今天很热,今天的温度是昨天的无穷大倍,今天的温度是多少度?今天的温度是1度。学生甲得分10分,学生乙得0分,可以说甲比乙多得10分,却不能说甲的成绩是乙的无穷大倍。因为“o分这里不是一个绝对的标准,并不意味着乙学生毫无知识。(四)定比尺度 不仅可以反映差距,还可以进行对比。特点:
4、0测度表示不存在,可以进行乘除的运算。如重量,长度。20公斤重的物体是10公斤重的2倍。100米长的距离是20米的5倍。二 数据的类型:(一)定性数据:通过定类和定序计量得出的数据是反映事物的品质特征的,不能用数值表示。定类:男,女定序:优,良,中,及格,不及格 (二)定量数据:通过定距和定比计量得到的数据,是说明现象的数量特征,能够用数值来表现。定序:温度,气压。定比:重量,长度。三、数据的表现形式:表现为绝对数和相对数:1 绝对数:反映现象的总规模、总水 平。如总产值,总人口,总面积。总人口数1000万人 总面积 1000万亩 总产值 1000万元 男性人口数500万人2 相对数:两个绝对
5、数对比形成相对数。男性的比重=相对数劳动生产率是绝对数还是相对数?单位成本是相对数还是绝对数?总成本是绝对数还是相对数?绝对数产量:今天电视机产量3台,昨天电视机产量5台,这两天产量为8台。出生人数:今天南京市出生500人,昨天出生500人,这两天共出生1000人。(1)时期数:反映现象在一段时期内的累计总量。如产量,出生人口数,产值。可以按时间累加。2 时点数:反映现象在某一时刻上的总量。如总人口,总库存。按时间相加没有意义。总人口:昨天南京市1000万人。今天南京市1000万人,这两天南京市2000万人。总库存:昨天电视机库存1000台。今天库存990台,这两天库存1990台。商品的年末库
6、存是时期数还是时点数?时点数商品销售额是时期数还是时点数?时期数第二节 统计数据的搜集一 调查的方式:(一)普查 普查是为了某种特定目的而专门组织的一次性的全面调查。普查的特点:1 通常是一次性的 因为要耗费大量的人力,物力,财力。2 人口普查要规定标准时点:我国每天出生52万余人,死亡22万余人。标准时点:调查员入户的时间不同,登记的人口信息要反映某个时点上的人口情况。1990年人口普查的标准时间为1990年7月1日零时,请问以下哪些需要登记:A 6月30日晚19:00死亡的人B 7月1日凌晨3:00出生的人C 6月29日出生的人口D 7月2日出生的人口(二)抽样调查 从调查对象的总体中随机
7、抽取一部分单位作为样本进行调查,并根据样本结果来推断总体数量特征的一种调查方法。星期天,你在家煮饺子,煮了二十分钟,看看饺子有没 有熟,吃了一个,熟了,那么,这一锅子饺子熟了,为什么一个饺子熟了,这一锅饺子都熟了呢?为什么?一位爷爷叫孙子去买火柴,临走关照他说,火柴一定要买划得着的,孙子说,知道了,一会儿,孙子将火柴买回来,爷爷问道:“火柴是不是都能划得着啊,”“是的,”孙子答道,“你怎么知道的啊”,“我每一根都划过了”随机性:保证每一单位被抽到和不被抽到的可能性是一样的。调查你班学生的每天的学习时间,将每一个学生编上号,放在袋子里摇一摇,再随机抽出,这就满足了随机性。调查你班学生的每天的学习
8、时间,如果调查的同学是个男生,他从不和女生讲话,他就从男生中选了一部份进行登记,请问他错在什么地方?某大学要调查大学生对学生谈对象的态度,并且校方准备出台一些措施进行管理。校方在团委设了一部电话,任何一位大学生都可以打电话去反映自已的看法,请问这项调查有没有破坏随机性原则?1936年美国总统竞选,当时是兰登和罗斯福,民意测验通过随机的电话号码的抽取,调查了一部分居民,显示是兰登当选,但最后结果是罗斯福当选,为什么这一项调查会失败呢?第三节:统计数据的整理:一、定性数据的整理(一)整理方法:编制频数分布表。为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中
9、的一个问题是:“您比较关心下列哪一类广告?”商品销售广告;服务广告;金融广告;房地产广告;招生招聘广告;其他广告。例11 频数:也称为次数,是数据个数。2 频数分布:各个类别及其相应的频数全部列出来就是频数分布或称次数分布。3 频数分布表:将频数分布用表格的形式表现出来就是频数分布表4 频率:各组次数所占的比重。(二)整理的作用:可以大大简化数据。很容易看出关注“商品广告”的人数最多,而关注“其他广告”的人数最少。例 2 在一项有关住房问题的研究中,研究人员在甲、乙两个城市各抽样调查300户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”非常不满意;不满意;一般;满意;非常满意。
10、二 定量数据的整理(一)整理的方法 (1)编制单变量分组表 (2)编制组距式分组表0岁1岁2岁3岁 单变量分组:变量的取值是单个的。如对婴幼儿按年龄分组。职工家庭总体按儿童数分组:0个儿童 1个儿童 2个儿童 3个儿童组距分组:将一定的区间作为一组60分-70分70分-80分80分-90分90分-100分学生按成绩分组职工按工资分组 500-600元 600-700元 700-800元 800-900元 900元以上(二)单变量分组表实例 某生产车间50名工人的日加工零件数(单位:个)如下。试采用单变量值对数据进行分组。某生产车间50名工人的日加工零件数(单位:个)如下。试采用组距分组对数据进
11、行分组。(三)组距分组实例:组距分组中,1 一个组的最小值称为下限,2 一个组的最大值称为上限。3 一个组的上限与下限之差是组距4 既有上限又有下限的组称为闭口组5 无上限或无下限的组称为开口组6 组中值(下限值十上限值)/27 开口组的组距参照相邻组的组距请大家写出各组的上限,下限,组距和组中值成绩(分)人数60以下(第一组)260-70(第二组)270-80(第三组)2080-90(第四组)2590以上(第五组)6计算第一组和第五组的组中值(四)分组的两个原则:1、不重不漏。“不重”是指一个数据不能在两组中重复出现.“不漏”是指每个数据必须分在某一组。2、上组限不在本组内生源姓名江苏陈俊,
12、李小玉,王明,非江苏王明,张琳,高兵例 1:将王明,陈俊,李小玉,张琳,高兵按生源分组:错在何处?生源姓名江苏省陈俊,李小玉非江苏王明,张琳,错在何处?例 2:将王明,陈俊,李小玉,张琳,高兵按生源分组:成绩(分)人数60-70(第一组)270-80(第二组)2080-90(第三组)2590-100(第四组)680分在哪一组?1直方图 横轴表示数据分组,纵轴表示频数2频数多边形图 把直方图顶部的中点(即组中值)用直线连接起来。4,茎叶图:(七)常见的频数分布的类型 (1)正态分布 (2)J形分布 (3)U形分布特点:两头小、中间大(1)正态分布 农作物的单位面积产量,人的身高,电视机的寿命,都
13、服从正态分布(2)J形分布利润率和投资额为正J型分布价格和需求量呈反J型分布(3)U形分布年龄和死亡率呈U型分布第二节:数据分布特征的描述1 分布的集中趋势的测定众数是被研究总体中出现次数最多的那个变量值。(一)未分组数列:了解南京审计学院学生餐厅某一种菜的销售价格,调查资料如下,6:00-7:00有750人是1.2元,7:00-7.20,菜已经冷了,工作人员以0.8元卖给5个同学,7:30快下班了,工作人员以0.5元卖给了最后一个同学。问今天该菜的销售价格?例1我们不必计算算术平均数,只需取众数1.2元即可。例2:7名工人日产量(件)为4、5、6、6、6、7、8。则众数是6。【例3】某个领导
14、小组各成员的年龄分别为:55,55,55,52,23(岁)平均年龄=48(岁);众数=55(岁)例4:设在某次捐款献爱心的活动中,有两个科室的 捐款数额分别为(单位:元):甲:80,90,100,100,100,110,120乙:10,10,10,10,10,600 甲:平均数额=100元;众数=100元 乙:平均数额=108.33元 众数=10元某制鞋厂想生产一种皮鞋,但不知想生产的鞋的大小,于是做了一个市场调查,资料如下:男皮鞋号码(码)人数302382340118425414520501例 1(二)由单项式数列确定众数如果计算算术平均数,那么结果 为41.324码,可不可以应用?为什么?
15、不可以,因为算术平均数考虑了所有的变量值,而研究一些随机现象时会受一些异常值(极端值)的影响,而众数为42码,该厂生产42码的鞋子应该能盈利,而产41.324码可能卖不掉。按日按日产产量量分分组组(件)(件)工人数工人数(人)(人)2015213022202310例2(二)组距式分组数列:众数=L+L-表示众数所在组的下限f-表示众数所在组变量的个数 表示众数所在组前一组变量的个数 表示众数所在组后一组变量的个数例1年人均纯收入(千元)农户数(户)5以下2405648067110078700893209以上160合计3000例2某厂400名职工工资如下:按月工资分组(元)职工人数(人)450-
16、550550-650650-750750-850850-950601001406040合计400根据上述资料计算该厂职工工资的众数练习二、中位数 是将数据按大小顺序排列起来,居于数列中间位置的那个数据。一个美国人想要买一个住房,他对房地产开发商讲,我的要求是邻居的素质较高,房地产商说,我有一处住房,邻居的平均年薪1500万美元,这个美国人想既然平均年薪这么高,居民素质应该比较高,于是就购买了该处住房,可住进去发现,自已的邻居不是穷人就是无业的黑人,治安非常不好,于是就将房地产商告上法庭,说你欺骗了我,房地产商人说我没有欺骗你,在法庭上法官请房地产商提供了邻居的年收 入证明,结果如下,Black
17、 5345 美元Tom 6257 美元Smith 7632 美元Richard 9343 美元Bush 75000000美元Bush是外地的一位富商,在该地区购买住房是因为一年之中偶尔度假,但平均下来,几个邻居的平均年薪有15000000美元。如果你是法官,你会怎么判?将收入排序 5345 美元 6257 美元 7632 美元 9343 美元 75000000美元,取中位数7632美元更具有代表性,更能代表他们的收入状况。(1)对于未分组的资料:例1:1,2,3,4,5,n为奇数,例2:1,2,3,4,5,6,n为偶数时,按日按日产产量分量分组组(件)(件)x工人数(人)工人数(人)f2010
18、221524302625合合计计80(2)单项式分组资料中位数为第40 名和41名日产量的平均值 例1:L 代表中位数所在组下限;代表为中位数所在组的次数;代表总次数d 代表中位数所在组的组距:代表中位数所在组以下的累计次 数;(3)组距式分组资料:计算中位数例2:1 找出中位数所在位置,总共50个人,中位数应在第25个人处。到第一组为止累计3个人 到第二组为止累计8个人 到第三组为止累计16个人 到第四组为止累计30个人,而中位数应在第25个人处,所以中位数必须在第四组。可知中位数所在组的下限L为120,2 可知中位数所在组的距为d为125-120=53 可知中位数所在组的次数 为144 可
19、知中位数所在组以下各组累计次数之和 为3+5+8=165 总次数 为3+5+8+14+10+6+4=50年人均年人均纯纯收收入(千元)入(千元)农户农户数(数(户户)5以下以下2405648067110078700893209以上以上160合合计计3000(1)计算总次数(2)确定中位数组(在第67组)(3)确定中位数数值例3:三 算术平均数:(一)简单算术平均数例1:两名学生考试成绩如下:成绩(分)60(分)90(分)计算两名大学生的平均考试成绩:(二)加权算术平均数(1)根据单项式分组数列计算的成绩(分)x60(分)90(分)人数f1001例1:成绩(分)x60(分)90(分)人数f110
20、0为什么刚才算出来平均数靠近60分现在算出来平均数靠近90分?例2:因为变量x都 一样,一个是60,一个是90,但f不一样,f对平均数有权衡轻重的作用,所以称f为权数。某车间20名工人加工某种零件资料 按日产量分组(件)x工人数(人)f日产总量xf14228154601681281758518118合计20319例3:一辆汽车以30公里/小时行驶了1小时,又以40公里/小时行驶了1小时,请计算平均速度。例4:(2)根据组距数列计算的某车间200名工人日产量资料:按日产量分组(公斤)工人数f组中值x日产总量xf2030102525030407035245040509045415050603055
21、1650合计2008500平均日产量四、几何平均数 几何平均数它是n个变量值乘积的n次方根。例:有一个工厂加工一种产品,要经过三道工序的加工,产品合格合格率计算三道工序的平均合格品率如果行不行,为什么?1因为三者相加没有意义2将每道工序合格品率赋予同等重要性有一个工厂加工一种产品,要经过三道工序的加工,产品合格合格率计算三道工序的平均合格品率100万产品加工到最后只剩一个,你说我平均合格率大于50%?有三个学生的成绩是100分,90分80分,计算三个同学的平均成绩为什么?100分+90分+80分=270分(总成绩,有意义)假设平均成绩为 从总体来说,可以替换每一个数,三个工序合格品率相乘某企业
22、生产某种产品需经过三个连续作业车间才能完成。车间投入量产出量合格率%x一100080080二80072090三72050470计算三个连续作业车间平均合格率 四 调和平均数变量值倒数的算术平均数的倒数(1)简单调和例1:一辆汽车以30公里/小时行驶1公里,又以40公里/小时行驶1公里,问它的平均速度?(2)加权调和例1:一辆汽车以30公里/小时行驶5公里,又以40公里/小时行驶5000公里,问它的平均速度?按日产量分组(件)x日产总量m(件)142815601612817851818合计319练习1:请计算工人平均日产量按日产量分组(件)x工人数f(人)142154168175181合计20练
23、习2:请计算工人平均日产量企业产值计划完成%x实际产值(万元)m甲95285乙105945丙115345合计1575练习3:计算平均产值计划完成程度平均计划完成程度=第二节:分布的离散程度的测定一 全距(R)公式:R=最大值最小值优点:计算简便缺点:易受极端值的影响 有两个学习小组的统计学成绩分别为 第一组;60 70 80 90 100 第二组:78 79 80 81 82 两个小组的考试成绩平均分都是80分哪一个分数比较集中呢?用全距指标来衡量,第一组的全距1006040(分)第二组的全距82784(分)例1:甲班 85分,84分,83分,85分,86分,84分,12分 甲班全距74分乙班
24、 60分,90分,50分,76分,42分,31分,80分,乙班全距59分,哪个班更分散?例 2:二 方差和标准差(一)未分组资料日产量(件)2022232426合计日产量(件)209221230241269合计20(二)分组资料日产量(公斤)工人数f203010304070405090506030合计200日产量(公斤)工人数f组中值x20301025289030407035343040509045810506030555070合 计20012200练习1:某厂400名职工工资如下:按月工资分组(元)职工人数(人)450-550550-650650-750750-850850-95060100
25、1406040合计400根据上述资料计算该厂职工平均工资和标准差。2 组间离差平方和:反映各组均值与总体均值之间差异程度的方差3 组内离差平方和:每个组别内由于个体之间的差异导致的本组别内每个单位之间的方差。(三)方差分析的基本思想1 总离差平方和:每个变量值和总体平均数的离差的平方和对每一行的所有列来说,是一个常数每个数据的总离差平方和=每个数据的组间离差平方和+每个数据的组内离差平方和。12个肥胖病人被随机分成3组试验3种减肥方案,两周后减轻的体重如下表(公斤)。方案A3445方案B2343方案5654(1)计算各组均值和总均值。(2)计算总离差平方和、组间平方和和组内平方和,验证三者之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 课件 精简

限制150内