《统计数据的搜集与整理幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集与整理幻灯片.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计数据的搜集与整理第1页,共32页,编辑于2022年,星期二(2)统计调查有哪些主要方式)统计调查有哪些主要方式 统计调查的方式有:统计报表、普查、抽样调查、重点调查和典型调查。普查是一种全面调查方式,抽样调查、重点调查和典型调查都是非全面调查方式。但是抽样调查是按照随机原则确定调查单位的,而典型调查和重点调查是有意识的选取调查单位。第2页,共32页,编辑于2022年,星期二2.某管理局下属40个企业1994年的产品销售收入数据如下(单位:万元):1261131461121581191151238897117108105110107137120136107108125127142118103
2、871151141191051171241291161001039295127104根据上面的数据分成以下几组:100以下,100110,110120,120130,130以上,根据分组结果编制频数分布表,并计算出频率、累积频数和累积频率。第3页,共32页,编辑于2022年,星期二分组频数频率(%)累计频数累计频率(%)-sale130512.540100.0第4页,共32页,编辑于2022年,星期二第二章统计数据的描述1.思考题(1)一组数据的分布可以从哪几个方面进行测度)一组数据的分布可以从哪几个方面进行测度?对一组数据的分布特征,可以从个方面进行测度和描述:一是分布的集中趋势,反映数据向
3、其中心值靠拢或聚集的程度。众数、中位数和均值是集中趋势的三个主要测度值;二是分布的离散程度,反映数据远离其中心值的趋势。极差、四分位差、标准差以及离散系数都是离散程度的测度值。第5页,共32页,编辑于2022年,星期二(2)众数、中位数、均值在什么情况下使用?)众数、中位数、均值在什么情况下使用?众数是一组数据分布的峰值,是一种位置代表值,不受极端值的影响,主要适合于作为分类数据的集中趋势的测度值。中位数是一组数据中间位置上的代表值,也是位置代表值,不受数据极端值的影响,主要适合于作为顺序数据的集中趋势测度值。均值是就数值性数据计算的,是实际中应用最广泛的集中趋势测度值,主要适合于数值型数据的
4、集中趋势测度值。第6页,共32页,编辑于2022年,星期二(3)在对两组数据的差异程度进行比较时,)在对两组数据的差异程度进行比较时,能否直接比较两组数据的方差?能否直接比较两组数据的方差?不能,方差的计算是以均值为中心的,对于平均水平不同或计量单位不同的不同组别的变量值要分别计算两组数据的离散系数,然后再进行比较。离散系数是测度数据离散程度的相对指标,主要用于比较不同总体或样本数据的离散程度。第7页,共32页,编辑于2022年,星期二2.某自学考试班统计学课程考试成绩资料如下:按成绩分组学生人数60以下8607020708040809028901004合计100试计算考试成绩的众数、中位数和
5、均值。第8页,共32页,编辑于2022年,星期二解:利用分组数据的公式,可计算得:众数中位数均值第9页,共32页,编辑于2022年,星期二3.甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。产品单位成本总成本(元)名称(元)甲企业乙企业A1521003255B2030001500C3015001500第10页,共32页,编辑于2022年,星期二解:利用调和平均数公式计算得:甲企业的平均成本:乙企业的平均成本:原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本,故甲企业的平均成本比乙企业高第11页
6、,共32页,编辑于2022年,星期二4.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤,是男生的体重差异大还是女生的体重差异大?为什么?解:设男女生体重的离散系数分别为和由已知条件可得,易见,故女生的体重差异较大。,第12页,共32页,编辑于2022年,星期二第三章概率与概率分布1.思考题 什么是随机变量?举例说明什么是随机变量?举例说明如果一个变量在随机试验中可以取得不同的数值,这些数值在实验之前无法确定,而对于一次具体的实验它的取值却又是确定,称这样的变量为随机变量。例如抛一枚硬币,可能出现正面,也可能出现反面。这种在一
7、定条件下,可能这样发生也可能那样发生的现象为随机现象。第13页,共32页,编辑于2022年,星期二2.设A、B是两个随机事件,已知求第14页,共32页,编辑于2022年,星期二解:由乘法公式得故第15页,共32页,编辑于2022年,星期二3.某人花2元钱买彩票,他抽中100元奖的概率是0.1%,抽中10元奖的概率是1%,抽中1元奖的概率是1/2,假设各种奖不能同时抽中,求:1)此人收益的概率分布;2)此人收益的期望值。第16页,共32页,编辑于2022年,星期二解:1)此人收益的概率分布:2)此人收益的期望值收益I1001010概率p 0.1%1%0.20.789第17页,共32页,编辑于20
8、22年,星期二4.设XN(3,4),求:1)P|X|2;2)PX3解:1)查表得P|X|2=0.6172)第18页,共32页,编辑于2022年,星期二第四章参数估计1.思考题简述评价估计量好坏的标准简述评价估计量好坏的标准评价估计量好坏的标准主要有以下几个无偏性:指估计量抽样分布的数学期望等于被估计的总体参数。有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。一致性:是指随着样本容量的增大,估计量的值越来越接近总体的参数。第19页,共32页,编辑于2022年,星期二2.设总体的概率密度为,若,.,为该总体的一个简单随机样本,试求参数的矩估计。第20页,共32页,编辑于202
9、2年,星期二解:令可得所以的矩估计第21页,共32页,编辑于2022年,星期二3.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。1)假定总体标准差为15元,求样本均值的抽样标准误差;2)如果样本均值为120元,求总体均值95%的置信区间。第22页,共32页,编辑于2022年,星期二解:解:1)故样本均值的抽样标准误差故样本均值的抽样标准误差2)方差已知,总体均值)方差已知,总体均值 的的 置信区间置信区间故总体均值故总体均值95%的置信区间(的置信区间(7.1,12.9)第23页,共32页,编辑于2022年,星期二4.从一个正态总体中随机抽
10、取容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11求总体均值95%的置信区间第24页,共32页,编辑于2022年,星期二解:方差未知,正态总体均值的解:方差未知,正态总体均值的 的置信区间的置信区间为为计算可得计算可得所以总体均值所以总体均值95%的置信区间为(的置信区间为(7.1,12.9)第25页,共32页,编辑于2022年,星期二第五章假设检验1.思考题假设检验分为几个步骤?假设检验分为几个步骤?假设检验分为5个步骤对所检验的问题提出原假设和备择假设;确定适当的假设检验量;规定显著性水平;计算检验统计量的值;作出统计决策并加以解释。第26页,共32页,编辑于202
11、2年,星期二2.已知某炼铁厂的含碳量服从正态分布N(4.55,0.108),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(=0.05)。第27页,共32页,编辑于2022年,星期二解:选择统计检验量计算统计检验量的值由于故接受,即认为现在铁水平均含碳量为4.55。第28页,共32页,编辑于2022年,星期二3.某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现用一种化肥进行试验,从25个地区抽样结果,平均产量为270公斤。问这种化肥是否使小麦明显增产?(=0.05)第29页,共32页,编辑于2022年,星期二解:解:选择检验统计量选择检验统计量否定域为否定域为故拒绝原假设故拒绝原假设第30页,共32页,编辑于2022年,星期二4.某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂。问该批食品能否出厂?(=0.05)第31页,共32页,编辑于2022年,星期二解:解:选择检验统计量选择检验统计量否定域否定域故拒绝原假设故拒绝原假设第32页,共32页,编辑于2022年,星期二
限制150内