统计知识点(共12页).doc
《统计知识点(共12页).doc》由会员分享,可在线阅读,更多相关《统计知识点(共12页).doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上友情提示:整理的课后计算题重点看解题思路,最终的结果或许有错误,但不影响解题步骤,大家自己注意一下下啊!第一章 绪论1、 统计含义:它是人们认识客观世界总体数量变动关系和变动规律活动的总称,是人们认识客观世界的一种有力依据。2、 统计包含三种涵义(1)统计工作:一种调查研究活动。对现象的数量进行搜集、整理和分析的活动过程。(2)统计资料:统计数据是统计实践活动的成果。(3)统计学:是研究总体一定条件下的数量特征及其规律性的方法论学科3、统计研究的基本环节统计设计:统计学理论与相关实质性学科理论 收集数据:统计调查、实验 整理与分析:描述统计、推断统计(4)统计资料的积
2、累、开发与应用4、标志与指标的联系与区别:联系:(1)一些数量标志汇总可以得到指标的数值(2)数量标志与指标之间存在变换关系。区别:(1)概念不同。总体各单位普遍具有的属性或特征称为标志。统计指标是反映统计总体数量特征的概念和数值。(2)标志是说明总体单位特征的,而指标是说明统计总体数量特征的;(3)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。第二章 统计数据的收集与整理1、统计调查的设计(即统计调查方案)(1)确定调查的目的 即为什么调查 (2)确定调查对象和调查单位 即向谁做调查。调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的
3、。作为调查单位乃是进行登记的标志表现的直接承担者。(3)确定调查项目和调查表 即用什么方法调查。拟订调查项目时要注意几个原则:- 调查项目要少而精;- 调查项目含义要明确;- 尽可能做到各个调查项目之间有一定的联系。调查表分为:一览表(把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;)单一表(将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。)(4)确定调查时间和调查期限 即在什么时间调查 。要区别调查时间和调查期限的不同:- 调查时间是指调查资料所属的时间(时点或时期);- 调查期限是指调查工作的起
4、讫时间。 (5) 确定调查的组织实施计划 2、普查 (1)定义:普查是专门组织的一种全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料 。(2)普查有主要特点:第一,它是非经常性的调查,一般间隔较长的时间才进行一次。第二,它是一种全面调查,可获得大量详细、全面的资料。 3、抽样调查 (1)定义:抽样调查是一种非全面调查,是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算或检验调查对象总体的数量特征。抽样调查目的:推算总体数量特征。在我国商品检验中广泛应用。 (2)抽样调查的特点: 按随机原则来进行。排除人的有意识地选择,总体中的每个单位都有被抽取的同等
5、机会。 以样本推断总体。抽样误差可以事先计算并加以控制。4、开口式组距数列组中值的计算:缺下限:组中值上限-相邻组组距/2 缺上限:组中值下限+相邻组组距/2第三章统计数据分布特征的统计描述描述统计分布集中趋势的指标又称平均指标,主要包括: 平均数、众数和中位数。离散趋势:标准差、方差、偏度和峰度第四章 抽样分布与参数估计1、抽样平均误差影响因素:(1)总体单位的标志值的变异程度;变异程度越大误差越大。(2)样本单位数的多少;在其他条件相同的情况下,样本单位数越多,则误差越小。(3)抽样方法;抽样方法不同,抽样误差也不相同,一般来说,重复抽样比不重复抽样误差要大些。(4)抽样误差的组织形式:采
6、用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。2影响必要抽样数目的因素:(1)抽样极限误差(2)概率保证程度(3)总体分布差异程度(4)抽样方法(5)抽样组织方式:简单随机抽样(纯随机抽样):即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。类型抽样(分类抽样):先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。整群抽样,即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽
7、样误差大。多阶段抽样,即把抽样本单位的过程分为两个或几个阶段来进行。机械抽样(等距抽样)【例4-12】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽出400件产品进行检测,发现有32件废品。试给出该批产品的废品率的区间估计(置信度是90%)。解:n=400,N=5 000,样本废品率P=32/400=8%。置信度1-=90%,=10%,/2=5%。查标准正态分布表得:z=1.645因此,这批产品废品率的区间估计是:即这批产品的废品率置信区间为5.9%,10.1%。3某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为
8、52公斤。试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。解:已知 =450公斤,n=100(大样本),n/N=1/50, ,不考虑抽样方式的影响,用重复抽样计算。s=52公斤,1-=95%,=5%。这时查标准正态分布表,可得临界值: 该地区粮食平均亩产量的置信区间是: =439.808,460.192 (公斤)总产量的置信区间是:439.85000,460.192 5000 (公斤)=,(公斤)6采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。要求:(1)计算合格品率及其抽样平均误差。(2)以95.45%的置信度,对合格品率和合格品数量进行区间
9、估计。(3)如果极限误差为2.31%,则其置信度是多少?解:(1)合格品率:P=190/%=95%抽样平均误差:=0.015(2) (3)7. 从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:工资水平(元)6007008009001000工人数(人) 51011204试求:(1)以95.45的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45,试问至少应抽多少工人?解(1)通过计算可得: =816元
10、,n=50人,s=113.77元。工资不少于800元的工人所占比重:P=35/50=70%。1-=95.45%。这时查标准正态分布表,可得临界值:z=2 工人平均工资的置信区间:=783.82, 848.18工资不少于800元的工人所占比重的置信区间(2) 抽样平均数和成数的极限误差分别是:30 ,10% 按抽样平均数与成数计算的样本容量分别是: =58(人) =84(人)取以上计算结果中较大者,即n=84,应抽取84人作样本以保证抽样调查的准确性。第五章假设检验【例5-2】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0.081mm,总体标准差为0.0
11、25mm。今换一种新机床进行加工,抽取200个零件进行检验,得到的椭圆度为0.076mm。试问在0.05的显著性水平上,新机床加工零件的椭圆度的均值与以前有无显著差异?解:第一步:确定原假设与备择假设。 H0:m =0.081,H1:m 0.081本例中,我们所关心的是新机床加工零件椭圆度的均值与以前有无显著差异,因此使用双侧检验。第二步:构造检验统计量。因总体标准差已知且样本容量较大,所以使用Z统计量。第三步:根据显著性水平,确定拒绝域。=0.05,双侧检验,拒绝域在两边,查标准正态分布表得临界值Za/2 =1.96, 拒绝域是(-,-1.961.96,+)。第四步:计算检验统计量的样本观测
12、值。第五步:判断。Z0= -2.8330% 以上的备择假设是企业自我声明的结论,我们希望证实该企业说的是实话。因此使用右侧检验。第二步:构造检验统计量Z。第三步:确定拒绝域。 =0.05,右侧检验,拒绝域在右边,查标准正态分布表得临界值Za=1.645,拒绝域是1.645,+)。第四步:计算检验统计量的样本观测值。 将样本成数P=220/600=0.37代入Z统计量,得:第五步:判断。 Z0=3.5 1.645,落入拒绝域。拒绝原假设,接受备择假设,认为样本数据证明该企业声明属实。第六章 相关与回归分析相关关系的种类(1) 按相关程度分,可分为: 完全相关、不完全相关和不相关完全相关就是相关现
13、象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。不相关是指两现象之间在数量上的变化上各自独立,互不影响。不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。 (2) 按相关关系的方向来分,可分为:正相关和负相关正相关是指两相关现象变化的方向是一致的。负相关是指两相关现象变化的方向是相反的。(3)按相关关系的形式来分,可分为:线性相关和非线性相关线性相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。非线性相关是指两个相关现象之间,当自变量X的数
14、值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。(4) 按所研究的变量多少来分,可分为:单相关、复相关和偏相关。二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。第七章时间序列分析(计算重点看P206/P234)1、定义:时期数列:在绝对动态数列中,如果各项指标都是反映某种现象
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 知识点 12
限制150内