应用统计复习资料PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用统计复习资料PPT课件.ppt》由会员分享,可在线阅读,更多相关《应用统计复习资料PPT课件.ppt(125页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计 总复习对外经济贸易大学 国际商学院统计与技术经济学系杨震宁复习重点基本概念基本公式基本原理课后习题和期中考题老师上课强调的内容复习的重点内容一、基本概念统计学内容统计学内容描述统计学推断统计学描述描述统计学学定定义:指搜集、整理、分析并提供指搜集、整理、分析并提供统计资料的理料的理论和方法。和方法。主要任主要任务:使反映客使反映客观事物的事物的统计数据可以一目了然,条理清数据可以一目了然,条理清晰,使用方便,可以晰,使用方便,可以说明明现象的数量特征和数量关象的数量特征和数量关系。系。内容内容:第二第二讲:数据的采集数据的采集 第三第三讲:数据的整理和表述数据的整理和表述 第四第四讲
2、:数据的描述性分析数据的描述性分析推断推断统计学学定定义:是只依据是只依据样本本资料推断料推断总体特征的技体特征的技术和方法。和方法。方法:方法:包括参数估包括参数估计和假和假设检验的方法。的方法。内容内容:第五第五讲:抽抽样分布与参数估分布与参数估计 第六第六讲:假假设检验 第七第七讲:方差分析方差分析有关概念有关概念总体和总体单位总体和总体单位样本和样本单位样本和样本单位变量(标志)变量(标志)数据数据总体和体和总体体单位位总体(有限体(有限总体和无限体和无限总体)体)定定义:研究具有某些相同性研究具有某些相同性质的全部的全部单位或事位或事件的整体。件的整体。特征特征:.同同质性性 .大量
3、性大量性 .变异性异性总体体单位位:组成成总体的个体。体的个体。样本和本和样本本单位位样本本:在在总体中抽取部分体中抽取部分总体体单位位进行行调查,被,被抽出的抽出的总体体单位构成一个整体,位构成一个整体,这个整体个整体称称为样本。本。样本本单位位:组成成样本的个体。本的个体。总体总体总体单位总体单位样本样本样本单位样本单位变量(量(标志):参数(志):参数(总体)和体)和统计量(量(样本)本)定定义:反映反映总体体单位属性或特征的名位属性或特征的名词种种类:品品质变量量:变量量值表示事物表示事物类别或或顺序的序的变量量.数量数量变量量:标志表志表现事物数字特征的事物数字特征的变量量.连续型型
4、变量量 离散型离散型变量量初级初级数据数据初级资料(primary data)、第一手资料,是指由数据的使用者组织,通过调查和实验而得到的数据 对原始资料的采集方法为:统计调查 实验 观察 次次级数据数据二、统计调查15判断抽样判断抽样非随机抽样非随机抽样抽样调查抽样调查随机抽样随机抽样简单随机抽样简单随机抽样方便抽样方便抽样配额抽样配额抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多步抽样多步抽样非随机抽样非随机抽样判断抽样判断抽样按照一定的标准有意识地在总体中抽取若干合按照一定的标准有意识地在总体中抽取若干合乎标准的样本单位进行调查;乎标准的样本单位进行调查;方便抽样方便抽样抽取样本
5、的标准主要是方便,这样抽出的样本抽取样本的标准主要是方便,这样抽出的样本代表性不高,常用于案例研究;代表性不高,常用于案例研究;配额抽样配额抽样 -根据已经定好的单位数抽取样本。根据已经定好的单位数抽取样本。随机抽样随机抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多步抽样多步抽样三、描述性统计频数分布编制频数分布编制分组的关键分组的关键变量的选择,选择与研究的问题有关的变量的选择,选择与研究的问题有关的 变量变量 。组限的确定。应遵循组限的确定。应遵循穷尽和互斥穷尽和互斥原则原则。定性数列编制:定性数列编制:组限的确定一般比较简单组限的确定一般比较简单。如人口按
6、性别分组、企业按所有制分组等如人口按性别分组、企业按所有制分组等 定量定量变变量量编制:编制:分为分为单项数列单项数列和和组距数列组距数列两种形式。两种形式。单项数列单项数列:即变量的一个取值为一组,适用于离散:即变量的一个取值为一组,适用于离散型变量,并且变量的取值较少。型变量,并且变量的取值较少。组距数列组距数列:即每一组有一个上限值和一个下限值所:即每一组有一个上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变量且形成的区间,适用于连续性变量,或离散型变量且变量的取值较多的情况。变量的取值较多的情况。注意以下三个方面的问题注意以下三个方面的问题 1.确定组数确定组数 2.确定组
7、距:组距为上限与下限之差。确定组距:组距为上限与下限之差。等距数列数据分布均匀。等距数列数据分布均匀。异距数列数据分布不均匀。异距数列数据分布不均匀。3.确定确定组组限限 应能把现象的不同类型划分出来应能把现象的不同类型划分出来。要考虑到数据是连续性变量还是离散型要考虑到数据是连续性变量还是离散型变量。变量。无法确定实际数据的取值范围,或者数无法确定实际数据的取值范围,或者数据中存在极端数值,可采用开口据中存在极端数值,可采用开口组组的的形形式式。4.确定确定组中值组中值 :(上限下限)上限下限)2 2 ,开口组,开口组 统计图饼图条形图直方图折线图曲线图茎叶图用途用途?集中趋势的测定集中趋势
8、的测定平均数平均数概念概念表表明明同同类类现现象象在在一一定定时时间间、地地点点、条条件件下下所所达达到到的的一一般般水水平平,是是总总体体内内某某个个变变量量大大小小各各异异的的观观察察值值的的代代表表性数值。也是对变量分布集中趋势的测定。性数值。也是对变量分布集中趋势的测定。数据集中区数据集中区变量变量x四、参数估计参数与统计量参数与统计量参数:反应总体分布特征的指标统称参数:反应总体分布特征的指标统称为总体参数,简称参数。常用的有为总体参数,简称参数。常用的有统计量:反应样本分布特征的指标统统计量:反应样本分布特征的指标统称为样本统计量,简称统计量。常用称为样本统计量,简称统计量。常用总
9、体参数总体参数 样本统计量样本统计量平均数平均数方差方差比率比率抽样分布样本统计量的概率分布称为抽样分布。用以描述抽样误差的规律性,是统计推断的理论基础。的抽样分布的抽样分布单一样本均值的抽样分布单一样本均值的抽样分布正态分布再生定理正态分布再生定理中心极限定理中心极限定理两样本均值差异的抽样分布两样本均值差异的抽样分布正态分布再生定理正态分布再生定理 当总体服从正态分布时,从中抽取样本容当总体服从正态分布时,从中抽取样本容量为量为n的样本,样本均值一定服从正态分布。的样本,样本均值一定服从正态分布。样本均值的期望值和方差?它们与总体的样本均值的期望值和方差?它们与总体的期望值和方差有何关系期
10、望值和方差有何关系样本均值的期望值等于总体均值样本均值的期望值等于总体均值方差(有退还抽样、无退还抽样方差(有退还抽样、无退还抽样)(退还抽样)(退还抽样)(不退还抽样)(不退还抽样)中心极限定理中心极限定理 设某总体的元素总量为设某总体的元素总量为N,期望值为,期望值为 ,标,标准差为准差为 ;若从该总体中随机抽取样本容量为;若从该总体中随机抽取样本容量为n的样本,当的样本,当n很大(很大(n30)时,则样本平均数时,则样本平均数 的抽样分布近似为正态分布,即:的抽样分布近似为正态分布,即:(退还抽样)(退还抽样)(不退还抽样)(不退还抽样)参数估计参数估计估计方法估计方法点估计点估计区间估
11、计区间估计单一总体均值估计单一总体均值估计单一总体比率估计单一总体比率估计参数估计的统计过程总体均值=?从总体中选取几项组成一个简单随机样本对样本数据的汇总提供了样本均值 的值用 的值对 值 进行推断 点估计点估计区间估计区间估计 参数估计的参数估计的方法方法点估计点估计定义:以实际抽样得到的某一估计量的定义:以实际抽样得到的某一估计量的单一值作为相应总体参数的估计值的估单一值作为相应总体参数的估计值的估计称为点估计计称为点估计估计量优良性的标准估计量优良性的标准v无偏性无偏性 v有效性有效性v一致性一致性常用的优良估计量我们用 来点估计总体均值.s 来点估计总体标准差.p 来点估计总体比例.
12、区间估计的定义区间估计的定义 区间估计是在一定的置信系数的区间估计是在一定的置信系数的保证下,根据统计量得到的一个保证下,根据统计量得到的一个取值范围去估计总体的参数。取值范围去估计总体的参数。区间估计的几个关键概念区间估计的几个关键概念置信系数置信系数 使人相信区间包含总体均值的使人相信区间包含总体均值的概率概率,一般取一般取 0.95,0.90,0.99.它的大小说明估计的把它的大小说明估计的把握性的大小握性的大小.置信区间置信区间:在一定概率的保证下在一定概率的保证下,包含总体均值的区包含总体均值的区间间,区间的宽窄说明估计精度的大小区间的宽窄说明估计精度的大小.区间越宽区间越宽,估计估
13、计的精度就小的精度就小;否则就大否则就大.临界值临界值:置信区间的上限和下限置信区间的上限和下限注意置信系数和注意置信系数和 区间宽窄的关系区间宽窄的关系区间估计的程序区间估计的程序选定置信系数选定置信系数抽取一个样本容量为抽取一个样本容量为n的样本的样本计算相应的统计量计算相应的统计量确定统计量的概率分布确定统计量的概率分布得到置信区间的临界值得到置信区间的临界值得到参数的置信区间得到参数的置信区间单一总体平均数的区间估计单一总体平均数的区间估计当当已知时已知时的置信区间的置信区间当当未知时未知时的置信区间的置信区间大样本大样本小样本小样本当当 已知时计算已知时计算的置信区间的步骤的置信区间
14、的步骤选定置信系数抽取一个样本容量为n的样本计算确定 统计量的概率分布求置信区间的临界值单一总体平均数的置信区间的临界值为当当 未知时的单一总体平均数的区未知时的单一总体平均数的区间估计(大样本)间估计(大样本)由于由于 未知,一般情况下用未知,一般情况下用S替代,替代,单一总体平均数的置信区间的临界值仍为单一总体平均数的置信区间的临界值仍为单一总体平均数的置信区间的临界值为单一总体平均数的置信区间的临界值为时的时的单一总体平均数的区间估计举例,教材144页单一总体比率的区间估计单一总体比率的区间估计应用条件:应用条件:()时,)时,样本比率样本比率 p近似服从正态分布。近似服从正态分布。使用
15、正态分布统计量使用正态分布统计量 总体比率总体比率总体比率总体比率总体比率总体比率 在在在在在在1-1-1-1-1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为根据均值区间估计公式可得样本容量根据均值区间估计公式可得样本容量n为为样本容量的确定样本容量的确定估计总体均值时估计总体均值时根据比率区间估计公式可得根据比率区间估计公式可得n为为 样本容量的确定样本容量的确定 估计总体比率时估计总体比率时分组、描述性统计和参数估计请复习期中考试习题(计算第一题)五、假设检验假设检验在统计方法中的地位推断统计推断
16、统计统计方法统计方法参数估计参数估计描述统计描述统计假设检验假设检验直接通过样本直接通过样本估计总体参数估计总体参数先假设先假设总体参总体参数具有数具有某特征,某特征,然后看然后看样本提样本提供的信供的信息是否息是否与假设与假设矛盾矛盾 假设(hypothesis)假设(假设(hypothesis):):是对总体参数的具体是对总体参数的具体数值所作的陈述。数值所作的陈述。参数是总体的均值、参数是总体的均值、比例、方差比例、方差参数必须在分析前确参数必须在分析前确定定我认为这批我认为这批产品的重量产品的重量符合现实要符合现实要求!求!原假设(null hypothesis)1、研究者想收集证据予
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 复习资料 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内