市场调查与分析抽样估计与样本容量确定.pptx
《市场调查与分析抽样估计与样本容量确定.pptx》由会员分享,可在线阅读,更多相关《市场调查与分析抽样估计与样本容量确定.pptx(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样估计的基本思路市场调查的目的就是通过样本的数据来推测总体参数,从而估计总体特征。例如我们想知道总体的平均值就可以用样本的平均值来估计。用样本均值来代替总体均值就是点估计,然而点估计虽然计算很简单,却只有在很少的情况下才完全正确,因此人们更偏向于区间估计。所谓区间估计就是对总体值落在某一范围内的可能性的推断。实例:路,工作日日人流总量定值估计值为771356人,在95%的概率保证程度下的区间估计值为726235人816478人;非工作日日人流总量定值估计值为712113人,在95%的概率保证程度下的区间估计值为652891人771335人。第1页/共26页要实现对总体的估计必须要了解一些基本
2、的信息,包括总体的标准差情况、置信度、抽样分布等等内容。下来我们以对总体均值的估计为研究对象,对这些基础知识进行一个简单的回顾。第2页/共26页一、正态分布重要的统计分布正态分布是一种钟形的、相对于其平均值对称的连续性分布。正态分布的统计特征在于:1.只有一个众数。2.相对于其平均值对称。3.正态分布由其平均值和标准差唯一确定。4.正态分布曲线下方的总面积等于1,正态分布曲线下任意两个变量值之间的区域面积等于观察值处于这两个变量值之间的概率。5.任何正态分布都可以通过简单的转化,变为标准正态分布。其转化公式为第3页/共26页 正态分布具有良好的统计性质,如果一个变量符合正态分布就可以很方便的对
3、它进行估计。举例,利用标准正态分布进行区间估计:设待估的总体参数为 ,样本的平均值为 假设 符合标准正态分布,则:即第4页/共26页正态分布在统计推断中处于特别重要的地位。原因在于:1.许多变量的概率分布都接近正态分布,如消费者消费掉的软饮料数量、爱吃快餐的人平均每月去快餐店的次数等。2.正态分布在理论上重要,根据中心极限定理,任何总体不论其分布如何,随着样本容量的增加,样本均值趋近于正态分布3.许多离散性概率分布也近似于正态分布。第5页/共26页总体分布、样本分布和抽样分布总体分布是总体中所有单位的频率分布,总体的分布存在多种形式,一般情况下总体分布是未知的。总体分布的平均值用 表示,总体分
4、布的标准差用 表示。样本分布是单个样本所有单位的频率分布。样本分布是已知的。样本均值用 表示,标准差用S表示。样本均值的抽样分布是从一个特定总体中抽取的给定容量的所有可能样本的平均值的概率分布。第6页/共26页总体的分布、样本分布可能不一定是正态分布,但是根据中心极限定理,样本平均值的抽样分布必定是正态分布。对于正态分布来说 管的是曲线的位置,管的是曲线的胖瘦。不同的样本量确定的样本平均值抽样分布其 和 不同,所以对于规定的置信区间来说,大样本的平均值的抽样分布更“集中”,误差也小;从另一方面,如果误差确定,大样本的平均值的置信度更高。第7页/共26页计算总体均值的区间估计,就是想获得样本均值
5、抽样分布的 和 ,从而根据置信度确定置信区间,然后在点估计的基础上确定区间估计。例:从一个500人的总体中,采用简单随机抽样抽出一个10人的样本,每个入样单元的年龄见下表。求平均年龄估计值的抽样方差、标准差,并计算在95%的置信水平下的误差限于相应的置信区间。第8页/共26页样本单元年龄估计值-平均数 离差的平方121-13.4179.56226-8.470.56327-7.454.76432-2.45.76534-0.40.166372.66.767383.612.968405.631.369427.657.76104712.6158.76合计578.4第9页/共26页1.计算点估计值:=(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场调查 分析 抽样 估计 样本 容量 确定
限制150内