市场调查数据的数理推断分析课件.pptx
《市场调查数据的数理推断分析课件.pptx》由会员分享,可在线阅读,更多相关《市场调查数据的数理推断分析课件.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.3 总体参数假设检验总体参数假设检验5.2 总体参数估计总体参数估计本章目录5.1 随机抽样随机抽样5.4 方差分析方差分析5.5 相关和回归分析相关和回归分析1第1页/共80页5.1.2 使用随机数生成函数实现随机抽样5.1.1 利用 EXCEL数据分析功能实现随机抽样5.1 随机抽样2第2页/共80页5.1.1 利用EXCEL数据分析功能实现随机抽样实现随机抽样有两种方法:1 1利用 Excel 数据分析功能实现随机抽样。2 2使用随机数生成函数实现随机抽样。第3页/共80页例例5-1 图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:
2、第一步:选择“工具”菜单下“数据分析”中“抽样”功能,打开“抽样”对话框,如图 5-2 所示。第4页/共80页例例5-1 图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:第二步:设置相关参数,如图 5-2 所示,单击“确定”按钮。第5页/共80页6第6页/共80页利用 Excel“数据分析”提供的抽样功能抽取的样本存在以下问题:12随机抽样采用的是可放回抽样,因此,总体中的每个数据都可以多次被抽中,所以样本中的数据一般都会有重复现象。经过筛选,抽样结果避免了重复,但最终所得样本数量可能少于所需数量,因而要根据经验适当调整在数据样本选取时的数量
3、设置,以使筛选后的样本数量满足要求。3尽管高级筛选可以对重复抽样情况进行修补,但抽样结果只能输出所需数目的所抽选项,其他相关信息需要利用其他辅助手段得到,给后继数据分析带来困难。第7页/共80页5.1.2 使用随机数生成函数实现随机抽样利用随机数函数 RAND()进行随机抽样上例数据利用 RAND函数抽样的操作步骤为:1 1第一步:增加字段“生成随机数”和“随机数排序”。2 23 3第二步:在单元格 F2 中输入公式“=RAND()”,并复制到单元格区域 F3:F81,得到一列动态随机数。如图 5-5 所示。第三步:选择单元格区域 F2:F81,单击鼠标右键,选择“复制”,移动光标到单元格 G
4、2,再次单击鼠标右键,选择“选择性粘贴”,在出现的对话框中选择“数值”并单击“确定”,得到一列静态随机数。4 4第四步:选择单元格区域 A1:G81,选择“数据”“排序”,以“随机数排序”为主要关键字排序。在排序结果中根据所需样本数目,即可以进行进一步数据推断。第8页/共80页5.2.2 均值区间估计5.2.1 参数估计概述5.2 总体参数估计5.2.3 比率区间估计9第9页/共80页5.2.1参数估计概述参数估计是指用样本指标(也称为统计量)来估计未知的总体指标(也称为总体参数)。最常见的是用样本平均数估计总体均数、用样本比率估计总体比率。点估计也称为定值估计,是以样本指标的实际值直接作为总
5、体未知参数的估计值的一种推断方法。区间估计是给出总体未知参数的可能变动范围,即区间,并用一定的概率保证区间包含总体未知参数,即根据统计量和标准误差推断总体指标的可能范围。第10页/共80页5.2.2均值区间估计正态总体区间估计说明总体方差已知为样本均值,n为样本容量,为已知总体标准差,为正态分布临界值总体方差未知容量30S为样本标准差,其他符号意义同上容量30 为t 分布临界值,其他符号意义同上第11页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知
6、,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:第一步:建立均值区间估计计算表,如图 5-7 所示。第12页/共80页13第13页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:第二步:总体方差已知的区间估计:在单元格B24 中输入已知总体标准差“10”,在单元格 B25中输入置信水平“95%”,在单元格 B26 中输入样本容量“20”,在单元格 B23 中输入公
7、式“=AVERAGE(C2:C21)”,计算样本均值;在单元格B27 中输入公式“=ABS(NORMSINV(1-B25)/2)”,计算正态分布临界值;在单元格 B28、B29 中分别输入公式“=B23-B27*B24/SQRT(B26)”,“=B23+B27*B24/SQRT(B26)”,计算均值区间的下限和上限。第14页/共80页例例5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:第三步:总体
8、方差未知的区间估计:在单元格D25 中输入置信水平“95%”,在单元格 D26 中输入样本容量“20”,在单元格 D23 中输入公式“=AVERAGE(C2:C21)”,计算样本均值;在单元格D24 中输入公式“=STDEV(C2:C21)”,计算样本标准差;在单元格 D27 中输入公式“=TINV(1-D25,D26-1)”,计算 t 分布临界值;在单元格 D28、D29中分别输入公式“=D23D27*D24/SQRT(D26)”,“=D23+D27*D24/SQRT(D26)”,计算均值区间的下限和上限。第15页/共80页5.2.3比率区间估计比率在大样本情况下,服从正态分布分布,比率的区
9、间估计为:第16页/共80页例例5-3 某市区随机调查了 300 名居民户,其中 6户拥有等离子电视机,估计该地区等离子电视机 95%的置信区间。具体的操作步骤如下:第一步:建立比率区间估计的计算表,如图 5-8所示。第二步:在单元格 B4 中输入公式“=B3/B2”,计算样本比率;在单元格 B7中输入公式“=ABS(NORMSINV(1-B6)/2)”,计算正态分布临界值。第三步:在单元格 B8、B9 中分别输入公式“=B4-B7*SQRT(B4*(1-B4)/B5)”,“=B4+B7*SQRT(B4*(1-B4)/B5)”,计算比率置信区间下限和上限。第17页/共80页5.3.2 一个总体
10、参数假设检验5.3.1 假设检验概述5.3 总体参数假设检验5.3.3 两个总体参数假设检验18第18页/共80页5.3.1假设检验概述 1.假设检验假设检验是推断分析的另一项重要内容,它与参数估计类似,但角度不同。参数估计是利用样本信息推断未知总体参数,而假设检验是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验有参数检验和非参数检验两种。逻辑上运用反证法,统计上依据小概率事件不可能发生这一原理。第19页/共80页5.3.1假设检验概述 2.原假设与备择假设统计是对总体参数的具体数值所作的陈述。在假设检验中,有原假设与备择假设。原假设是研究者想收集证据
11、予以反对的假设,又称“零假设”,用符号表示为 H 0 。之所以用零来修饰原假设,是因为原假设的内容总是没有差异或没有改变,或变量间没有关系等。关于样本统计量,如样本均值或样本均值之差的零假设,是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或者是否相等。备择假设也称“研究假设”,是研究者想收集证据予以支持的假设,表示为 H1。第20页/共80页5.3.1假设检验概述 3.双侧检验与单侧检验 如果备择假设没有特定的方向性,并含有符号“”,这样的检验称为双侧检验或双尾检验(图 5-9)。如果备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验。备择假设的方向为
12、“”,称为左侧检验(图 5-10).备择假设的方向为“”,称为右侧检验(图 5-11)。图5-9双侧假设检验图5-10 左侧假设检验图5-11右侧假设检验第21页/共80页5.3.1假设检验概述 4.显著性水平在假设检验中,把拒绝 H0 所犯的错误称为弃真错误(或类错误),发生的概率设为,也称显著性水平;把接受不真实的 H0 所犯的错误,称为取伪错误(或类错误),发生的概率设为,两者之间的关系是:大,就小;小,就大,一般力求在控制 的前提下减少。显著性水平 的通常取值有 0.1、0.05、0.001 等。如果犯类错误损失更大,为减少损失,值取小;如果犯类错误损失更大,值取大。确定了,就确定了临
13、界点。第22页/共80页5.3.1假设检验概述 5.检验统计量与拒绝域 检验统计量是根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。标准化检验统计量(点估计量假设值)点估计量的标准差,是对样本估计量的标准化结果,即原假设 H0 为真时,点估计量的抽样分布。双侧检验的拒绝域如图5-9 所示,左侧检验的拒绝域如图 5-10 所示,右侧检验的拒绝域如图 5-11所示。图5-9双侧假设检验图5-10 左侧假设检验图5-11右侧假设检验第23页/共80页5.3.1假设检验概述 6.假设检验的步骤 根据已知总体与样本陈述原假设和备择假设。确定一个适当的检验统计量,并利用样本数
14、据算出其具体数值。确定一个适当的显著性水平,并计算出其临界值,指定拒绝域。将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域内,拒绝 H,否则不拒绝 H。也可以直接利用 P 值作出决策,P 值,拒绝 H。第24页/共80页5.3.2一个总体参数假设检验 双侧检验左侧检验右侧检验假设形式H0:0H1:0H0:0H1:0H0:0H1:0检验统计量大样本未知,已知,小样本未知,已知,统计量与临界值决策准则统计量临界值统计量-临界值统计量临界值P值决策准则P,拒绝H0表5-2 一个总体均值检验类型1.一个总体均值检验第25页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为
15、100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:第一步:建立如图 5-12所示的总体均值检验表。第二步:在单元格区域 B7:D8,B15:D16 设置检验形式。其中,(1)为双侧检验,(2)为左侧检验,(3)为右侧检验。在单元格 B4 输入例 5-2 计算样本标准差。第26页/共80页例例5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场调查 数据 数理 推断 分析 课件
限制150内