Excel在推断统计中的应用.pdf
《Excel在推断统计中的应用.pdf》由会员分享,可在线阅读,更多相关《Excel在推断统计中的应用.pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 Excel 在推断统计中的应用一、二项分布工具二、其它分布的函数三、随机抽样的工具四、由样本推断总体五、假设检验六、双样本等均值假设检验七、正态性的X2检验一、二项分布工具(一)简介:在Excel 中想要计算二项分布的概率分布、累积概率,需要利用Excel 的工作表函数 BINOMDIST。函数 BINOMDIST 适用于固定次数的独立实验,实验的结果只包含成功或失败二种情况,且每次实验成功的概率固定不变。例如,已知次品概率的情况下,函数BINOMDIST 可以计算 10 个产品中发现2 个次品的概率。以下例子说明如何在Excel 中计算二项分布的概率,以及如何建立二项分布图表。(二)操作
2、步骤:例子如下所示,一个推销员打了六个电话,推销成功的概率是0.3,那么可以按以下步骤建立推销成功次数的概率分布图表。1 如图附-8 所示,先在Excel 之下建立好概率分布表格的框架。图附-8 2 如图附-9 所示,先在 B7 至 F7 单元格分别输入概率计算公式。2 图附-9 3 公式的拷贝。选取B7 至 F7 单元格,拖动“填充柄”至F13 单元格即可完成公式的拷贝操作。结果图附-10 所示。图附-10 4下面开始创建二项分布图表。选取B7 至 B13 单元格,选取“插入”菜单的“图表”子菜单。5选择“柱状图”,然后单击“下一步”。6.单击“系列”标签,单击“分类(X)轴标志”框,并用鼠
3、标选取A7至 A13 单元格为图表X 轴的轴标,然后单击“下一步”。7.分别键入图表名称“二项分布图”,X 轴名称“成功次数”,Y 轴名称“成功概率”,单击“完成”按扭即可生成二项分布图表。(三)结果说明:如图附-10 所示,利用 Excel 的 BINOMDIST 的函数可以计算出二项分布的概率以及累积概率。BINOMDIST 函数可以带四个参数,各参数的含义分别是:实验成功的次数,实验的总次数,每次实验中成功的概率,是否计算累积概率。第四个参数是一个逻辑值,如果为 TRUE,函数 BINOMDIST 返回累积分布函数,如果为FALSE,返回概率密度函数。二、其它分布的函数(一)函数CRIT
4、BINOM:1 说明:函数 CRITBINOM 可称为 BINOMDIST 的逆向函数,它返回使累积二项式分布概率P(X=x)大于等于临界概率值的最小值。2语法:CRITBINOM(trials,probability_s,alpha)Trials:贝努利实验次数。Probability_s:一次试验中成功的概率。Alpha:临界概率。3举例:CRITBINOM(6,0.5,0.75)等于 4,表明如果每次试验成功的概率为0.5,那么 6 次试验中成功的次数小于等于4 的概率恰好超过或等于0.75。(二)函数HYPGEOMDIST:1说明:函数HYPGEOMDIST 返回超几何分布。给定样本容
5、量、总体容量和样本总体中成功的次数,函数 HYPGEOMDIST 返回样本取得给定成功次数的概率。使用函数HYPGEOMDIST 可以解决有限总体的问题,其中每个观察值或者为成功或者为失败,且给定样本区间的所有子集有相等的发生概率。3 2.语法:HYPGEOMDIST(sample_s,number_sample,population_s,number_population)Sample_s:样本中成功的次数。Number_sample:样本容量。Population_s:样本总体中成功的次数。Number_population:样本总体的容量。3.举例:容器里有20 块巧克力,8 块是焦糖的
6、,其余12 块是果仁的。如果从中随机选出4 块,下面函数计算式计算出只有一块是焦糖巧克力的概率:HYPGEOMDIST(1,4,8,20)=0.363261。(三)函数NEGBINOMDIST:1说明:函数 NEGBINOMDIST 返回负二项式分布。当每次试验成功概率固时,函数 NEGBINOMDIST 返回在到达指定次数成功之前,出现n 次失败的概率。此函数与二项式分布相似,只是它的成功次数固定,试验总数为变量。与二项分布类似的是,试验次数被假设为自变量。2 语法:NEGBINOMDIST(number_f,number_s,probability_s)Number_f:失败次数。Numb
7、er_s:成功的临界次数。Probability_s:成功的概率。3 举例:例如,如果要找出5 个反应敏捷的人,且已知具有这种特征的候选人的概率为0.3。以下公式将计算出在找到5 个合格候选人之前,需要面试10 个候选人的概率:NEGBINOMDIST(10,5,0.3)=0.06871(四)函数POISSON:1说明:函数POISSON 返回泊松分布。泊松分布通常用于预测一段时间内事件发生指定次数的概率,比如一分钟内通过收费站的轿车的数量为n 的概率。2语法:POISSON(x,mean,cumulative)X:事件数。Mean:期望值。Cumulative:为一逻辑值,确定所返回的概率分
8、布形式。如果 cumulative 为 TRUE,函数 POISSON 返回累积分布函数,即,随机事件发生的次数在0 和 x 之间(包含 0 和 1);如果为 FALSE,则返回概率密度函数,即,随机事件发生的次数恰好为x。3 举例:POISSON(2,5,FALSE)=0.084224 表明,若某一收费站每分种通过的轿车平均数量为5 辆,那么某一分钟通只2 辆的概率为 0.084224。(五)正态分布函数NORMDIST:1说明:正态分布在模拟现实世界过程和描述随机样本平均值的不确定度时有广泛的用途。函数 NORMDIST 返回给定平均值和标准偏差的正态分布的累积函数。同样可以用类似“七”中
9、的方法,利用 NORMDIST 函数建立正态分布密度函数图,这里不再赘述。2.语法:NORMDIST(x,mean,standard_dev,cumulative)X:为需要计算其分布的数值。Mean:分布的算术平均值。Standard_dev:分布的标准偏差。Cumulative:为一逻辑值,指明函数的形式。如果cumulative 为 TRUE,函数 NORMDIST 返回累积分布函数;如果为FALSE,返回概率密度函数。3举例:例如,公式NORMDIST(6,5,2,0)返回平均值为5、标准差为 2 的正态函数当X=6 时概率密度函数的数值,公式NORMDIST(60,50,4,1)返回
10、平均值为50、标准差为4 的正态分布函数当 X=60 时累积分布函数的数值。(六)函数 NORMSDIST:1说明:函数NORMSDIST 返回标准正态分布的累积函数。2 语法:NORMSDIST(z)4 Z 为需要计算其分布的数值。3举例:NORMSDIST(0)=0.5(七)函数NORMSINV:1说明:函数NORMSINV 返回标准正态分布累积函数的逆函数。2 语法:NORMSINV(probability)Probability:正态分布的概率值。3举例:NORMSINV(0.5)=0(八)t 分布函数 TDIST:1说明:函数 TDIST 返回 student 的 t 分布数值。T
11、分布用于小样本数据集合的假设检验。使用此函数可以代替t 分布的临界值表。2语法:TDIST(x,degrees_freedom,tails)X:为需要计算分布的数字。Degrees_freedom:为表示自由度的整数。Tails:指明返回的分布函数是单尾分布还是双尾分布。如果tails=1,函数 TDIST 返回单尾分布。如果tails=2,函数 TDIST 返回双尾分布。3 举例:TDIST(1.96,60,2)=0.054645三、随机抽样的工具(一)简介:Excel 中的 Rand()函数可以返回大于等于0 小于 1 的均匀分布随机数,Rand()不带任何参数运行,每次计算时时都将返回一
12、个新的数值。RAND()函数可以被用来作为不重复抽样调查的工具。(二)操作步骤:如图附-11 所示有 10 个象征性的样本数据,欲从中随机抽取5 个数据可按如下步骤操作:图附-11 图附-12 1 选择 B2 单元格,输入公式“=RAND()”并回车。2拖动 B2 单元格右下角的填充柄至B11 单元格,并在B1 单元格输入标题“RANDOM”。3.选取单元格B2 至 B11,右击选中的区域选择“复制”,再次右击选中的区域,选择“选择性粘贴”,单击选项“数值”后,点击“确定”按扭。4.选取单元格A2 至 B11 单元格,选择“数据”菜单项下的排序子菜单。5.选取“RANDOM”为主要关键字,然后
13、点击“确定”按扭。排序结果如图附-12 所示,A2 至 A6 单元格的样本即为随机抽取的5 个样本。5(三)结果说明:1.以上进行的是不重复随机抽样,可以用类似的方法,利用 Excel 的 RANDBETWEEN(TOP,BOTTOM)函数实现总体的重复随机抽样。RANDBETWEEN(TOP,BOTTOM)函数可随机返回介于TOP 与 BOTTOM 之间的整数,抽取此整数对编号的样本可作为总体的重复随机抽样的结果。2.RAND()函数返回的是0 与 1 之间均匀的随机数,利用 Excel 数据分析工具中的随机数发生器,可以生成用户指定类型分布的随机数。例如 0-1 正态分布的随机数,指定参数
14、的迫松分布的随机数等。3.利用 Excel 易于产生各类型随机数的特性,可以用类似的方法方便的进行随机数字模拟试验与随机游走模拟试验。四、由样本推断总体(一)简介:利用Excel 的几个函数,如求平均函数AVERAGE、标准差函数STDEV、T 分布函数TINV 等的组合使用可以构造出一个专门用于实现样本推断总体的Excel 工作表。以下例子先计算样本的平均数和标准差,然后在一定置信水平上估计总体均值的区间范围。(二)操作步骤:1构造工作表。如图附-13 所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。2.为表格右边的公式计算结果定义左边的变量名。选定 A4:B6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Excel 推断 统计 中的 应用
限制150内