excel中的概率统计.pdf
《excel中的概率统计.pdf》由会员分享,可在线阅读,更多相关《excel中的概率统计.pdf(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 数理统计实验1Excel基本操作1.1 单元格操作1.1.1单元格的选取Excel 启动后首先将自动选取第A 列第 1 行的单元格即A1(或 a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可被选取的单元格将以反色显示1.1.2选取单元格范围(矩形区域)可以按如下两种方式选取单元格范围(1)先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可(2)先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示然后将鼠标指针移到终点(右下角)位置,先按
2、下Shift 键不放,而后点击鼠标左键1.1.3选取特殊单元格在实际中,有时要选取的单元格由若干不相连的单元格范围组成的此类有两种情况第一种情况是间断的单元格选取选取方法是先选取第一个单元格,然后按住 Ctrl键,再依次选取其它单元格即可第二种情况是间断的单元格范围选取选取方法是先选取第一个单元格范围,然后按住 Ctrl 键,用鼠标拖拉的方式选取第二个单元格范围即可1.1.4公式中的数值计算要输入计算公式,可先单击待输入公式的单元格,而后键入(等号),并接着键入公式,公式输入完毕后按Enter 键即可确认.如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel 将自动插入一个等号提示:(1)
3、通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式(2)可以通过另一单元格复制公式,然后在目标区域内输入同一公式公式是在工作表中对数据进行分析的等式它可以对工作表数值进行加法、减法和乘法等运算公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和 F5 中数值的和=(B4+25)/SUM(D5:F5)1.1.5公式中的语法公式语法也就是公式中元素的结构或顺序Excel 中的公式遵守一个特定的语法:2 最前面是等号(),后面
4、是参与计算的元素(运算数)和运算符每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数在默认状态下,Excel 从等号()开始,从左到右计算公式可以通过修改公式语法来控制计算的顺序例如,公式=5+2*3的结果为11,将2 乘以3(结果是6),然后再加上5因为 Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括号内的内容将首先被计算公式=(5+2)*3 的结果为 21,即先用5 加上2,再用其结果乘以 31.1.6单元格引用一个单元格中的数值或公式可以被另一个单元格引用含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值只要被引用单
5、元格做了修改,包含引用公式的单元格也就随之修改例如,公式“=B15*5”将单元格B15 中的数值乘以5每当单元格B15 中的值修改时,公式都将重新计算公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志在默认状态下,Excel 使用A1 引用类型这种类型用字母标志列(从A 到 IV,共 256 列),用数字标志行(从1 到 65536)如果要引用单元格,请顺序输入列字母和行数字 例如,D50 引用了列D 和行50 交叉处的单元格如果要引用单元格区域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用下面是引用的示例单元格引用范围引用符号在列A 和行10
6、中的单元格A10 属于列A 和行10 到行20 中的单元格区域A10:A20 属于行15 和列B 到列E 中的单元格区域B15:E15 从列A 行 10 到列 E 行 20 的矩形区域中的单元格A10:E20 行 5 中的所有单元格5:5 从行5 到行10 中的所有单元格5:10 列 H 中的所有单元格H:H 从列H 到列J 中的所有单元格H:J 1.1.7工作表函数Excel 包含许多预定义的,或称内置的公式,它们被叫做函数函数可以进行简单的或复杂的计算工作表中常用的函数是“SUM”函数,它被用来对单元格区域进行加法运算虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM”工作表函数
7、还可以方便地计算多个单元格区域函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号如果函数以公式的形式出现,请在函数名称前面键入等号()当生成包含函数的公式时,公式选项板将会提供相关的帮助使用公式的步骤:3 A.单击需要输入公式的单元格B.如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮C.单击“函数”下拉列表框右端的下拉箭头D.单击选定需要添加到公式中的函数如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表E.输入参数F.完成输入公式后,请按ENTER 键1.2 几种常见的统计函数1.2.1均值Excel 计算平均数使用AVERAGE 函数,其格式如下:A
8、VERAGE(参数 1,参数 2,,,参数30)范例:AVERAGE(12.6,13.4,11.9,12.8,13.0)=12.74 如果要计算单元格中1 到 B20 元素的平均数,可用AVERAGE(A1:B20)1.2.2标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差(1)样本标准差Excel 计算样本标准差采用无偏估计式,STDEV 函数格式如下:STDEV(参数 1,参数 2,,,参数30)范例:STDEV(3,5,6,4,6,7,5)1.35 如果要计算单元格中1 到 B20 元素的样本标准差,可用ST
9、DEV(A1:B20)(2)总体标准差Excel 计算总体标准差采用有偏估计式STDEVP 函数,其格式如下:STDEVP(参数 1,参数 2,,,参数30)范例:STDEVP(3,5,6,4,6,7,5)1.25 1.2.3方差方差为标准差的平方,在统计上亦分样本方差与总体方差(1)样本方差S2=1)(2nxxiExcel 计算样本方差使用VAR 函数,格式如下:VAR(参数 1,参数 2,,,参数30)如果要计算单元格中1 到 B20 元素的样本方差,可用VAR(A1:B20)范例:VAR(3,5,6,4,6,7,5)1.81(2)总体方差4 S2=nxxi2)(Excel 计算总体方差使
10、用VARP 函数,格式如下:VARP(参数 1,参数 2,,,参数30)范例:VAR(3,5,6,4,6,7,5)1.55 1.2.4正态分布函数Excel 计算正态分布时,使用NORMDIST函数,其格式如下:NORMDIST(变量,均值,标准差,累积)其中:变量(x):为分布要计算的x 值;均值():分布的均值;标准差():分布的标准差;累积:若为TRUE,则为分布函数;若为FALSE,则为概率密度函数范例:已知 X 服从正态分布,600,100,求 PX500输入公式NORMDIST(500,600,100,TRUE)得到的结果为0.158655,即 PX 500=0.158655 1.
11、2.5正态分布函数的反函数Excel 计算正态分布函数的反函数使用NORMINV函数,格式如下:NORMINV(下侧概率,均值,标准差)范例:已知概率P0.841345,均值 360,标准差 40,求 NORMINV函数的值输入公式NORMINV(0.841345,360,40)得到结果为400,即 P X400=0.841345 注意:(1)NORMDIST函数的反函数NORMINV用于分布函数,而非概率密度函数,请务必注意;(2)Excel 提供了计算标准正态分布函数NORMSDIST(x),及标准正态分布的反函数 NORMSINV(概率)范例:已知(0,1),计算(2)=PX1.711)
12、已知 t1.711,n=25,采用单侧,则T 分布的值:TDIST(1.711,24,1)得到 0.05,即 P(T1.711)=0.05若采用双侧,则T分布的值:TDIST(1.711,24,2)得到 0.1,即1.7110.1P T1.2.7t 分布的反函数Excel 使用 TINV 函数得到t 分布的反函数,格式如下:TINV(双侧概率,自由度)范例:已知随机变量服从t(10)分布,置信度为0.05,求 t205.0(10)输入公式TINV(0.05,10)得到 2.2281,即2.22810.05P T若求临界值t(n),则使用公式TINV(2*,n)范例:已知随机变量服从t(10)分
13、布,置信度为0.05,求 t0.05(10)输入公式TINV(0.1,10)得到 1.812462,即 t0.05(10)=1.8124621.2.8F 分布Excel 采用 FDIST 函数计算F 分布的上侧概率1()F x,格式如下:FDIST(变量,自由度1,自由度2)其中:变量(x):判断函数的变量值;自由度 1(1n):代表第1 个样本的自由度;自由度 2(2n):代表第2个样本的自由度6 范例:设 X 服从自由度1n=5,2n=15 的 F 分布,求P(X2.9)的值输入公式=FDIST(2.9,5,15)得到值为0.05,相当于临界值 1.2.9F 分布的反函数Excel 使用
14、FINV 函数得到F 分布的反函数,即临界值12(,)Fn n,格式为:FINV(上侧概率,自由度1,自由度2)范例:已知随机变量X 服从F(9,9)分布,临界值=0.05,求其上侧0.05 分位点F0.05(9,9)输入公式=FINV(0.05,9,9)得到值为3.178897,即 F0.05(9,9)=3.178897若求 单侧百分位点F0.025(9,9),F0.975(9,9)可使用公式=FINV(0.025,9,9)=FINV(0.975,9,9)得到两个临界值4.025992 和 0.248386若求临界值F(n1,n2),则使用公式 FINV(,n1,n2)1.2.10卡方分布E
15、xcel 使用 CHIDIST 函数得到卡方分布的上侧概率1()F x,其格式为:CHIDIST(数值,自由度)其中:数值(x):要判断分布的数值;自由度(v):指明自由度的数字范例:若 X 服从自由度v=12 的卡方分布,求P(X5.226)的值输入公式CHIDIST(5.226,12)得到 0.95,即1(5.226)F=0.95 或(5.226)F=0.051.2.11卡方分布的反函数Excel 使用 CHIINV函数得到卡方分布的反函数,即临界值2()n格式为:CHIINV(上侧概率值,自由度n)范例:下面的公式计算卡方分布的反函数:CHIINV(0.95,12)得到值为5.226,即
16、20.95(12)=5.226若求临界值2(n),则使用公式CHIINV(,n)7 1.2.12泊松分布计算泊松分布使用POISSON 函数,格式如下:POISSON(变量,参数,累计)其中:变量:表示事件发生的次数;参数:泊松分布的参数值;累计:若TRUE,为泊松分布函数值;若FALSE,则为泊松分布概率分布值范例:设服从参数为的泊松分布,计算PX=6 及 PX6输入公式=POISSON(6,4,FALSE)=POISSON(6,4,TRUE)得到概率0.104196 和 0.889326在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT,开平方函数SQRT,和函数SU
17、M,等等关于这些函数的具体用法,可以查看Excel 的关于函数的说明,不再赘述2区间估计实验计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限当熟悉了数据输入方法及常见统计函数后,变得十分简单2.1 单个正态总体均值与方差的区间估计:2.1.12已知时的置信区间置信区间为22,xuxunn例 1 随机从一批苗木中抽取16 株,测得其高度(单位:m)为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16设苗高服从正态分布,求总体均值的 0.95 的置信区间已知=0.01(米)步骤
18、:(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5 内输入样本数据(2)计算置信下限和置信上限可以在数据区域B3:G5 以外的任意两个单元格内分别输入如下两个表达式:=average(b3:g5)-normsinv(1-0.5*)*/sqrt(count(b3:g5)=average(b3:g5)+normsinv(1-0.5*)*/sqrt(count(b3:g5)上述第一个表达式计算置信下限,第二个表达式计算置信上限其中,显著性水平和标准差是具体的数值而不是符号本例中,=0.05,0.01,上述两个公式应实际输入为=average(b3:g5)-normsinv(0.975)*
19、0.01/sqrt(count(b3:g5)=average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5)8 计算结果为(1.148225,1.158025)2.1.22未知时的置信区间置信区间为22(1),(1)SSxtnxtnnn例 2 同例 1,但未知输入公式为:=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3
20、:g5)计算结果为(1.133695,1.172555)2.1.3未知时2的置信区间:置信区间为2222122(1)(1),(1)(1)nnnnss例从一批火箭推力装置中随机抽取10 个进行试验,它们的燃烧时间(单位:s)如下:50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5 试求总体方差2的 0.9 的置信区间(设总体为正态)操作步骤:(1)在单元格 B3:C7 分别输入样本数据;(2)在单元格 C9 中输入样本数或输入公式=COUNT(B3:C7);(3)在单元格 C10 中输入置信水平0.1(4)计算样本方差:在单元格C11 中输入公式=
21、VAR(B3:C7)(5)计算两个查表值:在单元格C12 中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)(6)计算置信区间下限:在单元格C14 中输入公式=(C9-1)*C11/C12(7)计算置信区间上限:在单元格C15 中输入公式=(C9-1)*C11/C13 9 当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2,count(b3:c7)-1)=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.
22、1/2,count(b3:c7)-1)2.2 两正态总体均值差与方差比的区间估计2.2.1当12=22=2但未知时1-2的置信区间置信区间为1212211(2)wxytnnSnn例在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5 和 7,分析其蛋白质含量为甲:12.6 13.4 11.9 12.8 13.0乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4 蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差-所在的范围(取 0.05)实验步骤:(1)在 A2:A6 输入甲组数据,在B2:B8 输入乙组数据;(2)在单元格B11 输入公式AVERAGE
23、(A2:A6),在单元格B12 中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值(3)分别在单元格C11 和 C12 分别输入公式=VAR(A2:A6),=VAR(B2:B8),计算出两组样本的方差(4)在单元格 D11 和 D12 分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小(5)将显著性水平0.05 输入到单元格E11 中(6)分别在单元格B13 和 B14 输入=B11-B12-TINV(0.025,10)*SQRT(4*C11+6*C12)/10)*SQRT(1/5+1/7)10 和=B11-B12+TINV(0.025
24、,10)*SQRT(4*C11+6*C12)/10)*SQRT(1/5+1/7)计算出置信区间的下限和上限2.2.21和未知时方差比/的置信区间置信区间为22112221221212211,(1,1)(1,1)sssFnns Fnn例有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10 次测定其测定值的方差分别是SA=0.5419,SB=0.6065设 2A和2B分别是 A、B所测量的数据总体(设为正态分布)的方差求方差比2A/2B的 0.95 置信区间操作步骤:(1)在单元格 B2,B3 输入样本数,C2,C3 输入样本方差,D2 输入置信度(2)在 B4 和 B5 利用
25、公式输入=C2/(C3*FINV(1-D2/2,B2-1,B3-1)和=C2/(C3*FINV(D2/2,B2-1,B3-1)计算出 A 组和 B 组的方差比的置信区间上限和下限11 2.3 练习题1.已知某树种的树高服从正态分布,随机抽取了该树种的60 株林木组成样本样本中各林木的树高资料如下(单位:m)22.3,21.2,19.2,16.6,23.1,23.9,24.8,26.4,26.6,24.8,23.9,23.2,23.3,21.4,19.8,18.3,20.0,21.5,18.7,22.4,26.6,23.9,24.8,18.8,27.1,20.6,25.0,22.5,23.5,2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- excel 中的 概率 统计
限制150内