数理统计及应用.ppt
《数理统计及应用.ppt》由会员分享,可在线阅读,更多相关《数理统计及应用.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具第第1010章章 数理统计及应用数理统计及应用第第1010章章 数理统计及应用数理统计及应用n本章内容:本章内容:通过实例,介绍如何使用Excel 2007统计函数和数据分析工具进行数据统计分析与预测。包括描述性统计、假设检验、方差分析和回归分析等n教学目标:教学目标:掌握利用Excel函数和数据分析工具进行统计分析与预测的基本方法数理统计是一门对客观不确定现象进行数据搜集、整理和分析的科学其目的是了解客观情况,探索数据内在结构及现象之间的规律性 Excel
2、2007 能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括:n函数n数据分析工具第第1 1节节 数理统计的基本概念数理统计的基本概念第第1 1节节 数理统计的基本概念数理统计的基本概念按功能划分统计函数的种类包括按功能划分统计函数的种类包括:(1)频数分布处理(2)描述统计量计算(3)概率计算(4)参数估计(5)假设检验(6)卡方检验(7)相关、回归分析第第1 1节节 数理统计的基本概念数理统计的基本概念按功能划分统计函数的种类包括:(1)频数分布处理(2)描述统计量计算(3)概率计算(4)参数估计(5)假设检验(6)卡方检验(7)相关、回归分析第第1 1节节 数理统计的
3、基本概念数理统计的基本概念数据分析工具的种类:数据分析工具的种类:(1)统计绘图、制表(2)描述统计量计算(3)参数估计(4)假设检验(5)方差分析(6)相关、回归分析(7)时间序列分析(8)抽样(9)数据变换第第1 1节节 数理统计的基本概念数理统计的基本概念使用数据分析工具,需加载:使用数据分析工具,需加载:单击“Office按钮”,然后单击“Excel选项”单击“加载项”,然后在“管理”框中,选择“Excel 加载宏”单击“转到”在“可用加载宏”框中,选中“分析工具库”复选框,然后单击“确定”确定后“数据”选项卡中增加了“数据分析”子项在进行数据分析的时候,一般首先是从了解数据的基本特征
4、开始的,即先对数据进行描述性统计描述性统计分析(DescriptiveAnalysis),以发现其内在的规律,然后再选择进一步分析的方法。描述性统计描述性统计分析主要包括两类:一类是数据集中趋势分析,表示数量的中心位置;另一类是数据的离散程度分析,表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。第第2 2节节 描述性统计描述性统计数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等:作用:作用:指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;作为样本或资料的代表数与其它资料进行比较2.1 2.1 数据集中趋势分析数据集中
5、趋势分析n平均数 算术平均数(average)调和平均数(harmean)几何平均数(geomean)2.1 2.1 数据集中趋势分析数据集中趋势分析几何平均可用于平均比率的计算,这里变化比率是在相等长度的时间区间内给出的。如果样本观测值包含某种倒数,则可用调和平均,特别地,调和平均可用于以不同的速度通过各路段,求总的平均速度;或在各种条件下,求不同密度的流体的平均密度的计算。调和平均数调和平均数某人从C到B的平均速度为30km/h,沿同一路线返回时平均速度为60km/h,求整个往返行程的平均速度为多少?用Excel调和平均数求解:“=HARMEAN(30,60)”40 即40km/h。2.1
6、 2.1 数据集中趋势分析数据集中趋势分析 几何平均数几何平均数一雇员在连续三年内的年薪增长率分别为6%、10%和12%,这里增加的百分数是在上一年的薪金基础上计算的,求其三年内的年薪平均增长率?用Excel几何平均数求解:“=GEOMEAN(1.06,1.1,1.12)”1.0930 所以,薪水的年平均增长率为9.3%。2.1 2.1 数据集中趋势分析数据集中趋势分析n中位数(MEDIAN)2.1 数据集中趋势分析数据集中趋势分析 中位数是样本的50分位点,它受极端数值的干扰很小。如果加入一个很大的干扰值,中值数仅可能有很小的移动。几何均值和调和均值同算术平均值一样,对极端数值也较敏感。它们
7、主要用于数据为对数正态分布或偏斜程度较大时。下例显示上述几种统计量对极端数值的敏感程度A1:A7=111111100=geomean(A1:A7)1.9307=harmean(A1:A7)1.1647=average(A1:A7)15.1429=median(A1:A7)12.1 数据集中趋势分析数据集中趋势分析几何均值调和均值算术平均值中位数中位数数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有极差、方差、标准差、四分位数间距等 作用:作用:描述变量分布的差异程度 衡量和比较均值指标的代表性高低为抽选样本单位数提供依据2.2 数据离散程度分析数据离散程度分析 极差极差(max
8、-min):是描述数据分散程度最简单的度量,但如果数据中出现了极端数据,极端数据有可能就是最大值或最小值,因此极差对极端数据非常敏感。标准差标准差(stdev)和方差方差(var)是常用的分散程度度量。它们对于正态分布的样本是最优的。但它们对极端数据也是较敏感的。偏离数据整体的一个极端数据可能会使它们的值急剧增大。2.2 数据离散程度分析数据离散程度分析 四分位数四分位数(quartile),四分位数不受两端个别极大值或极小值的影响,基本能反映数据的离散程度。2.2 数据离散程度分析数据离散程度分析语法语法:quartile(array,quart)array:为需要求得四分位数值的数组区域q
9、uart:决定返回哪一个四分位值。下例显示上述几种统计量对极端数值的敏感程度A1:A7=111111100=max(A1:A7)-min(A1:A7)99=stdev(A1:A7)37.4185=quartile(A1:A7,1)17.2 7.2 描述性统计描述性统计极差极差标准差标准差四分位间距四分位间距2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540
10、 560 若让你就评价两人的检验技术的好坏,你如何评价?2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 两人计数的均数都是500,能说两人的检验技术相同吗?不能,因为甲的计数结果比较密集,而乙的分散,因此甲的检验精度显然比乙的高。可以用极差来衡量:甲计数的极差为520480=40,乙的为560-440=120。可见乙的计数较甲的波动大。2.2
11、数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 甲乙甲乙480440490460平均500平均500500500标准误差7.071标准误差22.8510540中位数500中位数500520560标准差15.81标准差50.99方差250方差2600第第3 3节节 假设检验假设检验 假设检验是统计推断的基本问题之一,主要是确定关于样本总体特征的判断是否合
12、理的过程。先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。n假设检验的基本思想和原理假设检验的基本思想和原理 n假设检验的步骤假设检验的步骤n如何利用如何利用Excel进行总体均值的检验进行总体均值的检验总体总体总体总体抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择!作出决策作出决策作出决策作出决策先对总体参数的具体数值作陈述,然后利用样本信息判断假设是否成立首先对几个必要的名词作简要的解释:零假
13、设零假设:即初始判断 H0:=0 (=50)备选假设备选假设(也称对立假设):H1:0(或(或0 或或50 或或50)假设检验是在H0 成立的前提下,从样本数据中寻找证据来拒绝H0,“接受”H1.如果证据不足,则只能不拒绝H0,暂且认为H0正确第第3节节 假设检验假设检验假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:m m =m m0 0H0:m m m m0 0H0:m m m m0 0备择假设备择假设H1:m m m m0 0H1:m m m m0 0提出假设提出假设(例题分析例题分析)提出假设提出假设(例题分析例题分析)首先对几个必要的名词作简要的解释:统计量统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 应用
限制150内