数理统计第次.pptx
《数理统计第次.pptx》由会员分享,可在线阅读,更多相关《数理统计第次.pptx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 数理统计是一门对客观不确定现象进行数据搜集、数理统计是一门对客观不确定现象进行数据搜集、整理和分析的科学其目的是了解客观情况,探索数据内整理和分析的科学其目的是了解客观情况,探索数据内在结构及现象之间的规律性在结构及现象之间的规律性.是通过某事物的一部分(样本),来估计事物全部是通过某事物的一部分(样本),来估计事物全部(总体)的特征的,数理统计方法也就是以样本的特征对(总体)的特征的,数理统计方法也就是以样本的特征对未知总体做出合乎逻辑的推论,得到对事物客观本质的和未知总体做出合乎逻辑的推论,得到对事物客观本质的和规律性的认识。规律性的认识。Excel 2007 Excel 2007 能够
2、支持范围广泛的统计计算任务,提能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括函数和数据分析供工程和科学统计的基本能力。其中包括函数和数据分析工具。工具。第第1 1节节 数理统计的基本概念数理统计的基本概念第1页/共49页按功能划分统计函数的种类包括:按功能划分统计函数的种类包括:(1 1)频数分布处理)频数分布处理(2 2)描述统计量计算)描述统计量计算(3 3)概率计算)概率计算(4 4)参数估计)参数估计(5 5)假设检验)假设检验(6 6)卡方检验)卡方检验(7 7)相关、回归分析)相关、回归分析第第1 1节节 数理统计的基本概念数理统计的基本概念第2页/共49页
3、80个统计函数第第1 1节节 数理统计的基本概念数理统计的基本概念第3页/共49页Excel Excel 软件中提供了软件中提供了1515个数据分析工个数据分析工具:具:(1 1)统计绘图、制表)统计绘图、制表(2 2)描述统计量计算)描述统计量计算(3 3)参数估计)参数估计(4 4)假设检验)假设检验(5 5)方差分析)方差分析(6 6)相关、回归分析)相关、回归分析(7 7)时间序列分析)时间序列分析(8 8)抽样)抽样(9 9)数据变换)数据变换第第1 1节节 数理统计的基本概念数理统计的基本概念第4页/共49页第第1 1节节 数理统计的基本概念数理统计的基本概念第5页/共49页u首先
4、单击首先单击“Office Office 按钮按钮”,然后单击,然后单击“Excel Excel 选选项项”。u单击单击“加载项加载项”,然后在,然后在“管理管理”框中,选择框中,选择“Excel Excel 加载宏加载宏”。u单击单击“转到转到”。u在在“可用加载宏可用加载宏”框中,选中框中,选中“分析工具库分析工具库”复选框,复选框,然后单击然后单击“确定确定”。u确定后确定后“数据数据”选项卡中增加了选项卡中增加了“数据分析数据分析”子项。子项。第第1 1节节 数理统计的基本概念数理统计的基本概念第6页/共49页 在进行数据分析的时候,一般首先要对数据进行描描述性统计述性统计分析(Des
5、criptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述性统计描述性统计分析要对调查总体所有变量的有关数据做统计性描述统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计统计图形。预处理预处理、提前准备提前准备第第2 2节节 描述性统计描述性统计第7页/共49页 数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数、众数、几何平均值、调和平均数等 作用:作用:指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;作为样本或资料的代表数与其它资料进行比较2.1 2.1 数据集中
6、趋势分析数据集中趋势分析第8页/共49页平均数 算术平均数(average)调和平均数(harmean)几何平均数(geomean)2.1 2.1 数据集中趋势分析数据集中趋势分析几何平均可用于平均比率的计算,这里变化比率是在相等长度的时间区间内给出的。如果样本观测值包含某种倒数,则可用调和平均,特别地,调和平均可用于以不同的速度通过各路段,求总的平均速度;或在各种条件下,求不同密度的流体的平均密度的计算。第9页/共49页 调和平均数调和平均数 某人从C到B的平均速度为30km/h,沿同一路线返回时平均速度为60km/h,求整个往返行程的平均速度为多少?用Excel调和平均数求解:“=HARM
7、EAN(30,60)”40 即40km/h。2.1 2.1 数据集中趋势分析数据集中趋势分析第10页/共49页 几何平均数几何平均数 一雇员在连续三年内的年薪增长率分别为6%、10%和12%,这里增加的百分数是在上一年的薪金基础上计算的,求其三年内的年薪平均增长率?用Excel几何平均数求解:“=GEOMEAN(1.06,1.1,1.12)”1.0930 所以,薪水的年平均增长率为9.3%。2.1 2.1 数据集中趋势分析数据集中趋势分析第11页/共49页中位数(MEDIAN)2.1 2.1 数据集中趋势分析数据集中趋势分析 中位数是样本的50分位点,它受极端数值的干扰很小。如果加入一个很大的
8、干扰值,中值数仅可能有很小的移动。几何均值和调和均值同算术平均值一样,对极端数值也较敏感。它们主要用于数据为对数正态分布或偏斜程度较大时。第12页/共49页 下例显示上述几种统计量对极端数值的敏感程度 A1:A7=1 1 1 1 1 1 100 =geomean(A1:A7)1.9307 =harmean(A1:A7)1.1647 =average(A1:A7)15.1429 =median(A1:A7)1 2.1 2.1 数据集中趋势分析数据集中趋势分析几何均值调和均值算术平均值中位数第13页/共49页集中趋势 数据类型 测度指标布形状 是否整理众数 分类变量 钟形分布 顺序变量 U形分布
9、是 数值型变量 J形分布中位数 顺序变量 数值型变量 钟形分布 是数值平均数 数值型 变量钟形分布 均可2.1 2.1 数据集中趋势分析数据集中趋势分析-小结小结第14页/共49页算术平均数、调和平均数、几何平均数不同的数值平均数计算方法,根本原因在于个体量与总量的不同对应关系总量=个体量:如一个班同学的总成绩是每个同学的成绩之和。总量=个体量:如“十一五”期问经济的总发展速度,就等于期间各年的经济发展速度连乘积。算术平均数和调和平均数是平均指标的两种表现形式,是由于我们所掌握的资料不同而采用的不同的计算方法。2.1 2.1 数据集中趋势分析数据集中趋势分析-小结小结第15页/共49页 数据的
10、离散程度数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有极差、方差、标准差、四分位数间距等 作用:作用:描述变量分布的差异程度 衡量和比较均值指标的代表性高低 为抽选样本单位数提供依据2.2 2.2 数据离散程度分析数据离散程度分析第16页/共49页 极差:极差:为样本最大与最小值之差,是描述数据分散程度最简单的度量,但如果数据中出现了极端数据,极端数据有可能就是最大值或最小值,因此极差对极端数据非常敏感。标准差标准差和方差方差是常用的分散程度度量。它们对于正态分布的样本是最优的。但它们对极端数据也是较敏感的。偏离数据整体的一个极端数据可能会使它们的值急剧增大。2.2 2.2
11、数据离散程度分析数据离散程度分析第17页/共49页样本方差 为了度量其变异程度,对含有n个观测数x1,x2,xn的样本,可以用样本方差反映其变异程度。样本方差的定义公式为:Excel函数公式:2.2 2.2 数据离散程度分析数据离散程度分析 VAR(x1,x2,)x1,x2,为对应于总体样本的1到255个参数第18页/共49页样本标准差方差的定义虽然能够反映变量变异程度,但由于离均差取了平方值,使得它与原始数据和单位都不相适应,需要将方差开方还原,方差的标准根值就是标准差。样本标准差的定义公式:Excel函数公式:2.2 2.2 数据离散程度分析数据离散程度分析=STDEV(x1,x2,),x
12、1,x2,为对应于总体样本的1到255个参数。第19页/共49页 下例显示上述几种统计量对极端数值的敏感程度 A1:A7=1 1 1 1 1 1 100 =max(A1:A7)-min(A1:A7)99 =stdev(A1:A7)37.4185 极差标准差2.2 2.2 数据离散程度分析数据离散程度分析第20页/共49页2.2 2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440
13、460 500 540 560 若让你就评价两人的检验技术的好坏,你如何评价?第21页/共49页2.2 2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 两人计数的均数都是500,能说两人的检验技术相同吗?不能,因为甲的计数结果比较密集,而乙的分散,因此甲的检验精度显然比乙的高。可以用极差来衡量:甲计数的极差为520480=40,乙的为560-4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计
限制150内