统计基础培训课件.ppt
《统计基础培训课件.ppt》由会员分享,可在线阅读,更多相关《统计基础培训课件.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 1 统计基础知识统计基础知识 2 统计图和统计表统计图和统计表 3 excel在统计分析中的应用在统计分析中的应用主要内容主要内容1 1 统计基础知识统计基础知识1.1 1.1 统计描述的意义统计描述的意义1.2 1.2 频数表频数表1.3 1.3 集中趋势的描述集中趋势的描述1.4 1.4 离散趋势的描述离散趋势的描述1.5 1.5 抽样误差抽样误差1.6 1.6 正态分布正态分布1.1 1.1 统计描述的意义统计描述的意义 社会活动看似杂乱无章,对个体来说有很多不确定性,但总社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。体上都是服从一些统计规律的。 科研
2、工作有很多数据,统计描述就是对这些数据进行加工和科研工作有很多数据,统计描述就是对这些数据进行加工和提炼,找出规律、预测未知。提炼,找出规律、预测未知。 统计描述是最简洁有力的语言。统计描述是最简洁有力的语言。 统计描述通过描述性指标和统计图(表)反映资料的分布规统计描述通过描述性指标和统计图(表)反映资料的分布规律及其数量特征。律及其数量特征。1.2 1.2 频数表频数表Table 1.Table 1.某单位某单位19991999年的年的101101名职工的血清总胆固醇含量。名职工的血清总胆固醇含量。频数表:将变量值分为不同数量的组段,清点各组段的例数。频数表:将变量值分为不同数量的组段,清
3、点各组段的例数。意义:概括了解变量值在各组段的意义:概括了解变量值在各组段的分布和规律分布和规律。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.274.523.194
4、.593.753.984.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.261.1.确定全距确定全距: R= R=最大值最大值最小值最小值=5.71-2.35=3.36=5.71-2.35=3.362.2.定组数(定组数(8-138-13组)和组距组)和组距: 各组段的起点和终点分别称为上限和下限,某组段的组中值为该组段的各组段的起点和终点分别称为上限和下限,某组段的组中值为该组段的(
5、上限(上限+ +下限)下限)/2/2。相邻两组段的下限之差为组距。常用全距的。相邻两组段的下限之差为组距。常用全距的1/101/10取取整做组距。整做组距。 3.36/10=0.3360.3 3.36/10=0.3360.33.3.写出组段的下限:写出组段的下限: 第第1 1组段值小于或等于最小变量值,并以整数为好。如组段值小于或等于最小变量值,并以整数为好。如2.32.34. 4. 列出频数表:列出频数表: 变量(变量(x x)归为下限)归为下限xx上限。上限。计量资料频数表的编制步骤计量资料频数表的编制步骤Table 1.Table 1. 100100名职工血清总胆固醇频数表名职工血清总胆
6、固醇频数表组段组段频数频数f ff f(% %)2.3-2.3-1 11.01.02.6-2.6-3 33.03.02.9-2.9-6 66.06.03.2-3.2-8 88.08.03.5-3.5-171717.017.03.8-3.8-202020.020.04.1-4.1-171717.017.04.4-4.4-121212.012.04.7-4.7-8 88.08.05.0-5.0-5 55.05.05.3-5.3-2 22.02.05.3-5.65.3-5.61 11.01.0合计合计100100100.0100.0频数分布图频数分布图直方图直方图05101520252.3 2.6
7、2.9 3.2 3.5 3.8 4.1 4.4 4.7 5.0 5.3 5.6 5.9正态分布正态分布: :频数分布的集中位置在中间,左右两侧大致对称。频数分布的集中位置在中间,左右两侧大致对称。051015201224364860728496108潜伏期/h病例数正偏态分布正偏态分布: :频数分布不对称,集中位置偏向数值小的一侧。频数分布不对称,集中位置偏向数值小的一侧。101例正常人的血清肌红蛋白含量051015202505101520 2530354045频数负偏态分布负偏态分布: :集中位置偏向数值大的一侧。集中位置偏向数值大的一侧。1.3 1.3 集中趋势的描述集中趋势的描述 描述对
8、象:描述同质观察值描述对象:描述同质观察值平均水平平均水平或或中心位置。中心位置。1.3.1 1.3.1 均数(均数(averageaverage,meanmean):):12nXxxxXnnffXX基本公式:基本公式:加权法公式:加权法公式:应用范围:适用于正态或类似正态分布的数值变量资料。应用范围:适用于正态或类似正态分布的数值变量资料。1.3.2 1.3.2 几何均数几何均数(G)(G)应用范围:适用于数值呈应用范围:适用于数值呈倍数变化倍数变化或数据经过对数变换后或数据经过对数变换后 呈呈正态分布正态分布的数值变量资料。的数值变量资料。基本公式:基本公式:1lglg ()iXGn1lg
9、lg ()ifXGf加权法公式:加权法公式:n1G=,nXX1.3.3 1.3.3 中位数中位数定义:将一组变量值由小到大依次排列,居以中间位定义:将一组变量值由小到大依次排列,居以中间位 次的观察值即为中位数次的观察值即为中位数使用范围:适用于描述使用范围:适用于描述偏态分布偏态分布资料的平均水平资料的平均水平。1(1)2nMX(1)221()2nnMXXn n为偶数为偶数n n为奇数为奇数1.3.4 1.3.4 百分位数(百分位数(percentilepercentile)定义:将一组变量值由小到大依次排列,定义:将一组变量值由小到大依次排列,n nX%X%为第为第x x百分位数的秩百分位
10、数的秩次,其对应的变量值(次,其对应的变量值(x x)为第)为第x x百分位数,记为百分位数,记为PxPx。 中位数即为中位数即为P P5050。第第p p百分位数的计算:百分位数的计算: 第第1 1步:以递增顺序排列原始数据(即从小到大排列)。步:以递增顺序排列原始数据(即从小到大排列)。第第2 2步:计算指数步:计算指数i=ni=np%p%第第3 3步:步:l l)若)若i i不是整数,将不是整数,将i i向上取整。向上取整。大于大于i i的毗邻整数即为第的毗邻整数即为第p p百分位数的位置。百分位数的位置。2) 2) 若若i i是整数,则第是整数,则第p p百分位数是第百分位数是第i i
11、项项与第(与第(i il l)项数据的平均值。)项数据的平均值。 1.4 1.4 离散程度的描述离散程度的描述1.4.1 1.4.1 全距(全距( Range Range,R R):):定义:定义: R= R=最大值最大值 最小值最小值意义:意义: R R值越大,表示该组数据的变异越大。值越大,表示该组数据的变异越大。缺点:缺点: 数据利用不全,部分信息损失,在例数少时结果不稳定。数据利用不全,部分信息损失,在例数少时结果不稳定。 仅考虑最大值与最小值之差,不能反映组内其他观察值的仅考虑最大值与最小值之差,不能反映组内其他观察值的 变异度。变异度。描述对象:反映一组同质观察值的变异度描述对象:
12、反映一组同质观察值的变异度1.4.2 1.4.2 四分位数间距四分位数间距(quartile, (quartile, 简记为简记为Q)Q):定义:为上四分位数定义:为上四分位数Q QU U与下四分位数与下四分位数Q QL L之差。之差。Q=PQ=P75%75%-P-P25%25%意义:作为变异指标比极差稳定。常用于表示偏态分布资料的变异。意义:作为变异指标比极差稳定。常用于表示偏态分布资料的变异。 Q Q越大,变异度越大;反之,越大,变异度越大;反之,Q Q越小,变异度越小。越小,变异度越小。1.4.3 1.4.3 方差和标准差方差和标准差(standard deviation, STDEV)
13、(standard deviation, STDEV)2()XN22()XN总体方差总体方差(2)(2)总体标准差总体标准差()()2()1XXSn样本标准差样本标准差(s)(s)1.4.41.4.4 变异系数变异系数(CV)(CV)应用:应用:2.2.比较组单位相同比较组单位相同, ,但均数相差悬殊的组间变异程度但均数相差悬殊的组间变异程度. . CV CV越大,表示数据变异越大。越大,表示数据变异越大。 常用于衡量方法、仪器的精密度。常用于衡量方法、仪器的精密度。%100XSCV公式:公式:1.1.组间单位不同时变异程度的比较。组间单位不同时变异程度的比较。意义:意义:1.5 1.5 抽样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 基础 培训 课件
限制150内