定量变量的统计描述讲稿.ppt





《定量变量的统计描述讲稿.ppt》由会员分享,可在线阅读,更多相关《定量变量的统计描述讲稿.ppt(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于定量变量的统计描述第一页,讲稿共一百页哦定量变量的定量变量的统计描述统计描述统计图表统计图表统计指标:统计指标:集中趋势指标集中趋势指标离散趋势指标离散趋势指标利用统计表对数据进行概括,用统计图对分布形态及分布利用统计表对数据进行概括,用统计图对分布形态及分布间的关系做直观的表达,用于描述定量资料的统计指标的意义间的关系做直观的表达,用于描述定量资料的统计指标的意义与计算。与计算。第二页,讲稿共一百页哦一、一、频率分布表与频率分布图频率分布表与频率分布图(Frequency/Frequencydistribution)二、二、描述平均水平统计指标描述平均水平统计指标(Description
2、ofcentraltendency)【教学内容】三、三、描述变异程度统计指标描述变异程度统计指标(Descriptionoftendencyofdispersion)第三页,讲稿共一百页哦四、四、描述分布形态统计指标描述分布形态统计指标(Descriptionofdistribution)五、五、统计表与统计图统计表与统计图(statisticaltable,statisticchart)【教学内容】第四页,讲稿共一百页哦变变 量量统计学统计学 卫生统计学卫生统计学 研研究究内内容容定性变量定性变量定量变量定量变量统计描述统计描述统计推断统计推断随机性现象随机性现象概率论概率论数理统计数理统计
3、第五页,讲稿共一百页哦统计描述统计描述:从资料中获取信息最基本的方法从资料中获取信息最基本的方法 把握资料基本的特征把握资料基本的特征 为统计分析打下基础为统计分析打下基础第六页,讲稿共一百页哦表2-2120名名18-35岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(umol/L)7.427.428.658.6523.0223.0221.6121.6121.3121.3121.4621.469.979.9722.7322.7314.9414.9420.1820.1821.6221.6223.0723.0720.3820.388.48.417.3217.3229.6429.6419.691
4、9.6921.6921.6923.923.917.4517.4519.0819.0820.5220.5224.1424.1423.7723.7718.3618.3623.0423.0424.2224.2224.1324.1321.5321.5311.0911.0918.8918.8918.2618.2623.2923.2917.6717.6715.3815.3818.6118.6114.2714.2717.417.422.5522.5517.5517.5516.116.117.9817.9820.1320.13212114.5614.5619.8919.8919.8219.8217.4817.
5、4814.8914.8918.3718.3719.519.517.0817.0818.1218.1226.0226.0211.3411.3413.8113.8110.2510.2515.9415.9415.8315.8318.5418.5424.5224.5219.2619.2626.1326.1316.9916.9918.8918.8918.4618.4620.8720.8717.5117.5113.1213.1211.7511.7517.417.421.3621.3617.1417.1413.7713.7712.512.520.420.420.320.319.3819.3823.1123.
6、1112.6712.6723.0223.0224.3624.3625.6125.6119.5319.5314.7714.7714.3714.3724.7524.7512.7312.7317.2517.2519.0919.0916.7916.7917.1917.1919.3219.3219.5919.5919.1219.1215.3115.3121.7521.7519.4719.4715.5115.5110.8610.8627.8127.8121.6521.6516.3216.3220.7520.7522.1122.1113.1713.1717.5517.5519.2619.2612.6512.
7、6518.4818.4819.8319.8323.1223.1219.2219.2219.2219.2216.7216.7227.927.911.7411.7424.6624.6614.1814.1816.5216.52第七页,讲稿共一百页哦目的:描述该组目的:描述该组18-35岁健康男性居民血清铁含量岁健康男性居民血清铁含量的的分布规律。分布规律。问题问题1.该组该组居民血清铁含量居民血清铁含量平均值多少?平均值多少?问题问题4.用表用表/图表示图表示血清铁血清铁分布分布?问题问题2.血清铁含量血清铁含量范围?最高多少?最范围?最高多少?最低多少?多少?问题问题3.血清铁含量血清铁含量主要集
8、中在哪个范围主要集中在哪个范围?集中趋势集中趋势频数表频数表频数分布图频数分布图离散趋势离散趋势第八页,讲稿共一百页哦第一节第一节频数与频数分布频数与频数分布频数频数(frequency):对一个随机变量做重复观察,其中:对一个随机变量做重复观察,其中某变量值出现的次数。某变量值出现的次数。频数分布表频数分布表(frequencydistributiontable):将各变量:将各变量值及其相应的频数列成表格的形式。值及其相应的频数列成表格的形式。例例2-2抽样调查某地抽样调查某地120名名18岁岁35岁健康男性居民血岁健康男性居民血清铁含量清铁含量(mol/L),试编制频数分布表。试编制频数
9、分布表。频数表的编制:频数表的编制:一、连续型定量变量的频数分布一、连续型定量变量的频数分布第十页,讲稿共一百页哦(二)连续型变量频数表的编制方法:(二)连续型变量频数表的编制方法:求全距列表划记步骤:步骤:写组段定组距第十一页,讲稿共一百页哦 求全距求全距(Range,(Range,简记简记R)R):是一组资料中是一组资料中最大值(最大值(XmaxXmax)与最小值()与最小值(XminXmin)之差,亦称极差)之差,亦称极差。全距(全距(R)=Xmax-Xmin=29.647.42=22.22(umol/L)7.427.428.658.6523.0223.0221.6121.6121.31
10、21.3121.4621.469.979.9722.7322.7314.9414.9420.1820.1821.6221.6223.0723.0720.3820.388.48.417.3217.3229.6429.6419.6919.6921.6921.6923.923.917.4517.4519.0819.0820.5220.5224.1424.1423.7723.7718.3618.3623.0423.0424.2224.2224.1324.1321.5321.5311.0911.0918.8918.8918.2618.2623.2923.2917.6717.6715.3815.3818.
11、6118.6114.2714.2717.417.422.5522.5517.5517.5516.116.117.9817.9820.1320.13212114.5614.5619.8919.8919.8219.8217.4817.4814.8914.8918.3718.3719.519.517.0817.0818.1218.1226.0226.0211.3411.3413.8113.8110.2510.2515.9415.9415.8315.8318.5418.5424.5224.5219.2619.2626.1326.1316.9916.9918.8918.8918.4618.4620.87
12、20.8717.5117.5113.1213.1211.7511.7517.417.421.3621.3617.1417.1413.7713.7712.512.520.420.420.320.319.3819.3823.1123.1112.6712.6723.0223.0224.3624.3625.6125.6119.5319.5314.7714.7714.3714.3724.7524.7512.7312.7317.2517.2519.0919.0916.7916.7917.1917.1919.3219.3219.5919.5919.1219.1215.3115.3121.7521.7519.
13、4719.4715.5115.5110.8610.8627.8127.8121.6521.6516.3216.3220.7520.7522.1122.1113.1713.1717.5517.5519.2619.2612.6512.6518.4818.4819.8319.8323.1223.1219.2219.2219.2219.2216.7216.7227.927.911.7411.7424.6624.6614.1814.1816.5216.52第十二页,讲稿共一百页哦2.定组距定组距:将全距分为若干段,称为:将全距分为若干段,称为组段组段。组与组之间的距离,称为组与组之间的距离,称为组距组距
14、;用小写;用小写i表示。表示。原则原则:(1)“组段组段”数一般为数一般为8-15个;个;(2)“组距组距”一般为一般为R/10取整;取整;(3)为计算方便根据组距采取取整数方法为计算方便根据组距采取取整数方法本例题:本例题:组距(组距(i)=全距全距全距全距/预分组段预分组段预分组段预分组段=22.22/10=2.222/10=2.222(umol/L)第十三页,讲稿共一百页哦3.写组段写组段:即将全距分为若干段的过程:即将全距分为若干段的过程。原则原则:(1)第一组段要包括)第一组段要包括Xmin,最末组段包括,最末组段包括Xmax;(2)每组段均用下限值加每组段均用下限值加“”表示,最终
15、组段同时注表示,最终组段同时注明上下限。明上下限。注注意意:各各组组段段不不能能重重叠叠,每每一一组组段段均均为为半半开开半半闭闭区区间间。4.列表划记:列表划记:根据预定的组段和根据预定的组段和组距,用组距,用划记的方法整理原始资料。划记的方法整理原始资料。第十四页,讲稿共一百页哦表表2-3120名名18-35岁健康男性居民血清铁含量的频数分布表岁健康男性居民血清铁含量的频数分布表 6 8 10 12 14 16 18 20 22 24 26 2830 合计合计一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841组段划记频数120第十五页,讲稿共一百
16、页哦表2.2120名名18-35岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(umol/L)频数表)频数表组段组段频数频数频率频率%累计频数累计频数累计频率累计频率%610.8310.83832.5043.331065.00108.331286.671815.00141210.003025.00162016.675041.67182722.507764.17201815.009579.17221210.0010789.172486.6711595.832643.3311999.17283010.83120100.00合计合计120100.0第十六页,讲稿共一百页哦特点:中间高、两侧逐渐下
17、降、左右基本对称的分布特点:中间高、两侧逐渐下降、左右基本对称的分布-直方图直方图(直条间连续直条间连续),用于表达连续型变量的频数分布。,用于表达连续型变量的频数分布。频数直方图频数直方图(frequencydistributionfigure):根据频数分布表,以变量值为横坐标,频数为纵坐标,绘制根据频数分布表,以变量值为横坐标,频数为纵坐标,绘制的直方图。的直方图。第十七页,讲稿共一百页哦 的频数是的频数是7,频率为频率为7.3%,进行,进行3次检查次检查 的频数是的频数是11,频率频率 为为 11.5%,进行,进行5次以上检查的次以上检查的 频数是频数是12,频率为,频率为12.5%。
18、进行进行0次检查的频数是次检查的频数是4,其频率为,其频率为4.2%,进行进行1次次 检查检查 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7二、离散型定量变量的频数分布二、离散型定量变量的频数分布例例2-1(P11)第十八页,讲稿共一百页哦离散型变量的频数分布表每离散型变量的频数分布表每一个组段就是一个固定的取一个组段就是一个固定的取值值第十九页,讲稿共一百页哦离散型变量的频数分布图离散型变量的频数分布图直条图直条图横坐标为产前检查次数;纵坐标为横坐标为产前检查次数;纵坐标为频率,即产前检查频率,即产前检查K次的妇次的妇女在被统计妇女中所占的比例女在被统计妇女中所
19、占的比例%。图中等宽矩形长条的高度与。图中等宽矩形长条的高度与相应检查次数的频率呈正比。相应检查次数的频率呈正比。第二十页,讲稿共一百页哦频率:各组的频数除以总例数频率:各组的频数除以总例数n所得的比值。频率描述所得的比值。频率描述了各组频数在全体中所占的比重,各组了各组频数在全体中所占的比重,各组频率之和等于频率之和等于100%。累计频数:本组段的频数与以前各组段的频数累计频数:本组段的频数与以前各组段的频数相加;相加;累计频率:每组段的累计频数除以总例数。累计频率:每组段的累计频数除以总例数。第二十一页,讲稿共一百页哦三、三、频数分布的两个特征频数分布的两个特征 集中趋势:血清铁含量向中央
20、部分集中,集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在即中等含量者居多,集中在18这个组段,这种现象为集中趋势。这个组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布离散趋势:从中央部分到两侧的频数分布逐渐减少,而且逐渐减少,而且血清铁含量血清铁含量的值参差不齐,的值参差不齐,最低的接近最低的接近6,最高的接近,最高的接近30,这种现象称为离散趋势。这种现象称为离散趋势。由由于于同同质质性性,所所有有实实测测值值趋趋向向同同一一数值的趋势称为集中趋势。数值的趋势称为集中趋势。离离散散趋趋势势或或变变异异程程度度是是指指观观察察值值之之间参差不齐的程度。间参差不齐的程
21、度。第二十二页,讲稿共一百页哦血清胆固醇组段血清胆固醇组段(1)划记划记(2)频数频数(3)2.30 2.60 2.90 3.20 3.50 3.80 4.10 4.40 4.70 5.00 5.30 5.60 一一 下下 正一正一 正下正下 正正正丅正正正丅 正正正正正正正正 正正正丅正正正丅 正正丅正正丅 正止正止 正正 丅丅 一一 1368172017129521表表2-2 2-2 某地某地101101名名正常成年女子血清总胆固醇正常成年女子血清总胆固醇的频数表的频数表合计合计140从中央部分到从中央部分到两侧的频数分两侧的频数分布逐渐减少、布逐渐减少、血清胆固醇的血清胆固醇的的值参差不
22、齐的值参差不齐离散趋势离散趋势血清胆固醇值向中央部分血清胆固醇值向中央部分集中,即中等含量者居多集中,即中等含量者居多集中趋势集中趋势第二十三页,讲稿共一百页哦频数分布频数分布四、频数分布的类型四、频数分布的类型对称分布型:指集中位置在正中,左右对称分布型:指集中位置在正中,左右两侧频数分布大体对称两侧频数分布大体对称。偏态分布型:指集中位置偏向一侧,频数偏态分布型:指集中位置偏向一侧,频数分布不对称。分布不对称。偏态分布偏态分布正偏态分布:集中位置偏向数值小的一侧。正偏态分布:集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一侧负偏态分布:集中位置偏向数值大的一侧。第二十四页,讲稿
23、共一百页哦第二十五页,讲稿共一百页哦第二十六页,讲稿共一百页哦第二十七页,讲稿共一百页哦(三)频数表的用途:(三)频数表的用途:1.1.揭示变量的分布特征揭示变量的分布特征图图3.1某市某市100名名8岁男童身高岁男童身高(cm)的频数分布的频数分布离散趋势(tendencyofdispersion)集中趋势与离散趋势结合能全面反映频数的分布特征集中趋势与离散趋势结合能全面反映频数的分布特征集中趋势(centraltendency)身高身高(cm)频频数数分布分布特征特征第二十八页,讲稿共一百页哦2.2.揭示变量的分布类型揭示变量的分布类型频数频数分布分布偏态偏态分布分布正正偏偏负负偏偏集中部
24、位在中部,两端集中部位在中部,两端渐少,左右两侧的基本渐少,左右两侧的基本对称,为对称,为对称(正态对称(正态)分布分布。对称对称分布分布集中部位偏于较小值一集中部位偏于较小值一侧侧(左侧左侧),较大值方向,较大值方向渐减少,为渐减少,为正偏态分正偏态分布布。集中部位偏于较大值集中部位偏于较大值一侧一侧(右侧右侧),较小值,较小值方向渐减少,为方向渐减少,为负负偏态偏态分布分布。第二十九页,讲稿共一百页哦4.便于进一步计算统计指标和统计分析便于进一步计算统计指标和统计分析3.便于发现某些离群值或极端值便于发现某些离群值或极端值。图图3.1某市某市101名名8岁男童身高岁男童身高(cm)的频数分
25、布的频数分布身高(cm)频数第三十页,讲稿共一百页哦一一.集集中中趋趋势势统统计计指指标标:反反映映总总体体内内部部的的同同质质。二二.离离散散度度统统计计指指标标:反反映映总总体体内内个个体体间间的的变变异异。三三.分分 布布 形形 态态 统统 计计 指指 标标:反反 映映 高高 峰峰 的的 形形 态态。第二节第二节描述平均水平的统计指标描述平均水平的统计指标第三十一页,讲稿共一百页哦平均数平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。均水平。常用的平均数有算术均数,几何均数和中位数。常用的平均数有算术均数,几何均数和中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定量 变量 统计 描述 讲稿

限制150内