数值变量的描述离散趋势课件.ppt
数值变量的描述离散趋势数值变量的描述离散趋势第1页,此课件共17页哦主要内容l频数分布频数分布l集中趋势的描述集中趋势的描述l离散趋势的描述离散趋势的描述l正态分布正态分布l医学参考值范围的制定医学参考值范围的制定第2页,此课件共17页哦 设有甲、乙、丙三名医生,分别对相同的设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数份血样进行红细胞计数(万(万/mm3),甲得出了),甲得出了560、540、500、460、440,乙得出了,乙得出了520、510、500、490、480,丙得出了,丙得出了510、505、500、495、490,见下图,见下图2,三名医生的,三名医生的计数结果得到的均数均为计数结果得到的均数均为500,5个数值之和均为个数值之和均为2500。离散趋势的描述离散趋势的描述 甲医生得出的甲医生得出的5 5个个观察值间的差异(离散观察值间的差异(离散程度)较大,而丙医生程度)较大,而丙医生得出的得出的5 5个观察值间个观察值间的差异(离散程度)的差异(离散程度)较小。较小。第3页,此课件共17页哦离散趋势的描述离散趋势的描述常用统计指标常用统计指标l极差极差 (Range)l四分位数间距四分位数间距(Quartile range)l方差方差(Variance)l标准差标准差(Standard deviation)l变异系数变异系数(Coefficient of Variation)第4页,此课件共17页哦 用用R R表示:即一组变量值最大值与最小值之差。表示:即一组变量值最大值与最小值之差。例例2-12-1数据数据(下页),有下页),有845727(/)R 次 分简单简单仅利用了两端点值,稳定性差。仅利用了两端点值,稳定性差。一、极差(Range)第5页,此课件共17页哦例例2-1 测得测得130名健康成年男子脉搏资料名健康成年男子脉搏资料(次次/分分)如下,试编制频数表和如下,试编制频数表和观察频数分布情况。观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876第6页,此课件共17页哦二、四分位数间距(quartile range)四分位数间距,用Q表示:Q=下四分位数:上四分位数:50P2575PP 25LQP75UQP25P100P0P75P例2-1数据P2565+3x(130 x25%19)/1565.90P7574+3x(130 x75%85)/1974.66第7页,此课件共17页哦三、方差与标准差 1.方差(方差(variance)也称均方差()也称均方差(mean square deviation),反映一组数据的平均离散水平),反映一组数据的平均离散水平。总体方差总体方差 样本方差样本方差 22()XN离均差平方和SS22()1XXSn第8页,此课件共17页哦2、总体标准差公式:样本标准差用 表示,其度量单位与均数一致,所以最常用。公式:2()XNS2()1XXSn离均差平方和SS三、方差与标准差第9页,此课件共17页哦 标准差的公式还可以写成:利用频数表计算标准差的公式为22()1XXnSn22()1fXfXfSf第10页,此课件共17页哦例2-11 对例2-1的前10个数据:75,76,72,69,66,72,57,68,71,72,用直接法计算标准差。48984727675,698727675,102222XXn248984698/105.41()101S次/分第11页,此课件共17页哦例2-12 利用表2-2中的数据和频数表法计算标准差。Nf ffXfXfXfX2 22671354.59311.0/1305.89()130 1S次/分第12页,此课件共17页哦标准差的意义和用途标准差的意义和用途 说明资料的离散趋势说明资料的离散趋势(或变异程度或变异程度),标准差的值越大,标准差的值越大,说明变异程度越大,均数的代表性越差,说明变异程度越大,均数的代表性越差;.;.。标准差与原始数据的单位一致,在科技论文报告中标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。离散趋势。用于计算变异系数用于计算变异系数 用于计算标准误用于计算标准误2.2.结合均值与正态分布的规律,估计参考值的范围。结合均值与正态分布的规律,估计参考值的范围。第13页,此课件共17页哦四、变异系数C VSX 1 0 0%变异系数(coefficient of variation,CV)常用于比较度量单位不同度量单位不同或均数相差悬殊均数相差悬殊的两组(或多组)资料的变异程度。第14页,此课件共17页哦例:某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?体重 2.26100%10.14%22.29CV 身高 4.71100%3.83%123.10CV 第15页,此课件共17页哦小小 结结极差极差 (Range)四分位数间距四分位数间距(Interquartile range)方差方差(Variance)标准差标准差(Standard deviation)变异系数变异系数(Coefficient of Variation)第16页,此课件共17页哦About interquartile range In descriptive statistics,the interquartile range(IQR),is a measure of statistical dispersion,being equal to the difference between the third and first quartiles.IQR=Q3 Q1The IQR is used to build box plots,simple graphical representations of a probability distribution.The median is the corresponding measure of central tendency.第17页,此课件共17页哦