离散程度正态分布优秀课件.ppt
《离散程度正态分布优秀课件.ppt》由会员分享,可在线阅读,更多相关《离散程度正态分布优秀课件.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、离散程度正态分布第1页,本讲稿共75页对以下三组数据特征进行分析对以下三组数据特征进行分析甲组甲组 26 28 30 32 34乙组乙组 24 27 30 33 36丙组丙组 26 29 30 31 34第2页,本讲稿共75页定量描述离散趋势的指标,称为变异指标。反映一组同质的计量资料观察值之间变异程度。指标 按间距计算:全距和四分位间距 按平均差距计算:离均差平方和、方差、标准差、变异系数第3页,本讲稿共75页一、全距(range)优点:简便;计量单位与原变量计量单位相同 缺点:只利用了两个极端值 没有涉及数据的集中位置的信息 不稳定,对离群值敏感 n大,R也会大用途:一般用于描述单峰对称分
2、布小样本资料的离散程度或用于初步了解资料的变异程度第4页,本讲稿共75页二、四分位数间距分位数介于最大值和最小值之间的一个数值,它使得变量的一部分观察值小于或等于它,另一部分观察值大于或等于它。P100(max)P75P50(中位数中位数)P25P0(min)第5页,本讲稿共75页百分位数是一个位置指标,用Xp%表示。对样本来说,它表示按照升序排列的数列中,其左侧(即小于Xp%侧)的观察个数在整个样本中所占的百分比为p%,其右侧(即大于Xp%侧)的观察个数在整个样本中所占的百分比为(100-p)%。第6页,本讲稿共75页百分位数计算L为第x百分位数所在组的下限i为第x百分位数所在组的组距fp为
3、第x百分位数所在组的频数 为第x百分位数所在组的前一段的累积频数累积频率刚好大于x%的组即为第x百分位数所在的组第7页,本讲稿共75页 组段组段 (1)频数,频数,f(3)累计频数累计频数S Sf(4)累计百分率累计百分率0.5331.9 0.69127.5 0.7122415.0 0.8133723.1 0.9175433.8 1.0187245.0 1.1209257.5 1.21811068.8 1.31712779.4 1.41314087.5 1.5914993.1 1.6815798.1 1.71.8 合合计计3160100.0 160P250.9+0.1x(160 x25%37)
4、/170.92P751.3+0.1x(160 x75%110)/171.36第8页,本讲稿共75页四分位数间距(inter-quartile range)将特殊的3个分位数X25%,X50%,X75%统称为四分位数,并且分别称为第一四分位数,第二四分位数和第三四分位数,记为Q1,Q2和Q3.Q3与Q1的差值为四分位间距。QQ3 Q1=X75%-X25%第9页,本讲稿共75页四四分分位位数数间间距距常常用用于于描描述述偏偏态态分分布布资资料料,两两端端无无确确切切值值或分布不明确资料的离散程度或分布不明确资料的离散程度四四分分位位数数间间距距较较全全距距稳稳定定,常常与与中中位位数数一一起起,描
5、描述述偏偏态态分分布资料的特征。布资料的特征。计计量量单单位位与与原原变变量量的的计计量量单单位位相相同同,且且它它对对离离群群值值的的敏敏感远远低于全距,受样本量的影响较小。感远远低于全距,受样本量的影响较小。缺点是仅使用了原变量的部分信息。缺点是仅使用了原变量的部分信息。第10页,本讲稿共75页三、离均差平方和平均偏差:为了利用每一个观察值的信息,一个自然的设想是计算各观察值偏离平均数的平均差距,为了避免正负抵消,可将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差。第11页,本讲稿共75页离均差平方和(sum of square,ss)第12页,本讲稿共75页四、方差(mean
6、 of square,MS)总体方差样本方差S2第13页,本讲稿共75页样本均数代替总体均数,导致离均差缩小;英国统计学家Gosset W-S 提出自由度,以n-1代替n。n-1又称作自由度(degrees of freedom),指随机变量可以“自由”变动的个数。n-限制条件的数目第14页,本讲稿共75页五、标准差(standard of deviation,SD)总体标准差样本标准差S第15页,本讲稿共75页第16页,本讲稿共75页 组段组段 (1)频数,频数,f(3)组中值,组中值,X(4)fX(5)=(3)(4)fX2(5)=(3)(4)20.530.551.650.91 0.690.
7、655.853.80 0.7120.759.006.75 0.8130.8511.059.39 0.9170.9516.1515.34 1.0181.0518.9019.85 1.1201.1523.0026.45 1.2181.2522.5028.13 1.3171.3522.9530.98 1.4131.4518.8527.33 1.591.5513.9521.62 1.681.6513.2021.78 1.71.8 合合计计31.755.259.19 160182.30221.52 第17页,本讲稿共75页方差(221.52182.302/160)/(160-1)0.0869标准差0.2
8、9第18页,本讲稿共75页标准差的基本内容是“离均差”,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。第19页,本讲稿共75页 R SS MS S甲组甲组 8 40 10.0 3.16乙组乙组 12 90 22.5 4.74丙组丙组 8 34 8.5 2.92第20页,本讲稿共75页六、变异系数(coefficient of variation)亦称离散系数,是标准差s与均数之比,即:第21页,本讲稿共75页适用范围观察指标单位不同,如身高、体重 不同单位资料均数相差悬殊第22页,本讲稿共75页例:某地20岁男子100人,身高均数为166.06cm,标准
9、差为4.95cm;体重均数为53.7kg,标准差为4.96kg,试比较身高和体重的变异。身高体重 第23页,本讲稿共75页没有单位反映标准差占均数的百分比或标准差是均数的几倍可用来比较度量衡单位不同的资料的变异度 不受平均水平的影响反映的是以均数为基数的相对变异的大小比较均数相差悬殊的资料的变异度 变异系数的特点及相应的用途第24页,本讲稿共75页绝对变异受平均水平的影响相对变异排除了平均水平的影响第25页,本讲稿共75页平均数与变异度的关系平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征 变异度越小,平均数对各变量值的代表性越好 变异度越大,平均数对各变量值的代表
10、性越差第26页,本讲稿共75页通常,平均数与变异指标一起描述资料的分布特征。用均数和标准差描述正态分布资料的特征;用中位数和四分位数间距描述偏态分布资料的特征。第27页,本讲稿共75页变异指标小结变异指标小结1极差较粗,适合于任何分布2标准差与均数的单位相同,最常用,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征,常配套使用如 正态分布:均数、标准差;偏态分布:中位数、四分位间距第28页,本讲稿共75页1.变异系数主要用于A比较不同计量指标的变异程度 B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽
11、样误差的大小2.对于近似正态分布的资料,描述其变异程度应选用的指标是A.变异系数 B.离均差平方和 C.极差 D.四分位数间距 E.标准差3已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A全距 B.标准差 C.变异系数 D方差 E.四分位数间距第29页,本讲稿共75页第五章第四节 正态分布一、正态分布的概念和特征二、正态分布的应用第30页,本讲稿共75页一、正态分布概念和特征一种连续型随机变量常见而重要的分布 首先由德国数学家德.莫阿弗尔于1733年提出 德国数学家高斯在研究测量误差时也建立了正态分布,并对正态分布的性质作了进一步的研究,因此正态分
12、布也叫高斯分布。第31页,本讲稿共75页正态分布的图形某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.05时,图2.1 140名正常男子红细胞计数的直方图 第32页,本讲稿共75页如果将观察人数逐渐增多,组距也不断缩小,图中直条将逐渐变窄,整个图形将逐渐接近于一条光滑的曲线,即接近于近似正态分布曲线。第33页,本讲稿共75页第34页,本讲稿共75页连续型随机变量及其概率分布随机变量X取各种值的概率的规律称为概率分布规律,简称分布,是研究随机事物的工具和统计分析的理论基础在某一区间内随机变量取值的概率可通过计算积分获得,被积函数则称为连续型随机变量的密度函数如果X为连续型随机变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 离散 程度 正态分布 优秀 课件
限制150内