描述性统计.ppt
《描述性统计.ppt》由会员分享,可在线阅读,更多相关《描述性统计.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述性统计现在学习的是第1页,共48页第一节第一节 总体及其样本总体及其样本l 总体总体(population)(population)-具有共同性质的个体所组成的集团具有共同性质的个体所组成的集团.有限总体有限总体-总体所包含的个体数目有无穷多个总体所包含的个体数目有无穷多个.无限总体无限总体-由有限个个体构成的总体由有限个个体构成的总体.l 观察值观察值(observation)(observation)-每一个体的某一性状、特性的测定数值每一个体的某一性状、特性的测定数值.l 变数变数(variable)(variable)-观察值集合起来,称为总体的变数。变数又称为随观察值集合起来,称
2、为总体的变数。变数又称为随机变数机变数(random variable)。现在学习的是第2页,共48页l样本(sample)-从总体中抽取若干个个体的集合称为样本(sample)。l统计数(statistic)-测定样本中的各个体而得的样本特征数,如平均数等,称为统计数(statistic)。l随机样本(random sample)-从总体中随机抽取的样本称为随机样本(random sample)l样本容量(sample size)-样本中包含的个体数称为样本容量或样本含量(sample size)现在学习的是第3页,共48页第二节 次数分布一、试验资料的性质与分类二、次数分布表三、次数分布图
3、现在学习的是第4页,共48页一、试验资料的性质与分类(一)数量性状资料(二)质量性状资料现在学习的是第5页,共48页(一)数量性状资料 数量性状(quantitative trait)的度量有计数和量测两种方式,其所得变数不同。1.不连续性或间断性变数(discontinuous or discrete variable)指用计数方法获得的数据。2.连续性变数(continuous variable)指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。现在学习的是第6页,共48页(二)质量性状资料 质量性状(qualitative t
4、rait)指能观察而不能量测的状即属性性状,如颜色等。要从这类性状获得数量资料,可采用下列两种方法:统计次数法 于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。2.给分法 给予每类性状以相对数量的方法现在学习的是第7页,共48页二、次数分布表(一)间断性变数资料的整理(二)连续性变数资料的整理(三)属性变数资料的整理现在学习的是第8页,共48页(一)间断性变数资料的整理 现以某县村民小组的农户数为例,随机采取100个村民小组,计数每给户数,未加整理的资料列成表1.1。现在学习的是第9页,共48页表1.1 100个村民小组的户数18151719
5、161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917现在学习的是第10页,共48页户数(y)次数(f)1561615173218251917205总次数(n)100表1.1.1 100个村民小组户数的次数分布表 从表1.1.1中看到,一堆杂乱的原始资料表1.1,经初步
6、整理后,就可了解资料的大致情况,另外,经过整理的资料也便于进一步的分析。上述资料为间断性变数资料,每户在1520户的范围内变动,把所有观察值按收入多少加以归类,共分为6组,组与组间相差为户,称为组距。这样可得表1.1.1形式的次数分布表。现在学习的是第11页,共48页(二)连续性变数资料的整理兹以表1.2的100行水稻试验的产量为例,说明整理方法。177215197 97123159245119119131149152167104161214125175219118192176175 95136199116165214 9515883137 80138151187126196134206137
7、 98 97129143179174159165136108101141148168163176102194145173 75130149150161155111158131189 91142140154152163123205149155131209183 97119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表1.2 1
8、40行水稻产量(单位:克)现在学习的是第12页,共48页 具体步骤:1.数据排序(sort)首先对数据按从小到大排列(升序)或从大到小排列(降序)。2.求极差(range)所有数据中的最大观察值和最小观察值的差数,称为极差,亦即整个样本的变异幅度。从表3.4中查到最大观察值为254g,最小观察值为75g,极差为25475=179g。现在学习的是第13页,共48页 3.确定组数和组距(class interval)根据极差分为若干组,每组的距离相等,称为组距。在确定组数和组距时应考虑:(1)观察值个数的多少;(2)极差的大小;(3)便于计算;(4)能反映出资料的真实面貌等方面。样本大小(即样本内
9、包含观察值的个数的多少)与组数多少的关系可参照表1.3来确定。现在学习的是第14页,共48页表1.3样本容量与组数多少的关系样本内观察值的个数分组时的组数50 510100 81620010203001224500153010002040 组数确定后,还须确定组距。组距=极差/组数。以表1.2中140行水稻产量为例,样本内观察值的个数为140,查表1.3可分为816组,假定分为12组,则组距为179/12=14.9g,为分组方便起见,可以15g作为组距。现在学习的是第15页,共48页现在学习的是第16页,共48页 5.把原始资料的各个观察值按分组数列的各组组限归组 可按原始资料中各观察值的次序
10、,逐个把数值归于各组。待全部观察值归组后,即可求得各组的次数,制成一个次数分布表。例如表1.2中第一个观察值177应归于表3.6中第8组,组限为172.5187.5;第二个观察值149应归于第6组,组限为142.5157.5;。依次把140个观察值都进行归组,即可制成140行水稻产量的次数分布表(表1.3)。现在学习的是第17页,共48页表1.4 140行水稻的次数分布组 限中点值(y)次数(f)67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.5165251
11、72.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合计(n)140 注:前面提到分为12组,但由于第一组的中点值接近于最小观察值,故第一组的下限小于最小观察值,实际上差不多增加了1/2组;这样也使最后一组的中点值接近于最大值,又增加了1/2组,故实际的组数比原来确定的要多一个组,为13组。现在学习的是第18页,共48页(三)属性变数资料的整理 属性变数的资料,也可以用类似次数分布的方法来整理。在整理前,把资料按各种质量性状进行分类,分类数等于组数,然后根据各个体在质量属性上的
12、具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。例如,某专科学校教师分布,归于表1.5。表1.5 某专科学校教师分布属性分组(y)次数(f)助教96讲师37副教授31教授15合计(n)179现在学习的是第19页,共48页三、次数分布图(一)方柱形图(二)多边形图(三)条形图(四)饼图 现在学习的是第20页,共48页(一)方柱形图方柱形图(histogram)适用于表示连续性变数的次数分布。607590105 120 135 150 165 180 195 210 225 240 255 270510152025y(产量,克/行)现以表1.4的140行水稻产量的次数分布表为例加以说明
13、。即成方柱形次数分布图1.1。图1.1 140行水稻产量次数分布方柱形图现在学习的是第21页,共48页(二)多边形图 多边形图(polygon)也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。607590 105 120 135 150 165 180 195 210 225 240 255 270051015202530y(产量,克/行)仍以140行水稻产量次数分布为例,所成图形即为次数多边形图(图1.2)。图1.2 140行水稻产量次数分布多边形图现在学习的是第22页,共48页(三)条形图 条形图(bar)适用于间断性变数和属性变数资料,用以表示这些变数的次数分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 统计
限制150内