《《样本与采样》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《样本与采样》PPT课件.ppt(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 样本随随 机机 样样 本本v总体与个体总体与个体v样本样本v简单随机样本简单随机样本v样本值样本值总体与个体总体与个体v总体:总体:研究对象的某项数量指标值的全体。研究对象的某项数量指标值的全体。本质上,本质上,总体就是所研究的随机变量。总体就是所研究的随机变量。v个体:个体:总体中的每个元素为个体。总体中的每个元素为个体。即随机变量即随机变量 的每个可能的结果。的每个可能的结果。v 总体的容量:总体的容量:总体中所包含的个体的个数。总体中所包含的个体的个数。v有限总体与无限总体有限总体与无限总体例如:例如:“太湖湖底沉积物中汞的含量太湖湖底沉积物中汞的含量”这一随机这一随机试验总体是?试验
2、总体是?个体是?总体的容量是?个体是?总体的容量是?例如:例如:“在座各位同学的体重在座各位同学的体重”这一随机试验的总体是?这一随机试验的总体是?个体是?总体的容量是?个体是?总体的容量是?样本与简单随机样本样本与简单随机样本v样本:样本:从总体中抽出部分个体叫做总体的从总体中抽出部分个体叫做总体的 一个样本一个样本。v 简单随机样本:简单随机样本:在相同的条件下对总体在相同的条件下对总体X进进行行n次次重复的独立的重复的独立的观察,结果依次为观察,结果依次为X1、X2Xn;则则X1、X2Xn是相互独立且与总体是相互独立且与总体具有相同分布的随机变量具有相同分布的随机变量。定义:设定义:设
3、X 是具有分布函数是具有分布函数 F 的随机变量,若的随机变量,若是具有是具有同一分布函数同一分布函数 F 的的相互独立的随机变量相互独立的随机变量,则称,则称为从总体为从总体X中得到的中得到的容量为容量为n的简单随机样本的简单随机样本,简称为样本,其简称为样本,其观察值观察值简单随机样本简单随机样本样本与样本值有什么区别样本与样本值有什么区别样本是随机变量样本是随机变量,而,而样本值样本值是其可能取的某些是其可能取的某些实数实数。对于同一个样本对于同一个样本可以有不同的观察值由定义知:由定义知:若若 为为X的一个样本,则的一个样本,则 的联合分布函数为:的联合分布函数为:若设若设X的概率密度
4、为的概率密度为 f(x),则,则 的联合概的联合概率密度为:率密度为:若设若设X的分布律为的分布律为 ,则,则 的的联合分布率为:联合分布率为:3.3.总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 理论分布理论分布 样本样本 样本观察值样本观察值 统计是从已有的资料统计是从已有的资料样本观察值,去样本观察值,去推断推断总体总体的情况的情况总体分布。总体分布。样本是联系两者的桥梁。总体分布决定了样本取值样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体因而可以用样本
5、观察值去推断总体当获得的样本确实能代表总体时,统计才有意义当获得的样本确实能代表总体时,统计才有意义若研究的总体范畴很大,其中个体又受多种不同因素影若研究的总体范畴很大,其中个体又受多种不同因素影响,从中采集有代表性的样品不是轻而易举的!响,从中采集有代表性的样品不是轻而易举的!为确保样本的代表性,至少应注意以下两个方面:为确保样本的代表性,至少应注意以下两个方面:p 保证足够大的样本量保证足够大的样本量p 使用正确的采样方法使用正确的采样方法采采 样样 方方 法法p 随机采样随机采样p 系统采样系统采样p 系统系统-随机采样随机采样随随 机机 采采 样样随机采样:总体中每个个体被采集的机会完
6、全相同。例如,为随机采样:总体中每个个体被采集的机会完全相同。例如,为了研究某一污水处理设施的处理效率和运行稳定性,要在了研究某一污水处理设施的处理效率和运行稳定性,要在4 4小时小时内用随机采样方式采集内用随机采样方式采集1010个出水水样进行分析。个出水水样进行分析。1010个样品的采个样品的采集时间可用随机数表确定。集时间可用随机数表确定。随机取样有利于保证所取个体的随机性,但却容易得到在时间、随机取样有利于保证所取个体的随机性,但却容易得到在时间、空间上非均匀的样本,空间上非均匀的样本,特别是在小样本量的情况下。只适用于特别是在小样本量的情况下。只适用于那些受复杂因素影响,但个体之间不
7、存在自相关关系(即相邻那些受复杂因素影响,但个体之间不存在自相关关系(即相邻样点在性质上有相似性)的总体。样点在性质上有相似性)的总体。而环境样品,而环境样品,如土壤样品、河流沉积物样品都具有自相关性,如土壤样品、河流沉积物样品都具有自相关性,因此,随机采样不一定适合因此,随机采样不一定适合。系系 统统 采采 样样系统采样是按照某种事先确定的有规律的间隔从已排序总体中抽系统采样是按照某种事先确定的有规律的间隔从已排序总体中抽取个体。对大气、水体进行定期监测就是典型的系统取样取个体。对大气、水体进行定期监测就是典型的系统取样系统采样的优点是样品均匀分布,对于具有自相关特性的总体比系统采样的优点是
8、样品均匀分布,对于具有自相关特性的总体比较有利;较有利;但系统取样对总体中个体的排列方式十分敏感,若个体的排列方但系统取样对总体中个体的排列方式十分敏感,若个体的排列方式中包含某种规律性因素,而这种规律的变化周期恰与布点间隔式中包含某种规律性因素,而这种规律的变化周期恰与布点间隔重叠,会导致采集的样品没有代表性重叠,会导致采集的样品没有代表性系统系统-随机采样随机采样首先将排序后的总体划分为若干间隔,使间隔数等于样本量,首先将排序后的总体划分为若干间隔,使间隔数等于样本量,然后在每个间隔中随机抽取一个个体。然后在每个间隔中随机抽取一个个体。它既保证了样本的随机性,又不会受个体排列内在规律性的它
9、既保证了样本的随机性,又不会受个体排列内在规律性的干扰,但采样过程繁琐。干扰,但采样过程繁琐。多层次采样多层次采样一个复杂的总体往往可分为若干个性质有明显区别的一个复杂的总体往往可分为若干个性质有明显区别的子系统,或称层次。首先根据每个子系统的大小和样子系统,或称层次。首先根据每个子系统的大小和样本量总数确定每个子系统的采样个数,然后用上述三本量总数确定每个子系统的采样个数,然后用上述三种方法采集。种方法采集。某地区分布有三种类型土壤:栗钙土、草甸土、风砂土。某地区分布有三种类型土壤:栗钙土、草甸土、风砂土。为研究该地区表层土壤有机质含量,计划采集为研究该地区表层土壤有机质含量,计划采集100100个表个表土样。如何布点?土样。如何布点?由于三种类型的土壤有机质含量有很大差别,将整个地由于三种类型的土壤有机质含量有很大差别,将整个地区按土类分成三个部分,用系统方法分别在每个土类分区按土类分成三个部分,用系统方法分别在每个土类分布区布点,三部分的面积比为布区布点,三部分的面积比为65:15:20.65:15:20.用网格法将各用网格法将各土类分布区分成土类分布区分成6565、1515、2020个等面积的网格,在每个中个等面积的网格,在每个中心设置一个采样点。心设置一个采样点。
限制150内