《空间数据质量抽样检验模型与标准.pdf》由会员分享,可在线阅读,更多相关《空间数据质量抽样检验模型与标准.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据质量抽样检验模型与标准研究童小华同济大学空间数据质量抽样检验模型与标准研究童小华同济大学主要内容一 抽样概述主要内容一 抽样概述1.1 什么是抽样1.2 怎样抽-抽样方法1.3 抽多少与判断准则-抽样方案1.4 抽样检验国家标准体系二 当前抽样理论应用于空间数据质量检验存在的问题二 当前抽样理论应用于空间数据质量检验存在的问题2.1 空间数据产品与传统工业产品的类型不同2.2 传统百分比抽样方案的缺陷性2.3 样本容量与批量之间缺乏科学的理论依据2.4 检验后处理方式的不同2.5 现有抽样方案表中方案转移的问题三 空间数据质量抽样检验模型与标准:以国土资源数据质量检验为例三 空间数据质
2、量抽样检验模型与标准:以国土资源数据质量检验为例3.1 二级抽样模型的提出3.2 国土资源连续批数据正常、加严和放宽检验抽样方案四 实例分析比较五 结论四 实例分析比较五 结论一 抽样概述1.1 什么是抽样(1)定义一 抽样概述1.1 什么是抽样(1)定义按预先确定的抽样方案,从批或过程中随机抽取样本,逐个检验样本,并对批或过程质量做出是否接收的判定,是介于不检验与百分比检验之间的一种检验方法。(2)目的(2)目的通过样本推断总体。根据样本集所提供的信息对批数据进行检查并作出是否接收判定的一种检查,其目的是以尽量少的样本量来尽量准确的判断批的质量。(3)原则(3)原则以尽量少的样本量来尽量准确
3、的判断批的质量。1.2 怎样抽-抽样方法(1)简单随机抽样1.2 怎样抽-抽样方法(1)简单随机抽样l从包含N 个单元的总体中抽取n 个单元,每个样本被抽中的概率相同。是最基本的抽样方法,其操作简单,但精度不高。(2)系统抽样(2)系统抽样l总体中的抽样单元按某种次序排列,随机抽取一个初始单元,后按事先确定的规则确定其它样本单元。只有初始单元是随机抽样的,其他样本单元随着初始单元的确定而确定,例如等距抽样。(3)分层抽样(3)分层抽样l将总体N个单元划分成L个互不重复的层,在每个层中独立地进行抽样,计算各层的估计值以及总体目标值。原则:层内单元的属性值相近,而层间差异尽可能大,抽样精度较高。在
4、实际中应用较广泛。(4)整群抽样(4)整群抽样l将总体中的每个抽样单元分成若干次级单元,仅对初级单元抽样,若某个初级单元被抽中,则调查这个单元中所有次级单元。群就是初级单元。整群抽样的精度比直接对总体中所有次级单元进行简单随机抽样低,一般通过多抽样弥补,在总费用相同地条件下获得更高地精度。1.3 抽多少与判断准则-抽样方案(1)抽样方案1.3 抽多少与判断准则-抽样方案(1)抽样方案l规定样本量n和有关接收准则的一个具体方案,是实施抽样检验的主要依据。l当批量较小时,样本容量n的确定依据专家经验。批量N 较大时,需要通过计算获取样本容量n。ln越大,抽样误差就越小,即抽样结果就越能反映总体的情
5、况,调查的精度就越高,但是所需费用也就越大。l因此,在确定抽样样本容量n时,应该在精度和费用两个因素中加以权衡,而在实际应用中,一般优先考虑精度。(2)接收概率L(p):(2)接收概率L(p):对一批产品进行抽样检验时,其检验结果可能被接收,也可能被拒绝。批量为N 的产品其不合格品数D N P,从N 件中任取n 件,其中恰好有d件不合格品的接收概率L(p),可分以下几种情况:当N,n 较小时,以超几何分布计算接受概率,则当N 增大,n/N 0.1 0 时,超几何分布可用二项分布近似,当n D时,则当N 很大,且n/N 0.1 0,p 0.1 0时,超几何分布可用泊松分布近似,其中n p。即00
6、()()()(;,)()DNDccdn dNddNL ph d n D N=0()()(1)n dcndddL Ppp=0()!dcdL Ped=1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案(3)过程平均质量上限(A Q L)1.3 抽多少与判断准则-抽样方案(3)过程平均质量上限(A Q L)A Q L 是当一个连续系列批被提交验收抽样时,可允许的最差过程平均质量水平。给出 A Q L 值,并不意味着生产方有权提供已知的不合格品。无论是抽样检验中或其他场合发现的不合格品都应该逐个剔除。当以不合格品百分数表示质量水平时,A Q L 值应
7、不超过1 0 不合格品,当以每百单位不合格数表示质量水平时,可使用的 A Q L 值最高可达1 0 0 0 个不合格数。几种常见计数抽样标准 计数标准型抽样检验几种常见计数抽样标准 计数标准型抽样检验包括计数标准型一次抽样方案和计数序贯抽样检验方案。标准型抽样方案的准则是:对于指定的合格质量p0 与极限质量p1,选择抽样方案使其具有预先指定的第一类错判概率与第二类错判概率。标准型抽样方案是基于同时控制两类错判概率的准则下建立的,一般不需要抽样的历史资料,因此,标准型抽样方案适用于孤立批产品的检验。1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案 挑选型抽样方案 挑选型抽样方
8、案即道奇罗米格抽样方案。所谓挑选型,是指在进行抽样检验时,如果一批产品判为合格,则要求将样本中的不合格替换成合格品;如果一批产品判为不合格,则要求进行百分之百的检验,把所有不合格品替换成合格品。其制定准则是:控制第二类错判概率,并使平均检验件数A I N 最少;或者控制检后平均不合格品率的上限A O Q L,并使平均检验件数A I N 最少。1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案 调整性抽样方案 调整性抽样方案在产品处于正常的情况下,采用一个正常抽样方案进行检验;当产品质量变坏时,采用一个加严抽样方案进行检验;当产品质量显著变好时,采用一个放宽抽样方案进行检验.其
9、制定准则是:控制第一类错判概率,并通过抽样方案严格度的调整,保证使用质量。美国军用标准I S O 2 8 5 9 和我国G B/T 2 8 2 8-1 9 8 7 和G B/T 2 8 2 8-1 9 8 8 都是基于此方案制定。1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案抽样方案比较准则抽样检验特性曲线(O C曲线):抽样方案比较准则抽样检验特性曲线(O C曲线):对于一个特定的抽样检验方案,可画出唯一一条批接收概率L(p)随批的质量不合格率 p 而变化的函数曲线,即抽样检验特性曲线(简称为O C 曲线)。O C 曲线是建立和选择抽样方案的一种依据,描述了抽样方案的辨
10、别率。根据技术条件或供货方合同,假定质量标准为p0,抽样方案的辨别率是指:对p p0的低质量产品以高概率拒收(保护使用方)的综合能力。抽样方案的辨别率(O R):抽样方案的辨别率(O R):抽样方案的辨别率是指对于高质量产品以低概率拒收(以保护生产方)和对于低质量产品以高概率拒收(以保护使用方)的综合能力。常用辨别率O R 定量地衡量某个抽样方案的辨别率:0.100.95pORp=1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案例如抽样方案(5 0,5),在p=0 3 0 范围内,按泊松公式计算接收概率,O C 曲线如下图所示:如上例中方案(5 0,5)对应的。如果方案A
11、的O R 比B 方案的O R 值小,则A 方案的辨别力高于B 方案的辨别力。1.3 抽多少与判断准则-抽样方案1.3 抽多少与判断准则-抽样方案1.4 抽样检验国家标准体系1.4 抽样检验国家标准体系我国颁布的抽样检验国家标准涉及的有产品质量监督抽样检验,生产方、使用方验收抽样检验,商品质量监督抽样检验等,基本形成了一套抽样检验标准体系。抽样导则:G B/T 1 3 3 9 3抽样基础抽样方法:G B/T1 0 1 1 1计数:G B/T2 8 2 8,G B/T 1 3 2 6 3,G B/T 1 3 2 6 4,G B/T1 3 5 4 6连续批计量:G B/T6 3 7 8,G B/T
12、1 6 3 0 7大总体:G B/T 1 4 4 3 7计件左点小总体:G B/T 1 5 4 8 2单点型计点:G B/T1 4 1 6 2计数右点:G B/T2 8 2 9,G B抽样检验 分立个体 稳定批 孤立批 /T1 5 2 3 9大批:G B/T 1 3 2 6 2,G B/T 1 3 5 4 6两点型小批:G B/T 1 2 6 4单点型:G B/T 1 4 9 0 0计量两点型:G B/T8 0 5 3,G B/T8 0 5 4,G B/T 1 6 3 0 7,G B/T8 5 0 1流动批:G B/T8 0 5 2 粒度均匀:G B/T 1 3 7 3 2散料粒度不均二 当前
13、抽样理论应用于空间数据质量检验存在的问题2.1 空间数据与传统工业产品的区别二 当前抽样理论应用于空间数据质量检验存在的问题2.1 空间数据与传统工业产品的区别传统工业产品区别于空间数据产品的最大特点是“样本独立”。空间数据的特点:v数据具有多类、多源、多维、多尺度等特征。v信息内容复杂并有相关性,数据量大、数据类型和表达方式多样。v每个数据集都具有多个质量特性,每个质量特性可具有不同的质量范围和不同级别的缺陷,质量检查的工作量很大。2.2 传统的百分比抽样方案的缺陷2.2 传统的百分比抽样方案的缺陷目前大多空间数据产品使用百分比抽样方案,百分比抽样检验是指按批量确定比例抽样,即n/N=常数(用百分比表示,如1 0%),而且规定样本中不允许存在不合格品,即规定c=0,只要样本中出现不合格品,就判该批不合格,予以拒收。如图所示其存在“大批量过严,小批量过宽”的缺点。00.20.40.60.810481 21 62 0pL(p)1 0 0 0,1 0 0,0 2 0 0,2 0,0 1 0 0,1 0,0 5 0,5,0
限制150内