2022年实数公理等价命题证明.docx





《2022年实数公理等价命题证明.docx》由会员分享,可在线阅读,更多相关《2022年实数公理等价命题证明.docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品学习资源第5章评估假设对假设的精度进行体会的评估是机器学习中的基本问题;本章介绍了用统计方法估量假设精度,主要为解决以下三个问题:第一,已知一个假设在有限数据样本上观看到的精度,怎样估量它在其他实例上的精度;其次,假如一个假设在某些数据样本上好于另一 个,那么一般情形下是否该假设更精确;第三,当数据有限时,怎样高效地利用这些数 据,通过它们既能学习到假设,仍能估量其精度?由于有限的数据样本可能不代表数据的一般分布,所以从这些数据上估量出的假设精度可能有误差;统计的方法,结合有关数据基准分布的假定,使我们可以用有限数据样本上的观看精度来靠近整个数据分布上的真实精度;5.1 动机多数情形下,对
2、学习到的假设进行尽可能精确的性能评估特别重要;缘由之一很简洁,是为了知道是否可以使用该假设;例如,从一个长度有限的数据库中学习,以明白不同医疗手段的成效,就有必要尽可能精确地知道学习结果的正确性;另一缘由在于,对假设的评估是很多学习方法的重要组成部分;例如在决策树学习中,为防止过度拟合问题必需进行后修剪,这时我们必需评估每一步修剪对树的精度产生的影响;因此,有必要明白已修剪和未修剪树的精度估量中固有的可能误差;当数据特别充分时,假设精度的估量相对简洁;然而当给定的数据集特别有限时,要学习一个概念并估量其将来的精度,存在两个很关键的困难:估量的偏差 Bias in the estimate ;第
3、一,学习到的概念在训练样例上的观看精度通常不能很好地用于估量在将来样例上的精度;由于假设是从这些样例中得 出的,因此对将来样例的精度估量通常偏于乐观;特殊在学习器采纳了很大的 假设空间,并过度拟合训练样例时,这一情形更可能显现;要对将来的精度进 行无偏估量,典型的方法是挑选与训练样例和假设无关的检验样例,在这个样 例集合上检验假设;估量的方差 Variance in the estimate ;其次,即使假设精度在独立的无偏检验样例上测量,得到的精度仍可能与真实精度不同,这取决于特定检验样例集合 的组成;检验样例越少,产生的方差越大;本章争论了对学到的假设的评估、对两个假设精度的比较、和有限数
4、据样本情形下两个学习算法精度的比较;其中的争论多数集中在统计和采样理论的基本定律,而本章假定读者在统计学方面没有背景学问;假设的统计检验需要较多的理论学问;本章供应了介绍性的综述,集中争论那些与假设的学习、评估和比较相关的问题;5.2 估量假设精度在评估一个假设时,我们一般更感爱好于估量其对将来实例的分类精度;同时,也需要知道这一精度估量中的可能的误差即与此估量相联系的误差门限);本章使用的学习问题的框架如下;有一全部可能实例的空间X如全部人的集合),其 上定义了多个目标函数如方案本年购买滑雪板者);我们假定X 中不同实例具有不同的显现频率,对此,一种合适的建模方式是,假定存在一未知的概率分布
5、D,它定义了 X 中每一实例显现的概率 如 19 岁的人的概率比109 岁的人概率高);留意D 并没有说明x 是欢迎下载精品学习资源一正例仍是一反例,只确定了其显现概率;学习任务是在假设空间H 上学习一个目标概念被供应应学习器;为说明这一点,考虑目标函数“方案本年购买滑雪板者”,可以调查去滑雪板商店的顾客,通过此调查来收集训练样例;在这里实例空间X 为全部人组成的集合,每个实例可由人的各种属性描述,如年龄、职业、每年滑雪次数等;分布情形D 指定了在滑雪板商店中遇到的每个人的概率;目标函数f :X 0,1 将每个人进行分类,判定它是否会在本年内购买滑雪板;在这个一般的框架中,我们感爱好的是以下两
6、个问题:1. 给定假设h 和包含如干按D 分布随机抽取的样例的数据集,如何针对将来按同样分布抽取的实例,得到对h 的精度的最好估量;2. 这一精度估量的可能的误差是多少?5.2.1 样本错误率和真实错误率为解决上述的两个问题,需要准确地区分出两种精度 或两种错误率);其一是可用数据样本上该假设的错误率;其二是在分布为 D 的整个实例集合上该假设的错误率;它们分别被称为样本错误率和真实错误率;对于于从 X 中抽取的样本 S,某假设关于 S 的样本错误率 sample error ),是该假设错误分类的实例在 S中所占比例:定义: 假设 h 关于目标函数 f 和数据样本 S 的样本错误率 )为:其
7、中 n 为 S 中样例的数量,而在时为 1,否就为 0;真实错误率 true error 是对于按 D分布随机抽取的实例,该假设对它错误分类的概率;定义:假设 h 关于目标函数 f 和分布 D 的真实错误率 表示),为 h 误分类按 D 分布随机抽取实例的概率:这里,记号表示概率在实例分布D 上运算;我们通常想知道的是假设的真实错误率error Dh,由于这是在分类将来样例时显现错误的可能性;然而我们所能测量的只是样本错误率error Sh,它所要求的数据样本S 是我们所拥有的;本节所要考虑的主要问题就是“error Sh在何种程度上供应了对error Dh 的估量?”;5.2.2 离散值假设
8、的置信区间为解决“ error Sh在何种程度上供应了对error Dh 的估量”的问题,先考虑h 为离散值假设的情形;具体地说,比如要基于某离散值假设h 在样本 S 上观看到的样本错误率, 估量它的真实错误率,其中:欢迎下载精品学习资源样本 S包含 n 个样例,它们的抽取依据概率分布D,抽取过程是相互独立的, 并且不依靠于 hn 30假设 h 在这 n 个样例上犯了 r 个错误 =r /n) 已知这些条件,统计理论可给出以下断言:1. 没有其他信息的话, error Dh最可能的值为error S h2. 有大约 95的可能性,真实错误率error Dh处于下面的区间内:举例说明,假如数据样
9、本S 包含 n=40 个样例,并且假设h 在这些数据上产生了r =12 个错误;这样,样本错误率为error Sh=12/40 0.3;假如没有更多的信息,对真实错误率error Dh的最好的估量即为样本错误率0.3;然而我们不能期望这是对真实错误率的完善估计;假如另外搜集40 个随机抽取的样例S,样本错误率 error Sh将与原先的 error Sh存在些许不同;这种不同是由S和 S 组成上的随机差异所产生的;实际上,假如不断重复这 一试验,每次抽取一个包含40 样例的样本 Si ,将会发觉约 95%的试验中运算所得的区间包含真实错误率;因此,我们将此区间称为error D h的 95%置
10、信区间估量;在本例中,r =12和 n=40 ,依据上式, 95%置信区间为 0.30 1.96 0.07 0.300.14;上面的 95置信区间表达式可推广到一般情形以运算任意置信度;常数1.96 是由 95% 这一置信度确定的;定义zN 为运算 N%置信区间时的常数;运算error Dh的 N%置信区间的一般表达式为:5.1其中 zN 的值依靠于所需的置信度,参见表5-1 中的取值;表 5-1 双侧的 N置信区间的 zN 值置信度 N%50%68%80%90%95%98%99%常量 zN0.671.001.281.641.962.332.58因此,正如 error Dh的 95置信区间为
11、0.301.96 .0.07 其中 r =12 ,n=40 ),可以求得同样情形下 68%置信区间为 0.30落入此区间的概率;等式 5.1 描述了为了在error Sh基础上估量error Dh,如何运算置信区间 不太靠近0 或 1 时很接近真实情形;判定这种近似是否接近真实,更精确的规章为:上面我们概述了运算离散值假设的置信区间的过程,下一节将给出这一过程的统计学基础;欢迎下载精品学习资源5.3 采样理论基础本节介绍了统计学和采样理论的几个基本概念,包括概率分布、期望值、方差、二项分布和正态分布、以及双侧和单侧区间;对于这些概念的基本明白将有助于懂得假设评估和算法评估;更为重要的,它们供应
12、了一种重要的概念框架,以便于懂得相关的机器学习问题 可被看作是有概率输出的一个试验;它的值为试验的输出结果;某随机变量的概率分布 probability distribution 指定了 Y 取值为任一可能的值yi 的可能性 PrY=yi随机变量 Y 的期望值 expected value或均值 mean为;通常用符号 Y 来表示 E Y ;随机变量的方差 Variance 为 Var Y=E Y-Y2 ;它描述了 Y 关于其均值分布的宽度或分散度;Y 的标准差 Standard deviation 为;通常用符号 Y来代表;二项分布 Binomialdistribution 是在硬币投掷问题
13、中,如显现正面的概率为p,那么在 n 个独立的试验中显现r 次正面的分布情形;正态分布 Normal distribution 是一钟形的概率分布,它在很多自然现象中都会显现;中心极限定理 Central LimitTheorem说明独立同分布的随机变量在大量试验中的和遵循正态分布;估量量 estimator 为一随机变量Y,它用来估量一基准总体的某一参数p;P 的估量量 Y 的估量偏差 estimation bias 为E Y p ;无偏估量量是指该偏差为0;N%置信区间 confidence interval 用于估量参数 p,该区间以 N%的概率包含 p;5.3.1 错误率估量和二项比例
14、估量在样本错误率和真实错误率之间的差异与数据样本大小的依靠关系如何?这一问题在统计学中已透彻争论;它可表述为:给定一总体中随机抽取的部分样本的观看频率,估量整个总体的概率;在这里,我们感爱好的观看量为 h 是否误分类样例;解决该问题第一要留意到,测量样本错误率相当于在作一个有随机输出的试验;我们先从分布 D 中随机抽取出 n 个独立的实例,形成样本S,然后测量样本错误率error Sh, 如前一节所述,假如将试验重复多次,每次抽取大小为n 的不同的样本Si ,将可以得到不同的 error Sih的值,它取决于不同Si 的组成中的随机差异;这种情形下,第i 个这样的试验的输出 error Sih
15、被称为一随机变量 , error S2h ,error Skh;然后我们以图表的形式显示出观看到的每个错误率值的频率;当 k 不断增长, 该 图表 将 呈 现 如 表 5-3 那 样 的分 布 ; 该 表 描 述的 概 率 分 布 称为 二项 分 布 Binomial distribution );表 5-3 二项分布插图原书页码:25Binomial distribution for n=40, p=0.3: n=40, p=0.3 时的二项分布欢迎下载精品学习资源一个二项分布 由 Pr 给出;X 的期望值或均值EX 为:X 的方差 Var X为EX= np假如随机变量 X 遵循二项分布,就
16、:欢迎下载精品学习资源X 的标准差为 X为:VarX=np1-p欢迎下载精品学习资源对于足够大的 n 值,二项分布很接近于有同样均值和方差的正态分布 5 时使用正态分布来近似二项分布;5.3.2 二项分布为较好地懂得二项分布,考虑以下的问题;有一磨损并弯曲了的硬币,要估量在抛硬币时显现正面的概率;令此未知概率为p;投掷该硬币 n 次并运算显现正面的次数r;对于p 的一合理的估量为r /n;留意,假如重新进行一次该试验,生成一个新的n 次抛硬币的集合,其显现正面次数r 将与第一次试验有稍许不同,从而得到对p 的另一个估量;二项分布描述的是对任一可能的r 值是相同的问题;一次硬币抛掷对应于从D 中
17、抽取一个实例并测试它是否被h 误分类;一次随机抛掷显现正面的概率p 对应于随机抽取的实例被误分类的概率); n 次抛掷的样本观看到 r 次正面,对应 n 个抽取的实例被误分类的数目;因此r /n 对应 error Sh;估量 p 的问题等效于估量 error Dh;二项分布给出了一个一般形式的概率分布,无论用于表示 n 次硬币显现正面的次数仍是在 n 个样例中假设出错的次数;二项分布的具体形式依靠于样本大小 n 以及概率 p 或 error Dh;一般来说应用二项分布的条件包括:1. 有一基准试验 如投掷硬币),其输出可被描述为一随机变量Y;随机变量 Y 有两种取值 如 Y 1 为正面, Y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 实数 公理 等价 命题 证明

限制150内