(16.1.1)--第16讲_条件随机场.pdf
《(16.1.1)--第16讲_条件随机场.pdf》由会员分享,可在线阅读,更多相关《(16.1.1)--第16讲_条件随机场.pdf(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据机器学习第十六讲:条件随机场隐目录1.预备知识2.概率无向图模型3.条件随机场的定义与形式4.条件随机场的概率计算问题5.条件随机场的学习算法6.条件随机场的预测算法一、预备知识 词性标注和语法分析HMM到条件随机场 HMM CRFHMM和CRF 共性:都常用来对观测序列和输出序列建模,CRF的优势:HMM最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特征,限制了特征的选择;在每一节点都要进行归一化,所以只能找到局部的最优值,同时也带来了标记偏见的问题(label bias);CRF:选择上下文相关特性;不在每一个节点进行归一化,而是所有特征进行全局归一化,可以求得全局的最优
2、值。二维CRF 随机场 随机场(Random Filed)中,利用邻域系统可以分析空间上的马尔科夫性。一个像素点的特性,更可能受它周围像素的影响,与它距离越远的像素,对它的特性的影响越小。二维CRF在图像分割 的应用二、概率无向图模型 概念:概率无向图模型(probabilistic undirected graphical model)马尔可夫随机场(Markov random field)可以由无向图表示的联合概率分布。概率图模型Probabilistic graphical model变量关系图有向无环图 directed acyclic graph贝叶斯网络bayesian netwo
3、rk动态贝叶斯网络dynamic bayesian network无向图 undirected graph马尔科夫网络Markov network模型定义 Graph Node Edge v,集合V e,集合E G=(V,E)结点v,随机变量Yv;边e,随机变量间的概率依赖关系 概率图模型(Probabilistic graphical model):用图表示的概率分布。模型定义 定义:给定一个联合概率分布P(Y)和表示它的无向图G,定义无向图表示的随机变量之间存在的 成对马尔可夫性(pairwise Markov property)局部马尔可夫性(local Markov properly)
4、全局马尔可夫性(global Markov property)模型定义 成对马尔可夫性(Pairwise Markov property)设u和v是无向图G中任意两个没有边连接的结点,结点u和v分别对应随机变量Yu和Yv,其它所有结点为O,对应的随机变量组是Y0 给定随机变量组Y0的条件下随机变量Yu和Yv是条件独立的模型定义 局部马尔可夫性(Local Markov properly)v:任意结点 w:与v有边相连的结点 O:其它结点 在时,等价于模型定义 全局马尔可夫性(Global Markov property)结点集合A,B是在无向图G中被结点集合C分开的任意结点集合,模型定义 概率
5、无向图模型(马尔可夫随机场(Markov random field))设有联合概率分布P(Y),由无向图G=(V,E)表示,在图G中,结点表示随机变量,边表示随机变量之间的依赖关系,如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型(probability undirected graphical model),或马尔可夫随机场(Markov random field).问题关键:求联合概率,引申为对联合概率进行因子分解。概率无向图模型的因子分解 定义:团、最大团 无向图G中任何两个结点均有边连接的结点子集称为团(clique)。若C是无向图G的一个团,
6、井且不能再加进任何一个c的结点使其成为一个更大的团,则称此C为最大团(maximal clique).两个结点的团?三个结点的团?概率无向图模型的因子分解 将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式的操作,称为概率无向图模型的因子分解(Factorization).给定概率无向图模型,设其无向图为G,C为G上的最大团,Yc表示C对应的随机变量,那么概率无向图模型的联合概率分布P(Y)可写作图中所有最大团C上的函数的乘积形式,即 Z是规范化因子(normalization factor)概率无向图模型的因子分解 势函数:定理(Hammersley-Clifford定
7、理):概率无向图模型的联合概率分布P(Y)可以表示为如下形式:三、条件随机场的定义与形式 条件随机场(conditional random field)的定义:给定随机变量X条件下,随机变量Y的马尔可夫随机场。定义在线性链上的特殊的条件随机场:线性链条件随机场(linear chain conditional random field)线性链条件随机场可以用于标注等问题;在条件概率模型P(Y|X)中,Y是输出变量,表示标记序列,X是输入变量,表示需要标注的观测序列,也把标记序列称为状态序列。条件随机场的定义与形式 条件随机场:设X与Y是随机变量,P(Y|X)是在给定X的条件下Y的条件概率分布,
8、若随机变量Y构成一个由无向图G=(V,E)表示的马尔可夫随机场,即满足马尔科夫性 对任意结点v成立,则称条件概率分布P(Y|X)为条件随机场,式中wv表示在图G=(V,E)中与结点v有边连接的所有结点w,wv表示结点v以外的所有结点。条件随机场的定义与形式 线性链情况:最大团是相邻两个结点的集合,线性链条件随机场:条件随机场的定义与形式 定义(线性链条件随机场)设均为线性链表示的随机变量序列,若在给定随机变量序列X的条件下,随机变量序列Y的条件概率分布P(Y|X)构成条件随机场。即满足马尔可夫性 则称P(Y|X)为线性链条件随机场。在标注问题中,X表示输入观测序列,Y表示对应的输出标记序列或状
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 16.1 16 条件 随机
限制150内