图像处理中的细胞核检测、分割、分类方法综述.ppt
《图像处理中的细胞核检测、分割、分类方法综述.ppt》由会员分享,可在线阅读,更多相关《图像处理中的细胞核检测、分割、分类方法综述.ppt(142页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本PPT基于?Methods for Nuclei Detection,Segmentation and Classification in Digital Histopathology:A Review.Current Status and Future Potential?制作,历时2周,补充了大量的图像处理方面的根底。主要关注点为细胞检测、分割、分类。对图像处理有所需要这自行下载。能力所限,多有缺乏。by 临风游吟1/140第一页,共一百四十二页。MethodsforNucleiDetection,SegmentationandClassificationinDigitalHistopa
2、thology:AReview.CurrentStatusandFuturePotentialHumayunIrshad,StudentMember,IEEE,AntoineVeillard,LudovicRoux,DanielRacoceanu,Member,IEEE,2/140第二页,共一百四十二页。outline简介和动机细胞分割和分类的挑战图像处理方法简介检测、分割和分类的方法讨论3第三页,共一百四十二页。Thispresentreviewisintendedasacomprehensivestate-of-the-artsurveyontheparticularissuesofnuc
3、leidetection,segmentationandclassificationmethodsrestrictedtotwowidelyavailabletypesofimagemodalities:H&EandIHC.Weconcludewithadiscussion,pointingtofutureresearchdirectionsandopenproblemsrelatedtonucleidetection,segmentationandclassification.4第四页,共一百四十二页。染色苏木精 伊红染色法(hematoxylin-eosin staining),简称HE染
4、色法。细胞核深蓝色,其他细胞质,基质等粉红色。免疫组织化学Immunohistochemistry,IHC又称免疫细胞化学,是指带显色剂标记的特异性抗体在组织细胞原位通过抗原抗体反响和组织化学的呈色反响,对相应抗原进行定性、定位、定量测定的一项新技术。5第五页,共一百四十二页。6第六页,共一百四十二页。照明统一的光照是必须的。显微镜,样本厚度,染色等会导致照度不均。照相技术对不同波长的光的敏感度不一致短波-蓝长波-红。使用标准套件纠正光谱和空间光照变化。7第七页,共一百四十二页。重点淋巴细胞:形状规那么,比上皮细胞小上皮细胞:染色质均匀,边界平滑健康;变大,染色质分布不均,边界不规那么癌变8第
5、八页,共一百四十二页。挑战病理图像中待检测、分割、分类的细胞通常有很多的计算机视觉问题,这些视觉问题由很多因素导致,包括切片处理和图像采集等。细胞核通常是聚集在一起且存在重叠,并有多样化的外观。一个成功的图像处理方法应该是能够用鲁棒的方式克服这些问题以便在各种情况下都有高质量和准确率。9第九页,共一百四十二页。图像处理方法阈值thresholding形态学morphology区域生长region growing分水岭watershed主动轮廓模型和水平集active contour model and level setsK-均值聚类K-means clustering概率模型probabil
6、istic models图切割graph cuts10第十页,共一百四十二页。Thresholding目标和背景内部的相邻像素间的灰度值是高度相关的,但在目标和背景交界处两边的像素在灰度上有很大的差异。全局二值化11第十一页,共一百四十二页。全局阈值:仅根据图像像素本身性质1、极小点阈值 2、最优阈值 3、最大凸残差阈值;局部阈值:像素本身性质和局部区域性质1、直方图变换 2、灰度-梯度散射图动态阈值:像素本身性质、局部区域性质以及像素位置坐标12第十二页,共一百四十二页。13第十三页,共一百四十二页。Morphology形态学是一门建立在集论根底上的学科,将图像视为元素的集合,将图像作为几何
7、形状进行处理。形态学图像处理是在图像中移动一个结构元素,然后将结构元素与下面的二值图像进行交、并等集合运算。常用的结构元素有十字,矩形和圆形等。14第十四页,共一百四十二页。在形态学中,结构元素是最重要最根本的概念。结构元素在形态变换中的作用相当于信号处理中的“滤波窗口。根本的形态运算是腐蚀和膨胀。腐蚀和膨胀公式:15第十五页,共一百四十二页。16第十六页,共一百四十二页。先腐蚀后膨胀的过程称为开运算。它具有消除细小物体,在纤细处别离物体和平滑较大物体边界的作用。先膨胀后腐蚀的过程称为闭运算。它具有填充物体内细小空洞,连接邻近物体和平滑边界的作用。均会除去比结构元素小的图像细节。17第十七页,
8、共一百四十二页。18第十八页,共一百四十二页。Whiteandblacktop-hattransforms:可以提取元素和细节。Whitetop-hattransformsBlacktop-hattransforms19第十九页,共一百四十二页。20第二十页,共一百四十二页。形态学梯度:用于边缘检测21第二十一页,共一百四十二页。Regiongrowing种子区域生长法是从一组代表不同生长区域的种子像素开始,接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中,并将新添加的像素作为新的种子像素继续合并过程,直到找不到符合条件的新像素为止。22第二十二页,共一百四十二页。23第二
9、十三页,共一百四十二页。选择或确定一组能正确代表所需区域的种子像素确定在生长过程中能将相邻像素包括进来的准那么制定让生长停止的条件或规那么24第二十四页,共一百四十二页。Watershed分水岭法是一种基于拓扑理论的数学形态学的分割方法,其根本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界那么形成分水岭。25第二十五页,共一百四十二页。该算法的实现可以模拟成洪水淹没的过程,图像的最低点首先被淹没,然后水逐渐淹没整个山谷。当水位到达一定高度的时候将会溢出,这时在水溢出的地方修建堤坝,重复这个过程直到整个图像
10、上的点全部被淹没,这时所建立的一系列堤坝就成为分开各个盆地的分水岭。分水岭算法对微弱的边缘有着良好的响应,但图像中的噪声会使分水岭算法产生过分割的现象。26第二十六页,共一百四十二页。27第二十七页,共一百四十二页。ACM能量函数:以标准化曲线形状为目的的项,称为内能量,最小化内能量使得曲线不断向内部紧缩且保持平滑以靠近目标物体边缘为目的的项,称为外能量,外能量那么是保证曲线紧缩到目标物体边缘时停止。是自定义或目标物体先验的知识,来控制边界。Activecontourmodelandlevelsets28第二十八页,共一百四十二页。参数活动轮廓模型是基于Lagrange框架,直接以曲线的参数化
11、形式来表达曲线,最具代表性的是Snake模型。该类模型在早期的生物图像分割领域得到了成功的应用,但其存在着分割结果受初始轮廓的设置影响较大以及难以处理曲线拓扑结构变化等缺点.29第二十九页,共一百四十二页。根本思想是1在图像中初始化一个闭合曲线轮廓。形状任意,只要保证将目标物体完全包含在曲线内部即可;2然后构建能量方程。能量方程由两局部组成。3根据能量方程,计算出表示曲线受力的欧拉方程Euler equation。按照曲线各点的受力来对曲线进行变形,直至受力为0。此时能量方程到达最小值,曲线收敛到目标物体边缘。30第三十页,共一百四十二页。几何活动轮廓模型的曲线运动过程是基于曲线的几何度量参数
12、而非曲线的表达参数,因此可以较好地处理拓扑结构的变化,并可以解决参数活动轮廓模型难以解决的问题。而水平集LevelSet方法的引入,那么极大地推动了几何活动轮廓模型的开展,因此几何活动轮廓模型一般也可被称为水平集方法。31第三十一页,共一百四十二页。根本思想是将图像按照曲线量化为level set函数最常用的是signed distance function。level-set类似于等势线,一幅图像上所有level-set值等于某个常量的点构成一个闭合曲线。因此,t时刻的曲线可以表示为:C(t)=(x,y):u(t,x,y)=0这样的曲线表示方法不依赖于参数化,因此是曲线的本征表示。这样就将曲
13、线的运动转化为zero level-set函数的运动。32第三十二页,共一百四十二页。Levelsets水平集(levelset)的根本思想是将界面看成高一维空间中某一函数称为水平集函数的零水平集,同时界面的演化也扩充到高一维的空间中。我们将水平集函数按照它所满足的开展方程进行演化或迭代,由于水平集函数不断进行演化,所以对应的零水平集也在不断变化,当水平集演化趋于平稳时,演化停止,得到界面形状。33第三十三页,共一百四十二页。简单来说就是把低维空间上的函数通过水平集的方法来转化为高维空间(如果低维是n,那么这里的高维指n+1)假设用C(p,t)表示一个沿其法向方向的闭合曲线,它可以是二维中的一
14、条闭合曲线(curve),也可以是三维中的一个闭合曲面(Surface)。34第三十四页,共一百四十二页。如果把水平集函数 中的z变量变为t,那么二维空间的闭合曲线就是通过截取不同时刻三维空间连续函数曲面的水平层。当函数中的t取不同的值时,水平集函数对应不同的水平集,三维中的函数就是这样映射到二维的平面中的。也就是将二维中曲线的演化转化为了三维中的曲面的演化,低维变化到了高维,低维中的问题变化到了高维进行求解。35第三十五页,共一百四十二页。36第三十六页,共一百四十二页。MaximumLikelihood极大似然原理的直观想法是:一个随机试验如有假设干个可能的结果A,B,C,。假设在一次试验
15、中,结果A出现,那么一般认为试验条件对A出现有利,也即A出现的概率很大。37第三十七页,共一百四十二页。假设数据是服从同一个概率分布p(x|)的分布参数,那么抽到A的概率是p(xA|),抽到B的概率是p(xB|),那因为他们是独立的,同时抽到A和B的概率是p(xA|)*p(xB|),那么从分布是p(x|)的总体样本中抽取到n个样本的概率,也就是样本集X中各个样本的联合概率,用下式表示:最大似然估计会寻找关于的最可能的值38第三十八页,共一百四十二页。求最大似然函数估计值的一般步骤:1写出似然函数;2对似然函数取对数,并整理;3求导数,令导数为0,得到似然方程;4解似然方程,得到的参数即为所求;
16、39第三十九页,共一百四十二页。ExpectationMaximization期望最大化Expectation-maximuzation算法在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。EM是一个在能看出局部相关变量的情况下,估计未知变量的迭代技术。40第四十页,共一百四十二页。EM的算法流程如下:1:初始化分布参数:2:重复直到收敛。E步骤:估计未知参数的期望值,给出当前的参数估计。M步骤:重新估计分布参数,以使得数据的似然性最大,给出未知变量的期望估计。41第四十一页,共一百四十二页。K-meansclusteringK-means算法是很典型的基于距离的聚
17、类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。42第四十二页,共一百四十二页。1 从 n个数据对象任意选择 k 个对象作为初始聚类中心;2 根据每个聚类对象的均值中心对象,计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;3 重新计算每个有变化聚类的均值中心对象4 循环2到3直到每个聚类不再发生变化为止43第四十三页,共一百四十二页。Fuzzyc-meansclustering模糊c-均值聚类算法 fuzzy c-means algorithm(FCMA)或称 F
18、CM。在众多模糊聚类算法中,模糊C-均值 FCM 算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以到达自动对样本数据进行分类的目的。1973年,Bezdek提出44第四十四页,共一百四十二页。FCM用模糊划分,使得每个给定数据点用值在0,1间的隶属度来确定其属于各个组的程度。样本点的隶属度函数取值为区间0,1,同时每个样本点对各类的隶属度之和为1,即认为样本点对每个聚类均有一个隶属度关系,允许样本点以不同的模糊隶属度函数同时归属于所有聚类。模糊聚类方法的软性划分,真实地反映了图像的模糊性和不确定性。45第四十五页,共一百四十二页。步骤1:用值
19、在0,1间的随机数初始化隶属矩阵U,使其满足式6.9中的约束条件步骤2:用式6.12计算c个聚类中心ci,i=1,c。步骤3:根据式6.10计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,那么算法停止。步骤4:用6.13计算新的U矩阵。返回步骤2。46第四十六页,共一百四十二页。Probabilisticmodels统计学习的模型有两种,一种是概率模型,一种是非概率模型。所谓概率模型,就是指要学习的模型的形式是P(Y|X),这样在分类的过程中,通过未知数据X可以获得Y取值的一个概率分布,也就是训练后模型得到的输出不是一个具体的值,而是一系列值的概率对应于分类
20、问题来说,就是对应于各个不同的类的概率,然后可以选取概率最大的那个类作为判决对象算软分类soft assignment。47第四十七页,共一百四十二页。对于高斯混合模型GMM,学习的过程就是训练出几个概率分布,所谓混合高斯模型就是指对样本的概率密度分布进行估计,而估计的模型是几个高斯模型加权之和具体是几个要在模型训练前建立好。每个高斯模型就代表了一个类一个Cluster。对样本中的数据分别在几个高斯模型上投影,就会分别得到在各个类上的概率。然后我们可以选取概率最大的类所为判决结果。48第四十八页,共一百四十二页。Graphcuts此类方法把图像分割问题与图的最小割min cut问题相关联。首先
21、将图像映射为带权无向图G=,图中每个节点NV对应于图像中的每个像素,每条边E连接着一对相邻的像素,边的权值表示了相邻像素之间在灰度、颜色或纹理方面的非负相似度。49第四十九页,共一百四十二页。而对图像的一个分割s就是对图的一个剪切,被分割的每个区域CS对应着图中的一个子图。而分割的最优原那么就是使划分后的子图在内部保持相似度最大,而子图之间的相似度保持最小。基于图论的分割方法的本质就是移除特定的边,将图划分为假设干子图从而实现分割。50第五十页,共一百四十二页。GraphCuts图是在普通图的根底上多了2个顶点,这2个顶点分别用符号S和T表示,统称为终端顶点。其它所有的顶点都必须和这2个顶点相
22、连形成边集合中的一局部。所以GraphCuts中有两种顶点,也有两种边。51第五十一页,共一百四十二页。52第五十二页,共一百四十二页。HoughTransform霍夫变换是图像处理中的一个检测直线、圆等简单几何形状的方法。它最初是用于在二值化的图像中进行直线检测的。5353第五十三页,共一百四十二页。黑白图像上画一条直线,直线的方程可以用y=k*x+b来表示,过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一组直线。方程y0=kx0+b在参数k-b平面上是一条直线。这样,图像x-y平面上的一个前景像素点就对应到参数k-b平面上的一条直线。5454第
23、五十四页,共一百四十二页。同样,图像x-y平面上的一条直线y=k0*x+b0就对应到参数平面上的一个像素点K0,b0。不过,由于直线的斜率可能为无穷大,或者无穷小,那么,在k-b参数空间就不便于对直线进行刻画和描述。所以,采用极坐标参数空间进行直线检测。5555第五十五页,共一百四十二页。直线Y=X*K+b上点对应于KB空间上的不同直线,这一组直线的交点为K,b。那么通过对图像进行遍历,均映射到空间AB上,统计交点上相交直线的个数,那么个数最大的点及对应图像中占据像素点最多的线段。5656第五十六页,共一百四十二页。优点:抗干扰能力强,对应曲线为实线,虚线,还是残缺了一局部均可以检测;对应曲线
24、的均匀无要求。缺点:计算量大,不能检测图像的线段,检测出包括该线段的直线,对于像素点较少的线段无法检测,参数空间难求取最优参数。5757第五十七页,共一百四十二页。Markovrandomfield马尔可夫一般是马尔可夫性质的简称。它指的是一个随机变量序列按时间先后关系依次排开的时候,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。拿天气来打个比方。如果假定天气是马尔可夫的,其意思就是假设今天的天气仅仅与昨天的天气存在概率上的关联,而与前天及前天以前的天气没有关系。其它如传染病和谣言的传播规律,就是马尔可夫的。5858第五十八页,共一百四十二页。随机场包含两个要素:位置site,相空
25、间phase space。当给每一个位置中按照某种分布随机赋予相空间的一个值之后,其全体就叫做随机场。不妨拿种地来打个比方。“位置好比是一亩亩农田;“相空间好比是种的各种庄稼。可以给不同的地种上不同的庄稼,种的庄家类型只和相邻地里的庄家有关。这就好比给随机场的每个“位置,赋予相空间里不同的值。所以,俗气点说,随机场就是在哪块地里种什么庄稼的事情。5959第五十九页,共一百四十二页。马尔可夫链通常用来建模排队理论和统计学中的建模,最近的应用是在地理统计学geostatistics中。其中,马尔可夫链用在基于观察数据的二到三维离散变量的随机模拟。6060第六十页,共一百四十二页。laplacian
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 处理 中的 细胞核 检测 分割 分类 方法 综述
限制150内