医学专题—图像处理中的细胞核检测、分割、分类方法综述.pptx
《医学专题—图像处理中的细胞核检测、分割、分类方法综述.pptx》由会员分享,可在线阅读,更多相关《医学专题—图像处理中的细胞核检测、分割、分类方法综述.pptx(142页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本PPT基于MethodsforNucleiDetection,SegmentationandClassificationinDigitalHistopathology:AReview.CurrentStatusandFuturePotential制作,历时2周,补充了大量的图像处理方面的基础。主要关注点为细胞检测、分割、分类。对图像处理有所需要这自行(zxng)下载。能力所限,多有不足。by临风游吟1/140第一页,共一百四十二页。MethodsforNucleiDetection,SegmentationandClassificationinDigitalHistopathology:AR
2、eview.CurrentStatusandFuturePotentialHumayunIrshad,StudentMember,IEEE,AntoineVeillard,LudovicRoux,DanielRacoceanu,Member,IEEE,2/140第二页,共一百四十二页。outline简介和动机细胞分割(fng)和分类的挑战图像处理方法简介检测、分割和分类的方法讨论3第三页,共一百四十二页。Thispresentreviewisintendedasacomprehensivestate-of-the-artsurveyontheparticularissuesofnucleide
3、tection,segmentationandclassificationmethodsrestrictedtotwowidelyavailabletypesofimagemodalities:H&EandIHC.Weconcludewithadiscussion,pointingtofutureresearchdirectionsandopenproblemsrelatedtonucleidetection,segmentationandclassification.4第四页,共一百四十二页。染色(rns)苏木精 伊红染色法(hematoxylin-eosinstaining),简称HE染色
4、法。细胞核深蓝色,其他(细胞质,基质等)粉红色。免疫组织化学(Immunohistochemistry,IHC)又称免疫细胞(xbo)化学,是指带显色剂标记的特异性抗体在组织细胞(xbo)原位通过抗原抗体反应和组织化学的呈色反应,对相应抗原进行定性、定位、定量测定的一项新技术。5第五页,共一百四十二页。6第六页,共一百四十二页。照明(zhomng)统一的光照是必须的。显微镜,样本厚度,染色等会导致照度不均。照相技术对不同波长的光的敏感度不一致(短波-蓝长波-红)。使用标准套件纠正(jizhng)光谱和空间光照变化。7第七页,共一百四十二页。重点(zhngdin)淋巴细胞:形状规则,比上皮细胞小
5、上皮细胞:染色质均匀(jnyn),边界平滑(健康);变大,染色质分布不均,边界不规则(癌变)8第八页,共一百四十二页。挑战(tio zhn)病理图像中待检测、分割、分类的细胞通常有很多的计算机视觉问题,这些视觉问题由很多因素(yn s)导致,包括切片处理和图像采集等。细胞核通常是聚集在一起且存在重叠,并有多样化的外观。一个成功的图像处理方法应该是能够用鲁棒的方式克服这些问题以便在各种情况下都有高质量和准确率。9第九页,共一百四十二页。图像处理(t xin ch l)方法阈值(thresholding)形态学(morphology)区域(qy)生长(regiongrowing)分水岭(water
6、shed)主动轮廓模型和水平集(activecontourmodelandlevelsets)K-均值聚类(K-meansclustering)概率模型(probabilisticmodels)图切割(graphcuts)10第十页,共一百四十二页。Thresholding目标和背景内部(nib)的相邻像素间的灰度值是高度相关的,但在目标和背景交界处两边的像素在灰度上有很大的差别。全局二值化11第十一页,共一百四十二页。全局阈值:仅根据图像(t xin)像素本身性质1、极小点阈值 2、最优阈值 3、最大凸残差阈值;局部阈值:像素本身性质和局部区域性质1、直方图变换 2、灰度-梯度散射图动态阈值
7、:像素本身性质、局部区域性质以及像素位置坐标12第十二页,共一百四十二页。13第十三页,共一百四十二页。Morphology形态学是一门建立在集论基础上的学科,将图像(t xin)视为元素的集合,将图像(t xin)作为几何形状进行处理。形态学图像处理是在图像中移动一个结构元素,然后将结构元素与下面的二值图像进行交、并等集合运算。常用的结构元素有十字,矩形和圆形等。14第十四页,共一百四十二页。在形态学中,结构元素是最重要(zhngyo)最基本的概念。结构元素在形态变换中的作用相当于信号处理中的“滤波窗口”。基本的形态运算是腐蚀和膨胀。腐蚀和膨胀公式:15第十五页,共一百四十二页。16第十六页
8、,共一百四十二页。先腐蚀后膨胀的过程称为开运算。它具有消除细小物体,在纤细处分离物体和平滑较大物体边界(binji)的作用。先膨胀后腐蚀的过程称为闭运算。它具有填充物体内细小空洞,连接邻近物体和平滑边界的作用。均会除去比结构元素小的图像细节。17第十七页,共一百四十二页。18第十八页,共一百四十二页。Whiteandblacktop-hattransforms:可以(ky)提取元素和细节。Whitetop-hattransformsBlacktop-hattransforms19第十九页,共一百四十二页。20第二十页,共一百四十二页。形态学梯度(t d):用于边缘检测21第二十一页,共一百四十
9、二页。Regiongrowing种子区域生长法是从一组代表不同生长区域的种子像素(xin s)开始,接下来将种子像素(xin s)邻域里符合条件的像素(xin s)合并到种子像素(xin s)所代表的生长区域中,并将新添加的像素(xin s)作为新的种子像素(xin s)继续合并过程,直到找不到符合条件的新像素(xin s)为止。22第二十二页,共一百四十二页。23第二十三页,共一百四十二页。选择或确定一组能正确代表所需区域的种子像素确定在生长过程中能将相邻像素包括进来的准则制定让生长停止的条件(tiojin)或规则24第二十四页,共一百四十二页。Watershed分水岭法是一种基于拓扑理论的
10、数学形态学的分割方法,其基本思想是把图像看作是测地学(dxu)上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。25第二十五页,共一百四十二页。该算法的实现可以模拟成洪水淹没的过程,图像的最低点首先被淹没,然后水逐渐淹没整个山谷。当水位到达一定高度的时候将会溢出,这时在水溢出的地方修建堤坝,重复这个(zh ge)过程直到整个图像上的点全部被淹没,这时所建立的一系列堤坝就成为分开各个盆地的分水岭。分水岭算法对微弱的边缘有着良好的响应,但图像中的噪声会使分水岭算法产生过分割的现象。26第二十六页,共一百四十二页。27第二十
11、七页,共一百四十二页。ACM能量函数:以规范化曲线形状为目的的项,称为内能量,最小化内能量使得曲线不断向内部紧缩且保持平滑以靠近目标物体边缘为目的的项,称为外能量,外能量则是保证曲线紧缩到目标物体边缘时停止。是自定义或目标物体先验的知识(zh shi),来控制边界。Activecontourmodelandlevelsets28第二十八页,共一百四十二页。参数活动轮廓模型(mxng)是基于Lagrange框架,直接以曲线的参数化形式来表达曲线,最具代表性的是Snake模型。该类模型在早期的生物图像分割领域得到了成功的应用,但其存在着分割结果受初始轮廓的设置影响较大以及难以处理曲线拓扑结构变化等
12、缺点.29第二十九页,共一百四十二页。基本思想是1)在图像中初始化一个闭合曲线轮廓。形状任意,只要保证将目标物体完全包含在曲线内部即可;2)然后构建能量方程。能量方程由两部分组成。3)根据能量方程,计算出表示曲线受力的欧拉方程(Eulerequation)。按照曲线各点的受力来对曲线进行变形,直至受力为0。此时能量方程达到最小值,曲线收敛(shulin)到目标物体边缘。30第三十页,共一百四十二页。几何(j h)活动轮廓模型的曲线运动过程是基于曲线的几何(j h)度量参数而非曲线的表达参数,因此可以较好地处理拓扑结构的变化,并可以解决参数活动轮廓模型难以解决的问题。而水平集(LevelSet)
13、方法的引入,则极大地推动了几何活动轮廓模型的发展,因此几何活动轮廓模型一般也可被称为水平集方法。31第三十一页,共一百四十二页。基本思想是将图像按照曲线(qxin)量化为levelset函数(最常用的是signeddistancefunction)。level-set类似于等势线,一幅图像上所有level-set值等于某个常量的点构成一个闭合曲线。因此,t时刻的曲线可以表示为:C(t)=(x,y):u(t,x,y)=0这样的曲线表示方法不依赖于参数化,因此是曲线的本征表示。这样就将曲线的运动转化为zerolevel-set函数的运动。32第三十二页,共一百四十二页。Levelsets水平集(l
14、evelset)的基本思想是将界面(jimin)看成高一维空间中某一函数(称为水平集函数)的零水平集,同时界面的演化也扩充到高一维的空间中。我们将水平集函数按照它所满足的发展方程进行演化或迭代,由于水平集函数不断进行演化,所以对应的零水平集也在不断变化,当水平集演化趋于平稳时,演化停止,得到界面形状。33第三十三页,共一百四十二页。简单来说就是把低维空间上的函数通过水平集的方法来转化为高维空间(如果低维是n,则这里的高维指n+1)假设用C(p,t)表示一个(y)沿其法向方向的闭合曲线,它可以是二维中的一条闭合曲线(curve),也可以是三维中的一个闭合曲面(Surface)。34第三十四页,共
15、一百四十二页。如果把水平(shupng)集函数 中的z变量变为t,则二维空间的闭合曲线就是通过截取不同时刻三维空间连续函数曲面的水平层。当函数中的t取不同的值时,水平集函数对应不同的水平集,三维中的函数就是这样映射到二维的平面中的。也就是将二维中曲线的演化转化为了三维中的曲面的演化,低维变化到了高维,低维中的问题变化到了高维进行求解。35第三十五页,共一百四十二页。36第三十六页,共一百四十二页。MaximumLikelihood极大似然原理的直观想法是:一个随机试验如有若干个可能的结果A,B,C,。若在一次试验中,结果A出现,则一般认为(rnwi)试验条件对A出现有利,也即A出现的概率很大。
16、37第三十七页,共一百四十二页。假设数据是服从(fcng)同一个概率分布p(x|)的分布参数,那么抽到A的概率是p(xA|),抽到B的概率是p(xB|),那因为他们是独立的,同时抽到A和B的概率是p(xA|)*p(xB|),那么从分布是p(x|)的总体样本中抽取到n个样本的概率,也就是样本集X中各个样本的联合概率,用下式表示:最大似然估计会寻找关于的最可能的值38第三十八页,共一百四十二页。求最大似然函数估计值的一般步骤:(1)写出似然函数;(2)对似然函数取对数,并整理;(3)求导数,令导数为0,得到(d do)似然方程;(4)解似然方程,得到的参数即为所求;39第三十九页,共一百四十二页。
17、ExpectationMaximization期望最大化(Expectation-maximuzation)算法在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。EM是一个在已知部分(b fen)相关变量的情况下,估计未知变量的迭代技术。40第四十页,共一百四十二页。EM的算法流程如下:1:初始化分布参数:2:重复直到收敛。E步骤:估计未知参数的期望值,给出当前的参数估计。M步骤:重新估计分布参数,以使得(sh de)数据的似然性最大,给出未知变量的期望估计。41第四十一页,共一百四十二页。K-meansclusteringK-means算法(sun f)是很典型的
18、基于距离的聚类算法(sun f),采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法(sun f)认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。42第四十二页,共一百四十二页。(1)从 n个数据对象任意选择 k个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离(jl);并根据最小距离(jl)重新对相应对象进行划分;(3)重新计算每个(有变化)聚类的均值(中心对象)(4)循环(2)到(3)直到每个聚类不再发生变化为止43第四十三页,共一百四十二页。Fuzzyc-meansclustering模糊c
19、-均值聚类算法 fuzzyc-meansalgorithm(FCMA)或称(FCM)。在众多模糊聚类算法中,模糊C-均值(FCM)算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属(lsh)度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。1973年,Bezdek提出44第四十四页,共一百四十二页。FCM用模糊划分,使得每个给定(i dn)数据点用值在0,1间的隶属度来确定其属于各个组的程度。样本点的隶属度函数取值为区间0,1,同时每个样本点对各类的隶属度之和为1,即认为样本点对每个聚类均有一个隶属度关系,允许样本点以不同的模糊隶属度函数同时归属于所有聚类。模
20、糊聚类方法的软性划分,真实地反映了图像的模糊性和不确定性。45第四十五页,共一百四十二页。步骤1:用值在0,1间的随机数初始化隶属矩阵U,使其满足式(6.9)中的约束条件步骤2:用式(6.12)计算c个聚类中心ci,i=1,c。步骤3:根据式(6.10)计算价值函数(hnsh)。如果它小于某个确定的阀值,或它相对上次价值函数(hnsh)值的改变量小于某个阀值,则算法停止。步骤4:用(6.13)计算新的U矩阵。返回步骤2。46第四十六页,共一百四十二页。Probabilisticmodels统计学习的模型(mxng)有两种,一种是概率模型(mxng),一种是非概率模型(mxng)。所谓概率模型(
21、mxng),就是指要学习的模型(mxng)的形式是P(Y|X),这样在分类的过程中,通过未知数据X可以获得Y取值的一个概率分布,也就是训练后模型得到的输出不是一个具体的值,而是一系列值的概率(对应于分类问题来说,就是对应于各个不同的类的概率),然后可以选取概率最大的那个类作为判决对象(算软分类softassignment)。47第四十七页,共一百四十二页。对于高斯混合模型(GMM),学习的过程就是训练出几个概率分布,所谓混合高斯模型就是指对样本的概率密度分布进行估计,而估计的模型是几个高斯模型加权之和(具体是几个要在模型训练前建立好)。每个高斯模型就代表了一个类(一个Cluster)。对样本中
22、的数据分别在几个高斯模型上投影,就会分别得到在各个(gg)类上的概率。然后我们可以选取概率最大的类所为判决结果。48第四十八页,共一百四十二页。Graphcuts此类方法把图像分割问题与图的最小割(mincut)问题相关联。首先将图像映射(yngsh)为带权无向图G=,图中每个节点NV对应于图像中的每个像素,每条边E连接着一对相邻的像素,边的权值表示了相邻像素之间在灰度、颜色或纹理方面的非负相似度。49第四十九页,共一百四十二页。而对图像的一个分割s就是对图的一个剪切,被分割的每个区域CS对应着图中的一个子图。而分割的最优原则(yunz)就是使划分后的子图在内部保持相似度最大,而子图之间的相似
23、度保持最小。基于图论的分割方法的本质就是移除特定的边,将图划分为若干子图从而实现分割。50第五十页,共一百四十二页。GraphCuts图是在普通图的基础上多了2个顶点,这2个顶点分别用符号”S”和”T”表示,统称为终端顶点。其它所有的顶点都必须和这2个顶点相连(xin lin)形成边集合中的一部分。所以GraphCuts中有两种顶点,也有两种边。51第五十一页,共一百四十二页。52第五十二页,共一百四十二页。HoughTransform霍夫变换是图像处理中的一个检测(jin c)直线、圆等简单几何形状的方法。它最初是用于在二值化的图像中进行直线检测(jin c)的。5353第五十三页,共一百四
24、十二页。黑白图像上画一条直线,直线的方程可以用y=k*x+b来表示,过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一组直线。方程y0=kx0+b在参数k-b平面上是一条直线。这样(zhyng),图像x-y平面上的一个前景像素点就对应到参数k-b平面上的一条直线。5454第五十四页,共一百四十二页。同样,图像x-y平面上的一条(y tio)直线y=k0*x+b0就对应到参数平面上的一个像素点(K0,b0)。不过,由于直线的斜率可能为无穷大,或者无穷小,那么,在k-b参数空间就不便于对直线进行刻画和描述。所以,采用极坐标参数空间进行直线检测。5555第
25、五十五页,共一百四十二页。直线Y=X*K+b上点对应于KB空间上的不同直线,这一组直线的交点为(K,b)。则通过对图像进行遍历,均映射(yngsh)到空间AB上,统计交点上相交直线的个数,则个数最大的点及对应图像中占据像素点最多的线段。5656第五十六页,共一百四十二页。优点(yudin):抗干扰能力强,对应曲线为实线,虚线,还是残缺了一部分均可以检测;对应曲线的均匀无要求。缺点:计算量大,不能检测图像的线段,检测出包括该线段的直线,对于像素点较少的线段无法检测,参数空间难求取最优参数。5757第五十七页,共一百四十二页。Markovrandomfield马尔可夫一般是马尔可夫性质的简称。它指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 专题 图像 处理 中的 细胞核 检测 分割 分类 方法 综述
限制150内