基于多模态卷积神经网络的脑血管提取方法研究-秦志光.pdf
《基于多模态卷积神经网络的脑血管提取方法研究-秦志光.pdf》由会员分享,可在线阅读,更多相关《基于多模态卷积神经网络的脑血管提取方法研究-秦志光.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第 45 卷 第 4 期 电 子 科 技 大 学 学 报 Vol.45 No.4 2016年 7月 Journal of University of Electronic Science and Technology of China Jul. 2016 基于多模态卷积神经网络的脑血管提取方法研究 秦志光,陈 浩,丁 熠,蓝 天,陈 圆,沈广宇 (电子科技大学信息与软件工程学院 成都 610054) 【 摘要 】 提出了一种基于多模态的卷积神经网络对脑部 CT血管造影图像 (CTA)进行分割,从而实现脑血管的单独提取。该方法首先对原始 CTA图像进行高斯和拉普拉斯处理, 并将处理后的图像与原
2、始图像共同构成多模态图像作为输入,然后通过多个并行的卷积神经网络对多模态图像进行分割,最终将所有的分割结果通过线性回归进行融合从而提取出脑血管。该文通过一系列的实验不仅证明了卷积神经网络在脑血管分割上的有效性,而且证明了本文所提出方法的分割效果比现有的脑血管分割算法更加出色。 关 键 词 脑血管分割 ; 血管造影图像 ; 卷积神经网络 ; 多模态 中图分类号 TP315.69; TP181 文献标志码 A doi:10.3969/j.issn.1001-0548.2016.04.010 Research on Brain Vessel Extraction via Multi-Modal Co
3、nvolutional Neural Networks QIN Zhi-guang, CHEN Hao, DING Yi, LAN Tian, CHEN Yuan, and SHEN Guang-yu (Department of Information and Software Engeering, University of Electronic Science and Technology of China Chengdu 610054) Abstract This paper presents a method based on multi-modal convolution neur
4、al networks to segment the brain CT angiography image (CTA) for brain vessel. This method firstly processes the original image by adopting the Gaussian and Laplacian filter, respectively, and constructs the multi model image as the input by combining processed images with the original image together
5、. Next, these multi model images will be respectively segmented through a number of parallel convolutional neural networks. Finally, all the segmentation results are fused by employing the linear regression to extract the brain vessel. By evaluating the experiment with the real data acquired from th
6、e hospital, it can be proved that the convolution neural network is an effective method for segmenting the cerebral vessels. Moreover, the final result shows that our proposed segmenting method is more accurate than the existing algorithms. Key words brain vessel segmentation; computed tomography an
7、giogram; convolutional neural networks; multimodality 收稿日期:2016 05 15 基金项目:国家自然科学基金广东联合基金 (U1401257);国家自然科学基金 (61300090, 61133016);四川省科技厅应用基础计划 (2014JY0172);广东省电子信息产品可靠性技术重点实验室开放基金 (2013A061401003) 作者简介:秦志光 (1956 ),男,博士,教授、博士生导师,主要从事计算机开放系统与网络安全性、信息系统安全、计算机辅助诊断等方面的研究 . 因发病率、致残率、死亡率较高,脑血管病已是严重威胁人类健康、
8、甚至是导致死亡的三大疾病之一。对脑血管病进行早期的诊断和及时的治疗尤为重要:一方面对降低脑血管病的发病率、复发率、致残率和死亡率具有重要的意义,另一方面对脑血管病患者的预后和康复将发挥积极作用。 脑血管的影像学检查方法历来被视为影像学研究的重点之一。而脑血管的提取是影像学检查中最基本且重要的问题。脑部 CT血管造影 (CTA)图像作为一种简单、无创、操作便捷、价格低廉的影像学诊断技术,在脑外科临床上具有广泛的应用。 CTA图像的精确分割不仅能提供对血管不同结构特征的定量描述,还可提取出感兴趣区域进行单独观察,为诊断和治疗提供重要的参考依据。提取的结果也可用于血管的三维重建等其他分析任务中。但是
9、由于受成像噪声、复杂的血管结构、以及成像角度和距离等因素的影响, 血管影像通常表现为低对比度、模糊、血管结构易受噪声和非血管结构干扰而呈现不同的形式。虽然现在图像处理技术的相关理论和方法已经较为成熟, 但是针对脑血管影像分割领域,由于其成像方式和形态的特殊性,尚未存在一种通用的理论和方法。近年来,国内外很多学者在血管分割领域也提出了不少新的理论和方法。目前,针对脑部 CTA图像的分割算法,主要分为 5类:基于主 电 子 科 技 大 学 学 报 第 45 卷 574动轮廓模型、基于追踪的方法、基于神经网络的方法、基于管状物体检测的方法及基于统计学方法。但是这些方法或多或少存在一些问题。如在分割过
10、程中需要人为介入,在分割之前需要先验知识,分割中存在着过分割的情况,分割精确度较低等。因此,本文提出了一种基于多模态的卷积神经网络(convolutional neural network, CNN)对脑血管进行分割。在这里,多模态是指通过一定的方法对原始图像进行处理,从而得到经过处理后的多种模态的图像,并与原始图像一起构成训练模型的输入,为后面的训练模型提供更为丰富的图像细节信息,提升分割或分类的准确率。该方法首先对原始 CTA图像进行高斯和拉普拉斯滤波处理,分别实现对原始图像的平滑和锐化;然后使用并行的卷积神经网络分割处理后的图像与原始图像;最后将分割结果进行融合。经过最后的实验证明,本文
11、所提出的脑血管分割方法比现有的分割算法在分割效果上更加出色。 1 相关工作 1.1 传统分割方法 基于主动轮廓模型: 文献 1运用三维 Snake模型来重建血管造影图的三维管状结构;文献 2运用一种改进的活动轮廓模型,在相位对比扫描法的流量测量过程中进行血管结构的自动分割;文献 3提出了一种基于水平集的方法,该方法使用分布引导水平集去捕捉血管边界;文献 4提出一种自动的水平集方法用于脑部血管分割,通过使用默认参数可以无交互地实现自动分割;文献 5提出一种由模糊血管增强和各向异性的能量权重的组合水平集方法。 基于追踪的分割方法:追踪法即是在图像局部寻找血管特征,并以此为源头,追踪整个血管的过程。
12、文献 6通过寻找灰度脊线来近似估计血管的中心轴线;文献 7运用该方法中所提取的中心点,沿着追踪方向完成了序列图像的血管追踪;文献 8提出了一种基于中介真值程度测量的改进 FCM算法用于医学图像测量;文献 9提出了一种新的血管追踪算法:检测血管中心线、提供一个局部半径的估计、提取血管表面的密集点集。 基于神经网络的分割方法:神经网络一般用来对生物学知识进行仿真,在模式识别领域也被广泛使用。文献 10提出了一种基于 Gabor和不变矩特征的人工神经网络方法用于血管分割; 文献 11提出了一种基于 LBP算子和演化神经网络的血管分割方法;文献 12提出一种新的监督方法用于血管分割,该方法使用神经网络
13、分类策略。 基于管状物体检测的分割方法:这类方法聚焦于如何从图像中提取管状结构。这些方法包括结合轮廓和阴影的广义圆柱模型13、概率图与图分割算法结合14等。文献 15提出了一种基于形状识别的算法用于 DSA图像的血管分割; 文献 16提出了一种使用线状谱分割脑血管和 AV M的方法;文献 17提出了一种基于多方向圆柱模型的通量方法。 基于统计学:统计学的思想是把图像中的各个像素点的灰度值看作是具有一定概率分布的随机变量。文献 18提出了一种新的 Allen-Cahn方程和释然模型,能够以随意的初始化轮廓分割不同类型的造影图像;文献 19提出了一种脑血管分割的新方法,使用基于贝叶斯选择策略的优化
14、过程; 文献 20提出一种自动统计的基于强度的方法分割三维脑血管结构; 文献 21提出一种基于体素强度的概率模型的分类方法,实现了脑血管的三维分割。 1.2 卷积神经网络 卷积神经网络自从在手写字识别中获得巨大成功后22,逐渐开始应用于图像处理中。在 ImageNet比赛中的杰出表现23,表明了卷积神经网络在图像特征提取、图像分类方面拥有杰出的表现。目前,卷积神经网络已广泛用于图像处理中, 文献 24提出了一种基于特征与整体学习的方法,该方法组合了卷积神经网络 (CNN)与随机森林 (RF)两种分类器,CNN作为一个可训练的分层特征提取器, RF作为分类器。通过整合神经网络与传统分类器,该方法
15、可自动学习特征、分类,并且在 DRIVE和 SRARE数据集上均取得了较好的效果。 文献 25提出了一种新的CNN结构,并应用于分割脑肿瘤,在 2013 BRATS数据集上,该结构取得了极好的效果。文献 26提出了一种 U型的 CNN结构,用于生物医学图像分割,在2015 ISBI的数据集上取得了最好的成绩。文献 27提出了一种新的 3DCNN模型用于人体行为识别。文献 28通过组合稀疏自编码器和 3DCNN,构建了一种可根据 MRI序列数据预测阿尔兹海默的方法。总的来说,卷积神经网络能够获取输入和输出的高度非线性表示,不需要预先提取图像特征,并且卷积神经网络不需要对原始数据做过多处理,减少了
16、图像预处理操作,因此本文采用卷积神经网络来分割脑血管。 2 基于多模态 CNN的脑血管提取方法 本文采用了多模态卷积神经网络来分割脑部 第 4期 秦志光,等 : 基于多模态卷积神经网络的脑血管提取方法研究 575 CTA图像。卷积神经网络的一个优势就是输入时只需对原始数据进行简单的处理。但由于原始图像存在许多噪声,导致最后的结果也含有大量的噪声。文献 29说明了将图像进行一系列变换并分别通过平行的 CNN网络能够提高图像的识别率。因此本文通过对原始图像做一系列处理操作,来增强图像中的部分细节,并通过多个平行的 CNN网络来完成脑 血管的分割。 本文所采用的方法总体结构如图 1所示,包括 3个部
17、分,首先是图中的 a部分,将原始图像进行一系列处理来增强图像中的细节部分,其次将处理过的图像同原始图像分别通过训练好的 CNN进行分割,最后如同图中 b部分所示, 将所有的分割结果进行融合。下面将分别进行详细介绍。 原始图像 高斯处理 拉普拉斯 CNNCNNCNN最终结果 结果 2结果 2结果 3ab 原始图像 图 1 总体框图2.1 图像处理 在选取处理方式中, 虽然选择的处理方法越多,获取的图像细节信息就会越多,对最后的结果更有帮助,但考虑到处理方法的增多会增加 CNN模型的训练量,从而导致效率太低,因此,本文只选用了两种处理方式,分别是高斯算子和拉普拉斯算子。 图 2为脑部 CTA原始图
18、像,可以看出原始图像中高斯噪声比较强,有些噪声点的灰度值同血管点的灰度值相同。高斯滤波是一种线性平滑滤波,适用于消除高斯噪声。因此使用高斯滤波器对原始图像进行滤波处理,可便于去除背景的噪声点。本文使用均值为 0、方差为 0.5的高斯算子对图像进行卷积处理。此外图 2展示出的血管中,存在着细微血管结构,本文希望能够将这些细微结构锐化出来,以便于 CNN的分割,因此采用拉普拉斯算子对其进行处理。本文采用如下的 4-邻接拉普拉斯算子对图像进行卷积处理,并将原图像与拉普拉斯处理后的图像相减,以此尽可能地去掉图像的负值。 图 2 脑 CTA原始图像 laplace010141010h = 本文并没有采用
19、在图像增强中常用的做法,即对图像进行高斯平滑后再进行拉普拉斯锐化,这种方法主要的问题在于会导致脑血管的细微结构被平滑掉,因此针对脑血管的分割,本文将两种操作分开,从而突出不同的细节特点。 2.2 CNN结构 将原始图像进行处理后,需要对原始图像和处理后的两种图像所构成的多模态图像分别进行分割。 CNN网络用于分割时,通常是基于图像 patch的分割,即 CNN的输入是一个图像 patch,输出是该图像 patch的中心点类别,通过滑动取 patch的方式完成整个图像的分割。 本文采用的是平行的 CNN来对输入数据进行处理, 每个 CNN都采用相同的结构, 其结构如图 3所示,为 6层网络,包括
20、输入-卷积层 1-下采样层 1-卷积层2-下采样层 2-卷积层 3-分类层-输出。 CNN的输入为 2525大小的 patch,然后经过卷积层 1卷积, 得到 8个特征图, 本文采用 8个大小为 44的卷积核进行卷积,因此卷积后的图像大小为2222;卷积层 1的输出经过 22的平均采样,得到 8个 1111的特征图,之所以采用 pooling层,一方面是因为可减少数据大小,提高处理效率,另一方面是pooling操作能够提高整个 CNN网络的空间不变性;pooling后的特征图经过 16个大小为 44的卷积核卷 电 子 科 技 大 学 学 报 第 45 卷 576积,得到 16个 88大小的特征
21、图,其连接方式类似于LeNet-5中的连接方式,由人为指定;经过卷积层 2处理的特征图再经过 22大小的平均采样,得到 16个 44大小的特征图;再经过 20个 44大小的卷积核卷积,得到 20个 11大小的特征图,其连接方式采用全连接的方式,即每个卷积核卷积所有的特征图;最后将 20个 11大小的特征图作为特征向量, 通过分类层进行分类并输出。 Conv1 Pooling1 Conv1 Pooling2 Conv3 Logistics44 8222242 8111144168*822 2011 222525 图 3 CNN结构图 其中所有卷积层的激活函数采用的是 softplus函数: (
22、) log(1 e )xx =+ 传统的激活函数有 sigmoid函数和 tanh函数,但这两种函数随着训练次数的增加,会出现梯度消失的问题,而 Relu解决了这个问题,并且 Relu收敛速度更快。 Relu所用的激活函数为: ( ) max(0, )x x= 该函数在 x=0时不可导,因此本文使用了 Relu的近似表达,即 softplus函数。 在图像识别中,由于需要进行多分类,因此常用的是 softmax分类器,但由于本实验是针对血管分割,中心点只有血管或非血管两种类别,因此本文采用 logistics分类器。 Logistics分类器采用 sigmoid函数作为假设函数,因此分类器层的
23、激活函数采用sigmoid函数作为激活函数。此外,该网络的损失函数为: ( ) log (1 )log(1 )niiiJypyp =+式中, p为训练样本输出结果; y为训练样本的标识;N为样本数。 2.3 CNN初始化及训练 本文使用的 CNN都采用相同的结构,因此所有的 CNN都使用相同的参数进行初始化,参数的初始化为主要为卷积核的初始化和 logistics分类层的初始化,此外还有卷积层和分类层的偏置初始化。所有的卷积核采用高斯分布 N(0,0.4)进行初始化,logistics分类层则使用高斯分布 N(0,0.2)进行初始化。此外,所有的偏置设置为零。 训练 CNN网络最常用的方法是随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多模态 卷积 神经网络 脑血管 提取 方法 研究 秦志光
限制150内