基于场景模式的立体图像舒适度客观评价模型-应宏微.pdf
《基于场景模式的立体图像舒适度客观评价模型-应宏微.pdf》由会员分享,可在线阅读,更多相关《基于场景模式的立体图像舒适度客观评价模型-应宏微.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 38 卷第 2 期 电 子 与 信 息 学 报 Vol . 38No.2 2016 年 2 月 Journal of Electronics & Information Technology Feb. 2016 基于场景模式的立体图像舒适度客观评价模型 应宏微蒋刚毅*郁 梅彭宗举邵 枫(宁波大学信息科学与工程学院 宁波 315211) (宁波工程学院电子与信息工程学院 宁波 315211) (南京大学计算机软件新技术国家重点实验室 南京 210093) 摘 要:为了预测双目立体图像内容对视觉健康可能产生的危害, 该文提出一种基于场景模式的立体图像舒适度客观评价模型。根据场景中前景目标和后景
2、区域相对于显示屏幕的凹凸性以及是否处于舒适观看区, 将自然场景抽象为多种场景模式。在模式选择阶段,从视差图中自适应分割出前景目标和后景区域,根据前、后景的视差角特征确定场景所属的模式;在建模阶段,采用前、后景的视差角特征结合前景的宽度角和曲折度特征对各个场景模式分别进行建模,并量化了前、后景视差因素对视觉舒适度的影响。在 IVY 数据库上的实验结果表明,所提出的模型与主观感知存在较好的一致性, Pearson相关系数高于 0.91, Spearman相关系数高于 0.90, Kendall相关系数高于 0.74,平均绝对值误差低于 0.24, 均方根误差低于 0.32,与现有的方法相比,该文所
3、提出的模型的评价效果更好,更接近于主观测试结果。 关键词:立体图像;舒适度评价;场景模式;双目视觉 中图分类号: TN919. 81 文献标识码: A 文章编号:1009-5896(2016)02-0294-09 DOI: 10.11999/JEIT150267 Objective Visual Comfort Assessment Model of Stereo Image Based on Scene Mode YING HongweiJIANG GangyiYU MeiPENG ZongjuSHAO Feng(Faculty of Information Science and Engi
4、neering, Ningbo University, Ningbo 315211, China) (School of Electronic and Information Engineering, Ningbo University of Technology, Ningbo 315211, China) (State Key Laboratory for Novel Software Technology at Nanjing University, Nanjing 210093, China) Abstract: To predict the effects induced by st
5、ereo image content on visual health, a new objective Visual Comfort Assessment (VCA) method of stereo image is proposed based on scene modes. Natural scene is abstracted as multiple scene modes according to two position states of foreground object and background region. One is the convex-concave to
6、screen, and the other is the whether locate on zone of comfortable viewing. In the process of mode selection, disparity map is utilized to segment scene into foreground object and background region adaptively. Then, the scenes mode can be determined by disparity angle features of both foreground obj
7、ect and background region. In the modeling stage, disparity angle features of foreground object and background region, width angle and sinuosity features of foreground object are utilized to build objective VCA models in various scene modes. The experimental results tested on IVY database show that
8、high consistency exists between the proposed model and subjective perception that Pearson linear correlation coefficient is higher than 0.91, Spearman rank-order correlation coefficient is higher than 0.90, Kendall rank-order correlation coefficient is higher than 0.74, Mean Absolute Error (MAE) is
9、lower than 0.24 and Root Mean Squared Error (RMSE) is lower than 0.32. Compared with other existing methods, the proposed model has the better assessment performance and is much closer to the subjective assessment scores. Key words: Stereo image; Visual comfort assessment; Scene mode; Binocular visi
10、on 1 引言近几年来,以 3D 电影、 3D 游戏为代表的 3D收稿日期: 2015-03-04; 改回日期: 2015-11-18;网络出版: 2016-01-04 *通信作者:蒋刚毅 基金项目:国家自然科学基金(U1301257 , 61171163, 61271270, 61271021, 61311140262),宁波市自然科学基金(2013A610113) Foundation Items: The National Natural Science Foundation of China (U1301257, 61171163, 61271270, 61271021, 61311
11、140262), Natural Science Foundation of Ningbo (2013A610113) 文化产业所产生的巨大需求,带动了立体视觉相关产品的飞速发展,使用户得到了全新的视觉体验1,2。但由于人眼视觉机制、 3D 内容、显示器参数、观看条件等原因,人们在观看 3D 节目后会产生诸如眼疲劳、头痛、恶心等生理上的不舒适感3,从而限制了 3D 图像 /视频系统的广泛应用。为了改善这个问题, 3D 产业发展需要舒适度评价体系以指导 3D 内容制作、后期处理等方面的工作,此时视觉舒适度第 2 期 应宏微等: 基于场景模式的立体图像舒适度客观评价模型 295 评价( Visua
12、l Comfort Assessment, VCA)就引起人们的关注4。 立体图像引起不舒适的原因有许多,从人的生理线索来说,视差是产生深度感知的主要途径5,但由于人眼观看立体景物时存在的“调节”(accommodation)与“会聚”( 辐辏,vergence) 的矛盾机制,过大的视差也是引起双目无法融合,导致视觉疲劳的主要因素6。宽度因素也是一种对舒适度影响较大的特征,文献 7,8发现,在视差因素固定的情况下,双目融合 限制和目标宽度因素呈现为一种线性关系,宽度越小,融合限制越强,越容易引起不舒适感。此外,图像的空间频率特征会对双目融合产生影响9,10,随着频率下降、双目融合限制会放松。文
13、献1 1发现对图像进行模糊或者锐化会影响视觉舒适度,当视差超过双目融合限制时,如果空间频率较低,主观实验受试者中感到不舒适的人数相对较少。文献1 2的主观实验表明,立体图像低空间频率所致的模糊可以增加观看舒适度。 就立体图像舒适度的客观评价,文献 13提出了基于加权最大视差、相对视差和目标宽度特征(WMX+RD+OT)的立体图像舒适度评价方法,使用 M5P 回归树算法建立客观评价模型,文献 8设计了主观实验研究了前景目标的视差因素及 宽度因素与舒适度的关系,提出了基于前景目标视差角和宽度角特征的舒适度客观评价模型(D +W)。文献1 4提出一种基于视觉重要区域的立体图像舒适度客观评价模型,首先
14、利用 2 维图像显著图和视差图像得到立体图像视觉重要区域,然后提取视觉重要区域的视差幅度特征、视差梯度边缘特征以及空间频率特征,并 建立特征信息与平均主观评分值的关系。以上模型在 韩国先进科学技术院(Korea Advanced Institute of Science and Technology)的图像和视频系统实验室提供的立体图像数据库15(IVY)上 进行测试,都取得了较好的性能。其中文献1 3所使用的相对视差特征和文献 12所使用的视差梯度边缘特征隐含了立体图像局部区域的前、后景视差信息,所得到模型的性能较文献 8更好。 本文根据场景中前景目标和后景区域的深度设计了多种场景模式,在每
15、种场景模式下分别建立舒适度客观评价模型,所提出的模型组能更精确地反映视差对视觉舒适度感知的影响,实验结果显示提高了自然立体图像视觉舒适度的评价性能。 2 场景模式的分类 在文献 8主观实验所布置的场景仅为一种模式:前景目标凸出于屏幕,视差类型为交叉视差;后景区域为屏幕,视差为 0。所提出的 D+W 模型反映了前景目标的视差和宽度对视觉舒适度的影响,若该模型以 5 分制表示,则如式(1)所示: VC( , ) 4.2028 0.7084 0.1912 ln( )0.0208 ln( )DW D WDW (1) 其中 0.50 2.00D, 0.25 4.00W。 D 和 W分别表示前景目标的视差
16、角和宽度角, VC( , )DW 是舒适度评价值。 D 的取值范围为 0.50 ,2.00 ,这是因为当 D 小于 0.50时,前景目标处于舒适区内,难以产生不舒适感;当 D 大于 2.00时,许多受试者出现了不舒适的“复视”现象。因此可认为如果 D 处于 0.50 ,2.00 范围之外,则前景目标宽度因素对舒适度的影响不大。宽度角 W 的取值范围为 0.25 ,4.00 ,固定 D 时,舒适度会随着 W 的增大而上升,当 W 超出取值范围时,人眼的舒适感变化很小。 但在 IVY 数据库中,许多自然立体图像的前景目标超过了式(1)的视差限制,背景区域也并非固定于屏幕。用均方根误差(Root M
17、ean Squared Error, RMSE)和平均绝对值 误差( Mean Absolute Error, MAE)来度量该模型的误差,如果仅测试满足 D 0.50 ,2.00 的立体图像,得到 RMSE 0.347 , MAE 0.266 ;如果测试 IVY 数据库中所有的立体图像,得到 RMSE 0.450 , MAE 0.332 ,即误差上升。这说明当 D+W 模型面对更复杂的场景时,评价性能会有所下降。 真实的场景中通常存在多个目标物体,由于深度位置上的差异,它们对视觉舒适度的影响并不相同。为了简化研究,根据立体显示器场景中各立体内容的深度,可将它们抽象为前景目标、后景区域和显示器
18、屏幕 3 部分。人眼对场景中不同深度目标的关注度是不相同的,一般而言, 距观看者较近的前景目标所获得的关注度较高,对舒适度感知的影响较大16,后景区域则相对较小。同时,若前景目标离人眼太近或后景区域离人眼太远,超过了双目的潘诺融合限制(Panum s fusion limit),都会引起不舒适感。因此为得到性能较佳的舒适度模型,须分析不同深度位置的立体内容对人眼舒适度感知的影响程度。本文提出根据前、后景相对于屏幕的凹凸性以及是否处于舒适区( Zone of Comfortable Viewing, ZCV)17,将立体显示器所显示的自然场景分为 10 种模式,如图 1 所示。 双 目调节和会聚
19、矛盾是影响立体图像舒适度的生理机制。调节双目的实际对焦距离即为“调节”,当双目观看某一景物时,睫状肌会自动的调节晶状体的屈光力,使景物发出的光线能落于视网膜的中央凹处,确保成像清晰。与此同时,双目的视轴也 296 电 子 与 信 息 学 报 第 38 卷 图 1 立体显示器所显示的自然场景的分类 要转向内侧,使视轴均朝向被注视的景物,这种现象称为“会聚”。在观看自然世界时,人眼的调节和会聚是相互协作联合运动的,焦点的调节始终跟随着会聚的变化,二者是一致的。然而在观看人工制作的立体影像时,由于调节的距离即是眼睛到立体显示屏的距离,而会聚的距离则是人眼到显示于屏幕前方或后方的景物的距离,两者距离不
20、一致,就会产生冲突。 视差角体现了双目调节和会聚的矛盾,根据文献 18定义的视差角特征,定义 k 为调节角, f 和 b 分别是前景和背景的会聚角,则前景目标的视差角af为 af kf (2) 后景区域的视差角ab 为 ab kb (3) 当视差角绝对值大于 1时,通常双目将无法融第 2 期 应宏微等: 基于场景模式的立体图像舒适度客观评价模型 297 合,会产生“复视”等不舒适感,因此将视差角绝对值小于 1的区域称为舒适区域,如图 1 中两条虚线内的区域所示,虚线外的则为非舒适区域17。 采用 IVY 数据库作为立体图像样本数据集合。由于该数据库中所有立体图像的后景视差角绝对值均小于 1,即
21、都处于舒适区内,而场景模式 10 仅有1 幅图像,因此本文仅对 4, 5, 8, 9 这 4 类模式展开研究。 3 提出的视觉舒适度评价方法 为得到性能更优的视觉舒适度评价方法,本文对 4 类场景模式分别建立了视觉舒适度模型。首先提取影响视觉舒适度的特征,然后对文献8 的D+W 模型进行扩展,添加前景目标的曲折度衰减系数,建立了各场景模式下的模型,还得到了每种场景下前、后景对视觉舒适度影响力的量化结果。本文提出的视觉舒适度评价方法的 框架如图 2 所示。 图 2 所提出的视觉舒适度评价方法框架 3.1 模型的特征提取 IVY 数据库使用深度估计软件(Depth Estimation Refer
22、ence Software, DERS)19获得右视点的视差图像。统计视差图像的灰度直方图,使用最大类间方差法(OTSU) 对视差直方图进行自适应分割,得到前景区域和后景区域, 视前景区域中各连通域为前景目标。计算出各前景目标的平均视差幅值 F 、后景区域的平均视差幅值 B ,结合人眼到显示器的距离 h 、瞳距 p 、显示器宽度 L 、水平分辨率 N 等先验知识,以图 3 所示的视差角几何示意图为例,可得以式(4) 式 (6)所示的前景会聚角 f ,后景会聚角 b ,调节角 k 。 图 3 视差角几何示意图 /2 arctan2p FLNfh (4) /2 arctan2p BLNbh (5)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 场景 模式 立体 图像 舒适 客观 评价 模型 应宏微
限制150内