基于多核相关性挖掘的跨媒体检索研究-张文平.pdf





《基于多核相关性挖掘的跨媒体检索研究-张文平.pdf》由会员分享,可在线阅读,更多相关《基于多核相关性挖掘的跨媒体检索研究-张文平.pdf(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、!lllJllllIltflll JJIIllllf1lJIllflffllJI JllllIfY321 9308分类号工盟!14学校代码1 0 4 8 8学号型!j:坚!蝰!密级烈蓬弄峰拨夫哮硕士学位论文基于多核;:嗣关性挖掘的跨媒体检索研究学位申请人: 张文平学科专业: 一墼件王整 一一指孕教师: 张鸿答辩日期: 一20170514万方数据A Dissertation Submitted in Partial Fulfillment of the Requirementsfor the Degree of Master in EngineeringResearch on Multiple
2、Kernel CorrelationMining for Cross-Media RetrievalMaster Candidate: WenPing ZhangMajor: -Supervisor:Software EngineeringProfZhangWuhan University of Science and TechnologyWuhan,Hubei 430081,PRChinaMay,2017万方数据蔑汉辩授大攀研究生学僦论文创凝性声明零大郑羹声骥:所璺交熬攀位论文楚本久在器缚攒簿下,独立进行磷究掰取褥的成祭群除了文牵既经渡鲷弓鼹羽内容壤褥会裕婿究蘩圊蹇威豹互俺努,本论文苓链禽链
3、何其德个入藏集体愁缀发囊壤撰黪过的佟赫畿爨。对本文的研究徽魄爨簧烫献酶个人翔缀锩,均跫巍文巾以鹱确方式搽稠尊申请学位论文岛潦辩蔫有不安之缝,本入承担一协翱美责任。疆究璧学位论文版粳使鼹授权声暖本谂文的研宠残暴归武汉科技大学所有,其研究蠹容不褥竣其它攀德的名义发滏。本人宠垒了解武汉科技犬攀露哭僳辫、使爝攀链谂文豹规定,溺慈学校僚蘩势翔寮荚部门按照藏波科技大学关予研究爱攀傻论文收添工作鼹藏定执簿)送交论文憋复印糌鞠激予敝本,兔资论文羧浚阂窝徽阕,鬻意渗校将零谂文韵垒部躐潞分国容壤入攀校歆诳豹疆家棚荚数掭摩避符羧索秘瓣终服务。论文襻纛螯名:攒簿毅耀蓊镐:万方数据摘要在互联网+时代,网络已成为人们日常
4、生活的常用信息获取渠道,网络上的多媒体数据呈现出爆炸式的增长,人们对信息的检索需求也日益增加,传统单一模式的多媒体检索己不能满足人们的需求。跨媒体检索正是在这种技术环境和数据需求的情况下被提出,并迅速成为计算机视觉和信息检索领域的研究热点。跨媒体检索来源于基于内容的多媒体检索研究。基于内容的多媒体检索大都是针对单一类型的多媒体数据,不支持多种类型数据间的跨越,而跨媒体检索的目标是综合处理多种类型的多媒体数据,形成对多媒体语义的整体理解,实现不同类型数据的综合检索。如何挖掘不同类型数据之间的内在联系,进而计算跨媒体数据间的相似度,是跨媒体检索要解决的关键问题。本文以典型相关性分析为基础,在保留不
5、同类型数据间的相关性的同时,将异构的特征映射至同构子空间中,使得异构特征具有了可比性。在此基础上,针对典型相关性分析对线性关系的依赖以及单核方法的缺点,提出基于多核相关性挖掘的跨媒体检索方法。在实验结果的分析中,采用查准率和查全率作为评价指标,验证了基于多核相关性挖掘的跨媒体检索方法的有效性和优越性,其跨媒体检索结果的准确率高于对比实验中传统的跨媒体检索方法。关键词:跨媒体检索;典型相关性分析;核函数;多核方法万方数据AbstractIn the era of Intemet plus,the network has become a common source ofinformation f
6、or peopleS daily lifeThe multidedia data on the network shows anexplosive growth,and peopleS demand for information is also increasingHowever,the traditional single mode of multimedia retrieval has been unable to meet the needsof peopleCrossmedia retrieval has been proposed in the context of this te
7、chnicalenvironment and data requirements,and has rapidly become a research hotspot in thefield of computer vision and information retrievalCrossmedia retrieval is based on the contentbased multimedia retrievalHoweveL the contentbased multimedia retrieval is mostly for single type ofmultimedia data,d
8、oes not support the mutual retrieval between a varity of types ofmultimedia dataBut the goal of crossmedia retrieval is to deal with various types ofmultimedia data,to form a comprehensive understanding of multimedia semantics,andto smoothly retrieval differents types of multimedia dataA key issue t
9、o be solved incrossmedia retrieval is that how to explore the internal relationship between differenttypes of data,and then to calculate the similarity between cross-media dataIn thispaper,based on Canonical Correlation Analysis,the underlying heterogeneity featuresare mapped to the new isomorphic s
10、ubspace,while the correlation between differenttypes of multimedia data is been maximumly reservedSimilarity of different types ofmultimedia data are comparable in this subspaceOn the basis of this,we proposes amethod of canonical correlation analysis based on multi kernel function to solve theprobl
11、em of the dependence of canonical correlation analysis on data linearity and thedifficulty of choosing kemel functionIn the evaluation of the experimental results,we use precision and recall as theevaluating indicatorExperimental results show that this method can not only achievegood performance,but
12、 also the accuracy is higher than other traditional cross-mediaretrieval algorithmsKeywords:crossmedia retrieval;canonical correlation analysis;kernel function;multi kernel functionII万方数据目 录摘 要一IABSTRACTII第1章绪论l11研究背景与意义112国内外研究现状213本文的主要工作314本文的结构安排421基于内容的多媒体检索522跨媒体检索7221跨媒体检索的定义7222跨媒体检索特性723跨媒体
13、检索相关研究8231跨媒体检索研究的挑战8232跨媒体检索研究的方法824本章小结9第3章 异构特征间的典型相关性学习1031视听觉特征的提取与预处理10311图像特征的提取lO312音频特征的提取13313特征归一化15314 PCA降维一1632不同特征间的相关性分析17321典型相关性分析17322图像特征和音频特征之间的典型相关性分析18323子空间相似度计算一19324本方法的优缺点分析20111万方数据33本章小结20第4章基于多核相关性挖掘的跨媒体检索2l41核函数2l411核函数的定义21412核函数的分类2l42基于核函数的典型相关性分析2243多核学习方法一2444基于多核
14、相关性挖掘的跨媒体检索一2545本章小结27第5章实验结果和对比分析2851整体框架和流程2852跨媒体数据库2853实验结果对比与分析29531性能评价标准29532跨媒体检索结果对比分析3054本章小结一33第6章总结与展望3561总结3562展望36致谢37参考文献38附录1攻读硕士学位期间发表的论文41附录2攻读硕士学位期间参加的科研项目42IV万方数据武汉科技大学硕士学位论文11研究背景与意义第1章绪论在互联网+时代,计算机和互联网得到了极大的普及,网络已经成为人们日常生活中获取信息最主要的渠道,网络上的信息资源不仅数量上呈现出爆炸式的增加趋势,而且承载这些信息的载体形式也呈现出多样
15、化的趋势,如文本、图形图像、音视频和多维模型等,正在变得丰富多样化。多媒体信息已经从单一的文本表达发展为文本、图像和音视频等更加多样化的表达,这些不同形式的信息载体可以从不同角度对同一种多媒体语义进行描述。多媒体数据数量增长的海量化和信息载体形式的多样化,使得人们不仅对信息的检索需求日益增加,还对检索结果类型的多样化也有所需求。同时,科学研究表明,同时接收视觉、听觉等不同感觉器官提供的信息会让大脑更加活跃,更好地理解外部事物。所以,跨媒体检索在现实生活中有着很高的理论研究意义和实际应用意义,并且自提出以来已经迅速成为多媒体检索领域中的一个研究热点。基于文本的多媒体检索技术【11,是先对多媒体资
16、源建立关键词等文本描述信息,然后通过关键词匹配检索出人们所需资源的一种技术。然而随着多媒体资源的急速增多和多样化,这种方式已经越来越不能适应网络信息检索的要求了,不仅费时费力,而且人工标注的关键字信息的过程带有很强的主观性,难以完全准确地反应多媒体所要表达的信息内容,最终导致差强人意的检索结果。二十世纪六十年代,在图像检索领域,研究学者首先提出了基于内容检索的技术【2J,并由此衍生出基于内容的文本、音频、视频等检索技术f3】【41。基于内容的多媒体检索技术克服了费时费力和带有主观性的缺点,在确定了特征提取算法后,它可以在无人工干预的情况下由计算机直接对多媒体的内容进行分析,提取所需特征,这些内
17、容特征可以用来度量多媒体之间的相似度。利用内容特征计算多媒体之间的相似性,并以相似性为依据进行检索,大大提高了海量数据库的检索速度,并且在人工标注的情况下检索结果也具有很强的客观性。常用的特征有,图像的颜色、纹理和形状等;视频的镜头、场景和镜头的运动等;声音中的音调,响度,音色等。虽然基于内容的多媒体检索技术取得了很大的进步,但是也有其不足之处,它主要针对的是单模态检索,是对类型单一的多媒体数据库进行检索。然而,互联网上信息的载体形式越来越多样化,这些不同类型多媒体数据更加紧密混合在一起,共同描述着某种语义,如何实现这些不同数据间的相互检索已经成为一个前沿的研究课题。万方数据武汉科技大学硕士学
18、位论文一祷媒体检索,是用某一种或多种多媒体类型为检索实例,检索出具有相同语义而信息载体形式不同的多媒体文件的一种新兴技术,它使多媒体检索技术从只能在单一媒体类型中进行检索的检索形式,变成了能在各种媒体类型中进行相互检索的新形式。12国内外研究现状互联网多媒体数据数量增长的海量化和信息载体形式的多样化,以及人们对检索结果的多样化需求,促进了跨媒体检索的研究的提出和发展,跨媒体检索是一个比较新的研究方向。跨媒体检索在提出后,迅速吸引了很多国内外学者的关注和研究,也有不少的研究成果在国内外得到了发表。国内最早于2005年提出跨媒体检索,是复旦大学薛向阳的论文【5J,该文简要分析了跨媒体检索与传统检索
19、之间的关系与区别,提出了跨媒体检索的基本概念。随后,国内的研究机构和学者,以及相关的研究成果逐年递增。文献6】就图片和文本之间的跨媒体检索展开了研究,提出了基于潜语义主题加强的跨媒体检索算法(LSTR),先是利用LDA模型构造文本语义空间和以词袋模型来描述图像;然后对图像和文本进行分类,用得到的的后验概率表示文本和图像的潜语义主题;最后利用文本潜语义主题去正则化图像的潜语义主题,加强图像的潜语义的同时最大化文本和图像之间的语义关联;文献7就地理标注图片和文本之间的跨媒体问题进行了研究,提出的面向地理标注图片和文本的跨媒体表示模型。此外,国家自然科学基金发布的“视听觉信息的认知计算”研究计划项目
20、指南中也关注了跨媒体检索这一研究问题,而且越来越多的以“跨媒体相关研究”作为课题的国家自然科学基金项目获得了立项,其中浙江大学和中科院自动化研究所获得了最多的立项项目,它们也都是国内比较早开始关注跨媒体检索的机构。跨媒体检索研究课题在国外同样吸引了不少研究者进行研究。2004年,Lux、Granitzer和Kienreich(8】在首个关于跨媒体检索技术的论文中详细阐述了相关的概念。随后,在计算机、互联网和多媒体等权威国际会议上,越来越多跨媒体检索的相关研究成果得到了发表,也吸引了越来越多学者的目光。文献【9提出了一种可以自动学习潜在的语义词汇、以数据为驱动的跨媒体检索方法,自动从多媒体收藏中
21、发现词汇概念及其注释,而不需要人工标注;文献10】提出了一种应用于个人媒体的跨媒体检索方法,它主要是基于Ontology的。传媒一体化与合作化是未来信息发展的趋势和方向,跨媒体传播正是这种趋势和方向的外部表象。许多传媒行业的巨头,如国外的BBC、新闻集团(NewsCorporation)、时代华纳(Time Warner Inc)矛n国内的上海广播电视(SMG)等,它们是跨媒体传播最早的实践者和受益者。上海广播电视经过几年的网络化和数字化改2万方数据武汉科技大学硕士学位论文造,已经建成了广播媒资系统、信息管理系统、图书图片管理系统等一系列管理系统。经过几年的使用,人们发现不同的内容要通过不同的
22、系统进行查找,比较繁琐。于是,SMG又进行建设,为所有系统提供了统一的检索入口。这样不仅整合了资源,提高了检索效率,也方便了内容和信息的查询【111。本文以典型相关性分析为基础,在分析了典型相关性分析算法和核典型相关性分析算法的缺点后提出了基于多核相关性挖掘的跨媒体检索研究算法,不仅克服了典型相关性对数据的线性关系有依赖的缺点,还进一步对核典型相关性分析作了优化,解决了核函数和核函数参数选择困难的问题,消除了单核方法导致的局限性,适用性不是很强的缺点。本文算法整体表现更优,适用性更广,更灵活,检索结果的准确度也更高。13本文的主要工作本文主要就如何在异构的图像视觉特征和音频听觉特征之间实现跨媒
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多核 相关性 挖掘 媒体 检索 研究 张文平

限制150内