智能检索技术在媒体资产管理系统中的研究与实现.pdf
《智能检索技术在媒体资产管理系统中的研究与实现.pdf》由会员分享,可在线阅读,更多相关《智能检索技术在媒体资产管理系统中的研究与实现.pdf(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、山东轻工业学院硕士学位论文智能检索技术在媒体资产管理系统中的研究与实现姓名:孙利涛申请学位级别:硕士专业:计算机应用技术指导教师:顾卫东20080505山东轻T 业学院硕士学位论文摘要随着数字存储技术和多媒体技术的发展,对海量的音视频资料进行存储、管理、检索和再利用成了摆在人们面前一个严峻的课题。媒体资产管理系统中的智能化检索技术克服了传统文本检索的缺陷,成为当前的一个研究热点。本文从媒体资产管理系统对智能化检索的要求出发,系统的研究了数字图像底层特征提取、视频镜头切割、关键帧提取、视频场景合成(视频镜头聚类)以及基于模糊集的模糊聚类分析等方面的内容。对子视频镜头切割,本文采用了基予全局的直方
2、匿的方法。在视频镜头分割的基础上,需要对镜头抽取关键帧来表征视频镜头。常见的关键帧的选取算法,有的选取的关键帧的数目固定,不能完全反映视频镜头内容的变化;有的则存在关键帧选取过多的缺点。本文利用信息论中熵的含义,设计了一种基于图像灰度熵的关键帧提取算法,试验证明浚算法能够克服传统的基于内容分析的关键帧提取算法中存在的关键帧提取过多的缺点,同时又能根据镜头内容的变化保留合适数目的关键帧。关键帧仅仅反映了一个镜头的内容。单个的视频镜头往往不簏完备的反映视频的语义信息,因此需要在视频镜头的基础上合成更高层次的视频单元,从而建立以场景为单位的语义表示级视频结构。本文研究了常见的聚类算法,|司时利用模糊
3、数学为理论工具,设计了种基于模糊聚类的视频语义分析算法,该算法能够提供不同精度的聚类输出。关键词:媒体资产管理;智能检索;视频镜头分割;关键帧;模糊聚类A B S T R A C TA B S T R A C TW i t ht h ed e v e l o p m e n to fd i g i t a ls t o r a g et e c h n o l o g ya n dm u l t i m e d i at e c h n o l o g y,t h ed a t as t o r a g e,m a n a g e m e n t,r e t r i e v a la n dr
4、 e u s ea b o u taf l o o do fa u d i oa n dv i d e oh a sb e c o m eas e r i o u si s s u e T h ei n t e l l i g e n tr e t r i e v a lt e c h n o l o g yo fM e d i aA s s e tM a n a g e m e n ts y s t e mo v e r c o m et h es h o r t c o m i n g so ft r a d i t i o n a lt e x tr e t r i e v a l,a
5、n db e c o m ear e s e a r c hf o c u s I nt h i sp a p e r,t h em e d i ac a p i t a lo fi n t e l l i g e n tr e t r i e v a ls y s t e mr e q u i r e m e n t so ft h es y s t e mo nt h eg r o u n df l o o ro ft h ed i g i t a li m a g ef e a t u r ee x t r a c t i o n,v i d e oc a m e r ac u t t
6、i n g,ak e yf r a m ee x t r a c t i o na n dv i d e os c e n e so f(v i d e oc a m e r ac l u s t e r i n g),a n db a s e do nf u z z ys e t so ff u z z yc l u s t e r i n ga n a l y s i s C u t t i n gt h ev i d e oc a m e r a,t h ep a p e ri sb a s e do nt h eo v e r a l lh i s t o g r a mm e t h
7、 o d I nv i d e os h o td e t e c t i o no nt h eb a s i so fv i d e ok e yf r a m ee x t r a c t i o nt h r o u g ht h el e n sc h a r a c t e r i z e dv i d e oc a m e r a C o m m o nk e yf r a m es e l e c t i o na l g o r i t h m,a n ds o m es e l e c t e dk e yf r a m et h en u m b e ro ff i x
8、e dv i d e oc a m e r ac a nn o tf u l l yr e f l e c tt h ec h a n g e si nt h ec o n t e n t,w h i l et h e r ea r es o m ek e yf l a m es e l e c t i o nt o om a n ys h o r t c o m i n g s B yu s i n gi n f o r m a t i o nt h e o r y,t h em e a n i n go ft h ee n t r o p y,d e s i g n,w h i c hi
9、sb a s e do ng r a y。s c a l ei m a g ee n t r o p yk e yf r a m ee x t r a c t i o na l g o r i t h ma n dT e s ts h o w st h a tt h ea l g o r i t h mw i l lb ea b l et oo v e r c o m et h et r a d i t i o n a lc o n t e n t b a s e da n a l y s i so ft h ek e yf l a m ee x t r a c t i o na l g o
10、r i t h mi nt h ek e yf l a m ee x t r a c t i o nt o om a n ys h o r t c o m i n g s,w h i l et h ec o n t e n t so ft h el e n si na c c o r d a n c ew i t ht h ea p p r o p r i a t en u m b e ro fc h a n g e st or e t a i nk e yf l a m e K e yf l a m er e f l e c t so n l yt h ec o n t e n t so f
11、as c e n e As i n g l ev i d e oc a m e r ao f t e nd on o tr e f l e c tt h ec o m p l e t ev i d e os e m a n t i ci n f o r m a t i o n,t h e r e f o r e,r e q u i r e st h el e n so nt h eb a s i so fah i g h e rl e v e lo fv i d e ou n i tt oe s t a b l i s hau n i tf o rt h es c e n es a i dt
12、h es e m a n t i cl e v e lv i d e os t r u c t u r e T h i sp a p e rs t u d i e st h ec o m m o nc l u s t e r i n ga l g o r i t h m,a n du s i n gf u z z ym a t ht h e o r yt o o l s,ad e s i g nb a s e do nf u z z yc l u s t e r i n gv i d e os e m a n t i ca n a l y s i sa l g o r i t h m s T
13、h ea l g o r i t h mc a np r o v i d ed i f f e r e n tc l u s t e r i n ga c c u r a c yo ft h eo u t p u t K e y w o r d s:M e d i aA s s e tM a n a g e m e n t,I n t e l l i g e n tI n f o r m a t i o nR e t r i e v a l,V i d e oS h o tD e t e c t i o n,K e yF r a m e,F u z z yC l u s t e r i n g
14、I I学位论文独创性声明本人声明,所呈交的学位论文系在导师指导下本人独立完成的研究成果。文中引用他人的成果,均已做出明确标注鼓得到许可。论文内容未包含法律意义上已属于他人的任何形式的研究成果,也不包含本人己用于其他学位申请的论文或成果,与我一闻工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文知识产权权属声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属山东轻工业学院。由东轻工监学院享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权利,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,本人离校后发表或使用学位论文或与该论文直接褶关的学术论
15、文或成果时,署名单位仍然为山东轻工业学院。论文侔者签名:銎二丕l 缉隰丝巫年五月丝日导师签名:山东轻工业学院硕十学位论文第1 章绪论1 1 引言随着数字化时代的到来和多媒体技术的发展,电视螽和音像资料馆积累了海量的音视频素材,尤其是那些时代久远具有历史价值的素材,更是成为电视台等所有者宝贵的财富。如何对这些海量的音视频资料进行存储、管理、检索和再利用就变成了一个棘手的问题。传统的方法是将记录有内容的录像带羹占上标签,存放于带库架子上。等需要时,再根据标签上的内容进行相应的查找。媒体资产管理(M e d i aA s s e tM a n a g e m e n t)系统H 五引,正是针对这一麓
16、题提高的一整套解决方案,是套完整的数字媒体资产存储、管理、发布的解决方案。(1)构建媒体资产管理系统所要解决的现实问题瞄前大多数电视台的节目资料基本还是以模拟形式保留在磁带上,因此遇到很多闯题。资料保存寿命受到制约。原因l:由模拟录像带本身的缺陷造成。模拟录像带由于不可避免磁粉脱落,其寿命与使用的次数成反比。越是重要的节目,保存时闻反而越短。由于使用中对录像带的损坏程度是无法量他的,所以无法精确的估计录像带的真正寿命。原因2:由录像带播放设备的更新换代造成。目前许多电视台在设备升级换代的同时,还不得不保留一些老式录像机读取老式磁带上的信息。资料检索困难。在现有节目存储系统查找素材主要分两步,一
17、是要首先找到存储相关节舀的录像带,然艏再从录像带中找到相应的信息。为了制作一个新的节豳,通常需要从几十盘录像带中截耿片段。找到了所需要的录像带,只是完成了检索工作量的2 0,然焉就需要顺序查找每盘录像带的节冒片段,通常一个小时的录像带上有用的节目只有几十秒。由于有用的节网片段可能在录像带的任何位置,为了找到这个片段所需要的平均时闻在理论上应该是录像带总长度的一半,但实际上用户经常需要反复查找、比较之后才能找到有用的片段,所以实际上找到这片段所需要的时间经常是录像带总长度的一点五至两倍。资料共攀不方便。目前电视台现实音视频信息的共享途径主要有两种:使用最多的是借用录像带,这是最不可取的一种方式,
18、因为每个用户在一段时间内需要独占地使用他们新借阅的录像带,褥且录像带每借阕一次,寿命都会缩短。另外种方式是复制录像带,这种方式的优点是可以多个人同时使用,而且可以延长录像节冒的寿命,这还是隧前不同的电视台之闽交流录像节躁的主要方式。(2)电视台媒体资产管理的特点电视台的主要业务是节目生产,因此音视频信息是电视媒体信息的最主要部第l 章绪论分,当然还包括文稿、解说词、图片、拍摄脚本、编目信息等。保存价值高。音视频信息是用来记录重大事件和人物的最重要的手段。我国的各级电视台在其各自发展历史中,都积累了一定数量的珍贵素材。音视频资料拍摄制作编辑设备复杂,生产成本远大于文字资料。另外许多十分珍贵的历史
19、镜头和声音均无法重新制作,重复利用要求较高。这些历史资料随着时间的推移,应用次数越多,应用所产生的价值增量越大,重复利用价值越高,甚至可能超过电视台固定资产的价值。电视台的现有音像节目主要通过再利用体现其价值。数据存储量大。数字化后的音视频数据存储量=节目时长术压缩码率,其中压缩码率主要由质量要求和编码格式决定。例如:2 0 0 0 小时的节目素材,采用M P E G 压缩码率定为2 5 M b S,总存储量约为2 0 T B。全国大中型电视台都已积存了万级以上小时的素材资料。另外由于数据量大从而给传输、存储、检索带来极大的压力。从技术实现角度考虑这是音视频媒体数据区别于其他类型数据的最主要特
20、点。数据关系复杂。每一个电视节目其相关信息都涉及到视频、音频、图文、检索等信息,各种数据之间构成了很复杂的关系。(3)媒体资产管理系统的核一t 3 功能及工作流程媒体资产管理系统的核心功能:(i)通过采集和对素材源进行数字化,创建不同格式、不同应用码率的数字素材。(i i)通过自动化的分析比较系统(手动辅助),提取素材中的关键帧信息。(i i i)通过中央数据库系统,管理提取出来的关键帧、重要的元数据和描述关键字信息。(i v)通过分类编目系统,对素材进行分层次的分类编目工作,层次化的工作至少要保证该素材在以后需要时可以方便准确的被检索出来。(V)通过浏览检索端,以搜索引擎的方式方便、准确的查
21、找到所需要的素材。(v i)通过浏览检索端,浏览所找到的素材,标志入出点,准备重复使用符合要求的素材。(v i i)导出选择好的素材,通过在线精编辑工作站点或者离线软编辑工作站点进行制作。(V i i i)通过存储系统和分级存储管理,存储媒体资产。媒体资产管理系统的工作流程:产生阶段一应用阶段一结束阶段媒体资产管理系统是针对媒体资产整个生命周期进行管理形成闭环,尽可能延长应用期的时间,以发挥媒体资产的价值。2山东轻工业学院硕十学位论文电视台媒体资产管理系统是从“频道管理到“内容管理 的变革。这种业务实现手段的提升和业务管理思想的变革,为电视台带来的结果是以内容为商务核心的运营模式。媒体资产管理
22、的实质是:只须创建资产内容一次,然屠就可以以不同的形式,在不同的环境下进行管理,使内容被重用和再销售的机会大大增加。在信息为王的时代,当这种资源被充分发掘时,必将成为广播电台、电视台图书资料音像馆的一笔非常庞大的理想资产。1 2 传统检索方法在媒体资产管理系统中的应用1 2 1 传统检索方法简介传统的检索方法即:基于文本的检索(T B R)。通常,媒体资产管理系统在检索节因、素材、片段、场景、镜头时都是采用基于文本检索(T e s t B a s e d R e t r i e v a l)的方式,也就是针对节目、素材、片段、场景、镜头等视频资料运用数据库技术,并结合广播电视音像资料编目规范进
23、行人工标注。查询时,根据查询关键词去精确地匹配人工标注。其检索过程如图l。l 所示:图1 1 传统媒资管理系统的检索流程1 2 2 传统检索方法豹局限性传统的检索方法有其自身难可以克服的局限性【4】,在查询相关的视频信息时仅仅使用了文字或标签,面没有使用底层或中层与感知相关的信息。但是用文字描述与感知相关的信息是很难的,文字标签难以表达蕴藏在多媒体数据中丰富的内容,在查询图像、视频时常会出现错误。其次,文字描述是种特定的抽象,如果描述的标准改变,则标签也得重新制作么能适合新查询的要求,即:特定的标签只适合特定的查询要求。辩次,目前这些文字标签是靠观察者选出来加上去的,因此受主观因素影响很大,不
24、同的观察者或同一观察者在不同条件下对同一幅图像可能给出不同的描第1 章绪论述,因此不够客观,没有统一标准。最后,采用这种方式,标注工作量巨大,不适用于大规模的数据集合。1 3 智能检索技术在媒体资产管理系统中的应用1 3 1 媒体资产管理系统中智能检索技术的定义近年来,智能化检索技术开始用于多媒体信息的检索【5,6】。所谓智能化检索技术,是根据媒体对象的内容语义及上下文联系的特征进行检索,如图像的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音的音调、响度、音色等,简言之,就是根据媒体对象内容的各种特征进行直接检索,找到具有指定特征或含有特定内容的音视频资料。它区别于传统的基于文本的检索
25、手段,融合了图像理解、模式识别、计算机视觉处理等技术,具有如下特点:(1)不需要额外的人工添加大量的文本注释信息,而且可以克服T B R 中的主观性和不完备性,它直接从视频内容中提取信息线索,比如提取视频数据关键帧的形状、颜色、纹理等特征,而后对特征进行匹配。(2)与基于文本的T B R 常规检索去精确地匹配关键词有明显不同,基于内容的智能化检索是一种近似匹配,通过采用近似性匹配逐步求精,以不断逼近查询目标。(3)特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。(4)检索结果通常是按匹配程度以从大N d,的顺序返回给用户的结果集。对原始视频信息中提取的特征进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 检索 技术 媒体 资产 管理 系统 中的 研究 实现
限制150内