基于视频监控系统的RTP与SIP协议分析.pdf
北京邮电大学硕士学位论文基于视频监控系统的RTP与SIP协议分析姓名:龚猷龙申请学位级别:硕士专业:通信与信息系统指导教师:刘勇20080210北京邮电大学硕上研究生学位论文基于视频监控系统的R T P 与SlP 协议分析摘要随着网络技术的进步,视频监控系统朝着数字化、网络化、智能化方向不断发展。现代视频监控系统主要是基于I P 网络运营,采用了相关的网络协议,并引进了先进的视频压缩编码技术。在视频监控系统中,传输的码流包括视频流和控制信息流,这里的控制信息流是指视频监控系统中各服务器之间的信令流。为节省网络带宽,必须将采集的初始视频流进行压缩编码;同时,为满足用户的实时需求,采用R T P 协议对压缩视频流进行打包传输。以前采用的视频标准主要是M P E G 2,而H 2 6 4 编码标准具有高压缩比、网络适应性强的特点,现在逐渐把H 2 6 4 标准引入视频监控系统,于是碰到了H 2 6 4 视频流的R T P 封装问题。控制信息流为视频监控系统提供了“智能化”工作的可能,本文中视频监控系统采用S I P 协议传输控制信息流,由于各运营商之间采用的S I P 信令格式不匹配,需要对S I P 协议解析,在开源代码O S I P 中给出了S I P 协议的解析方法,然而,考虑到实现的复杂性,需要自行实现。本文作者在研究生期间主要参与了北京智安邦科技有限公司的视频监控系统的研发工作,作者主要完成了以下工作:1 在H 2 6 4 编码知识的基础上,认真研读了M P E G 4 的码流格式及R F C l 8 8 9 文档,采用代码实现了M P E G 4 的码流分析。2 在项目负责人的带领下,学习R T P 的相关知识,采用R T P 对M P E G 一4 码流进行打包封装,完成相关的工作。同时,自行设计完成了H 2 6 4 码流的R T P 封装方法,供参考使用。3 采用C 代码实现S I P 信令测试中P U 端的程序,并完成了与C M U 端的S I P 信令测试;同时,为了实现电信和网通之间的S I P 信令匹配,完成了S I P 信令解析。作者在完成上述的研发工作之前,在北京邮电大学通信网络综合技术研究所多媒体实验室学习了H 2 6 4 编解码原理,编码理论基础扎实,并进行了X 2 6 4 代码的研究。由于作者理论水平和实践经验的限制,论文中的不当之处在所难北京邮电大学硕士研究生学位论文免,恳请各位老师和专家批评指正。关键词:视频监控压缩实时传输协议会话发起协议I I北京邮电大学硕士研究生学位论文I U PA N DS I PP R o T o C o L SA N A L Y S I SB A S E DO NS U R V E I L L A N C ES Y S T E MA B S T R A C TA l o n gw i t hd e v e l o p m e n to fn e t w o r kt e c h n o l o g y,v i d e os u r v e i l l a n c es y s t e mi se v o l u t i o nw i t hd i g i t a l、c y b e r i z a t i o n、i n t e l l i g e n t i z e M o d e mv i d e os u r v e i l l a n c es y s t e mi Sm a i n l yb a s e do nI Pa n da d o p t sn e t w o r kp r o t o c o la n da d v a n c e dv i d e oc o m p r e s s i o nc o d e ct e c h n o l o g y I nt h ev i d e os u r v e i l l a n c es y s t e m,t r a n s m i tb i ts t r e a mi sc o n s i s t so fv i d e os t r e a ma n dc o n t r o ls t r e a m T h ec o n t r o ls t r e a mi ss i g n a ls t r e a ma m o n gs e r v e r si nv i d e os u r v e i l l a n c es y s t e m C o m p r e s st h ev i d e os t r e a mt os a v et h eb a n d w i d t ho fn e t w o r k A tt h es a m et i m e,A d o p t i n gR T Pt op a c k e t i n ga n dt r a n s m i t t i n gt h ev i d e os t r e a mt of u l f i l l st h en e e do fr e a lt i m ef o ru s e r M P E G 2s t a n d a r dw a sa d o p t e db e f o r e M o r e o v e rt h eH 2 6 4C O D E Cs t a n d a r dp o s s e s s e sh i g hc o m p r e s sr a t ea n ds t r o n gn e t w o r ka d a p t a b i l i t y,n o ww h i c hi sa d o p t e di ns u r v e i l l a n c es y s t e m T h e r e f o r e,t h eR T Pp a y l o a df o r m a tf o rH 2 6 4b e c o m e sa ni m p o r t a n tp r o b l e m C o n t r o ls t r e a mp r o v i d e sp o s s i b l ef o rs u r v e i l l a n c es y s t e mw i t hi n t e l l i g e n t i z ew o r k I ns u r v e i l l a n c es y s t e mo ft h ep a p e r,S I Pi sa d o p t e dt ot r a n s m i tc o n t r o ls t r e a m P a r s i n gS I Pi sn e c e s s a r yf o rt h en o tm a t c ha m o n go p e r a t ea g e n c i e s B e c a u s eo ft h ec o m p l e x i t yo fi m p l e m e n t,n oo p e n i n gc o d eO S I Pb u ti m p l e m e n tc o d ei sa d o p t e d I nt h ep e r i o do fg r a d u a t es t u d e n t,a u t h o rt a k e sp a r ti nt h eR&Dt a s ko fs u r v e i l l a n c ei nt h eB e i j i n gZ A N Bt e c h n o l o g yC o,L T D T h em a i nt a s ki sf o l l o w i n g:1 B a s e do nt h eH 2 6 4C O D E C,r e a d i n gt h es t r e a mf o r m a to fM P E G-4a n dR F C18 8 9,a n di m p l e m e n t i n gt h ep a r s i n gM P E G 一4s t r e a mb yCc o d e 2 U n d e rt h eg u i d eo ft e a ml e a d e Ls t u d y i n gR T Pa n da d o p t i n gR T Pt op a c k e tM P E G 一4s t r e a m M e a n w h i l e,i m p l e m e n tR T Pe n c a p s u l a t i o nI I I北京邮电人学硕士研究生学位论文f o r m a tf o rH 2 6 4f o rr e f e r e n c e 3 I m p l e m e n t i n gP Ui nt h ep r o c e s so fS I Ps i g n a lt e s tb yCc o d e,a n df i n i s h i n gt h es i g n a lt e s tb e t w e e nP Ua n dC M S I m p l e m e n tt h ep a r s i n go fS I Pf o rm a t c hb e t w e e nC h i n aT e l e c o ma n dC h i n aN e t c o m B e f o r ef i n i s h i n gt h ea b o v eR Dt a s k t h ea u t h o rs t u d i e dt h eH 2 6 4C O D E Ca tS c h o o lo fC o m m u n i c a t i o na n dN e t w o r kT e c h n o l o g y,B e i ji n gU n i v e r s i t yo fP o s t sa n dT e l e c o m m u n i c a t i o n sa n dw i t hw e l lf o u n d a t i o no fc o d i n gt h e o r y R e s e a r c ht h eX 2 6 4c o d e I t Sh a r dt oa v o i dm i s t a k e sb e c a u s eo fm y1 i m i t a t i o n si nt h e o r i e sa n de x p e r i e n c e s,S O1w i l lb ev e r ya p p r e c i a t e di ft h e ya r ep o i n t e do u tb ye v e r ye x p e r t K E YW O R D S:v i d e os u r v e i l l a n c e,c o m p r e s s i o n,R T P,S I PI V北京邮电人学硕上研究生学位论文独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期:趟:墨:堑,关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。本人签名:导师签名:l 墩杀日期:型:主:三兰日期:趟:主:型北京邮电人学硕上研究生学位论文1 1 课题背景第一章绪论视频监控是一种应用比较早的业务,而且应用面也越来越广。从业务角度而言,视频监控就是指在不需要人为干预的情况下,利用计算机视觉和视频分析的方法对摄像机拍录的图像序列进行自动分析,并判断它们的行为,从而做到在完成日常管理外还能对发生的异常状况做出相应的反应。系统能够向保卫人员准确及时的发出报警,从而避免犯罪的发生,同时也减少了雇用大批监视人员所需要的人力、物力和财力的投入。从技术角度而言,视频监控主要是基于运动视觉分析理论的应用,包括了运动目标的检测、目标分割提取、目标跟踪等几个部分,涉及到计算机视觉、模式识别和人工智能领域的许多核心问题,是一个具有挑战性的课题,也是近年来备受关注的研究方向。由于视频监控系统采用了多种通信技术,包括计算机处理、视频压缩、网络传输技术和多媒体技术等,因此,随着这些相关技术的不断提出和完善,视频监控系统也会得到相应的发展,并进一步扩展了其应用范围。在视频监控系统的发展中,技术和业务需求往往是两个相互推动又相互制约的因素。新的业务需求推动了技术的革新,新技术的产生又带动业务的发展,这是一个良性的市场发展模式。同时在市场上也可以看到这样的情况,某些新技术的产生并没有得到广泛的应用,原因是,在这些新技术的发展中,忽视了市场背景和当前业务的需求,使得这些新技术只得到了理论上的发挥,在实际业务操作中没有得到广泛的应用,例如,A T M 技术。因此,视频监控系统的发展也应当兼顾这两者。2 0 0 8 年北京奥运会给很多新技术提供了展示的舞台,从某种意义上讲,北京奥运会就是一次科技奥运。视频监控系统正是科技奥运的重要部分,目前所建的奥运视频监控系统是中国网通基于I P v 6 的下一代互联网C N G I(C h i n aN e x tG e n e r a t i o nI n t e m e t)关键技术研发的通信产品,能够满足各种组织和个人对视频监控业务的需求。奥运视频系统性能非常良好,而且也能及时满足奥组委对于安全的要求,在0 8 年的奥运会中必将有更大作为。本论文课题来源于中国电信的一个视频监控系统项目一“全球眼”,目的是设计智能化网络视频监控系统。北京邮电大学硕十研究生学位论文1 2 工作内容及研究意义(1)工作内容:本文作者从事过视频监控系统的开发工作,参加了H 2 6 4 码流分析、R T P 传送以及与深圳中兴通讯股份有限公司进行S I P 信令联调等工作。在整个视频监控系统的设计中,包含了前端单元服务器、中心平台服务器和客户端服务器,另外还有界面的设计。本文的主要任务是研究视频监控中的关键技术及其应用,主要包括视频编解码标准H 2 6 4,实时传输协议R T P R T C P,还有信令协议S I P。着重研究H 2 6 4 的编解码技术,包括H 2 6 4 编码器中各模块的关键技术,以及H 2 6 4 视频流的帧定位的研究,并将H 2 6 4 的编码码流进行R T P 封装,讲述整个封装过程。最后讨论S I P 协议在P U 和C M S 间的应用,其中包括S I P 协议的解析,并将解析的内容重新加载S I P 协议格式。本论文围绕这个过程展开的。(2)研究意义:视频监控在业界得到了广泛的应用,许多先进的技术被逐渐引入视频监控系统。正是由于这些技术的快速发展和成熟,使得视频监控系统的实现具有了更多的选择性,这些技术的选择性主要集中在视频压缩编码、网络传输以及服务的智能化。视频压缩编解码技术是视频监控系统的核心技术。视频压缩标准主要有两个系列,一个是由I T U T 制定的H 2 6 x 系列,另一个是由I S O 制定的M P E G X 系列。目前比较看好的国际标准是H 2 6 4 和M P E G-4。H 2 6 4 具有压缩比高、网络亲和性好等特点,研究H 2 6 4 在视频监控中的应用有十分重要的意义。多媒体通信采用R T P 协议传输多媒体数据,提高网络的Q O S,视频监控也往往采用R T P 协议传输视频流。S I P 协议的出发点是以I n t e r n e t 为基础,协议简单且扩展性好,视频监控系统的发展方向是具于P 网络,为此视频监控技术将逐步采用S I P 协议进行给服务器间的信令交互。本文基于视频监控系统的研究,对H 2 6 4、R T P 和S I P 协议进行探讨和应用。目前这些技术比较好的解决了视频监控系统在数字化、网络化和智能化进程中遇到的难题。本文对这些技术的研究具有重要的意义。1 3 论文结构第一章是课题研究背景,这部分首先讲述了视频监控系统在各领域中的主要应用,并介绍了视频监控系统的研究状况。后面给出了作者在研究生期间的主要工作内容和意义,以及论文结构;2北京邮电大学硕士研究生学位论文第二章给出了P 网络视频监控系统的结构以及国内外研究状况,尤其是视频监控系统中的视频流及控制信息的数据流程。同时详细讲述了网络视频监控系统所采用的关键技术,包括视频压缩技术、视频传输技术及终端信令控制协议;第三章描述了视频压缩编解码原理及发展进程,研究视频压缩的必要性及可行性,并重点介绍了H 2 6 4 编码器原理;第四章是视频流的R T P 封装原理,主要分两个阶段研究,首先介绍R T P R T C P协议,然后给出了视频流的R T P 封装过程,包括M P E G 4 码流以及H 2 6 4 码流的R T P封装过程;第五章详细讲述了S I P 信令协议,在网络视频监控系统中,控制信息采用S I P 信令进行交互,给出了S I P 信令测试过程,并加以分析,基于S I P 信令格式的一致性,给出了S I P 信令解析方法,以及主要函数。最后一部分是文章的结束语及参考文献。北京邮电大学硕士研究生学位论文第二章视频监控系统的研究随着计算机、网络及通信技术的快速发展和成熟,视频监控系统从模拟视频监控系统逐渐转向以数字化、网络化和智能化为特色的网络数字视频监控系统。2 1 视频监控系统的发展及研究现状在视频监控系统的发展过程中,主要经历了以下三个阶段。(1)在2 0 世纪9 0 年代初及其以前,由安防产品演化而来的闭路视频监控系统是我国第一代模拟视频监控系统。这种监控系统相当于直接把监控端的模拟信号不做任何处理,直接传输给客户端。最简单的监控系统是由一架摄像机和一台监视器组成,中间用传输线连接,不需要特殊处理,监控的范围仅限于本地网络,应用受到很大限制。(2)2 0 世纪9 0 年代中期,随着计算机处理能力的提高和视频技术的发展,人们利用计算机的高速数据处理能力进行视频的采集和处理,利用显示器的高分辨率实现图像的多画面显示,从而大大提高了图像质量,增强了视频监控的功能。这种基于多媒体计算机的系统称为第二代数字化本地视频监控系统,即模拟输入与数字压缩、显示和控制系统。因为核心设备是数字设备,因此可以称为数字视频监控系统。但由于其图像质量、稳定性以及远程传输技术方面的不足,第二代数字化本地视频监控系统的应用并不广泛。(3)到了2 0 世纪9 0 年代末特别是近两三年,随着网络带宽增加、计算机处理能力的迅速提高和存储容量的增大,以及各种实用视频信息处理技术的出现,视频监控进入了全数字化的网络时代,称为第三代远程视频监控系统,即全数字视频监控系统或网络数字视频监控系统。视频监控系统的第二阶段和第三阶段可以统称为数字视频监控系统,两个阶段的区别主要是在摄像机的输出,有模拟和数字信号之分,但系统的功能并没有本质的区别。远程视频监控系统是基于T C P I P 网络的,而T C P I P 网络是面向全球用户,资源共享是T C P I P 最大的优点。T C P I P 是目前最流行采用的互联网技术,而且使用价格低廉,满足大众化的需求,其应用前景十分广阔。因此,采用口组网是视频监控系统朝网络化发展的趋势。视频监控系统研究一直是国内外科研机构和研究人员的热点。无论是在国防、运4北京邮电大学硕士研究生学位论文输、基础建设等方面,视频监控系统都具有广泛的前景和潜在的经济价值。目前,国际上对智能视频监控的研究已经达到了一定的水平,智能视频也受到越来越多的重视,一些重要的学术期刊和重要的学术会议己经将智能视频监控作为主题内容之一,同时也有不少的原型系统被研制出来。在国外,美、英等国开展了大量有关视频监控的研究。美国国防高级研究计划局(D A R P A)资助卡内基梅隆、戴维S A R N O F F 研究中心等著名大学和科研机构,联合研制出了智能场景监视与监控系统V S A M,用于在未来战争中人力监控费用昂贵、非常危险或者人力无法实现的场合的监控:美国工s s 公司的研制出的A U T O S C O P E2 0 0 4 是一种大区域视频监控系统,已经作为北美铁路运输监视系统实现了应用。英国的瑞丁大学(U n i v e r s i t yo f R e a d i n g)也展开了对车辆和行人的跟踪及交互式作用识别的相关研究,这一技术有望使未来的视频监控系统不仅可以自动识别扒手和盗车贼,而且还会预报地铁或机场内可能发生的行凶抢劫或恐怖活动。在国内,智能视频监控的研究也有了长足的进步,2 0 0 2 年5 月,第一届“全国智能视觉监控学术会议”在北京召开,迄今为止,己经举行了三届,得到了广泛的关注。此外,中国科学院自动化研究所模式识别国家重点实验室己经成立了智能视频监控的研究小组,正在开展智能视频监控方面的研究,研究内容包括:快速准确的运动检测,实时性、鲁棒性的基于三维模型的车辆与行人的定位、识别和跟踪,基于移动摄像机的视觉监控技术,多摄像机的协作监控,事件的机器学习方法,异常现象的检测、报警与目标的行为预测,对目标运动情况给出语义上的解释的方法以及远距离的身份识别等等,其目标是实现一个包括以上研究内容的动态场景集成分析演示系统【l】。网络视频监控业务是一种基于宽带网络为用户提供图像和各种报警信号远程采集、传输、储存、处理的一种全新电信业务。视频监控系统包括硬件结构和软件结构。硬件结构包含了视频监控系统中所需的设备;软件结构提供了对视频流的处理方式,给视频监控系统带来了很大的灵活性,智能视频监控系统的设计主要是在软件结构方面实现。2 2 视频监控系统的结构视频监控系统(这里选择的是基于P 网络的远程视频监控系统)主要由视频监控端、服务器端和客户端组成,一般采用的是客户端N 务器模型。其硬件结构如图所示。其中视频监控端包括由镜头、摄像机、云台、报警开关、视频编解码设备(如H 2 6 4)、主机控制设备和监控软件组成;服务器端由一个中心服务平台组成,包括用于业务平台管理和调度的网络服务器,解码器和显示设备。中心服务平台具有业务平台的管理功能,并对传送过来的图像进行转发、分发或存储,对报警进行联动处理;北京邮电大学硕士研究生学位论文客户端包括一个接入I P 网的集线器和各个P C 机终端,客户端在获得用户认证之后就可以任意观看任意一个摄像机的任意角度的视频,并可以接收到前端的报警信息。各部分通过以太网相连接。p-网it 圈科4;l。稳一*;确窘:凰垆窘=禽|1 圈g 三二黧lQp 9 一,、+j j、。掣愈也图2-1 网络视频监控系统视频监控系统的软件设计包括前端单元【2】(P U)、中心服务平台(C M S)和客户端单元(C U)。从网络视频监控系统可以看出,系统中主要存在两种数据流:视频监控端向客户端发送的媒体流和客户端向视频监控端发送的控制信息流。中心服务平台实现视频监控端和客户端的接入、信令转发处理、系统及其信息管理。系统的数据流程如图2 2 所示。视频监控端客户端图2-2 系统数据流程图从传输层的角度看,传输两种数据流所采用的协议是不一样的。控制信息流对服务器6北京邮电大学硕士研究生学位论文平台业务管理、客户端与视频端的接入、调度及解码显示等都是十分重要的,可见在控制信息流的传输过程中不允许有丢包,因此采用面向连接、可靠传输的T C P 协议传输控制信息。然而T C P 传输需要的网络开销较大,通过降低有效性来换取传输的可靠性,不能达到实时传输媒体流的目的。U D P 协议是面向无连接、不可靠传输的控制协议,传输之前不需要先建立连接,在传输时延及带宽利用率方面都要强于T C P,正好满足了媒体流实时性的特点,通常采用U D P 作为媒体流的传输协议。不过,采用U D P 传输媒体流同样存在不可靠性的问题:U D P 数据包没有编号,无法提供差错控制,也不保证包不丢失,更不能加载媒体流的时间信息。导致在客户端显示的视频图像存在延时和抖动,在一定程度上仍然不能达到实时传输的效果p j。2 3 视频监控系统中的关键技术视频监控是多媒体通信的主要应用之一,而多媒体通信又是3 G 网络的重要业务。研究视频监控系统并不只在于视频监控技术的发展,同时也促进3 G 业务的成熟,因此研究视频监控技术具有十分重要的意义。视频监控系统的研究主要集中在以下几个关键技术方面:(1)音、视频流的压缩编解码技术经采集的音、视频流的数据量非常巨大,不论是用来传输还是存储都是不利的,特别是视频流数据。例如,C I F 格式下的视频流,按照每秒2 5 帧的帧率播放,传输或存储一秒钟的视频数据量为3 5 2 x 2 8 8 x 1 2 x 2 5=3 0 4 M b i t。如此高的码率给传输带宽和服务器的存储容量带来了很大的压力,而且给多媒体信息的同步提出了很高的要求。解决这个问题的关键是采用视频压缩编解码,将视频数据压缩,提高传输系统的有效性,同时减轻了服务器的负荷【4】。在远程视频监控系统中,由于提供的带宽有限,需要将采集的原始信息进行压缩后再传输。另外,有些历史信息需要储存在视频服务器端,如直接存储原始的视频信息,会给服务器带来很大的压力,而且有些冗余信息没有必要存储,这给服务器资源带来了极大的浪费。因此,在现代的网络视频监控系统引入视频压缩技术是十分必要的。(2)音、视频流的网络传输技术R T P 是由I E T F 音视频工作组制定的实时传输协议,专门用于交互式语音、视频传输等实时多媒体应用【5 1。R T P 可以在点对点或点对多点的传输情况下工作,而且通常使用U D P 来传送数据。当应用程序开始一个R T P 会话时,同时还要开启R T C P 协议,因为I 盯P 协议并不能提供差错控制和保证的网络的Q o S,需要和R T C P 配合使用。此时的会话将使用两个端口:一个给R T P,另一个给R T C P。7北京邮电大学硕士研究生学位论文R T P 协议的设计目的是提供实时数据传输中的时间戳信息及各数据流的同步功能。R T P 提供序列号以恢复数据包的顺序,实现丢包检测,为实时传输提供网络拥塞等信息;提供时间戳用于媒体同步,使接收端按正确的速率回放数据;提供同步源标志使接收端有可能获得有关发送方的信息。R T C P 的主要功能是提供有关Q o S 的信息反馈。网络终端系统可根据这些反馈信息来调整数据的发送速率。R T C P 包共有五种类型:发送端报告(s R)、接收端报告(R R)、源描述(S D E S)、B Y E 和A P P。其中,S R用来描述发送端的发送和接收统计数据;R R 用来描述接收端的接收统计数据。这些统计数据包括发送包数、发送字节数、累计丢包数、已收报文的最大序列号、达到时间间隔抖动等。实时传输协议R T P 和传输控制协议R T C P 一起提供流量控制和拥塞控制服务。在R T P 会话期间,各参与者周期性地传输R T C P 包。服务器利用R T C P 包中所包含的信息动态地改变传输速率,甚至改变有效载荷类型。因此,R T P 用来传送实时多媒体数据信息,而R T C P 用来传送控制信息f 6】。通信服务质量(Q O S)是对多媒体通信效果的主要表示参数,主要用于描述通信双方的传输质量。视频监控中采用R T P 协议传输视频压缩流,提高了传输的服务质量(6 J。(3)终端技术视频监控系统中的视频会话的控制采用S I P 协议。S I P 是一个应用层的控制协议,可以用来建立、修改、和终止多媒体会话(或者会议)。例如h l t e r n e t 电话。S I P 也可以邀请参与者参加已经存在的会话,比如多方会议。媒体可以在一个已经存在的会话中方便的增加(或者删除)。S I P 显示的支持名字映射和重定向服务,这个用于支持个人移动业务一用户可以使用一个唯一的外部标志而不用关系他们的实际网络地点【7】。视频监控采用S I P 协议进行C U 的注册、修改及会话等功能。而且P U 端与C M S端之间的设备注册、心跳和视频请求等信令交互都是通过S I P 协议完成的,S I P 协议在视频监控领域的应用越来越广泛。北京邮电大学硕士研究生学位论文第三章视频编码原理3 1 视频压缩编解码标准目前,随着3 G 技术的发展,多媒体技术也将得到广泛的应用,并成为3 G 技术的主要业务。在G S M 系统中,语音和一些低速率的数据业务是其主要的业务,此时多媒体业务还是处于一个过渡阶段,而且一直没有得到快速的发展。造成这一局面的主要因素是由于多媒体中视频数据量非常大,导致在存放、网络传送都存在很大的问题。对于I n t e m e t 和有线电视网,网络带宽一直是制约各业务发展的瓶颈。I n t e m e t 是基于T C P I P 的全球化网络,其采用的交换方式为分组交换,虽然目前I n t e m e t 采用光纤光缆传输,传输带宽已经达到了很大,而人类所使用的信息量成几何倍数增加,尤其是多媒体信息。另外,用有线电视网传送原始视频信号给用户,不但费用很高,而且传送的频道很有限。由此可见,制约目前“三网(电信网络、有线电视网络和计算机网络)发展的一个非常重要因素一多媒体原始数据量太大,而视频数据占多媒体数据的主要部分。因此,在对视频数据处理之前,需要将其进行压缩。为了压缩视频数据,出现了各种不同的压缩算法,并都取得了一定成效。但被普遍认可且最具有权威的是由I S O 组织颁布的M P E G x 系列标准和由1 1 r U T 组织颁布的H 2 6 x 系列标准。本章将主要讲述视频压缩的相关内容,先介绍其必要性和可行性,然后简单介绍视频压缩编码的发展,最后着重介绍目前国内外比较流行的M P E G 4 和H 2 6 4 A V C 标准【9】。3 1 1 视频压缩的必要性和可行性在过去的1 0 年里,需要存储、传输和处理的信息量不断增加。主要是两项技术的发展,一是多媒体系统在众多领域得到广泛的应用,过去计算机只能处理数字和文本,现在已经能处理声音、图像、电影;另一项是I n t e m e t 的发展,它使得信息可以共享。这两项技术综合作用产生了所谓的W o r l d W i d e W e b,一个交互的、多媒体的、基于超文本的信息网络。这些发展得益于硬件方面的技术革新,比如C P U、磁盘、传输信道的性能发展。但是光靠硬件技术的发展是不够的,需要找到另一种解决方案,这里采用的方法是将原始的视频数据进行压缩。9北京邮电大学硕士研究生学位论文(1)视频压缩的必要性众所周知,图像信号的数字化在图像处理中有一系列的优点,然而数字化后的图像数据却相当庞大。如果不经过压缩处理,要想对一帧N T S C 制式的彩色视频进行数字化传输的话,则要求信道的传输能力要达到2 4 8 M b i t s。同样,一帧H D T V 的彩色电视图像,其分辨率为1 9 2 0 像素x 1 0 8 0 线,每种颜色中的每个像素用8 b i t 表示,每秒传输3 0 帧,那么需要信道的传输速率为1 5 M b i t s。一幅超3 5 格的高档电影图像,通过数字化成4 0 9 6 像素x 3 1 1 2 线,并且每种颜色中的每个像素用1 0 b i t 表示,如果每秒传输2 4 帧图像,那么,一秒钟的彩色电影图像需要大约9 G b i t(1 5 G 字节)的存储空间。按照这样的数据传输速率计算,在对图像不进行压缩的情况下,一张存储空间大约5 G b i t 的C D 盘能够存储大约2 0 s 的N T S C 制式的视频图像或3 s 的H D T V 视频图像或0 5 的电影图像。因此,不进行图像压缩编码给存储器存储容量传输信道的传输率(带宽)及计算机的处理速度等方面增加极大的压力。(2)视频压缩的可行性一般说来,在帧内以及帧间,众多的视频序列均包含很大的统计冗余度和主观冗余度。视频信号存在者多种冗余,有空间冗余、时间冗余、信息熵冗余、人眼视觉冗余、知识冗余和结构冗余等,而任何压缩机制的目的都是除去数据中存在的相关性,所谓相关性是信息之间的冗余,就是根据给出的一部分数据来判断出其相邻的数据。下面给出常见的三种冗余的特点。空间相关性:可以根据图像中某一点的像素值推断出其相邻点的像素值。频率相关性:一个信号的傅立叶变换通常是光滑的,这意味着可以根据某一部分的频率来推断其相邻部分的频率。时间相关性:在数字视频中,在时间上相邻两帧图像的大部分像素的值变化很小。正因为视频信号的存在冗余特性,使得视频压缩成为可能。码率压缩系统的工作是去除传输之前编码器输入信号中的冗余信息,并在解码器中的恢复这些冗余信息。所以压缩中最关键的问题是能够在原始数据与压缩数据之间快速地切换,根据解压缩数据与原始数据之间是否有误差,可将压缩机制分为有损压缩和无损压缩。无损压缩通常被用于文本文件的压缩中,而有损压缩主要用于允许压缩后产生质量上的误差,比如视频的压缩,因为人眼对视频图像的分辨能力有限,所以允许丢失一些人眼“看不到”的信息。无损压缩的压缩比都比较小,一般几倍到十几倍;而有损压缩的压缩比很大,最大可以达到2 0 0 多。文中将要介绍的M P E G-4 和H 2 6 4 都是有损压缩的视频编码标准。l O北京邮电大学硕士研究生学位论文3 1 2 视频压缩编码标准简介图像编码技术的发展和广泛应用促进了许多有关国际标准的制定。这方面的工作主要是由国际标准化组织I S O、国际电子学委员会I E C 和国际电信联盟I T U 进行的。上述三个组织领导制订了三个有关视频压缩编解码的国际标准系列,即J P E G、M P E G和H 2 6 x 标准。J P E G 标准这里不做介绍,下面只介绍M P E G 和H 2 6 x 系列标准。(1)M P E G 标准M P E G 是活动图像专家组(M o v i n gP i c t u r eE x p o r t sG r o u p)英文的缩写,于1 9 8 8 年成立,是为数字视音频制定压缩标准的专家组。M P E G 组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码标准的组织。目前为止,在视频压缩领域M P E G 成为最热也是应用最多的压缩技术。随着互联网和宽带的发展,M P E G 技术越来越多的在各个领域得到应用。M P E G 的任务是开发运动图像及其声音的数字编码标准,目前已提出M P E G 1、M P E G 2、M P E G 一4、M P E G 7 和M P E G 2 1 标准。下面简单介绍M P E G 标准及其应用。M P E G 1 为数字电视标准,于1 9 9 2 年正式发布。是针对1 5 M b p s 以下数据传输率的数字存储媒质运动图像及其伴音编码的国际标准。它提供的重要特性包括基于帧的视频随机访问,通过压缩比特流的快进快退搜索,视频的倒放,以及压缩比特流的可编辑性。主要应用有V C D 和M P 3 等。(窑)M P E G 2 标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从3