多媒体信息处理基础.ppt
《多媒体信息处理基础.ppt》由会员分享,可在线阅读,更多相关《多媒体信息处理基础.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体信息处理基础多媒体信息处理基础n1.1 多媒体的基本概念多媒体的基本概念n1.2 音频信息处理基础音频信息处理基础n1.3 图像信息处理基础图像信息处理基础n1.4 视频信号的数字化视频信号的数字化n1.5 MATALAB在图像处理中的应用在图像处理中的应用第第1章章 多媒体信息处理基础多媒体信息处理基础 n熟悉多媒体及多媒体技术的基本概念及特征。熟悉多媒体及多媒体技术的基本概念及特征。n了解声音的基本特性及主观感觉。了解声音的基本特性及主观感觉。n熟悉音频、图像、视频信号数字化的过程,掌握均熟悉音频、图像、视频信号数字化的过程,掌握均匀量化的原理。匀量化的原理。n掌握彩色三要素、三基色
2、原理及混色方法等色度学掌握彩色三要素、三基色原理及混色方法等色度学基本知识。基本知识。n理解理解RGB、YUV、YIQ、YCbCr、HSI/HSV等颜色等颜色空间的表示及转换。空间的表示及转换。n熟悉熟悉ITU-R BT.601建议的主要内容。建议的主要内容。n了解了解MATLAB在图像处理和分析领域的应用。在图像处理和分析领域的应用。本章学习目标本章学习目标n1.1.1 媒体的概念媒体的概念n1.1.2 多媒体与多媒体技术多媒体与多媒体技术1.1 多媒体的基本概念多媒体的基本概念n1.媒体(媒体(medium)n按传统的说法,媒体指的是信息的载体,如:按传统的说法,媒体指的是信息的载体,如:
3、n报纸、杂志、电视、广播、因特网报纸、杂志、电视、广播、因特网n在计算机领域有两种含义:在计算机领域有两种含义:n信息的存储实体,如磁盘、光盘、磁带、半导体存储信息的存储实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为器等,中文常译为媒质媒质或或媒介媒介;n传递信息的基本元素,如文字、声音、图形、动画和传递信息的基本元素,如文字、声音、图形、动画和图像等。图像等。1.1.1 媒体的概念媒体的概念2.媒体的分类媒体的分类国际电话电报咨询委员会(国际电话电报咨询委员会(CCITT)把媒体分成如下)把媒体分成如下5类。类。(1)感知媒体()感知媒体(Perception Medium)感知媒体就
4、是指能直接作用于人的感觉器官,使人直接产感知媒体就是指能直接作用于人的感觉器官,使人直接产生感觉(视、听、嗅、味、触觉)的一类媒体,如语言、音乐、生感觉(视、听、嗅、味、触觉)的一类媒体,如语言、音乐、图形、动画、数据、文字、文件等都是感知媒体。图形、动画、数据、文字、文件等都是感知媒体。(2)表示媒体()表示媒体(Representation Medium)表示媒体是为了更有效地加工、处理和传输感知媒体而人表示媒体是为了更有效地加工、处理和传输感知媒体而人为研究和构造出来的一种媒体。它包括上述感知媒体的各种编为研究和构造出来的一种媒体。它包括上述感知媒体的各种编码,诸如语言编码、静止和活动图
5、像编码,以及文本编码等。码,诸如语言编码、静止和活动图像编码,以及文本编码等。(3)呈现媒体()呈现媒体(Presentation Medium)呈现媒体是感知媒体与用于通信的电信号之间在转换中用呈现媒体是感知媒体与用于通信的电信号之间在转换中用于信息输入和输出的媒体。可分为输入呈现媒体(如键盘、摄于信息输入和输出的媒体。可分为输入呈现媒体(如键盘、摄像机、话筒、扫描仪等)和输出呈现媒体(如显示器、扬声器、像机、话筒、扫描仪等)和输出呈现媒体(如显示器、扬声器、打印机等)两种。打印机等)两种。(4)存储媒体()存储媒体(Storage Medium)存储媒体用于存储表示媒体,即存放感知媒体数字
6、化后的存储媒体用于存储表示媒体,即存放感知媒体数字化后的代码的媒体称为存储媒体,如磁盘、光盘、磁带、半导体存储代码的媒体称为存储媒体,如磁盘、光盘、磁带、半导体存储器等。器等。(5)传输媒体()传输媒体(Transmission Medium)传输媒体是指用来将表示媒体从一处传递到另一处的物理传输媒体是指用来将表示媒体从一处传递到另一处的物理传输介质,如同轴电缆、双绞线、光纤及其他通信信道。传输介质,如同轴电缆、双绞线、光纤及其他通信信道。在多媒体技术中所说的媒体一般指在多媒体技术中所说的媒体一般指感知媒体感知媒体。常见的感知媒。常见的感知媒体包括:体包括:(1)视觉媒体:视觉媒体:图像、图形
7、、符号、视频、动画等。图像、图形、符号、视频、动画等。(2)听觉媒体:听觉媒体:声音、语音、音乐和音响。声音、语音、音乐和音响。(3)触觉媒体:触觉媒体:通过直接或间接与人体接触,使人能感觉到通过直接或间接与人体接触,使人能感觉到对象的位置、大小、方向、方位、质地等性质。对象的位置、大小、方向、方位、质地等性质。图像 图像图像(ImageImage):):是指由输入设备捕捉的是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意实际场景画面,或以数字化形式存储的任意画面。画面。静止的图像可用一个矩阵来表示,矩静止的图像可用一个矩阵来表示,矩阵列中的各个元素用来描述构成图像的各个阵列中的各个
8、元素用来描述构成图像的各个点(称为像素点(称为像素 pixel pixel)的强度与颜色等信息。)的强度与颜色等信息。这种图像也称为这种图像也称为位图位图(Bitmap Bitmap)。)。图像由像素组成图像由像素组成n位图位图(bitmap,bit-mapped image)n对位图进行操作时,只能对图中的像素进行操作,而不对位图进行操作时,只能对图中的像素进行操作,而不能把位图中的物体作为独立实体进行操作。能把位图中的物体作为独立实体进行操作。n画位图或编辑位图的软件称为画图程序;存放位图的格画位图或编辑位图的软件称为画图程序;存放位图的格式称为位图格式;存储的内容是描述像素的数值。式称为
9、位图格式;存储的内容是描述像素的数值。n位图的获取通常用扫描仪、数码相机和相关的数字化设位图的获取通常用扫描仪、数码相机和相关的数字化设备。备。n位图文件占据的存储空间比较大,影响位图文件大小的位图文件占据的存储空间比较大,影响位图文件大小的因素因素n图像分辨率:图像分辨率:分辨率越高,表示组成一幅图的像分辨率越高,表示组成一幅图的像素就越多,图像文件就越大素就越多,图像文件就越大n像素深度:像素深度:像素深度越深,表达单个像素的颜色像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大和亮度的位数越多,图像文件就越大 n灰度图像灰度图像(gray-scale image或或inte
10、nsity image):只有明暗不只有明暗不同的像素而没有彩色像素组成的图像。按灰度级的数目来划同的像素而没有彩色像素组成的图像。按灰度级的数目来划分:分:n单色图像(二值图像):单色图像(二值图像):只有黑白两种颜色的图像。只有黑白两种颜色的图像。n每个像素的像素值用每个像素的像素值用1bit1bit存储,其值是存储,其值是“0”“0”或或“1”“1”n灰度图像:灰度图像:如果每个像素的像素值用一个字节表示,灰度值级数就如果每个像素的像素值用一个字节表示,灰度值级数就等于等于256级,每个像素可以是级,每个像素可以是0255之间的任何一个值。之间的任何一个值。单色图像灰度图像n彩色图像彩色
11、图像(color image)n每个像素包含颜色信息的图像。每个像素包含颜色信息的图像。n可按照颜色的数目划分:可按照颜色的数目划分:n256256色图像:色图像:每个像素的每个像素的R、G和和B值用一个字节来表示,一幅值用一个字节来表示,一幅640480的彩色图像需要的彩色图像需要300 KB的存储空间的存储空间n真彩色图像:真彩色图像:每个像素的每个像素的R、G、B分量分别用一个字节表示,一分量分别用一个字节表示,一幅幅640480的真彩色图像需要的真彩色图像需要900 KB的存储空间的存储空间256色图像 24位真彩色图像 视频视频视频(VideoVideo):):是动态的图像序列,由一
12、系列是动态的图像序列,由一系列连续的画面序列(帧)组成连续的画面序列(帧)组成,这些画面以一定的速,这些画面以一定的速率(帧频)连续地投射在屏幕上,使观察者具有图像率(帧频)连续地投射在屏幕上,使观察者具有图像连续运动的感觉。连续运动的感觉。一一帧帧电电视视画画面面xytF(u,v)k-1帧k+1帧帧k帧帧k-1帧帧图形 图形图形(GraphicGraphic):):是一种抽象化的图像,一般指用计算是一种抽象化的图像,一般指用计算机绘制(机绘制(drawdraw)的几何图)的几何图(包含彩色图包含彩色图),如直线、圆、圆,如直线、圆、圆弧、矩形、任意曲线和图表等。弧、矩形、任意曲线和图表等。在
13、几何学中,图形一般使用矢量表示,因此也称在几何学中,图形一般使用矢量表示,因此也称矢量图矢量图(Vector GraphicsVector Graphics)。矢量图矢量图是用一组指令集合来描述图形的是用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、圆内容,这些指令用来描述构成该图形的所有直线、圆、圆弧、矩形、曲线等图元的位置、维数和形状等。弧、矩形、曲线等图元的位置、维数和形状等。在计算机屏幕上显示矢量图形要有专门的软件,如在计算机屏幕上显示矢量图形要有专门的软件,如AutoCADAutoCAD、Corel DrawCorel Draw、Adobe Illustra
14、torAdobe Illustrator等,这些软件等,这些软件将描述图形的指令转换成在屏幕上显示的形状和颜色,也将描述图形的指令转换成在屏幕上显示的形状和颜色,也可产生和操作矢量图形的各成分,并对矢量图形进行移动、可产生和操作矢量图形的各成分,并对矢量图形进行移动、缩放、旋转和扭曲等变换。缩放、旋转和扭曲等变换。动画动画(AnimationAnimation):):是动态图像的一是动态图像的一种,与视频不同之处在于,动画中的图像种,与视频不同之处在于,动画中的图像采用的是计算机产生出来或人工绘制的图采用的是计算机产生出来或人工绘制的图像或图形,而视频中的图像则是真实的图像或图形,而视频中的图
15、像则是真实的图像。也就是说,动画是活动的画面,实质像。也就是说,动画是活动的画面,实质是一幅幅静态图形的连续播放。是一幅幅静态图形的连续播放。动画 计算机设计动画有两种:计算机设计动画有两种:帧动画:帧动画:是由一幅幅位图组成的连续是由一幅幅位图组成的连续的画面,就如电影胶片或视频画面一样要的画面,就如电影胶片或视频画面一样要分别设计每屏幕显示的画面。分别设计每屏幕显示的画面。造型动画:造型动画:是对每一个运动的物体分是对每一个运动的物体分别进行设计,赋予每个动元一些特征,然别进行设计,赋予每个动元一些特征,然后用这些动元构成完整的帧画面。动元的后用这些动元构成完整的帧画面。动元的表演和行为是
16、由制作表组成的脚本来控制。表演和行为是由制作表组成的脚本来控制。n帧动画帧动画 文本文本文本(TextText):):分为非格式化文本文分为非格式化文本文件和格式化文本文件。件和格式化文本文件。非格式化文本文件:非格式化文本文件:只有文本信息没只有文本信息没有其他任何有关格式信息的文件,又称为有其他任何有关格式信息的文件,又称为纯文本文件。如纯文本文件。如“.TXT”“.TXT”文件。文件。格式化文本文件:格式化文本文件:带有各种文本排版带有各种文本排版信息等格式信息的文本文件。如信息等格式信息的文本文件。如“.DOC”“.DOC”文件。文件。音频音频(AudioAudio)可分为可分为波形声
17、音波形声音、语音语音和和音乐音乐。n波形声音波形声音n包含了所有的声音形式包含了所有的声音形式n自然界中的各种声音,包括人的说话声、音乐、天空的惊自然界中的各种声音,包括人的说话声、音乐、天空的惊雷等,可以用一种模拟的连续波形表示。雷等,可以用一种模拟的连续波形表示。音频n语音:语音:不仅是一种波形声音,而且还具有内在的语言、不仅是一种波形声音,而且还具有内在的语言、语音学内涵,可以经由特殊的方法而提取。波形声音也语音学内涵,可以经由特殊的方法而提取。波形声音也可以表现和记录语音,但常把语音作为一种特殊的听觉可以表现和记录语音,但常把语音作为一种特殊的听觉媒体。媒体。音频n音乐:音乐:符号化了
18、的声音。这种符号就是符号化了的声音。这种符号就是乐谱。音乐与语音相比,形式更为规范。乐谱。音乐与语音相比,形式更为规范。在多媒体计算机中,在多媒体计算机中,MIDI就是一种乐谱就是一种乐谱数字化描述的规范。数字化描述的规范。h1 1多媒体多媒体关于多媒体(关于多媒体(MultimediumMultimedium)的定义或说法多种多样,从)的定义或说法多种多样,从不同的角度出发对多媒体给出了不同的描述,目前仍没有统不同的角度出发对多媒体给出了不同的描述,目前仍没有统一的标准。通常所说的多媒体就是各种媒体的综合,也就是一的标准。通常所说的多媒体就是各种媒体的综合,也就是声音、图像、动画、视频、文本
19、等各种媒体的综合声音、图像、动画、视频、文本等各种媒体的综合。“多媒多媒体体”常被当作常被当作“多媒体技术多媒体技术”的同义词。的同义词。2 2多媒体技术多媒体技术多媒体技术就是利用计算机技术把文本、图像、图形、动多媒体技术就是利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体有机地集成起来,使人们能以更画、音频及视频等多种媒体有机地集成起来,使人们能以更加自然的方式使用信息,并与计算机进行交互,且使表现的加自然的方式使用信息,并与计算机进行交互,且使表现的信息图、文、声并茂。简言之,信息图、文、声并茂。简言之,多媒体技术就是计算机综合多媒体技术就是计算机综合处理声、文、图信息的技术
20、,具有集成性、实时性和交互性。处理声、文、图信息的技术,具有集成性、实时性和交互性。1.1.2 多媒体与多媒体技术多媒体与多媒体技术n1.1 多媒体的基本概念多媒体的基本概念n1.2 音频信息处理基础音频信息处理基础n1.3 图像信息处理基础图像信息处理基础n1.4 视频信号的数字化视频信号的数字化n1.5 MATALAB在图像处理中的应用在图像处理中的应用第第1章章 多媒体信息处理基础多媒体信息处理基础n1.2.1 声音的基本特性声音的基本特性n1.2.2 声音的主观感觉声音的主观感觉n1.2.3 音频信号的数字化音频信号的数字化 1.2 音频信息处理基础音频信息处理基础h声音是机械振动或气
21、流振动引起周围传播媒质(气体、液体、固体等)声音是机械振动或气流振动引起周围传播媒质(气体、液体、固体等)发生波动的现象,通常将产生声音的发声体称为声源。当声源产生振动时,发生波动的现象,通常将产生声音的发声体称为声源。当声源产生振动时,引起邻近空气的振动。这样空气就随着声源体所振动幅度的不同,而产生引起邻近空气的振动。这样空气就随着声源体所振动幅度的不同,而产生密或稀的振动,空气的这种振动被称为声波。声波可以用一条连续的曲线密或稀的振动,空气的这种振动被称为声波。声波可以用一条连续的曲线来表示,它可以分解成一系列正弦波的线性叠加来表示,它可以分解成一系列正弦波的线性叠加。1.2.1 声音的基
22、本特性声音的基本特性h1.1.频率频率单位时间内信号振动的次数,单位是赫兹(单位时间内信号振动的次数,单位是赫兹(Hz)。)。声音的声音的音调由音调由频率频率决定。决定。n声音尖细表示频率高,声音尖细表示频率高,n声音低粗表示频率低。声音低粗表示频率低。1.2.1 声音的基本特性声音的基本特性次声波次声波音频信号音频信号超声波超声波20 000Hz声音信号按频率划分:声音信号按频率划分:h2.2.频谱频谱 声音信号按频率成分组成来分,可分为:声音信号按频率成分组成来分,可分为:n纯音:纯音:频率单一、振幅随时间按正弦函数规律变化的声音频率单一、振幅随时间按正弦函数规律变化的声音n复音:复音:由
23、不同频率和不同振幅的声波组合而成的声音由不同频率和不同振幅的声波组合而成的声音n基音:基音:复音中频率最低的成分(分音)复音中频率最低的成分(分音)n谐音:谐音:复音中频率与基音成整数倍的分音复音中频率与基音成整数倍的分音 声音的频谱结构是用基音、谐音数目、各谐音振幅大小声音的频谱结构是用基音、谐音数目、各谐音振幅大小及相位关系来描述的。声音的音色就是由其频谱成分决定的。及相位关系来描述的。声音的音色就是由其频谱成分决定的。1.2.1 声音的基本特性声音的基本特性声压声压n由声波引起的交变压强称为声压,一般用由声波引起的交变压强称为声压,一般用P表示,单位是帕(表示,单位是帕(Pa)。)。n声
24、压的大小反映了声音振动的强弱,同时也决定了声波的幅度大小。声压的大小反映了声音振动的强弱,同时也决定了声波的幅度大小。声压级声压级 用声压的相对大小(称声压级或声强)来表示声压的强弱。声压级用声压的相对大小(称声压级或声强)来表示声压的强弱。声压级用符号用符号SPL 表示,单位是分贝(表示,单位是分贝(dB):式中,式中,P为声压有效值;为声压有效值;Pref为参考声压,一般取为参考声压,一般取 Pa,这个数,这个数值是人耳所能听到的值是人耳所能听到的1kHz声音的最低声压,低于这一声压,人耳就无声音的最低声压,低于这一声压,人耳就无法觉察出声波的存在了。法觉察出声波的存在了。h3.3.声压及
25、声压级声压及声压级 1.2.1 声音的基本特性声音的基本特性 人对声音的感知有人对声音的感知有响度响度、音调音调和和音色音色三个主观听感要素。三个主观听感要素。n响度响度:与声波振动的幅度有关与声波振动的幅度有关n音调:音调:取决于声波的基音频率取决于声波的基音频率n音色:音色:由声波的的频谱成分决定由声波的的频谱成分决定1.2.2 声音的主观感觉声音的主观感觉h1.1.响度:响度:是人耳对声音强弱的主观感觉程度。是人耳对声音强弱的主观感觉程度。在客观的度量中,声音的强弱是由声波的振幅(声压)决在客观的度量中,声音的强弱是由声波的振幅(声压)决定的。但响度与声波的振幅并不完全一致。响度不仅取决
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体信息 处理 基础
限制150内