多媒体基础知识概述课件.ppt
《多媒体基础知识概述课件.ppt》由会员分享,可在线阅读,更多相关《多媒体基础知识概述课件.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.1 6.1 多媒体技术概述多媒体技术概述6.2 6.2 音频信息的表示和处理音频信息的表示和处理6.3 6.3 图形图像的表示和处理图形图像的表示和处理6.4 6.4 视频信息处理视频信息处理6.5 6.5 动画(了解)动画(了解)6.6 6.6 多媒体数据压缩标准(选讲)多媒体数据压缩标准(选讲)第第6 6章章 多媒体基础多媒体基础1一、多媒体的概念一、多媒体的概念v 媒体媒体:即信息的载体:即信息的载体两种含义:两种含义:(1)存储信息的载体,如磁盘、存储器等)存储信息的载体,如磁盘、存储器等 (2)传递信息的载体,如数字,声音等)传递信息的载体,如数字,声音等 其中(其中(2)为主要
2、学习范畴。)为主要学习范畴。6.1 多媒体技术概述多媒体技术概述2v媒体分类媒体分类:视觉、听觉、触觉等视觉、听觉、触觉等v多媒体多媒体:直接作用于人的感官的文字、图:直接作用于人的感官的文字、图形、图像、动画、声音和影像等各种媒体的统形、图像、动画、声音和影像等各种媒体的统称,是多种信息载体的表现形式和传递方式。称,是多种信息载体的表现形式和传递方式。v 多媒体技术多媒体技术:把文字、图形、图像、动:把文字、图形、图像、动画、音频和视频等各种媒体通过计算机进行数画、音频和视频等各种媒体通过计算机进行数字化的采集、获取、加工处理、存储和传播而字化的采集、获取、加工处理、存储和传播而综合为一体化
3、的技术。综合为一体化的技术。3二、多媒体技术的特性二、多媒体技术的特性v 多样性多样性 v 集成性集成性 多媒体信息的集成多媒体信息的集成设备和软件的集成设备和软件的集成v 交互性交互性v 数字化数字化4三、多媒体信息的类型三、多媒体信息的类型 文本、图形、图像、动画、视频和音频文本、图形、图像、动画、视频和音频v 文本文本(计算机中基本的信息表示方式,包计算机中基本的信息表示方式,包括字母、数字及各种符号)括字母、数字及各种符号)v 图形图形 (通过绘图软件绘制的直线、圆、圆(通过绘图软件绘制的直线、圆、圆弧、曲线等组成的画面,以矢量图形文件保存,弧、曲线等组成的画面,以矢量图形文件保存,保
4、存其生成图形的指令)保存其生成图形的指令)5三、多媒体信息的类型三、多媒体信息的类型v 图像图像 (通过扫描仪等输入设备捕捉的真实(通过扫描仪等输入设备捕捉的真实场景的画面,数字化后以位图格式存储。)场景的画面,数字化后以位图格式存储。)v 动画动画 (制作软件有制作软件有flashflash、3DSMAX3DSMAX等等)v 视频视频 (来自摄像机等视频信号源的影像,来自摄像机等视频信号源的影像,数字化后以视频文件格式存储数字化后以视频文件格式存储)v 音频音频 (包括语音、音乐及各种动物和自然包括语音、音乐及各种动物和自然界发出的声音等界发出的声音等)6四、多媒体技术的发展历史四、多媒体技
5、术的发展历史u1984年年Apple公司公司Macintosh机机bitmapu1986年年Philips、Sony推出推出650M光盘光盘u1989年年Intel的的DVI(交互数字视频交互数字视频)u1992年年Intel将将DVI用于主板用于主板u1990S,图像压缩,图像压缩/解压方案解压方案MPEG7五、多媒体技术的应用领域五、多媒体技术的应用领域1.多媒体教育多媒体教育2.电子出版物电子出版物报纸,教材,辞典,数据库文献报纸,教材,辞典,数据库文献报纸,教材,辞典,数据库文献报纸,教材,辞典,数据库文献1 1张光盘可存储张光盘可存储张光盘可存储张光盘可存储600600本本本本505
6、0万汉字的书万汉字的书万汉字的书万汉字的书3.多媒体网络应用多媒体网络应用互联网的直播、视频点播、互联网的直播、视频点播、远程教育、视频会议系统远程教育、视频会议系统86.2 6.2 音频的表示和处理音频的表示和处理6.2.1 音频的数字化(音频的数字化(重点重点)6.2.2 声音合成技术声音合成技术6.2.3 常用的音频文件格式常用的音频文件格式6.2.4 声音处理软件声音处理软件9u声音:具有振幅周期性的声波声音:具有振幅周期性的声波u3个量描述:振幅、周期、频率个量描述:振幅、周期、频率u人耳听觉范围:人耳听觉范围:2020kHz 蚊子声音蚊子声音u说话频率:说话频率:300Hz3400
7、Hzu音频(音频(Audio)u音频技术包括:音频技术包括:音频信息采集、编码音频信息采集、编码/解码、编辑、解码、编辑、传输;音乐合成、语音识别理解、音频视频同步传输;音乐合成、语音识别理解、音频视频同步6.2 音频信息的表示与处理音频信息的表示与处理106.2.1 音频的数字化音频的数字化 多媒体信息在计算机中进行处理,其多媒体信息在计算机中进行处理,其核心问题是数字化,即转化为二进制数字核心问题是数字化,即转化为二进制数字进行处理,处理后在输出。在其过程中要进行处理,处理后在输出。在其过程中要经过经过“模数模数”转换或转换或“数模数模”转换。转换。音频信号转为数字信号的过程如下:音频信号
8、转为数字信号的过程如下:11 实现音频的数字化就是将模拟音频信号转换实现音频的数字化就是将模拟音频信号转换成有限个数字表示的离散序列。音频数字化涉及成有限个数字表示的离散序列。音频数字化涉及音频的音频的采样采样、量化量化和和编码编码。模拟模拟模拟模拟声音声音声音声音信号信号信号信号采样采样量化量化编码编码数字数字数字数字声音声音声音声音011010011101 6.2.1音频的数字化音频的数字化 选择采样频率,进行采样;选择分辨率,进选择采样频率,进行采样;选择分辨率,进行量化;形成数字化声音。行量化;形成数字化声音。121.声音采样l l计算机并不直接使用连续平滑的波形来表示声音。它是以固定
9、的时间间隔对波形的幅值进行采样,用得到的系列数字量来表示声音。6.2.1音频的数字化音频的数字化13l奈奎斯特采样定理:采样频率只要高于被采样信号最高频率的2倍,就能获得满意的声音还原效果。l采样频率采样频率:单位时间内的采样次数。:单位时间内的采样次数。l常用的采样频率:常用的采样频率:11.025kHz(11.025kHz(11.025kHz(11.025kHz(语言效果语言效果语言效果语言效果)、22.05kHz(22.05kHz(22.05kHz(22.05kHz(音乐效果音乐效果音乐效果音乐效果)和和和和44.1kHz(44.1kHz(44.1kHz(44.1kHz(高保真效果高保真
10、效果高保真效果高保真效果)6.2.1音频的数字化音频的数字化142.量化6.2.1音频的数字化音频的数字化 采样得到的数据只是一些离散的值,将这些离散采样得到的数据只是一些离散的值,将这些离散采样得到的数据只是一些离散的值,将这些离散采样得到的数据只是一些离散的值,将这些离散的值用计算机中的若干二进制位来表示,这一过程称的值用计算机中的若干二进制位来表示,这一过程称的值用计算机中的若干二进制位来表示,这一过程称的值用计算机中的若干二进制位来表示,这一过程称作量化。显然,量化的过程中要损失一些精度。作量化。显然,量化的过程中要损失一些精度。作量化。显然,量化的过程中要损失一些精度。作量化。显然,
11、量化的过程中要损失一些精度。量化精度量化精度量化精度量化精度 :若采样位数为:若采样位数为:若采样位数为:若采样位数为R R,则有,则有,则有,则有2 2R R个量化级个量化级个量化级个量化级 ;量化级分得越细,对声音信号的反应越灵敏,即量化量化级分得越细,对声音信号的反应越灵敏,即量化量化级分得越细,对声音信号的反应越灵敏,即量化量化级分得越细,对声音信号的反应越灵敏,即量化精度越高,存储的数据量也就越大。精度越高,存储的数据量也就越大。精度越高,存储的数据量也就越大。精度越高,存储的数据量也就越大。156.2.1音频的数字化音频的数字化 3 3 3 3位位位位量量量量化化化化只只只只能能能
12、能表表表表示示示示8 8 8 8个个个个值值值值;o o o o75757575,0 0 0 05 5 5 5,0 0 0 025252525,0 0 0 0,-0-0-0-025252525,-0-0-0-05 5 5 5,一一一一0 0 0 075757575和和和和-1-1-1-1,可可可可以以以以看看看看出出出出量量量量化化化化位位位位数数数数越少,波形就越难辨认,还原后的声音质量也就越差。越少,波形就越难辨认,还原后的声音质量也就越差。越少,波形就越难辨认,还原后的声音质量也就越差。越少,波形就越难辨认,还原后的声音质量也就越差。16 对对声声音音进进行行数数据据压压缩缩,减减少少数
13、数据据量量,并组织数据,便于存储和处理。并组织数据,便于存储和处理。(3)编码)编码6.2.1 6.2.1 音频的数字化(重点)音频的数字化(重点)176.2.1音频的数字化音频的数字化 声道数声道数:指声音通道的个数。指声音通道的个数。单单声声道道只只记记录录和和产产生生一一个个波波形形,双双声声道道记记录录和和产产生生两两个个波波形形,即即立立体体声声,存存储储空间是单声道的两倍。空间是单声道的两倍。186.2.1音频的数字化音频的数字化 波波形形声声音音的的主主要要参参数数包包括括:取取样样频频率率,量量化化位位数数,声声道道数数目目,使使用用的的编编码码方方法法及及码码率率。码码率率几
14、几即即每每秒秒中中的的数数据据量量,数数字字声声音音未未压压缩缩前前,码率的计算机公式为:码率的计算机公式为:码率(码率(b/s)=采样频率采样频率量化位数量化位数声道数声道数 (要会计算)(要会计算)(要会计算)(要会计算)例例例例:双双双双声声声声道道道道立立立立体体体体声声声声,采采采采样样样样频频频频率率率率为为为为11.025kHz11.025kHz,8 8位位位位量量量量化化化化,其其其其码率码率码率码率=11.025*8*2=176.4(kb/s)=22.05(kB/s)=11.025*8*2=176.4(kb/s)=22.05(kB/s)存储存储存储存储1 1分钟分钟分钟分钟这
15、样的声音数据,这样的声音数据,这样的声音数据,这样的声音数据,容量容量容量容量=22.05(kB/s)60(s)=1323kB 22.05(kB/s)60(s)=1323kB 1292KB1292KB 1.262MB1.262MB19 (1 1)乐器数字接口)乐器数字接口MIDIMIDI(了解)(了解)MIDIMIDI是多媒体计算机所支持的一种声音产是多媒体计算机所支持的一种声音产生方法,生方法,与波形音频产生和记录声音的方法不与波形音频产生和记录声音的方法不同同,它不支持记录声音的波形信息,而是说明,它不支持记录声音的波形信息,而是说明音乐信息的一系列音乐信息的一系列指令指令,如,如音符序列
16、、节拍速音符序列、节拍速度度等,即它通过描述声音产生数字化的等,即它通过描述声音产生数字化的乐谱乐谱。6.2.2 6.2.2 声音合成技术声音合成技术20 MIDI声音特点:(1 1)占用数据量小。3030分钟的音乐,用分钟的音乐,用MIDIMIDI文件记录只需文件记录只需200KB200KB,用用1616位位CDCD品质的未压缩品质的未压缩WAVWAV文件记录需文件记录需317317MB MB。(2 2)编辑修改方便灵活。配音比较方便。因为。配音比较方便。因为MIDIMIDI文件文件存储的是命令,而不是声音波形;容易编辑。存储的是命令,而不是声音波形;容易编辑。(3 3)配音比较方便。用作背
17、景音乐,和其它媒体如数字电。用作背景音乐,和其它媒体如数字电视、图形、动画、话音等一起播放,加强演示效果。视、图形、动画、话音等一起播放,加强演示效果。(4 4)处理语音能力较差,并且受合成器中乐器组合限制,并且受合成器中乐器组合限制,不能保证一个不能保证一个MIDIMIDI文件在不同声音卡上播放时效果一样文件在不同声音卡上播放时效果一样6.2.2 声音合成技术声音合成技术21(2 2)语音合成)语音合成(Speech synthesisSpeech synthesis)语音合成语音合成:使计算机模仿人的发声,自动使计算机模仿人的发声,自动生成语音的过程。生成语音的过程。合成的语音必须是可理解
18、的,听上去要尽合成的语音必须是可理解的,听上去要尽量量自然自然,可理解可理解是一个基本的前提。是一个基本的前提。例如:在股票交易、航班等动态查询,电例如:在股票交易、航班等动态查询,电话中相关信息的查询等就要用到该技术。话中相关信息的查询等就要用到该技术。6.2.2 6.2.2 声音合成技术声音合成技术22例:计算机合成的语音和音乐例:计算机合成的语音和音乐l l你好,我是贝尔实验室的中文语音合成系统你好,我是贝尔实验室的中文语音合成系统你好,我是贝尔实验室的中文语音合成系统你好,我是贝尔实验室的中文语音合成系统(BellTTS1BellTTS1BellTTS1BellTTS1)l l南京大学
19、计算机系南京大学计算机系南京大学计算机系南京大学计算机系2002200220022002年招收了年招收了年招收了年招收了202202202202名本科生,名本科生,名本科生,名本科生,15151515名(名(名(名(22222222名)名)名)名)博士生,博士生,博士生,博士生,130130130130多名硕士生。多名硕士生。多名硕士生。多名硕士生。(中科大讯飞)(中科大讯飞)(中科大讯飞)(中科大讯飞)(BellBellBellBell)l l我们都是同行,我们一路同行,去参加人参培植研讨会我们都是同行,我们一路同行,去参加人参培植研讨会我们都是同行,我们一路同行,去参加人参培植研讨会我们都
20、是同行,我们一路同行,去参加人参培植研讨会 (BellBellBellBell)(讯飞)(讯飞)(讯飞)(讯飞)l计算机合成的计算机合成的MIDIMIDI音乐音乐 军港之夜军港之夜军港之夜军港之夜(6KB6KB6KB6KB)需要进一步提高之处:发音和断句要需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力正确,提高自然度,丰富表现力231)WAV 特点:真实采样,文件大2)MP3 特点:压缩比高,文件小3)RA、RAM、RM:网络在线收听4)MID MIDI格式文件5)RMI MIDI格式文件(微软)6)MOD 自带波形表,比MID文件大6.2.3 常见音频文件格式常见音频文件格式2
21、41)波形的剪辑波形的剪辑2)声音强度调节声音强度调节3)添加声音的特殊效果添加声音的特殊效果4)格式转换功能格式转换功能6.2.4 声音处理软件声音处理软件声音处理软件声音处理软件可以对波形音频数据进行加工可以对波形音频数据进行加工处理,编辑处理功能主要包括:处理,编辑处理功能主要包括:251)超级解霸2)Gold Wave3)Audio Editer4)Sound Edit5)Wave Studio6)Cool Edit Pro6.2.4 声音处理软件声音处理软件26 图像的数字化图像的数字化 矢量图形表示矢量图形表示图形图像文件格式图形图像文件格式图形、图像处理软件图形、图像处理软件6.
22、3 图形、图像的表示与处理图形、图像的表示与处理27l l 图形图形:即矢量图形或几何图形,基本元素是即矢量图形或几何图形,基本元素是图元图元,即图形命令即图形命令,用来描述构成画面的直线、用来描述构成画面的直线、矩形、圆、圆弧、曲线等的形状、位置、颜色矩形、圆、圆弧、曲线等的形状、位置、颜色等各种属性和参数。等各种属性和参数。l l 图像图像:点阵图像或位图图像:点阵图像或位图图像(Bitmap),(Bitmap),基本元基本元素是像素。通过描述画面中素是像素。通过描述画面中每一个像素的亮度每一个像素的亮度或颜色或颜色来表示画面。来表示画面。l l图像更逼真;图形是对图像的抽象,图形变换图像
23、更逼真;图形是对图像的抽象,图形变换不失真。不失真。28 (1 1)图像的获取)图像的获取 计算机获取图像的过程称为图计算机获取图像的过程称为图像的获取,像的获取,其步骤为:其步骤为:采样采样 量化量化6.3.1 6.3.1 图像的数字化图像的数字化29采样采样:对图像进行离散化处理。经采样:对图像进行离散化处理。经采样得到得到N*MN*M的离散样本阵列,整个样本阵列的离散样本阵列,整个样本阵列构成构成位图,位图,每个采样点称为一个每个采样点称为一个像素。像素。量化量化:对每个采样点的:对每个采样点的灰度或颜色灰度或颜色进行进行数字化处理,即用数字化处理,即用二进制进行编码二进制进行编码,表示
24、,表示图像的图像的颜色颜色。6.3.1 6.3.1 图像的数字化图像的数字化30 描述图像的重要属性是:描述图像的重要属性是:图像分辨率图像分辨率 彩色空间彩色空间 图像颜色深度和最大颜色数图像颜色深度和最大颜色数 图像的数据量图像的数据量(2 2)图像的表示图像的表示6.3.1 6.3.1 图像的数字化图像的数字化31 图像的分辨率图像的分辨率:指图像的尺寸,即水平:指图像的尺寸,即水平方向上与垂直方向上所包含的像素个数。方向上与垂直方向上所包含的像素个数。与屏幕分辨率未必相同。与屏幕分辨率未必相同。彩色空间彩色空间:即颜色模型,指图像所使用:即颜色模型,指图像所使用的彩色描述方法,如:的彩
25、色描述方法,如:RGBRGB模型、模型、CMYK(CMYK(青青橙黄黑橙黄黑)模型、模型、YUV(YUV(亮度、色差亮度、色差)模型。模型。6.3.1 6.3.1 图像的数字化图像的数字化32举例:分辨率与图像尺寸的关系举例:分辨率与图像尺寸的关系520 x376260 x188130 x94 在显示比例相同时,显示在屏幕上的图像尺在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比寸与图像分辨率成正比33 图像颜色深度和最大颜色图像颜色深度和最大颜色(灰度灰度)数数:图像颜色深度图像颜色深度-组成该图像的所有组成该图像的所有颜色分量的位数之和,如颜色分量的位数之和,如8 8位或位或24
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 基础知识 概述 课件
限制150内