声音和图像.pdf
1.基本概念 声波:声源体发生振动会引起四周空气振荡 振荡方式就是声波。 复杂的声波由许多具有不同振幅和频 率的正弦波组成。 四、音频的数字化四、音频的数字化 周期T:重复出现的时间间隔; 振幅A:波形相对基线的最大位移, 表示音量的大小; 频率f:信号每秒钟变化的次数,即1/T 以赫兹(Hz)为单位。 振幅 A f 周期 T 声音按频率分类 正常人所能听到的声音频率范围为正常人所能听到的声音频率范围为 2020 HzHz2020 kHzkHz。 声音质量的频率范围声音质量的频率范围: : CDCD 如随身听如随身听 FMFM: :调频调频 AMAM: :调幅调幅 电话电话 20kHZ 20HZ 20HZ 次声波 可听声波 超声波 f(HZ) CD-DA FM 广播 AM 广播 10 20 50 200 3.4k 7k 15k 20k 次声波 可听声波 超声波 f(HZ) 电话 2.模拟音频的数字化 转换过程:转换过程: 采样:每隔一定时间间隔对模拟波形上取 一个幅度值,即离散化。 量化 :将幅度值以数字表示。 编码: 将数字数据以一定的格式记录下来 模拟模拟 信号信号 采样采样 量化量化 编码编码 数字数字 信号信号 采样 模拟信号 量化 编码成数字信号 0111000111000 3.数字音频的技术指标 采样频率、量化位数和声道数 采样频率:每秒钟的采样次数 量化位数(采样精度):存放采样点振幅值的 二进制位数。通常有8位28、16位216等级。 声道数:声音通道的个数,立体声为双声道。 每秒钟存储声音容量的公式为: 采样频率采样精度声道数/8=字节数 采样频率和量化参数比较 例: 用44.10 kHz采样频率,16位精度存储, 则录制1秒钟的立体声节目,其WAV文件所 需的存储量为: 44 100162/8=176 400(字节) 4.数字音频的文件格式 Wave格式文件(.wav) 记录了真实声音的二进制采样数据,文件大 MIDI格式文件(.mid) 记录的是音符数字,文件小,一般背景音乐 MPEG音频文件(.mp3 ) 采用MPEG音频压缩标准进行压缩的文件。 RA格式文件(.ra) RA(Real Audio)是Real Network公司制 定的音频压缩规范,有较高的压缩比,采用 流媒体的方式在网上实时播放。 5.声音的录制与播放 “录音机”是Windows附件中提供的程序。 作用:声音文件的录制与播放,对声音进行简单编辑。 Windows XP Windows 7 五、图像的数字化五、图像的数字化 图图 形形 图像图像 1.基本概念 图形和图像 图形:由点、线等组成的有边界画面, 文件中存放描述图形的指令。 图像:由图像设备输入的无边界画面, 数字化后以位图形式存储。 2.图像的数字化 采样 用多少个像素点的“列数行数”描述图像, 即图像分辨率;分辨率高,图像清晰,存储量大 量化 将像素点色彩、浓淡的值以整数值表示, 整数值占位数称为量化级数,即颜色深度. 模拟图像 采样 量化 编码 数字图像 颜色深度 黑白图黑白图 深度为1,一个二进制位1和0表示纯白、纯黑; 灰度图灰度图 深度为8,占一个字节,灰度级别为256级。 RGB 24RGB 24位位真彩色 由红、绿、蓝三基色混合而成, 每色值为0255,共占24位,就构成了224“真彩色” 灰度图 彩色图 思考: 如何查看同一幅图选择不同颜色深度所占大小? 图像的分辨率和像素位的颜色深度决定了 图像文件的大小,计算公式为: 列数行数颜色深度8=图像字节数 例 当要表示一个分辨率为640480的 “24位真彩色”图像,则需要: 6404802481MB 由此可见,数字化后的图像数据量巨大, 必须采用编码技术来压缩信息,它是图像 传输与存储的关键。 3.常用图像文件格式 BMP和DIB格式文件 位图格式文件,Windows环境中经常使用. WMF格式文件 位图与矢量图的混合体, 剪贴画图像是以 该格式存储; 应用于桌面出版印刷领域 JPEG格式文件(.jpg) 适用于处理256色以上、大幅面图像,网络 GIF格式文件 256色以内,<64 KB,压缩比较高,网络 PNG格式文件 移植的网络图象文件格式,流式图像文件。 压缩比率高,无损压缩,支持Alpha通道 透明图像制作;但不支持动画功能。 4. 4. 图像数据的获取图像数据的获取 利用图像处理软件和现成的图像库 最常用的是Photoshop,可以绘图,也可以编辑 来自网络、CD-ROM光盘上存储的图像库 “画图”程序可以获取屏幕界面 利用数字化设备获取 数码相机、数字摄象机,将拍摄的自然界景 物按数字格式存储通过连接转换转换成计算机 中的图像和影象文件。 扫描仪将照片、艺术作品转换成数字图像文件。