信息媒体工程学介绍.ppt
第第1 1章章 信息媒体工程学介绍信息媒体工程学介绍任课教师:张佳任课教师:张佳专业:模式识别与智能系统专业:模式识别与智能系统电话:电话:6891246368912463Email:Email:课程简介课程简介信息媒体工程学信息媒体工程学参考文献参考文献信息媒体信息媒体一、一、课程简介课程简介学时计划:学时计划:总学时总学时 3232每讲每讲2 2学时学时共分共分1515讲讲2 2学时复习答疑学时复习答疑考试方式:半开卷考试方式:半开卷成绩组成:成绩组成:4040分平时成绩(出勤、课堂作业)分平时成绩(出勤、课堂作业)+60 +60分考试成绩分考试成绩信源信源信宿信宿信道信道 信息是指客观世界中不断发信息是指客观世界中不断发生和被传递的可以表征事物特生和被传递的可以表征事物特性的事实或数据。性的事实或数据。以传送信息的字以传送信息的字符发生率定义信符发生率定义信息量息量二、信息媒体二、信息媒体什么是信息什么是信息?传统传统:媒体是信息的载体媒体是信息的载体,如报纸、电视、广播、广如报纸、电视、广播、广告、杂志等,信息借助于这些载体得以交流传播。告、杂志等,信息借助于这些载体得以交流传播。媒体传递信息的基本元素:声音、图形、视频、图媒体传递信息的基本元素:声音、图形、视频、图像、动画、文字。像、动画、文字。媒体媒体媒体:信息传递和存储的技术和手段,即信息的载体。媒体:信息传递和存储的技术和手段,即信息的载体。感知媒感知媒体体呈现媒体呈现媒体传输媒传输媒体体直接作用于人的感官,使直接作用于人的感官,使人产生感觉人产生感觉为加工、处理和传输感知为加工、处理和传输感知媒体而人为构造出来的媒体而人为构造出来的将媒体信息的内容呈现出来将媒体信息的内容呈现出来媒体的种类媒体的种类表示媒表示媒体体存储媒存储媒体体用于存储表示媒体的物理介用于存储表示媒体的物理介质,用以方便计算机处理、质,用以方便计算机处理、加工和调用加工和调用将表示媒体从一处传输到另将表示媒体从一处传输到另一处的物理媒介一处的物理媒介视觉媒体、听觉媒体、触觉视觉媒体、听觉媒体、触觉媒体、嗅觉媒体、味觉媒体媒体、嗅觉媒体、味觉媒体各种编码方式:语音编码、各种编码方式:语音编码、视频编码、图像编码视频编码、图像编码输入类:键盘、鼠标、扫描仪输入类:键盘、鼠标、扫描仪输出类:显示器、扬声器、打印机输出类:显示器、扬声器、打印机外部存储介质:磁盘、外部存储介质:磁盘、光盘、磁带等光盘、磁带等双绞线、同轴电缆、双绞线、同轴电缆、光纤、微波光纤、微波利用信息媒体的通信利用信息媒体的通信沟通沟通空间因素空间因素时间因素时间因素克服了空间与时间的限制克服了空间与时间的限制通信通信?要传递某些信息要传递某些信息,或从某处或从某处获取某些信息获取某些信息表现媒体的种类表现媒体的种类表现媒体:人脑中的信息需要用相应的表现媒体表现媒体:人脑中的信息需要用相应的表现媒体去表现。去表现。用计算机对各种各样的表现媒体进行处理时,首用计算机对各种各样的表现媒体进行处理时,首先要把媒体所具有的信息进行数字化后再输入到先要把媒体所具有的信息进行数字化后再输入到计算机中,然后对输入的表现媒体所带的信息进计算机中,然后对输入的表现媒体所带的信息进行处理,再将所处理的信息用所对应的表现媒体行处理,再将所处理的信息用所对应的表现媒体来表现,然后有必要对人作出一种提示。来表现,然后有必要对人作出一种提示。(1 1)视觉)视觉通信媒介:可见光通信媒介:可见光输入装置:照相机、扫描仪输入装置:照相机、扫描仪输出装置:打印机、显示器输出装置:打印机、显示器表现媒体:文字、图形、图像、景色表现媒体:文字、图形、图像、景色图像处理图像处理(2 2)听觉)听觉通信媒介:空气的疏密波通信媒介:空气的疏密波输入装置:话筒输入装置:话筒输出装置:喇叭输出装置:喇叭表现媒体:语言、音乐表现媒体:语言、音乐语音识别、语音识别、语音合成语音合成(3 3)触觉)触觉没有作为信号媒介的通信媒体,是输入装置没有作为信号媒介的通信媒体,是输入装置(接受刺激的皮肤)和输出装置(引起刺激的(接受刺激的皮肤)和输出装置(引起刺激的装置)直接接触。装置)直接接触。如何处理获得的触觉信号,为了产生某种感觉如何处理获得的触觉信号,为了产生某种感觉把信息如何变换成信号等信息处理的研究刚刚把信息如何变换成信号等信息处理的研究刚刚开始,远没有达到可以使用的信息媒体的阶段。开始,远没有达到可以使用的信息媒体的阶段。(4 4)嗅觉)嗅觉通信媒体:空气通信媒体:空气输入装置:感知气味的传感器输入装置:感知气味的传感器输出装置:时序设备(探测气味)输出装置:时序设备(探测气味)(5 5)味觉)味觉媒介:可溶性物质媒介:可溶性物质传感器:测水果糖度的传感器传感器:测水果糖度的传感器视觉媒体视觉媒体图像:图像:采用各种观测系统获得的、能够为人类视觉系统采用各种观测系统获得的、能够为人类视觉系统所感知的实体,是各种图片和影像的总称。包括:照片、所感知的实体,是各种图片和影像的总称。包括:照片、X X光片、遥感图片、电视画面、绘图等。光片、遥感图片、电视画面、绘图等。视频:视频:动态图像,是一组图像按时间顺序的连续表现。动态图像,是一组图像按时间顺序的连续表现。图形:图形:抽象化的图像,一般指用计算机绘制的几何画面。抽象化的图像,一般指用计算机绘制的几何画面。不直接描述图像的每一点,而是描述产生这些点的算法。不直接描述图像的每一点,而是描述产生这些点的算法。动画:动画:动态图像的一种,其中的图像采用的是计算机产动态图像的一种,其中的图像采用的是计算机产生出来或人工绘制的图像或图形。生出来或人工绘制的图像或图形。符号与文本:符号与文本:符号是人类对信息进行抽象的结果。文本符号是人类对信息进行抽象的结果。文本是人类创造出来用于记述信息的工具,由具有上下文关是人类创造出来用于记述信息的工具,由具有上下文关系的字符串所组成。系的字符串所组成。感知媒体感知媒体听觉媒体听觉媒体波形声音:波形声音:包含了所有的声音形式。自然界中的各种包含了所有的声音形式。自然界中的各种声音都可以以一种模拟的连续波形表示。通过对模拟声音都可以以一种模拟的连续波形表示。通过对模拟的声音进行采样、量化和编码,可生成数字的波形声的声音进行采样、量化和编码,可生成数字的波形声音数据。音数据。语音:语音:人类为表达思想通过发音器官发出的声音,是人类为表达思想通过发音器官发出的声音,是人类语言的物理形式,由一连串的因素组成。人类语言的物理形式,由一连串的因素组成。音乐:音乐:是符号化了的声音,这种符号就是乐谱。是符号化了的声音,这种符号就是乐谱。触觉媒体触觉媒体:人类与外界环境的触觉交互主要包:人类与外界环境的触觉交互主要包括位置跟踪、力量反馈等方面。已引入虚拟现括位置跟踪、力量反馈等方面。已引入虚拟现实系统,对触觉媒体的研究处于初级阶段。实系统,对触觉媒体的研究处于初级阶段。嗅觉媒体嗅觉媒体味觉媒体味觉媒体尚尚不能不能在在计算机中处理计算机中处理举例举例信息媒体信息媒体 电话电话感知媒体感知媒体 听觉媒体:听觉媒体:语言、声音语言、声音传输媒体传输媒体 电线、空间电线、空间三、信息媒体工程学三、信息媒体工程学计算机的信息媒体必须对各种各样的感知媒计算机的信息媒体必须对各种各样的感知媒体具有相对应的输入、输出功能,并能进行体具有相对应的输入、输出功能,并能进行相应的处理。相应的处理。信息媒体工程学信息媒体工程学研究计算机所具有的各种研究计算机所具有的各种感知媒体的处理有关的基本原理、技术。感知媒体的处理有关的基本原理、技术。不只信息媒体本身,不只信息媒体本身,还包括处理和应用还包括处理和应用多媒体信息的相应技术多媒体信息的相应技术信息媒体工程的研究领域信息媒体工程的研究领域1.1.自然语言处理自然语言处理2.2.语音识别语音识别3.3.音乐处理音乐处理4.4.图像处理图像处理5.5.文字识别文字识别6.6.影像分析影像分析 1 1、自然语言处理、自然语言处理自然语言处理是计算机科学领域与人工智能领自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。有效通信的各种理论和方法。关键技术:汉字编码、词法分析、句法分析、关键技术:汉字编码、词法分析、句法分析、语义分析、文本生成、语音识别语义分析、文本生成、语音识别2 2、语音识别、语音识别语音识别技术的目标是语音识别技术的目标是将人类的语音中的词汇内容将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码转换为计算机可读的输入,例如按键、二进制编码或者字符序列或者字符序列。应用应用:语音拨号、语音导航、室内设备控制、语音文语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。用,例如语音到语音的翻译。3 3、图像处理、图像处理图像处理图像处理(Image Processing)(Image Processing),用计算机对图像进,用计算机对图像进行分析,以达到所需结果的技术。行分析,以达到所需结果的技术。图像处理一般指数字图像处理。数字图像是指用数图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的字摄像机、扫描仪等设备经过采样和数字化得到的一个的二维数组,该数组的元素称为像素,其值为一个的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别三个部分。原,匹配、描述和识别三个部分。常见的处理有图像数字化、图像编码、图像增强、常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像复原、图像分割和图像分析等。4 4、文字识别、文字识别利用计算机自动识别字符的技术,是模式识别应用的一个利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。重要领域。文字识别可应用于许多领域,如阅读、翻译、文献资料的文字识别可应用于许多领域,如阅读、翻译、文献资料的检索、信件和包裹的分拣、稿件的编辑和校对、大量统计检索、信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理,以及水、统计汇总、商品编码的识别、商品仓库的管理,以及水、电、煤气、房租、人身保险等费用的征收业务中的大量信电、煤气、房租、人身保险等费用的征收业务中的大量信用卡片的自动处理用卡片的自动处理 和办公室打字员工作的局部自和办公室打字员工作的局部自 动化等。动化等。5 5、影像分析、影像分析 影像分析,是指从地物或现象的物理、化学、影像分析,是指从地物或现象的物理、化学、几何等特征和成像机制出发,运用地学、生物几何等特征和成像机制出发,运用地学、生物学和环境科学规律对遥感影像进行分析,以识学和环境科学规律对遥感影像进行分析,以识别地物或现象及其相互关系的过程。别地物或现象及其相互关系的过程。四、参考文献四、参考文献 (日日)美浓导彦美浓导彦,西田正吾编,白玉林西田正吾编,白玉林,王毓仁王毓仁,商商福昆译。信息媒体工程。北京福昆译。信息媒体工程。北京-科学出版社,科学出版社,20012001。卢官明,焦良葆。多媒体信息处理。人民邮电出版卢官明,焦良葆。多媒体信息处理。人民邮电出版社,社,20112011朱学芳。多媒体信息处理与检索技术。电子工业出朱学芳。多媒体信息处理与检索技术。电子工业出版社,版社,20022002。王向阳。多媒体信息处理技术原理。科学出版社,王向阳。多媒体信息处理技术原理。科学出版社,20052005。冈萨雷斯。数字图像处理(第二版)。电子工业出冈萨雷斯。数字图像处理(第二版)。电子工业出版社,版社,20092009。