《文本信息的获取.ppt》由会员分享,可在线阅读,更多相关《文本信息的获取.ppt(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 文本信息的获取文本信息的获取什么是文本信息什么是文本信息 文本信息包括所有的字母、数文本信息包括所有的字母、数字和符号。字和符号。数字化数字化解释一:解释一:数字化就是将许多复杂多变的信数字化就是将许多复杂多变的信息转变为可以度量的数字、数据,再以这息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,些数字、数据建立起适当的数字化模型,把它们转变为一系列把它们转变为一系列二进制代码二进制代码,引入计,引入计算机内部,进行统一处理,这就是数字化算机内部,进行统一处理,这就是数字化的基本过程。解释二:数字化将任何连续的基本过程。解释二:数字化将任何连续变化的输入如图画的线条或
2、声音信号转化变化的输入如图画的线条或声音信号转化为一串分离的单元,在计算机中用为一串分离的单元,在计算机中用0和和1表表示。通常用示。通常用模数转换器模数转换器执行这个转换。执行这个转换。概念:概念:下下面面所所列列举举的的资资料料中中,哪哪些些是是数数字字化化了了的资料?的资料?报纸报纸杂志杂志书籍书籍相片相片磁盘磁盘光盘光盘(CDROM)录相带录相带信息数字化后所具有的优点:信息数字化后所具有的优点:1.易于表示和存储2.易于处理和检索3.易于传播和集成4.易于获取和共享文本信息的获取方法文本信息的获取方法 通过网络获取文本信息;通过网络获取文本信息;通过键盘直接录入文本信息;通过键盘直接
3、录入文本信息;通过通过手写手写录入文本信息;录入文本信息;通过通过OCR(光学字符识别技术光学字符识别技术)进行文本信进行文本信息的录入;息的录入;通过语音识别技术进行文本信息的录入;通过语音识别技术进行文本信息的录入;手写输入技术手写输入技术巵巵罴罴杲杲砵砵桒桒声音的制作过程:先将模拟音源从声卡的麦克风输入插口声音的制作过程:先将模拟音源从声卡的麦克风输入插口送入计算机,运行音频处理软件(如送入计算机,运行音频处理软件(如Windows的录音机、的录音机、CoolEdit),由软件控制声卡的合成器对模拟音频采样后,由软件控制声卡的合成器对模拟音频采样后,量化编码为二进制数字序列,经过处理后以
4、某种音频格式量化编码为二进制数字序列,经过处理后以某种音频格式的文件形式存储在计算机中。回放数字音频时,再由数字的文件形式存储在计算机中。回放数字音频时,再由数字到模拟的转换器解码,将二进制编码还原成模拟的信号,到模拟的转换器解码,将二进制编码还原成模拟的信号,通过音响设备输出。通过音响设备输出。声音信息的表示:数字音频的质量的决定因素采样频率:1秒钟内采样的次数。(常用:11.025kHz,22.05kHz,44.1kHz)量化位数:描述每个采榇点值的二进制位数(8位和16位)声道数:声音通道的个数(单声道、双声道即立体声).图像信息的表示图像信息的表示 图像数字化:将图像上每个点的颜色信息
5、按某种规律编成一系列二进制编码,既用0和和1的组合来表示图象信息的过程。数码相机(数码相机(DC):):DV:数字视频:数字视频.视频信息的表示视频信息的表示数字视频信号的获取可以分为两种方式:数字视频信号的获取可以分为两种方式:1.将模拟视频的数字化将模拟视频的数字化 2.由类似数码摄像机之类的设备直接摄制由类似数码摄像机之类的设备直接摄制 一般地,使用视频采集卡对摄像机、录相机、一般地,使用视频采集卡对摄像机、录相机、摄像头和其他视频信号源获得的模拟视频进行捕捉摄像头和其他视频信号源获得的模拟视频进行捕捉并转化为数字信号并转化为数字信号模糊识别的原理模糊识别的原理模糊识别的原理模糊识别的原理模糊信息 模糊集合 信息代码例如:人脸识别技术、虹膜识别技术、指纹识别技术等人工智能人工智能 计算机通过学习、训练,从计算机通过学习、训练,从而能够理解、领悟和认识的能而能够理解、领悟和认识的能力。力。小结小结1.1.什么是文本信息什么是文本信息2.2.文本信息的获取方法文本信息的获取方法3.3.模糊识别的原理模糊识别的原理4.4.人工智能人工智能
限制150内