多媒体技术与培训课件制作技术复训.docx
《多媒体技术与培训课件制作技术复训.docx》由会员分享,可在线阅读,更多相关《多媒体技术与培训课件制作技术复训.docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体技术及培训课件制作技术多媒体课件素材,大致可以分为文本、图形、图像、音频(声音)、视频、动画等几种主要形式。第一章 文本素材的获得及处理一、常见文本文件的格式目前流行的文字处理软件种类繁多,不同的软件生成的文件格式各不一样。当运用不同的文本编辑软件编辑文本时,系统通常会采纳默认的文本文件格式来保存文档。如字处理软件MicroSoft Word XP/2003的默认文档格式为DOC ,当然该软件还支持另外一些流行的文本文件格式。如TXT 、RTF等等。下面是比拟流行的文本文件格式:1.TXT格式:是纯ASCII码文本文件,纯文本文件除了换行和回车外,不包括任何格式化的信息,即文件里没有任何
2、有关文字字体、大小、颜色、位置等格式化信息。2.WRI格式: 是Windows系统下的写字板应用程序所支持的文件格式。3.DOC格式: 是Microsoft Word字处理软件所运用的默认文件格式,其中可以包含不同的字符格式和段落格式。4.RTF格式:是Rich Text Format文件格式,是一种可以包含文字、图片和热字(超文本)等多种媒体的文档。5.WPS格式:是金山中文字处理软件的格式,其中包含特有的换行和排版信息,称为格式化文本,通常只在WPS编辑软件中运用。二、文字素材的采集文本信息输入、采集的方法主要有以下几类:1.键盘输入方法键盘输入文本的优点是便利快捷,易修改并且不需附加录入
3、设备,缺点是由于运用键盘输入文字通常须要理解和记忆对应的中文输入法的编码规则,因此输入速度较难进步。 2.语音输入方法语音输入法,是将声音通过话筒输入计算机后干脆转换成文字的一种输入方法。利用语音识别技术,计算机能快速、自然地把读入计算机的声音信息转换成计算机中的文本。3.联机手写识别输入手写输入法是一种用特制的感应书写笔,在及计算机接口相连的手写板上书写文字来完成文本输入的方法。它符合人们用笔写字的习惯,只要将手写板接入计算机,在手写板上按平常的习惯写字,电脑就能将其识别显示出来。4.扫描仪+OCR识别输入法在实际办公中,假如须要进展大量文字录入,如书稿,资料等,仍用手工录入,无疑会奢侈很多
4、时间,用扫描转换的方法,可以大大加快文字录入速度,进步工作效率。利用OCR技术,我们可以把须要的教材、文件、资料等进展扫描转换,生成电子文档,更便于保存。OCR是光学字符识别技术的英文缩写。扫描仪+OCR识别输入就是将印刷品类纸张上的文字以图像的方式扫描到计算机中,再用OCR软件将图像中的文字识别出来,并转换为文本格式的文件。它要求把要输入的文稿首先通过扫描仪转化为图像后才能识别,所以,扫描仪是OCR技术中必需的配置。假如被扫描的原稿印刷质量越高,识别的精确率就越高,一般最好是印刷体的文字,比方图书、杂志等,假如原稿的纸张较薄,那么有可能在扫描时纸张反面的图形、文字也透射过来,干扰最终的识别效
5、果。须要留意的是,扫描仪本身并没有文字识别功能,它只能将文稿扫描到计算机中后以图片的方式保存,文字识别则由OCR软件处理完成。三、OCR文字识别过程扫描仪+OCR识别输入法能将纸介文件转换为电子文档,通常须要经过文稿扫描、版面处理、文字识别、文字编辑几个阶段。下面以中晶科技的扫描仪Microtek ScanMaker 4100和尚书七号OCR识别软件为例,构建一个扫描、文字识别系统。利用该系统扫描文字图像并将文字图像转换为电子文档的操作过程是: 依据扫描仪的说明书,将计算机和扫描仪连接好,并安装相应的驱动程序、图像扫描程序Microtek ScanWizard 5 和尚书七号OCR软件。文字识
6、别工作区文件管理区工具栏菜单栏文字识别工作区1-1尚书七号OCR系统窗口 双击Windows桌面上的“尚书七号OCR”快捷方式图标,启动尚书七号OCR程序,如图1-1所示,及其它高档品牌的扫描仪一样, Microtek ScanMaker 4100扫描仪在其配置的图像扫描程序Microtek ScanWizard 5中,本身也包含了干脆对文字稿件的OCR识别功能,但由于文档识别率较低,因此采纳了及扫描仪匹配的第三方OCR文字识别软件。图2-3设置系统参数图1-2扫描图像的来源 翻开菜单栏上文件菜单,执行“选择扫描仪”吩咐,翻开图1-2所示的“选择来源”对话框,选定对应扫描仪型号的驱动程序选项。
7、再选择文件菜单,执行“系统配置”吩咐,翻开图2-3所示的“设置系统参数”对话框,并在获得新图像面板上选择识别语言为“中文简体”,按下【确定】按钮,配置完成。留意:选择的识别语言要依据被识别的文字图像上的文字内容而定,假如为纯英文,则应选择英文识别。 将要扫描的印刷体文字稿件平放在扫描仪玻璃上。在放置扫描原稿时,被扫描的文字材料肯定要摆放在扫描起始线正中,并且文稿的一角应对齐基点,以最大限度地减小由于光学透镜导致的失真,这样有助于后面进步OCR软件识别率。同时还要留意扫描仪玻璃的干净和爱护其不受损害。 单击尚书OCR程序窗口中工具栏上的“扫描”按钮【】,启动扫描程序Microtek ScanWi
8、zard5 ,在图1-4所示的“设置”面板中,依次设定扫描辨别率为300dpi、扫描图像色调形式为黑白二色、阀值可设定其范围在80130之间,阀值稍有改变会影响OCR的识别结果。应当留意:辨别率的设置是文字识别的重要前提,但不是扫描辨别率设得越高识别正确率就越高。通常,要求设置辨别率的大小和文字大小成反比关系。1、2、3号字的文章段,举荐运用200dpi;4、小4、5号字的文章段,举荐运用300dpi;文字原稿的扫描识别,设置扫描辨别率时千万不要超过扫描仪的光学辨别率,不然会得不偿失。图1-4扫描程序Microtek ScanWizard 5的主窗口为了便于后面识别文本图像,建议最好不要大量采
9、纳灰度、彩色扫描形式扫描文件,因为彩色图像文件占用大量的内存和CPU,操作速度会很慢;而且背景图案会影响处理效果。 单击扫描程序窗口中工具栏上的【预览】按钮,扫描仪开场工作。屏幕上扫描程序窗口的图像显示区将显示出纸介文稿上的文字图像,单击其工具栏上的“选区”按钮【】,并通过拖曳鼠标,在文字图像中框选出要扫描的文字图像区域,如图1-4所示。然后点击工具栏上的【预扫】按钮,执行图像的预扫描。在对原稿扫描时,假如选用了灰度或RGB彩色形式,为了进步文字识别率,可调整原图像的亮度、比照度,使扫描文件黑白清楚;调整原图像暗调和高光,丰富原图像的亮度层次,使扫描图像更加清晰。调整扫描参数的详细操作是:w
10、在Microtek ScanWizard 5程序窗口中,单击设置面板中的按钮【】,进展扫描图像的亮度和比照度值的设置。在进展正式识别前,先视察扫描得到的图像中文字质量如何,假如图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说光明度值太小了,应当增加亮度值;假如文字线条凹凸不平,有断线甚至图像中汉字轮廓严峻残缺时,说光明度值太大了,应减小亮度值;w 单击设置面板中的“亮度/比照度”按钮【】,可选择不同的色阶分布通道,通过拖动色阶滑块对扫描图像的亮度层次进展调整。 在设定了适宜的扫描参数并对原图像作了相关的调整后,即可正式执行扫描操作,单击【扫描】按钮,扫描仪马上开场驱动,并显示扫描进程,
11、扫描得到的文字图像将干脆传送到尚书七号OCR系统的图像处理界面窗口中。 单击尚书七号OCR程序窗口工具栏上的缩放按钮【】和【】,可以调整图像处理窗口中文字图像的大小。然后,依次选择识别菜单中的“图像反白”和“自动倾斜校正”吩咐对文字图像进展处理。再单击其工具栏上的“版面分析”按钮【】,对文字图像按类别进展分析。以上调整完成后,单击工具栏上的“识别”按钮【】或执行识别菜单中的“开场识别”吩咐,系统即对所选图像进展版面识别,结果如图1-5所示。假如被识别的扫描图像中存在图文、表格混排状况,则肯定要进展版面分析。尚书OCR可以对表格进展自动识别,但在识别时要及其它文字版块区分划开,才会得到整个页面的
12、识别。尚书OCR识别属性分为“横排正文”、“竖排正文”及“表格”,因此用户可以先执行手动版面分析,通过鼠标拖曳框出表格对象,然后完成整个页面的高效识别。候选字区文字识别区文件管理区原图像区图1-5 文字图像识别结果 文字校对及编辑:识别转换完成后,要进展文字校对,检查识别转换是否有误,假如有错,可通过校对栏,选择当前字的候选字交换识别有误的字;在文本编辑区内还可以进展字符编辑,可完成退格、删除、撤消等操作;可以输入特别符号,只要单击尚书七号OCR程序的工具栏上的“符号表”按钮【】,翻开特别符号表窗口,选择所需的特别符号,即可将符号插入到当前位置。图1-6 保存识别结果对话框 校对检查完成后 ,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 培训 课件 制作 技术
限制150内