《2022年如何把JPG转换成文档 .pdf》由会员分享,可在线阅读,更多相关《2022年如何把JPG转换成文档 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如何把 JPG 转换成 WORD 文档Office在2003 版中增加了Document Imaging工具,用它可以把文字给“ 抠” 出来1.把 JPG 文件另存为TIFF-TAG 图像文件格式(可用ACDSee 软件)2.在“ 开始 ” 菜单的 “ Microsoft Office工具 ” 中打开 Microsoft Office Document Imaging,3.文件打开,选择想要提取文件的图片,4.在“ 工具 ” 中选择 “ 使用 OCR 识别文本 ” ,Document Imaging的 OCR 识别程序就会对图片进行识别,完成后5.选择 “ 工具 ” 中的 “ 将文本发送到Wo
2、rd ” ,程序会自动打开Word文档,展现在你面前的就是从图片中“ 抠” 出来的文字。提示:一般而言,识别的准确率可以达到95 以上,但对英文和数字的识别不是太好其它软件一、汉王感觉比紫光好,可以识别表格,新版汉王5800 ,还没有装。二、清华紫光以前 7.5用过很多次,基本还可以,文科类书籍识别还不错,新版紫光9.0 ,应该有提高三、慧视小灵鼠号称很厉害,用手机拍得都行。四、尚书有表格识别,大概很中庸,用的人不多。五、丹青能识别繁体六、 cajviewer 6.0 不是专用识别软件,内部应该是汉王的核心。七、 Microsoft Office Document Imaging 八、 Fin
3、eReader v7.0 Professional 据说很牛的英文识别软件,是俄国人搞的,天空软件有下,汉字也有,只是没有地方下到。九、 ABBYY 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - e 文识别。十、 TextBridge e 文识别首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去,一般单位都有扫描仪,如果没有也没关系,用数码相机拍也行,拍成图片放到WORD里面去, 不过在些之前,你还得装一下WORD 自带的组件
4、, 03 和07的都行。点开始-程序 -控制面板 - 添加 /删除程序,找到Office- 更改 - 添加或删除功能,然后下一步,注意一定要勾选上“ 选择应用程序的高级自定义” -下一步,单击 office工具 -找到 Microsoft Office Document Imaging 这个组件, Microsoft Office Document Imaging Writer 点在本机上运行,单击更新然后按步骤操作就可以了。首先将扫描仪安装好,接下来从开始菜单启动“ Microsoft Office/ Microsoft Office 工具/Microsoft Office Document
5、 Scanning” 即可开始扫描。提示 :Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入 Office2003的光盘进行安装。由于是文字扫描通常我们选择“ 黑白模式 ” ,点击扫描,开始调用扫描仪自带的驱动进行扫描。这里也要设置为“ 黑白模式 ” ,建议分辨率为300dpi 。扫描完毕后回将图片自动调入Office 2003种另外一个组件“ Microsoft Office Document Imaging” 中。点击工具栏中的“ 使用 OCR 识别文字 ” 按键,就开始对刚才扫描的文件进行识别了。按下“ 将文本发送到Word ” 按键即可将识别出来
6、的文字转换到Word中去了。如果你要获取部分文字, 只需要用鼠标框选所需文字,然后点击鼠标右键选择“ 将文本发送到Word ”就将选中区域的文字发送到Word中了。此软件还有一小技巧:通过改变选项里的OCR 语言,可以更准确的提取文字。例如图片里为全英文,把OCR 语言改为 “ 英语 ” 可以确保其准确率,而如果是“ 默认 ” 则最终出现的可能是乱码名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 4 页 - - - - - - - - - 还有:应该说, PDF 文档的规
7、范性使得浏览者在阅读上方便了许多,但倘若要从里面提取些资料,实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译,痛苦的要命,竟然傻到用 Print Screen截取画面到画图板,再回粘到word中,够白了:(最近连做几份商务标书, 从 Honeywell本部获取的业绩资料全部是英文版的PDF,为了不再被折磨,花费了一个晚上的时间研究PDF 和 Word文件的转换, 找到下面 2种方法, 出于无产阶级所谓的同甘共苦之心,共享下:)1、实现工具: Office 2003中自带的 Microsoft Office Document Imaging 应用情景:目前国外很多软件的支持信息都使用PDF
8、 方式进行发布,如果没有Adobe Reader , 无法查看其内容, 如果没有相关的编辑软件又无法编辑PDF 文件。转换为 DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF 转换为DOC 的工作,但很多都不支持中文,我们利用Office 2003中的 Microsoft Office Document Imaging组件来实现这一要求最为方便。使用方法:第一步: 首先使用 Adobe Reader打开待转换的PDF 文件,接下来选择 “ 文件 打印 ”菜单,在打开的“ 打印 ” 设置窗口中将 “ 打印机 ” 栏中的 “ 名称” 设置为 “ Microsoft Office Docu
9、ment Image Writer” ,确认后将该PDF 文件输出为MDI 格式的虚拟打印文件编辑提示: 如果你在 “ 名称 ” 设置的下拉列表中没有找到“ Microsoft Office Document Image Writer” 项,那证明你在安装Office 2003的时候没有安装该组件,请使用 Office 2003 安装光盘中的 “ 添加 /删除组件 ” 更新安装该组件。第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI 文件,选择 “ 工具 将文本发送到Word ” 菜单,并在弹出的窗口中勾选“ 在输出时保持图片版式不
10、变” ,确认后系统提示“ 必须在执行此操作前重新运行OCR。这可能需要一些时间 ” ,不管它,确认即可。编辑提示: 目前,包括此工具在内的所有软件对PDF 转 DOC 的识别率都不是特别完美,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 4 页 - - - - - - - - - 而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。2、实现工具: Solid Converter PDF 应用情景:利用Office 2003中的 Micr
11、osoft Office Document Imaging组件来实现 PDF 转 Word文档在一定程度上的确可以实现PDF 文档到 Word文档的转换, 但是对于很多 “ 不规则 ” 的 PDF 文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。为了恢复PDF 的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。使用方法:1、下载安装文件Solid Converter PDF,点击安装。编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。2、 运行软件, 按工具栏要求选择需要转换的PDF 文档,点击右下的 “ 转换 ”(Convert )按扭,选择自己需要的版式,根据提示完成转换只能用 OCR 文字识别软件,推荐紫光OCR ,OCR 软件识别后变成纯文本,可以粘贴到 word就可以编辑了名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 4 页 - - - - - - - - -
限制150内