图片转换成文本文档?

发布网友 发布时间:2022-04-23 17:34

我来回答

2个回答

热心网友 时间:2023-09-22 21:01

offiice2003 确实有这个功能!
自带了Document Imaging 安装office的时候选上
默认是不安装的!

还有很多OCR软件

我使用Document Imaging的时候感觉非常不错! 推荐一下

如果 公式 字母 中文 混排
任何软件都识别不全的!
用OCR就可以了.
比如Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。
第一种方法:用SnagIt工具进行文字提取。

首先使用SnagIt的文字捕捉功能将文字提取出来。SnagIt当前版本为7.02,大小为03KB,下载地址可以在http://www.skycn.com/soft/2290.html 找到,汉化补丁可以在http://www.skycn.com/soft/2291.html 找到。启动SnagIt,选择菜单“输入/区域”,选择菜单“工具/文字捕获”,然后我们打开要捕捉的文件窗口,按下捕捉快捷键,选定捕捉区域即可捕捉到文字。

接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或段落错乱等现象,而且字号、字体等不合自己的心意。这时我们可以用熟悉的WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取后文章的编排。

用WPSOffice2003打开提取文章;然后选择“工具”菜单下的“文字”/“段落重排”,这时你会看到提取文章重新进行排版;接下来选择“工具”菜单下的“文字”/“删除段首空格”命令,使得文章的每段参差不齐的行首空格被删除;再选择“工具”菜单下的“文字”/“增加段首空格”,文章变为正常的书写格式;提取文章一般都留有空段,为删除这些空段,继续选择“工具”菜单下的“文字”/“删除空段”命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意编辑文章吧。

第二种方法:用屏幕截图然后让OCR软件识别。

打开带有文字的图片或电子书籍,翻到你希望提取的页面,点击键盘上的打印屏幕键(PrintScreen)进行屏幕捕获;打开Windows自带的画图工具,将刚才捕获的屏幕截图,粘贴进去,保存为一个.bmp文件;接着打开刚才保存的文件,在编辑器中进行修正,根据你所要提取的文字进行裁剪,尽量去除不要的部分;最后启动OCR软件,在OCR中打开刚才保存的修改文件,进行文字识别,然后可随心所欲进行编辑。

热心网友 时间:2023-09-22 21:02

你说的是ocr吧。现在主流的就是方正的和汉王的,不过都对图片的清晰度有要求的,如果图片清晰度不行的话,识别出来的结果是很让人崩溃

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com