发布网友 发布时间:2022-04-22 19:41
共4个回答
热心网友 时间:2023-06-25 04:32
如果不是图片类做成的PDF 你可以转换成WORD格式后进行编辑, 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码。
对于是图片和没有字体(乱码)做成的PDF文件,那么我们就需要用OCR类软件进行识别了,软件有:清华紫光OCR;尚书七号;Leadtools OCR;赛酷OCR;汉王文豪7600(图形OCR识别成WORD或EXCEL);汉王HW_PDF_OCR_81(推荐:PDF文件、图形,OCR识别成WORD或EXCEL);ABBYY FineReader(推荐)
我用汉王HW_PDF_OCR_81,可在汉王官方网站 主页右下角有免费的正版下载,下载地址:www.hw99.com/
汉王HW_PDF_OCR_81可以直接OCR识别图形和扫描格式的PDF文件为TXT、WORD、EXCEL格式,不用上面说的要转换成图片再用文豪7600识别。汉王HW_PDF_OCR_81是文豪7600的升级版本,是最新和免费的版本。
不明白时,在百度Hi中联系来自:求助得到的回答
热心网友 时间:2023-06-25 04:32
1.用雪莹DocConvert将原pdf输出为jpg格式
2.用汉王文豪7600进行识别,在版面分析后,检查一下造成乱码的部分,将这些部分改成图片(因为公式、公司徽标之类的文字是无法识别的),然后再识别
热心网友 时间:2023-06-25 04:33
很正常了。经常这样。
热心网友 时间:2023-06-25 04:33
可能是因为字体也是图片吧 可以用OCR软件识别文字试一试追问我用的就是这个软件啊 转成RTF以后 比如封面图片啊 都没问题 就是原来是字体的部分是一些乱码!!!!是不是操作不对啊?你能不能介绍一下具体操作啊 谢谢啦