1、把汉王 PDF OCR安装到电脑后,运行PDF OCR主程序。单击PDF OCR窗口“文件→打开”菜单,打开“打开图像文围泠惶底件”对话框。再单击“查找范围”后面的下拉按钮,找到所要打开的PDF文件,双击打开即可。如果PDF文件有多页内容,则会弹出“选择拆分多页pdf”的提示,单击确定后开始拆分页面操作。
2、拆分完成后,会在左侧列表框中生成诸多文件列表。接着,单击窗口的“编辑→自动倾斜校正”菜单,对图片进行倾斜校正。单击窗口的“识别→选择全部文件”菜单后,选中列表框中所有的拆分文件。继续单击继续窗口的“识别→开始识别”菜单,进行批处理识别操作。
3、等到识别完成后,再单击窗口的“输出→到指定格式文件”菜单,打开“保存识别结果”对话框。 单击“保存在”按钮,选择合适的保存目录后,在“文件名”后输入便于识别的文件名,再单击“保存类型”按钮,选中“rtf文件”后,单击“保存”即可。
4、打开生成的文件,可以看到所有文字和表格都能修改编辑,正确识别率高达到90%以上