【简 介】 OCR识别软件是扫描议必备的软件之一。它的功能用于是能够把文本转化成电脑中的文档资料。在应用OCR软件之中,扫描的正确率不仅与OCR软件有关,而且如果设置不恰当,扫描出来的差距是非常大的,这里我们来认识一下MICROTEK扫描仪配备的“尚书六号OCR”。
|
|
|
|
|
其次、辨识前所需的注意事项
当以上事项完成以后,我们所要做的就是在OCR软件中的实际操作了。
注意文字的倾斜校正
由于OCR的辨识原理是采用字模的方式进行的,所以一定要注意稿件是否水平。具体实施过程中,可以采用图像倾斜校正按扭来解决(见图六)。
由于原稿的情况差异万千,所以我们在识别前,需做一些预先的处理。首先应该去除原稿中的杂点和图像。文稿中如含有图像,OCR是不能识别的,图像的存在,会影响OCR的文字切分。操作中,可使用“图像的块擦拭”工具将文档中的图像去除,同时文稿中的一些杂点,也应尽量地去除。
针对文档中出现分栏的情况,建议您手动设定辨识范围,最好不要采用“自动切分”,只有这样才能保证辨识结果的连贯性(见图七)。
采用适当的辨识方式
在具体的辨识中,还应注意您的稿件是横排还是竖排,由此选择正确的编排格式按扭,以保持对应。
目前的《尚书六号》OCR软件为用户提供了简体、繁体、英文等不同的识别方式,其选择是在窗口上的下拉菜单,而非按扭菜单。按扭中的简体、繁体、ENGLISH是《尚书六号》在不同的操作系统上获得正确显示的显示模式,千万不要搞混(见图八)。
确认以上的步骤后,此时就可按下“识别”按扭,识别完毕后,系统进入“文稿校对界面”。
|
|
|
焦点文章
| | |
|
|
相关文章
|