2010-03-18 15:39:51 阅读4 评论0 字号:大中小
一、将纸质文字用拍照功能拍入手机
将纸质文档拍入手机是最关键的一步,如果这一步没做好,在文字识别时会出现字形失真,导致识别出错。用扫描仪进行输入时张纸贴得很近,光线均匀,以协调比例的扫入电脑中,然而采用手机上的进行拍照就要控制好摄影头与纸面的距离、角度、亮度等。因此,在操作时要控制好这些。
1、 选好文字的纸质。
选择最干净、平整的纸张,如是书本或杂志时,则在翻到相应页面后要摆放平整,不要出现过于明显的高低边,折边,如纸上有污渍的事先设法擦除。
2、控制手机的位置进行微距拍照
将纸张或书本放在光线充足的桌面({zh0}在白天),打开手机的拍照功能,闪光灯选择自动。将手机的摄像头垂直置于纸张正上方,距离不宜超过30厘米,{zh0}在10CM左右,一只手扶好手机按下快门,在拍时不能晃动。
距离远点虽然拍的范围大了,但会增加软件识别时的难度。
二、将图像文件传输到电脑之中
利用USB数据线、蓝牙、红外线、串行数据线等方式之一将拍照的文件传到电脑之中。具体操作方法见有关手机说明书,这里不分述。我曾经分别用USB数据线与蓝牙两种方式实现图片的传输。其中蓝牙更方便,前提是手机与电脑都要有蓝牙功能,如没有就用USB数据线,可进行复习粘贴。
三、用OCR软件进行图文识别
目前OCR软件挺多,如国内的汉王、清华紫光、尚书等,这里以尚书六号汉字表格识别系统为例。
1、进入OCR识别系统
2、调入图像文件
单击菜单上的【文件】→【打开图象页】,选择传到电脑上的拍照文件,这里选择以拍摄报纸上部分内容的一个图像文件。
3、识别前处理
(1)如图像是90度,倒置的先进行旋转(软件里有旋转功能)。如有杂点的用工具将一些杂点擦除。
(2)进行识别前的范围选定与切分。如手工选择,可将一些不需要的内容排除在识别之外。
4、进行识别操作
完成选择与切分后,单击识别,系统弹出文稿校对。校对完之后进行拖动全部选择得执行复制命令.
四、创建Word文件
1、打开Word文件,执行粘贴命令,将识别的内容粘到Word文档中。
2、对粘贴入的文字进行编辑与调整。
经以上四个步骤完成了纸质内容到可编辑文本的过渡,操作熟练之后,这几步是很快的。用手机拍照纸质文稿,非常方便。如在图书馆找资料,阅览室看杂志,看到需要的xx等都可逐张拍照,回到家里或单位的电脑上一次性传入电脑,进行文字识别,和Word的理整就完成了一次资料的收集,以便工作之需。
以上的手机型号为诺基亚5530MX,希望与有相同做法的朋友交流。