借助OneNote实现图片中文字的提取

时间:2020-02-21
阅读:

在日常工作中,可能经常涉及一些数据的录入工作,最典型的就是用户拿到一些书面材料,需要将这些材料中的文字录入到文字处理软件,从而得到电子版的文档。其实,这些费时费力的工作完全可以借助OneNote来完成,从而可以将用户从这种枯燥、低技术含量的工作中解脱出来。

若要将书面材料中的内容输入到电子文档中,则可以按照如下步骤进行操作。

1、如果用户手头已经拿到一份书面材料,可以通过扫描仪将其扫描成某种图片格式。在选择图片格式时,可以选择支持透明度通道的图片格式(例如TIFF等),因为这种图片格式可以在扫描期间就尽可能地将图片中的文字与背景进行分离,从而便于其他第三方的光学识别(OCR)软件来对其中的文字进行提取。但是,这类图片格式的最大缺点就是扫描速度非常慢,扫描时间几乎相当于(甚至超过)用户录入所花费的时间。因此,建议用户选择扫描速度较快的普通单层图片格式,例如最常用的BMP或JPG格式。扫描后得到的图片文件如图1所示。

图1 扫描得到的图片文件

2、将该图片文件复制到OneNote中的任意一个笔记页中,然后,用鼠标右键单击该图片,并执行快捷菜单中的【复制图片中的文本】命令,即可将图片中的文字内容复制到Office剪贴板中,如图2所示。

图2 将图片中的文字内容复制到Office剪贴板中

3、新建一个Word文档,将光标定位到目标位置,并按【Ctrl】+【V】组合键,即可将图片中的文字粘贴到文档中,变为真正可以编辑的电子版内容,如图3所示。

图3 在文档中粘贴提取到的文字

返回顶部
顶部