【正】 光学文字辨识(Optical Character Recognition,简称OCR)是电脑透过特定软件,而能识别扫描器扫描进来的图档,将里面的文字(图形字)转换为可编辑文字(一般字)的一种功能。我们通常利用它来将想买的资料存入电脑而不用重新输入,例如报章杂志的剪报、资料文件的保存、甚至是文件的管理等。在早期的时候,文字识别的工作只能由简单的识别软件逐字进行,无法分辨不同的字体。接着,能够一次识别多种字体的识别软件产生了,它的资料库中储存了许多不同打字机的字型(当时识别的主要对象多是办公室里的打字文件),当识别进行时,它会将扫描得到图形字逐个对比不同的字型,然后得到最