티스토리 뷰

광학식 문자 인식 OCR 앞으로 대세


Optical Character Recognition이 바로 광학식 문자 인식 OCR입니다.


손으로 쓴 글자나 인쇄된 문자를 스캐너나 디지털 카메라로 읽어, 문자 데이터로 변환하는 기술을 말합니다.




OCR의 기능을 갖춘 하드웨어나 소프트웨어도 OCR라고 합니다.


이 경우의 OCR은 「Optical CharacterReader」의 약자로 여겨집니다.


문자를 데이터화할 수 있다고 해도, 스친 문자나, 일문에 혼재한 구문 문자, 특수 문자 등은 정확한 문자 인식을 할 수 없는 경우가 있습니다.




원래 OCR는 문자를 읽는 수단으로서 이용되고 있었지만, 정보를 데이터화함으로써 물리적인 보관장소의 공간절약을 꾀할 수 있는 데다 데이터 검색의 신속화, 데이터의 재이용 등에도 도움이 됩니다.


최근에는 e-문서법이나 일본판 SOX법(J-SOX법)의 제정에 의해 문서나 전표의 전자화(파일링)가 진행되고 있어 더욱 보급될 것으로 예측됩니다.

댓글