Character decomposition to resolve class imbalance problem in Hangul OCR
Authors : Geonuk Kim, Jaemin Son, Kanghyu Lee, Jaesik Min
Conference : ECCVW
Year Published : 2022
Topics : Computer Vision, OCR
Abstract
본 연구에서는 한국어 문자 인식(OCR, Optical Character Recognition)을 위한 새로운 접근 방안을 제시합니다. 한글은 음절 문자로서 52개의 자모를 조합하여 11,172개의 서로 다른 문자를 표현할 수 있습니다. 그러나 전체 문자 수가 신경망의 용량을 초과할 수 있으므로 기존의 OCR 인코딩 방법들은 자주 사용되는 문자의 작은 집합을 미리 정의하는 방식으로 접근합니다. 이러한 설계 선택은 자연스럽게 긴 꼬리(long-tail) 문자의 성능 저하를 초래할 수 있습니다. 본 연구에서는 자모 인코딩 방식이 한글 OCR에서 효율적일 뿐만 아니라 성능 또한 우수하다는 것을 실험적으로 입증합니다. 벤치마크 테스트 결과, 제안된 접근 방식이 한글 OCR에서 두 가지 주요 문제인 클래스 불균형 및 대상 클래스 선택 문제를 효과적으로 해결함을 확인하였습니다.