KR20090111202A

KR20090111202A - 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치

Info

Publication number: KR20090111202A
Application number: KR1020080036842A
Authority: KR
Inventors: 조영선; 박수희
Original assignee: 슬림디스크 주식회사
Priority date: 2008-04-21
Filing date: 2008-04-21
Publication date: 2009-10-26

Abstract

1. 청구범위에 기재된 발명이 속한 기술 분야

본 발명은 한글의 문서인식 기능을 모바일 환경에 접목하기 위해서는 인식율 및 인식속도를 향상 시켜야 하는데, 한글은 생성가능한 문자수가 2,350 자로 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 복잡하게 형성하기 때문에 문자의 유사성이 커서 인식하는데 한계가 있다. 이에 한글의 구조적인 특성을 이용하는 기존의 많은 인식 방법론들에서는 한글의 기본 요소를 획으로 정의하는데 반해, 본 발명은 수직선, 수평선, 사선과 같이 방향성이 강한 선소들로 구성되어 있다는 점을 이용하여 한글을 인식하는 과정보다는 구분하도록 제공하였다. 즉, 훈민정음의 창제 원리에 입각한 한글 인식 방법에 관한 것이다.

2. 발명이 해결하려고 하는 기술적 과제

기존 방식에 있어서 문자 인식을 하기 위한 과정은 레이블링을 이용 문자를 추출하고, 정규화를 거쳐, 모폴로지 과정을 거쳐 잡음을 제거하고 Zhang-suen 알고리즘 등을 통해 세선화를 하고, 코너 검출을 통한 특징점 찾기를 실시하는 형태로 이뤄진다. 본 발명은, 상기한 바와 같은 문제점을 해결하기 위해 제안된 것으로 한글은 영어, 일본어 등과 달리 생성 가능한 문자 수가 KSC5601 코드로는 2,350 자에 달하며 문광부 선정 실생활 유효문자도 1,076 자에 이를 정도로 생성 가능한 문자수가 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 형성하기 때문에 문 자의 유사성(일례로 자음의 경우 초성과 종성으로 사용되는 ‘ㅁ' ’ㅂ' 'ㅍ‘)이 커서 이를 인식하는데, 특히 복모음과 복잡한 받침의 경우 이를 구분하여 인식하는데 기존에 적용된 알고리듬으로는 많은 어려움이 있는 실정이다.

3. 발명의 해결방법의 요지

본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 제안된 것으로, 즉 자음과 모음은 선으로 이루어지며 이는 방향(수평, 수직, 사선, 역사선, 원)과 길이(장, 중, 단)으로 차별화되므로 단순히 각각의 갯수를 이용하여 구분 코드화하면 다른 한글인식 알고리듬이 형태나 위치를 추출하는 것에 비해 매우 빠르다. 즉, 1 단계로 획의 방향과 길이에 대한 개수로 코드화하면 각문자별로 독자적인 코드값을 가진 경우(전체 문자의 36%) 바로 인식이 되며, 겹치는 코드값을 갖는 경우 모음의 위치 방향(일례로 ㅏ 와 ㅓ , ㅗ 와 ㅜ 등 구분)을 간단히 판별하는 알고리듬을 적용하면 전체 한글 문자의 64%까지 구분되며, 나머지는 자음 (일례로 중복 경우를 분석하면 ㅁ, ㅂ, ㅍ, 구분과 ‘옷’과 ‘송’과 같은 경우 구분)을 처리하면 100% 한글 문자 구별이 이루어진다.

4. 발명의 중요한 용도

본 발명을 통해 최근 디지털 카메라와 휴대폰 및 PDA 카메라가 보편화되면서 휴대용 기기에서의 이미지 획득이 간편하게 이루어지고 있다. 획득한 이미지에 포함되어 있는 한글 문자를 빠르고, 정확하게 추출하여 인식한다면 은행전표, 택배전 표, 주문서, 신청서 등의 자동입력은 물론 시각장애인의 독서 및 보행 안내, 이동 로봇의 주행 등과 같이 실생활에 유용하게 활용될 수 있다. 즉, 시각장애인용 독서보조기기를 문서를 캡쳐하여 인식하고 이를 TTS로 변환 음성으로 바꿔주는 장치 형태로 만들 수 있다. 이러한 독서보조기기는 시각장애인은 물론 노인 및 난독증 환자들이 사용하여 생활의 불편함 해소는 물론 장애로 인한 정보화 소외로부터 벗어날 수 있다.

수평선, 수직선, 사선, 역사선, 코드화, 세선화, 일단계, 이단계, 삼단계

Description

한글의 기본 구성요소인 수평선, 수직선, 사선, 원의 개수와 특성치를 이용한 한글인식 방법 및 장치{The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel}

한글 인식은 영문, 한자 등에 비해서 매우 어렵고, 현재 기술로도 다양한 서체에 비해 관련 분야의 연구가 지속되지 않아 명조, 고딕체에 대해서만 인식 가능한 수준이지만 고려대, KAIST, 숙명여대 등 연구소에서 다양한 서체 및 표지판/ 간판 등의 서체를 인식하기 위한 전처리, 후처리 등 다양한 접근 연구가 진행되고 있다.

즉, 한글 문서 인식 SW 관련 기업으로 알려진 퍼셉콤, 한국인식기술에서 10년 전부터 명함인식기를 출시한 이래 시장이 대규모로 형성되지 않아 지속적 투자가 이루어지지 않아 최근 수년간 성능 향상이 없었지만, 학계에서는 자연 영상에서 문자영역 검증기법, 카메라 영상에서 텍스트 영역 추출 기법 등을 통해 문서가 아닌 주변 환경의 문자를 인식하는 발전적 연구도 이루어지고 있다.

2차원 인쇄 한글 문서의 OCR(Optical Character Recognition) 기술이 휴대폰 기술의 발달에 따라 모바일 환경에도 적용해야 하는 요구가 증대하고 있지만, 최근 40여 년간 인쇄 문서의 인식 기술이 지속적으로 연구되어 왔으나 기술 수준은 아직 일반인이 기대하는 수준에 미달함 또한 사실이다.

본 발명은 한글의 문서인식 기능을 모바일 환경에 접목하기 위해서는 인식율 및 인식속도를 향상 시켜야 하는데, 한글은 생성가능한 문자수가 2350자로 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 복잡하게 초성, 중성, 종성 등의 형태로 형성하기 때문에 문자의 유사성이 커서 인식하는데 한계가 있다.

한글의 구조적인 특성을 이용하는 기존의 많은 인식 방법론들에서는 한글의 기본 요소를 획으로 정의하는데 반해, 본 발명은 수직선, 수평선, 사선과 같이 방향성이 강한 선소들로 구성되어 있다는 점을 이용하여 한글을 인식보다는 구분하도록 제공하였다.

즉, 휴대폰과 같은 모바일 환경에서 문자 인식율과 인식 속도 향상을 위해서는 새로운 문자 인식 알고리즘 개발이 필요하다는 점에서 본 발명이 이루어지게 되었다.

특히 최근 휴대폰에 3M 픽셀 이상(영어 인식 가능 해상도)의 고성능의 카메라 센서가 장착됨에 따라 3차원 카메라 획득 문서 및 배경의 OCR 기술을 적용할 수 있게 되어 한글문자 인식율과 인식 속도가 향상된다면 시각장애인용 실시간 독서보조기로 적용도 가능하다는 점에서 본 발명이 이루어지게 되었다.

시각장애인의 한계나 요구에 따른 신뢰성/ 인식율/ 속도의 적절한 조합 및 선택에 따른 새로운 알고리즘 개발 필요한데, 기존에 한국에서 상용화된 ‘아르미’, ‘글눈’ 등은 기본적으로 개발 환경이 컴퓨터용 스캐너 장비를 이용하는 정적 인식 수준에 그치고 있고 모바일 특유의 흔들림, 빛, 인식대상의 3차원 기울임에 대한 보정 기술 개발도 필요하다.

최근 들어 카메라 센서, CPU 성능이 부분적으로 향상되면서 모바일 OCR 관련 연구가 단순 명함인식 기능을 벗어나는 연구가 진행되고 있지만, 아직은 카메라센서 해상도 및 휴대폰 CPU 등의 인식 속도 등의 문제로 한정된 형태로 접근하고 있는 실정이다.

이에 시각장애인용으로 제안된 보이스아이라는 특수 2차원 바코드 심볼용 코드 리더기는 가로, 세로 1.5cm 크기의 보이스아이 심볼에 책 2 페이지 분량의 정보가 저장되어 원본과 함께 인쇄된 출판물의 정보를 시각장애인 스스로 접할 수 있도록 설계된 하드웨어와 소프트웨어 구성, 녹음 도서를 따로 만들 필요없이 모든 인쇄 및 출판물 문서 작업시 보이스아이 심볼을 만들면 이 심볼에 기기를 대어 음성 출력이 가능토록 되어 있지만 이 또한 보이스아이 심볼이 인쇄되어 있는 문서가 보편적이지 않아 이용에 제한이 있다.

현재까지 보편적인 한글 문자 인식을 위해서는 전처리 과정을 통해 문자의 여백 등을 추출, 입력 문자 이미지를 형성하는 전처리 이미지 프로세싱을 거쳐, 히스토그램 및 바이널라이즈를 통해 세선화 알고리즘 변형 기술이 적용되어 윤곽선 추출을 통해 수평영역과 수직영역 투영 변환을 실시하고, 최소 인접 다각형 추출 및 배경 세선화를 거쳐 외곽선 분석 추출과 대각선-대각선 영역 투영 변환을 실시하고, 8방향 성분분포 특징 추출 양자화를 통해 끝점, 분기점, 교차점, 굴곡점과 같은 구조적 특징점 들을 추출하고 평활화 샘플링을 거쳐 탬플랫 특징점 데이터베이스를 형성, 만들어둔 문자특징 성분 데이터베이스와 원형접합 및 탄력접합 알고리즘을 통해 인식문자를 추출하는 복잡한 과정으로 수행된다.

이러한 한글 문자 인식 기술을 이용하여 많은 상품들이 소개되었는데, ‘모바일 리더’라는 제품은 카메라가 장착된 휴대폰, PDA 등 제한된 환경에서 동작하는 영상처리 및 자동인식 정보를 여러 알고리듬을 적용하여 추출하여 문자정보를 판단하는데. 현재 출시한 상용화 제품은 명함 인식 및 전자사전용 문자인식 기능으로 일부 휴대폰에 탑재되었으며, 디오텍사의 모바일 OCR은 문서인식 솔루션으로서 인쇄된 문서 영상을 인식 및 판독하여 텍스트 형태로 변환하는 기술로 접사 촬영 또는 오토 포커스가 지원되는 1M픽셀 이상의 카메라가 장착된 단말기에 적용이 가능하며, 고해상도 카메라 폰의 등장과 함께 활용성이 높아지고 있지만 휴대폰의 CPU 성능 및 카메라센서 해상도 신호처리의 한계로 실제 생활에서 불편하지 않게 사용할 수 있는 필요한 제품으로는 평가받지 못하고 있다.

퍼셉콤의 문서인식 소프트웨어 ‘아르미’는 거의 국내 최초로 상용화된 문서인식 상품으로 기존 인쇄 자료들을 스캐너 등을 통해 이미지 형태로 읽어 데이터의 내용을 분석, 그림과 글자 영역으로 구분 문서편집기에서 수정, 편집이 가능한 인식 소프트웨어로 인정받아 국내 스캐너 업체 대부분에서 번들 제품으로 사용되었으며, 명함인식기 ‘아르미’도 명함인식 및 관리를 제한된 범위 내에서는 완벽하게 처리함이 증명되어 국내 문자 인식 엔진으로는 현재 최고의 제품으로 인정받아 타 업체에서도 기반 솔루션으로 사용하고 있다.

기존 방식에 있어서 문자 인식을 하기 위한 과정은 레이블링을 이용 문자를 추출하고, 정규화를 거쳐, 모폴로지 알고리즘을 거쳐 잡음을 제거하고, Zhang-suen 알고리즘 등을 통해 세선화를 하고, 코너 검출을 통한 특징점들을 찾는 과정으로 이뤄진다.

본 발명은, 상기한 바와 같은 문제점을 해결하기 위해 제안된 것으로 한글은 영어, 일본어 등과 달리 생성 가능한 문자 수가 KSC5601 코드로는 2,350 자에 달하며 문광부 선정 실생활 유효문자도 1,076 자에 이를 정도로 생성 가능한 문자수가 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 형성하기 때문에 문자의 유사성(일례로 자음의 경우 초성과 종성으로 사용되는 ‘ㅁ' ’ㅂ' 'ㅍ‘ )이 커서 이를 인식하는데, 특히 복모음과 복잡한 받침의 경우 이를 구분하여 인식하는데 기존에 적용된 알고리즘으로는 많은 어려움이 있는 실정이다.

이에 한글의 구조적인 특성을 이용하는 기존 문자 인식 알고리즘은 전처리 및 단어 사전 검색과 같은 후처리에 많이 의존하는 경향이 있다.

한글 문자는 기본 자소로 구성되고, 기본 자소는 방향을 갖는 기본 선소가 접속되어 구성되어 진다. 따라서 한글 인식에 있어서 이러한 선소들의 접속정보를 효율적으로 이용하는 것이 인식의 관건으로, 90년에 발표된 ’계층구조 획 추출에 의한 한글인식’ 논문에서는 선소들의 정보를 계층적으로 구성하여 좀 더 효율적으로 사용할 수 있는 방법을 제안했는데, 입력 문자를 정규화한 후 이를 4개의 방향 (수직방향, 수평방향, 사선방향, 역사선 방향)에 대하여 직선선분을 강조하여 방향 성분을 추출하였고 4방향 평면에 대하여 각 방향선소의 시작위치에 그 방향선소의 길이를 정보로 저장하고 여기에 대상 영역을 동일 크기의 부영역으로 분할하여 그 부영역에 있어서의 가장 큰 길이 정보를 대표값으로 정하고, 동일 위치의 부영역에 대해서 4방향 성분을 고려하여 그 영역에서의 선소의 연결 형태를 결정하며, 이러한 과정을 거쳐 한 문자당 16 부영역에서의 선소의 연결 형태를 나타내는 특징을 추출 한글을 인식하는 방법도 제시되었다.

본 발명에서 제시하는 방법은 이와 달리 수직선, 수평선, 사선, 원을 단순히 한글글자 이미지를 가로, 세로를 삼등분하여 겹치는 길이에 따라 단, 중, 장 선소로 구분하고 이를 코드화하도록 하여 일차적으로 구분하고, 코드가 동일한 글자들에 대해서는 보완 인식 방법을 적용하면 대부분 한글의 코드를 구분하는 것이 가능하다는 점에서 연구가 이루어지게 되었다.

한글에 있어서 자음의 경우 대부분의 자소가 수직선소와 수평선소로 구성이 되나 ㅅ , ㅇ , ㅈ 등은 사선 선소와 원 선소를 가지고 있다. 한글 자소들은 크게 4방향의 직선 선소로 구성되며 자음이 모음에 비해서 좀 더 복잡한 연결 형태를 나타낸다.

자음에서의 선소들의 연결은 어떠한 형태의 선소의 연결 형태가 존재하는가 하는 것이 자소들을 구분하는데 중요한 역할을 한다. 모음에 있어서는 수직선소와 수평선소의 비교적 단순한 연결 형태를 갖고 있으며 연결 형태만이 아니라 연결위 치가 중요한 정보를 갖게 된다.

즉 자음과 모음은 선으로 이루어지며 이는 방향(수평, 수직, 사선, 역사선, 원)과 길이(장, 중, 단)로 차별화되므로 단순히 각각의 개수를 이용하여 구분 코드화하면 다른 한글인식 알고리즘이 복잡한 형태나 위치를 추출하는 것에 비해 매우 빠르다.

즉, 1 단계로 획의 방향과 길이에 대한 개수로 코드화하면 각 문자별로 독자적인 코드값을 가진 경우(전체 문자의 36%) 바로 인식이 되며, 겹치는 코드값을 갖는 경우 모음의 위치 방향(일례로 ㅏ 와 ㅓ , ㅗ 와 ㅜ 등 구분)을 간단히 판별하는 알고리즘을 적용하면 전체 한글 문자의 64%까지 구분되며, 나머지는 자음 (일례로 중복 경우를 분석하면 ㅁ, ㅂ, ㅍ, 구분과 ‘옷’과 ‘송’과 같은 경우 구분)을 처리하면 100% 한글 문자 구별이 이루어진다.

즉, 자음의 경우 대부분의 자소가 ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅌ ㅍ 처럼 수직선과 수평선으로 구성되며 ㅅ ㅈ ㅊ ㅋ 은 사선과 역사선을 포함한 형태이며 ㅇ ㅎ 원을 포함한 형태다.

즉 ㄱ과 ㄴ은 수평, 수직 각 1개이며(수평의 위치로 쉽게 구분함), ㄷ은 수평 2, 수직 1개이며, ㅌ은 수평 3, 수직 1개이며 ㄹ은 수평 3, 수직 1개다.

ㅁ ㅂ ㅍ은 모두 수평, 수직 2이므로 이를 구분하기 위해서는 왼쪽 수직선을 기준으로 위의 시작점과 수평선 왼쪽 시작점이 일치하면 ㅁ , 수평선 시작점이 아래에 있으면 ㅂ 으로 구분하며, 수평선이 수직선보다 위에 있으면 ㅍ 이다.

이상과 같이 한글의 자음과 모음은 훈민정음 창제 원리에 의해 기본적으로 수직, 수평, 사선, 원으로 이뤄지며 이러한 선소들의 개수와 크기를 같이 코드화시키면 독자적인 패턴이 만들어지지 한다.

KS 규격에 의한 한글 2,350 개에서 4가지 선소와 모음에서 ㅏ와 ㅓ를 구분하는 것처럼 코드를 삽입할 경우 64%가 구분이 됨을 전 글자에 대해서 계산을 통해 확인하였다.

이 방식의 이점은 특정 코드에 따라 일례로 ‘밥’, ‘팝’, ‘맙’, ‘맘’, ‘밤’, ‘팜’은 가장 많은 동일 코드를 나타내는데 여기서 초성이 ‘ㅁ'인지를 판별하면 ’맘‘, 맙’ 2 글자중 하나이며 종성을 판별 ‘ㅁ’이면 ‘맘’, 아니면 ‘맙’으로 최대 3단계에서 계산이 대부분 종료된다.

이와 함께 후처리 알고리듬에서 단어 검사 등을 통하여 정정할 수 있음은 기존 방식과 동일하다.

최근 디지털 카메라와 휴대폰 및 PDA 카메라가 보편화되면서 휴대용 기기에서의 이미지 획득이 간편하게 이루어지고 있다.

획득한 이미지에 포함되어 있는 한글 문자를 빠르고, 정확하게 추출하여 인식한다면 은행전표, 택배전표, 주문서, 신청서 등의 자동입력은 물론 시각장애인의 독서 및 보행 안내, 이동 로봇의 주행 등과 같이 실생활에 유용하게 활용될 수 있다.

그러나, 기존의 알고리즘은 문서의 기울기, 조도, 카메라 특성에 많은 영향을 받고 복잡한 변환 및 추출, 양자화 과정을 거치므로 계산 시간이 오래 걸려 컴 퓨터에 비해 계산 능력이 떨어지는 PDA 특히 휴대폰에 적용하는 데는 한계가 있고, 인식율이 저하되어 초기에 일부 휴대폰에 명함인식용으로 소개되었지만 소비자의 외면으로 현재는 거의 적용되지 않고 있다.

이를 극복하기 위해 문서 환경에 둔감한 본 발명이 이루어졌으며 이를 통해 PDA에 적용하면, 시각장애인용 독서보조기기를 문서를 캡쳐하여 인식하고 이를 TTS로 변환 음성으로 바꿔주는 장치 형태로 만들 수 있다.

이러한 독서보조기기는 시각장애인은 물론 노인 및 난독증 환자들이 사용하여 생활의 불편함 해소는 물론 장애로 인한 정보화 소외로부터 벗어날 수 있다.

그동안 이미지에서의 텍스트 추출 연구는 대부분 스캐너로 입력된 문서 이미지나 자막이 포함된 동영상 이미지를 대상으로 수행되었지만, 최근에는 디지털 카메라의 광범위한 보급으로 다양한 조명 및 복잡한 배경을 갖는 이미지에서의 텍스트 영역 추출로 연구가 확대되고 있는데 본 발명을 통해 이러한 연구가 보다 더 활성화되는 계기가 제공될 것으로 기대한다.

상술한 목적, 특징들 및 장점은 첨부한 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하 첨부한 도면을 참조하여 본 발명에 따른 바람직한 일실시 에를 상세히 설명한다.

도 1 은 현재 널리 사용되는 한글 문자 인식 알고리듬 및 인식 프로세스 흐름도로서 전처리 과정을 통해 문자의 여백 등을 추출 입력 문자 이미지를 형성하는 전처리 이미지 프로세싱을 거쳐, 히스토그램 및 바이널라이즈를 통해 세선화 알고리즘 변형 기술이 적용하며, 윤곽선 추출을 통해 수평영역과 수직영역 투영 변환을 실시하고, 최소 인접 다각형 추출 및 배경 세선화를 거쳐 외곽선 분석 추출과 대각선-대각선 영역 투영 변환을 실시하고, 8방향 성분분포 특징 추출 양자화를 통해 끝점, 분기점, 교차점, 굴곡점과 같은 구조적 특징점들을 추출하고 평활화, 샘플링을 거쳐 탬플랫 특징점 데이터베이스를 형성, 만들어둔 문자특징 성분 데이터베이스와 원형접합 및 탄력접합 알고리즘을 통해 인식문자를 추출하는 복잡한 과정을 수행하는 방식으로 구성된다.

세선화란 대상 물체의 표면을 조금씩 벗겨내어 최종적으로 두께 1을 가지도록 하는 것으로, 문서 인식 초기에 많은 연구자들이 물체를 골격선으로 표시하여 정보의 양을 최대한 압축한 다음 이를 인지하고자 연구되었으며 기본 요건으로 첫째, 골격선 폭은 1이어야 하며 둘째, 골격선의 위치는 선 도형의 중심에 위치해야 하며 셋째, 골격선은 원래의 도형에 있어서의 연결성을 유지해야 하며 넷째, 세선화 과정에서 골격선의 길이는 계속해서 줄어서는 안되며 다섯째, 패턴 윤곽선의 작은 요철로 인한 잡 가지선의 모양이 골격선에 첨가되지 않아야 한다.

세선화는 기본적으로 순차적 처리(sequential processing) 방법과 병렬적 처리(parallel processing) 방법으로 구분할 수 있다. 순차적 처리 방법은 현재의 처리 결과가 과거의 처리 값에 영향을 받음은 물론, 미래의 처리 결과에도 영향을 미치는 것으로 이 방법에서는 대상 화상만 있으면 처리가 가능하다.

병렬적 처리 방법은 현재의 처리 결과가 과거나 미래의 처리 결과에 전혀 영 향을 받거나 미치지 않는 것으로써 추가적으로 대상 화상 크기만큼의 버퍼가 필요하며, 현재의 관심 화소(pixel)에 대한 처리 결과를 버퍼에 저장하는 식으로, 전체 화상에 대한 한 차례의 처리가 모두 끝난 다음에 버퍼에 저장되어 있는 처리 결과를 원래의 대상 화상 위에 덮어 쓰게 된다.

널리 대표적으로 사용되는 Zhang Suen 세선화 알고리즘은 1984년에 처음으로 발표한 것으로 병렬적 처리(Parallel Processing)방법의 하나로써 기본적인 알고리즘은 다음과 같다.

처리대상인 검은 픽셀 I(i,j)에 대해서 다음과 같은 조건을 만족하면 지워 세선화 한다.

① 픽셀 I(i,j)에 대해서 그 주위의 픽셀들의 connectivity가 1이고,

② 픽셀 I(i,j)에 대해서 그 주위의 픽셀들 중 검은 픽셀이 적어도 2개에서 6개사이에 있어야 하며,

③ 적어도 픽셀 I(i,j+1), I(i-1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 하며,

④ 적어도 픽셀 I(i-1,j), I(i+1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 한다.

첫번째 subiteration을 만족하면 그다음 다음과 같은 조건에 다시 적용시킨다.

③ 적어도 픽셀 I(i-1,j), I(i,j+1), I(i+1,j)중의 하나는 배경 픽셀 즉 0이어야 하며,

④ 적어도 픽셀 I(i,j+1), I(i+1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 한다.

위의 두 subiteration을 계속하여 더이상 지울 픽셀이 남아 있지 않을때 까지 계속 적용시킨다.

도 2 는 훈민정음 창제원리에 의한 한글문자 인식을 위한 단계별 흐름도로서, 일단계로 글자의 선소 및 획을 분리하는데 문광부 선정 실생활 유효문자 1,076 자를 대상으로 하는 경우를 기준으로 먼저 입력 문자를 정규화된 이미지(32x32 혹은 62x62 도트 등)를 각각 3등분 하고 4개의 방향성(수직, 수평, 사선, 원)에 대해 획을 추출하고 이 선소들의 길이(장, 중, 단은 총 9개의 셀들 중 선소가 1개의 셀에 들어가면 단, 2개의 셀에 들어가면 중, 3개의 셀에 들어가면 장) 정보를 구분하여 분류하면 1076자 중 385자가 유일한 형태의 코드를 가지게 된다.

이를 통해 단+중+장(수평선소)+단+중+소(수직선소)+단+중+장(사선)+원 형식으로 개수를 써넣으면 각 글자에 대한 1단계 코드 값이 만들어 진다.

이 경우에는 모음에 대한 구분은 하지 못한다. (ㅏ와 ㅓ, ㅗ와 ㅜ, ㅑ와 ㅕ, ㅛ와 ㅠ 등은 동일하게 인식) 그러나 385자는 유일한 형태의 코드값을 나타내므로 4방향 선소의 개수를 계산하는 것만으로 바로 분류가 이루어진다.

4방향 선소를 계산하는 방법으로 수평선 개수는 맨 윗 줄(row)부터 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 수평선이 체크되면 줄 번호와 도트수를 기록하고, 한줄 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생)이면 같은 수평선으로 판단(세선화하지 않은 경우)한다.

동일 줄에 4도트 이상 떨어진 수평선들이 나타날 때는 이는 별개의 수평선으로 판단한다. 수평선 체크중 카운트가 된 수평선들은 이미지에서 지워나간다. 그러므로 수평선 검색이 끝난 이미지는 수평선 부문이 없어지고 수직선과 사선, 원만 남게 된다.

다음 과정의 수직선 개수는 맨 왼쪽 열 (column)부터 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 수직선이 체크되면 열 번호와 도트수를 기록하고, 한열 더 오른쪽으로 이동하여 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생, 세선화하지 않은 경우)이면 같은 수직선으로 판단한다.

동일 열에 4도트 이상 떨어진 수직선들이 나타날 때는 이는 별개의 수직선으로 판단한다. 수직선 체크중 카운트가 된 수직선들은 이미지에서 지워 나간다. 그러므로 수직선 검색이 끝난 이미지는 수직선 부문이 없어지고 사선과 원만 남게 된다.

이와 같이 32x32 도트의 한글 문자 이미지에서 특히 명조체의 경우 3화소 이상의 선폭을 갖는 선소도 존재하는데 이와 같은 경우에 하나의 선소에 2개 이상의 선소가 존재한다고 판단할 수 있다.

그러나 실제는 하나의 선소이므로 위와 같이 판단하여 이러한 오류를 보상해야 한다. 사선 개수는 맨 윗 줄(row) 왼쪽 열부터 45도 간격으로 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 사선이 체크되면 줄 및 열번호와 도트수를 기록하고, 대각선으로 한 도트 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생, 사선화하지 않은 경우)이면 같은 사선으로 판단한다. 동일 줄에 4도트 이상 떨어진 사선들이 나타날 때는 이는 별개의 사선으로 판단한다.

사선 체크중 카운트가 된 사선들은 이미지에서 지워나간다. 그러므로 사선 검색이 끝난 이미지는 사선 부문이 없어지고 역방향 사선과 원만 남게 된다. 역사선 개수는 맨 윗 줄(row) 오른쪽 열부터 45도 간격으로 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 역사선이 체크되면 줄 및 열번호와 도트수를 기록하고, 대각선으로 한 도트 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생)이면 같은 역사선으로 판단한다.

동일 줄에 4도트 이상 떨어진 역사선들이 나타날 때는 이는 별개의 역사선으로 판단한다. 역사선 체크중 카운트가 된 역사선들은 이미지에서 지워나간다. 그러므로 역사선 검색까지 끝난 이미지는 역사선 부문이 없어지고 원만 남게 된다. 수평, 수직, 사선, 역사선을 검색시 원과 구분하는 방법이 필요하다.

이런 의미에서 글자 이미지를 4방향 선소를 검색하기 전에 선소를 한 도트의 폭으로 변화하는 세선화를 실시하면 수평, 수직, 사선을 판별할 때 원 구분이 용이 하다.

즉, 수평선 탐색중 (둥근 원이 아니라 넓은 원의 경우) 줄이 바뀜에 따라 연결되는 도트들의 간격이 커지다가 작아지면 이를 원으로 판단하고 중심과 반지름(수직, 수평)을 기록한다.

이단계로 모음의 위치 방향을 (일단계에서는 ㅏ와 ㅓ, ㅗ와 ㅜ, ㅑ와 ㅕ, ㅛ와 ㅠ 등은 동일하게 인식) 판단하여 이를 방향+단+중+장(수평선소)+방향+단+중+소(수직선소)+단+중+장(사선)+원의 형식으로 코드화하여 정렬하면 1076자 중 692자가 고유한 코드값을 가지므로 자동으로 유일하게 분류가 된다.

즉, 일단계에서 코드가 중복이 되는 문자인 경우(예를 들면 ‘아’와 ‘어’) 모음을 구성하는 수평선과 수직선의 위치를 판별 구분토록 구성된다. 이단계를 거치고도 코드값이 중복되는 한글 문자 유형을 구분하면 ㄱ, ㄴ(수평 1, 수직 1)과 ㅁ, ㅂ, ㅍ(수평 2, 수직 2)의 수평 수직 선소의 장/중/단이 일치하는 경우가 대부분으로 중복 개수가 제일 많은 것도 4개로 나타난다.

삼단계로 ㄱ, ㄴ(수평 1, 수직 1)과 ㅁ, ㅂ, ㅍ(수평 2, 수직 2)을 구분하고 초성과 종성 위치만을 판별하여 방향+단+중+장(수평선소)+방향+단+중+소(수직선소)+단+중+장(사선)+원+(ㄱ ㄴ구분)+(ㅁ ㅂ ㅍ 구분)으로 코드 값을 정의 계산하면 1,076 자 중 1,066 자를 인식 99% 분류가 이루어진다.

분류되지 않는 10개의 글자는 ‘얻과 엌’, ‘두와 쿠’, ‘도와 코’, ‘송 과 옷’, ‘뤽과 쉴’이다. ‘송과 옷’ 및 ‘륏과 쉴’은 사선의 위치가 위에 있는지 아래에 있는지로 구분하면 되며, ‘도와 코’ 및 ‘두와 쿠’ 및 ‘얻과 엌’은 자음을 구성하는 수직선의 위치 (ㄷ과 ㅋ에서 ㄷ은 수직선이 왼쪽, ㅋ은 오른쪽에 있음)를 게산하여 구분한다. 이를 통해 100% 구분이 이루어지게 된다.

제 3도는 본 발명이 적용되는 훈민정음 창제원리에 의해 코드화한 한글문자 분류도표의 일부로 이러한 형식으로 한글의 각 글씨체에 따른 분류도표 데이터베이스를 구축, 삼단계 비교 과정을 거쳐 99%의 한글문자를 쉽게 구분하고, 마지막으로 10개의 문자에 대해서도 사선의 위치와 수직선의 위치를 가지고 구분이 이루어진다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.

도 1은 기존의 한글 문자 인식 알고리듬 및 인식 프로세스 흐름도

도 2는 본 발명이 적용되는 훈민정음 창제원리에 의한 한글문자 인식을 위한 단계별 흐름도

도 3는 본 발명이 적용되는 훈민정음 창제원리에 의해 코드화한 한글문자 분류도표 예

* 도면의 주요 부분에 대한 부호의 설명

1 : 글자의 선소, 획 분리 2 : 모음의 연결위치 방향 구분

3 : 초성, 종성 구분

Claims

문자를 인식하는 방법에 있어서,

한 글자의 문자 이미지를 형성하고,

수평선, 수직선, 사선 들을 해당 문자 이미지에서 추출하여 각각의 특성을 기록하며,

각각의 갯수를 코드화하여 글자를 나타내는 고유한 코드값을 형성하여

선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 갯수를 계산하여 문자를 인식하는 방법
1 항에 있어서

한 글자의 문자 이미지를 형성한 후

세선화 과정을 거쳐 해당 문자의 이미지를 골격화한 후 진행함을 특징으로 하는 선소의 갯수를 계산하여 문자를 인식하는 방법
1 항과 같이 일단계로 수평선, 수직선, 사선의 갯수로 비교한 후,

중복되는 코드값을 가지는 경우

모음을 나타내는 수직선과 수평선의 방향 성분을 코드화시켜 추가로 구성하여

선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 갯수와 방향을 계산하여 문자를 인식하는 방법
3 항에 있어서,

모음을 나타내는 수직선과 수평선의 방향 성분을 코드화하여 추가로 구성하고도

중복된 코드값이 나타나는 경우,

기역과 니은을 구분하거나

미음과 비읍, 피읖을 구분하는 성분을 코드화하여 추가로 구성하고

선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 개수와 자음을 구분하여 문자를 인식하는 방법
4 항에 있어서,

모음을 나타내는 수직선과 수평선의 방향 성분을 코드화하여 추가로 구성하고도

중복된 코드값이 나타나는 경우,

디귿과 키읔을 구분하거나

사선의 위치를 구분하는 성분을 코드화하여 추가로 구성하고

선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 개수와 자음을 구분하여 문자를 인식하는 방법
5 항에 있어서,

디귿과 키읔을 구분하기 위해서

자음을 구성하는 수직선의 위치로 구분함을 특징으로 하는 디귿과 티읔 구분 방법
4 항에 있어서,

기역과 니은을 구분하기 위해서

자음을 구성하는 수평선의 위치로 구분함을 특징으로 하는 기역과 니은 구분 방법
4 항에 있어서,

미음과 비읍 및 피읖을 구분하기 위해서

자음을 구성하는 수평선과 수직선의 위치(왼쪽 수직선에 대해 수평선의 위치, 피읍은 위에 있으며 미음은 일치하며 비읍은 중간 정도에 있음)로 구분함을 특징으로 하는 미음과 비읍 및 피읖 구분 방법
1 항에 있어서,

선소를 구분하기 위해

줄(row)과 행(column)을 이동시킬 때

기본 검사하는 대상을 1 도트 이상씩으로 구성(2~3 도트 폭으로 검사, 글자 이미지 해상도에 따라 변화시킴, 32x 32 도트의 경우 2도트로 도트 폭을 설정하면 16단계 영역으로 이동하며 선소 존재를 검사함)하여

세선화 과정에서 발생하는 직선의 노이즈 부문을 흡수하도록 구성함을 특징으로 하는

문자 이미지에서 1 도트 이상의 폭을 갖는 영역에서의 선소 검사 방법