KR20060065197A - 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법 - Google Patents

휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법 Download PDF

Info

Publication number
KR20060065197A
KR20060065197A KR1020040103979A KR20040103979A KR20060065197A KR 20060065197 A KR20060065197 A KR 20060065197A KR 1020040103979 A KR1020040103979 A KR 1020040103979A KR 20040103979 A KR20040103979 A KR 20040103979A KR 20060065197 A KR20060065197 A KR 20060065197A
Authority
KR
South Korea
Prior art keywords
character
image
text
extracting
extracted
Prior art date
Application number
KR1020040103979A
Other languages
English (en)
Other versions
KR100667156B1 (ko
Inventor
김계경
지수영
정연구
이재연
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020040103979A priority Critical patent/KR100667156B1/ko
Publication of KR20060065197A publication Critical patent/KR20060065197A/ko
Application granted granted Critical
Publication of KR100667156B1 publication Critical patent/KR100667156B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 휴대형 카메라로 획득한 문자영상에서 문자영역을 선택하여 국소 이진화한 후에 문자를 인식함으로써, 문자 추출 및 인식 성능을 향상시킬 수 있는 문자인식 장치 및 그 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치에 있어서, 휴대형 카메라를 이용하여 획득한 문자영상을 입력받기 위한 문자영상 입력 수단; 상기 문자영상 입력 수단을 통하여 입력받은 카메라 문자영상을 처리하여 문자영역을 추출하기 위한 문자영역 추출 수단; 상기 문자영역 추출 수단에서 추출한 문자영역에 대해 이진화를 수행하기 위한 이진화 수단; 상기 이진화 수단에서 이진화한 문자영역에서 문자를 추출하기 위한 문자 추출 수단; 상기 문자 추출 수단에서 추출한 문자의 특징을 추출하기 위한 특징 추출 수단; 및 상기 특징 추출 수단에서 추출한 문자의 특징을 이용하여 문자를 인식하기 위한 문자 인식 수단을 포함함.
4. 발명의 중요한 용도
본 발명은 영상처리 기술분야 중 패턴인식분야의 문자인식 기술분야 등에 이용됨.
휴대형 카메라, 문자영상 획득, 문자영역 선택, 국소 이진화, 문자인식

Description

휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치 및 그 방법{Apparatus and method for character recognition by selecting character region in camera document image captured by portable camera}
도 1은 본 발명의 일실시 예에 따른 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치의 구성도,
도 2는 본 발명의 일실시 예에 따른 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 방법에 대한 일실시예 흐름도,
도 3a 및 도 3b는 휴대형 카메라로 획득한 문자영상을 예시한 도면,
도 4는 본 발명에 따라 전처리한 문자영상을 도시한 도면,
도 5a 내지 도 5c는 본 발명에 따른 에지 영상, 화소 팽창 영상, 및 문자영역부분만 선택한 영상을 도시한 도면,
도 6a 및 도 6b는 카메라 문자영상에서 선택한 문자영역에 대한 이진화 결과와 카메라 문자영상 전체에 대한 이진화 결과를 비교 도시한 도면이다.
* 도면의 주요 부분에 대한 부호의 설명
100 : 문자인식 장치 110 : 문자영상 입력부
120 : 영상 전처리부 130 : 에지 검출부
140 : 화소 팽창부 150 : 가상문자영역 추출부
160 : 국소 이진화부 170 : 문자 추출부
180 : 특징 추출부 190 : 문자 인식부
본 발명은 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 PDA(Personal Digital Assistants)나 휴대폰 등과 같은 모바일 기기의 휴대형 카메라를 이용하여 획득한 문자영상에서 문자영역을 자동으로 선택한 후에 그 선택한 문자영역에 대해서 국소 이진화를 수행하여 문자를 인식하기 위한 문자인식 장치 및 그 방법에 관한 것이다.
지금까지의 문자인식은 대부분 종이문서를 스캐너로 스캐닝하여 인식한 다음에 텍스트 파일이나 전자 문서의 형태로 변환하여 사용하여 왔다. 그러나 최근 카메라 기술의 발달로 인하여 PDA나 휴대폰 등과 같은 모바일 기기에 카메라 기능을 내장시켜 정보 획득의 수단으로 활용할 수 있게 되었다. 그리고 모바일 기기의 사용이 증대됨에 따라 일반 사용자의 편의를 위해 카메라로 획득한 문자영상처리에 대한 요구가 증대되고 있는 실정이다.
카메라 문자인식은 기존의 종이문서를 주로 입력해왔던 스캐너와는 달리 현장에 존재하는 어떤 형태의 문자정보도 쉽게 획득할 수 있다는 장점이 있다. 즉, 카메라 문자인식은 종이문서뿐만 아니라 스캐너로 입력이 불가능한 문자들도 손쉽게 획득하여 인식한 다음에 그 인식 결과를 활용할 수 있다는 점이 기존의 스캐너 기반 문자인식과 차별화되는 점이다. 카메라 문자인식대상으로는 관광지의 안내문이나 각종 자료에 대한 설명문, 기념비, 간판, 명함, 메뉴 등을 들 수가 있다. 이러한 카메라 문자인식은 입력 대상 문자들이 기록되어있는 매체에 상관없이 휴대형 카메라로 문자들을 손쉽게 획득하여 인식할 수 있다는 장점이 있으므로 최근 활발히 연구되고 있는 문자인식분야 가운데 하나이다.
그러나 카메라 문자영상은 스캐너 문자영상과는 달리 문자영상을 입력하는 조건이 제한되지 않아 주변 조명의 영향을 많이 받는다는 단점이 있어서, 기존의 스캐너 기반 문자인식에 비하여 인식하기 매우 어려운 것으로 알려져 있다. 카메라 문자인식을 위해 종래에 발표된 방법은 다음과 같다.
첫 번째 종래 방법에서는 거리간판에 씌어진 문자를 PDA용 카메라로 획득한 다음에 인식하도록 하였다. 이 종래 방법에서는 획득한 영상의 배경에서 사용자가 문자영역만 직접 선택한 다음에 서버로 문자영상을 전송한다. 그에 따른 문자인식결과는 정보 검색이나 외국어로 번역하여 사용자에게 다시 서비스해 주는데 활용되었다.
두 번째 종래 방법은 카메라를 이용하여 종이문서를 데이터베이스화하는 것에 관한 것이다. 여기서, 문서영상은 이진화를 통해 문자를 추출한 다음에 인식하 도록 하였다. 그러나 상기 두 번째 종래 방법에는 카메라 문서영상인식에 대한 전처리, 문자추출에 대한 처리방법이 구체적으로 제안되지 않았다.
한편, 일반적으로 카메라 문자영상인식은 제한되지 않은 환경에서의 문자 입력 및 인식대상이 되는 문자 종류의 다양성 등으로 인하여 카메라 문자인식에 대한 안정된 인식 성능을 보장할 수 없다는 문제점이 있다.
따라서 주변 조명 영향에 강인하게 카메라 문자영상에서 문자영역을 제대로 추출하여 인식하는 방법이 요구되고 있다. 또한, 모바일 기기에서 카메라 문자인식기능을 수행하기 위하여 무엇보다 메모리나 처리시간이 문제점으로 지적되어 왔었다. 따라서, 이러한 상기 문제점들을 보완하여 안정적인 문자인식률을 보장할 수 있는 카메라 문자인식 기술이 요구되고 있다.
본 발명은 상기 문제점을 해결하고 상기 요구에 부응하기 위하여 제안된 것으로, 휴대형 카메라로 획득한 문자영상에서 문자영역을 선택하여 국소 이진화한 후에 문자를 인식함으로써, 문자 추출 및 인식 성능을 향상시킬 수 있는 문자인식 장치 및 그 방법을 제공하는데 그 목적이 있다.
즉, 본 발명은 모바일 기기 등에 부착된 휴대형 카메라를 이용하여 획득한 문자영상에서 문자영역을 선택하여 가상문자크기를 알아내고 이 정보로부터 이진화시킬 부 윈도우 크기를 결정하여 국소 이진화한 후에 문자를 인식함으로써, 문자 추출 및 인식 성능을 향상시키고 메모리를 감소시키며 처리시간을 단축시킬 수 있 는 문자인식 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시 예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 장치는, 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치에 있어서, 휴대형 카메라를 이용하여 획득한 문자영상을 입력받기 위한 문자영상 입력 수단; 상기 문자영상 입력 수단을 통하여 입력받은 카메라 문자영상을 처리하여 문자영역을 추출하기 위한 문자영역 추출 수단; 상기 문자영역 추출 수단에서 추출한 문자영역에 대해 이진화를 수행하기 위한 이진화 수단; 상기 이진화 수단에서 이진화한 문자영역에서 문자를 추출하기 위한 문자 추출 수단; 상기 문자 추출 수단에서 추출한 문자의 특징을 추출하기 위한 특징 추출 수단; 및 상기 특징 추출 수단에서 추출한 문자의 특징을 이용하여 문자를 인식하기 위한 문자 인식 수단을 포함하는 것을 특징으로 한다.
한편, 본 발명의 방법은, 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 방법에 있어서, 휴대형 카메라를 이용하여 획득한 문자영상을 입력받는 입력 단계; 상기 입력받은 문자영상에 대하여 문자부분이 제대로 추출되도록 하기 위하여 영상 전처리를 수행하는 영상 전처리 단계; 상기 영상 전처리한 문 자영상에 대해서 에지 영상을 추출하는 단계; 문자영역을 추출하기 위하여 상기 에지 영상의 화소를 팽창시키는 단계; 상기 화소 팽창을 수행한 문자영상 중에서 문자영역을 추출하는 문자영역 추출 단계; 상기 추출한 문자영역 내에서 이진화를 수행하는 이진화 단계; 상기 이진화한 문자영역에서 문자를 추출하는 문자 추출 단계; 상기 추출한 문자에 대해서 특징을 추출하는 단계; 및 상기 추출한 문자를 인식하는 문자 인식 단계를 포함하는 것을 특징으로 한다.
이처럼, 본 발명은 휴대형 카메라로 획득한 문자영상에서 문자영역을 선택하여 그 선택된 문자영역에 대해 국소 이진화 방법을 적용하도록 하였다. 이를 위하여 선택한 문자영역으로부터 문자높이를 구하여 국소 이진화에 사용될 윈도우의 크기로 사용하였다. 또한 본 발명은 문자가 적혀있는 부분 영역에 대해서 국소 이진화를 적용하므로 전체 문자영상에 대한 이진화 결과보다 나은 이진화 결과를 얻을 수 있다. 또한, 본 발명은 처리해야할 영상의 크기가 작아짐에 따라 이에 따르는 메모리 문제나 처리시간 문제도 동시에 해결할 수 있는 장점을 제공한다. 따라서 본 발명은 실시간 인식이 가능하므로 사용자 컴퓨터뿐만 아니라 휴대폰이나 PDA 등과 같은 모바일 기기에 탑재하여 활용할 수 있다. 즉, 본 발명은 카메라 문자영상처리에 소요되는 메모리를 감소시키고 처리시간도 단축시킬 수 있으므로, PDA나 휴대폰 등과 같은 휴대형 기기에 탑재하여 실재 활용할 수 있다는 큰 장점을 제공한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시 예를 상세히 설명하기로 한다.
도 1은 본 발명의 일실시 예에 따른 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치의 구성도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치(100)는, 휴대형 카메라를 이용하여 획득한 문자영상을 입력받기 위한 문자영상 입력부(110), 상기 문자영상 입력부(110)를 통하여 입력받은 카메라 문자영상을 전처리하여 영상을 개선하기 위한 영상 전처리부(120). 상기 영상 전처리부(120)에서 영상 개선한 문자영상에 대해 에지 영상을 검출하기 위한 에지 검출부(130), 상기 에지 검출부(130)에서 검출한 에지 영상에 대해 화소를 팽창(Dilation)시키기 위한 화소 팽창부(140), 상기 화소 팽창부(140)로부터의 문자영상에서 일정 폭을 가지면서 긴 라인을 형성하는 가상문자영역을 추출하기 위한 가상문자영역 추출부(150), 상기 가상문자영역 추출부(150)에서 추출한 가상문자영역에 대해 국소 이진화를 수행하기 위한 국소 이진화부(160), 상기 국소 이진화부(160)에서 국소 이진화한 문자영역에서 개별 문자의 구조적인 특징 정보를 이용하여 단어 및 개별 문자를 추출하기 위한 문자 추출부(170), 상기 문자 추출부(170)에서 추출한 문자의 특징을 추출하기 위한 특징 추출부(180), 및 상기 특징 추출부(180)에서 추출한 문자의 특징을 이용하여 문자의 유형을 분류한 후에 문자를 인식하기 위한 문자 인식부(190)를 포함한다.
상기 각 구성요소의 구체적인 동작 및 그 예를 도 2 내지 도 6을 참조하여 상세히 살펴보기로 한다.
도 2는 본 발명의 일실시 예에 따른 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 방법에 대한 일실시예 흐름도이다.
먼저, 사용자가 휴대형 카메라를 이용하여 다양한 형태의 인식대상문자를 획득하여 본 발명에 따른 문자인식 장치(100)로 전달한다. 그에 따라, 본 발명에 따른 문자인식 장치(100)의 문자영상 입력부(110)가 해당 문자영상을 입력받는다(210).
즉, 다양한 카메라 문자영상을 대상으로 하여 인식 성능을 실험하기 위하여 카메라와 문자 사이의 거리를 다양하게 하여 문자영상을 획득하고 다양한 문자 폰트를 대상으로 하여 휴대폰 카메라로 문자영상을 획득하도록 한다. 즉, 다양한 형태의 인식대상문자 획득을 위하여 휴대형 카메라와 문서와의 거리를 다양하게 하여 카메라 문자영상 샘플들을 얻는다. 또한, 다양한 문자 폰트가 기록된 문자영상(문서영상)을 대상으로 샘플들을 입력할 수도 있다(도 3a 참조). 시뮬레이션에 사용된 문자영상은 제한되지 않은 조명 조건 환경에서 얻어진 영상들이다. 따라서 실내·외 환경에서 문자가 기록된 매체에 상관없이 인쇄체로 적힌 문자영상을 획득하도록 한다(도 3b 참조).
그런데, 휴대형 카메라로 획득한 문자영상을 입력할 경우에 렌즈의 특성에 따른 왜곡 현상 및 포커스 문제로 인하여 문자 부분을 제대로 인식할 수 없는 경우가 발생한다. 또한, 저해상도 카메라를 이용하여 획득한 문자영상이 입력됨으로 인하여 문자영상이 블러링되거나 이웃하는 문자와 겹쳐지는 경우가 많이 나타나게 되므로, 문자영역을 분할하여 인식하는 것이 매우 어렵게 된다. 따라서 본 발명에서는 후술하는 바와 같이 문자영역을 먼저 추출하여 이진화, 문자 추출 및 인식 과정을 진행한다.
이후, 상기 입력받은 문자영상에 대하여 문자부분이 제대로 추출되도록 하기 위한 영상 전처리 알고리즘을 적용시킨다(220). 왜냐하면, 스캐너로 입력한 문자영상과 달리 카메라 문자영상은 주변 조명의 영향으로 인하여 획득한 문자영상의 가장 자리부분에 비네트(vignette) 현상 및 문자영상이 흐려지는 블러링 현상이 발생한다. 이러한 요인들은 문자의 오 인식을 유발하는 요인으로 작용하므로 문자부분을 제대로 추출하여 인식하는 방법이 요구된다.
따라서 컬러 영상을 명도 영상으로 변환시킨 후에 명도 레벨 정규화(gray-level normalization) 방식을 이용하여 명도 영상에서 부분영역에 위치하고 있는 화소 값들을 전체 레벨에 균등하게 확장시켜 배치시키는 방식으로 영상 전처리를 수행하여 배경으로부터 문자영역을 강조한다. 그 결과로 개선된 영상이 도 4에 도시되어 있다.
이후, 상기 영상 전처리한 문자영상에 대해서 에지 영상을 추출한다(230). 즉, 상기 영상 전처리 알고리즘이 적용된 문자영상에 대해 도 5a와 같은 에지 영상을 추출한다. 이는 입력받은 문자영상에서 문자가 존재하는 영역을 추출하기 위한 것이다.
이후, 문자영역을 추출하기 위하여 상기 에지 영상의 화소를 팽창시킨다(240). 그 결과 영상이 도 5b에 도시되어 있다.
이후, 일정 높이를 가진 긴 라인 영역을 가상문자영역으로 간주하여 추출한다(250). 즉, 상기 화소 팽창을 수행한 문자영상 중에서 일정 높이를 가진 긴 선 영역을 가상문자영역으로 간주하여 추출한다. 그 결과 영상이 도 5c에 도시되어 있다.
이후, 상기 추출한 가상문자영역 내에서 국소 이진화를 수행한다(260). 즉, 상기 추출한 가상문자영역 내에서 각각 이진화를 위한 임계치를 계산하여 국소 적응적 이진화를 수행하여 문자 획의 손실을 최대한 줄이면서 문자를 추출할 수 있도록 한다. 전술한 바와 같이 휴대형 카메라 문자인식은 문자가 적힌 매체에 상관없이 다양한 종류의 실세계 문자 정보를 휴대형 카메라로 손쉽게 획득하여 입력함으로써, 해당 문자를 인식할 수 있는 장점이 있다. 그러나 카메라로 획득한 문자영상은 스캐너로 획득한 문자영상과 달리 주변 조명의 영향으로 인하여 문자영역을 제대로 추출하지 못해서 인식하지 못하는 경우가 흔히 발생한다. 이러한 문제점을 보완하기 위하여 문자영상을 부 영역으로 나누어 각 영역 내에 존재하는 화소들의 명도 분포를 조사하여 이진화시키는 국소 적응적 이진화 방식을 적용한다. 국소 적응적 이진화 방식에서는 주변 화소들의 정보를 반영하기 위한 부 윈도우의 크기와 대상 문자들의 크기가 많은 연계성을 가진다.
이후, 상기 국소 이진화한 문자영역에서 결합 및 분리 알고리즘을 이용하여 단어 및 개별 문자를 추출한다(270). 즉, 문자 분할을 위하여 수직 투영 및 여백 정보를 이용하여 단어를 추출한 후에 결합 및 분리 알고리즘을 이용하여 개별 문자를 추출한다. 일반적으로 한글은 다른 문자들과 달리 모음과 자음이 결합하여 문자를 이루기 때문에 연결 화소에 대하여 결합 및 분리 알고리즘을 적용하여 개별 문자를 추출할 수 있다. 이 때, 문자 이외의 연결 화소 즉, 표, 그림, 국소 이진화 결과로 나타나는 문자 이외의 연결 화소를 잡음으로 간주하여 제거한다. 특히, 한영이 혼용된 문자영상의 경우에 한글과 영어의 구조적인 특징 정보를 이용하여 개별 문자를 추출한다.
이후, 상기 추출한 개별 문자에 대해서 특징을 추출한다(280). 즉, 개별 문자 인식을 위하여 망 특징, 거리정보 특징, 및 윤곽선 정보를 이용하여 개별 문자에 대한 특징을 추출한다.
이후, 상기 추출한 개별 문자를 인식하여 인식 결과를 얻는다(290). 즉, 상기 추출한 개별 문자의 유형을 분류한 후에 문자를 인식한다. 이 때, 한글, 영어, 기호, 숫자가 혼용된 문자 인식을 위하여 한글에 대하여 여섯 가지 문자유형으로 분류하고 영어, 기호, 숫자를 비 한글 유형으로 분류하여 각 문자 유형별로 문자들을 인식한다.
전술한 바와 같이, 본 발명에서는 휴대형 카메라를 이용하여 문자영상을 획득하여 가상문자영역을 미리 추출한 다음에 그 영역에 적합한 국소 이진화를 적용하여 문자를 추출하고 인식하는 방식을 제안하였다. 또한, 본 발명에서는 주변 조명 영향을 줄이기 위하여 영상 개선 알고리즘을 적용시키고 가상문자영역을 미리 추출하여 그 영역에 적합한 국소 이진화 방법을 선택적으로 적용하도록 하였다. 또한, 결합 및 분리 알고리즘을 이용하여 개별 문자를 추출하여 유형별로 문자인식을 하도록 함으로써, 인식기의 부담을 줄여 오 인식을 줄일 수 있도록 하였다. 또한 본 발명은 기존의 카메라 문자영상이 주변 조명이나 카메라 렌즈의 영향으로 인하여 인식하기 어려운 문자대상으로 여겨졌었던 문제점을 보완할 수 있도록 하였으며, 또한 휴대폰 등에 카메라 문자인식 알고리즘을 탑재하여 사용할 경우 문제 시 되는 처리시간 및 메모리 문제를 해결하였다. 또한 본 발명은 기존 카메라 문자인식이 해결해야 할 처리시간 문제, 메모리 문제뿐만 아니라 선택적으로 문자영역을 선택하여 국소 이진화를 수행함으로써 카메라 문자인식 성능을 높일 수 있도록 하였다. 또한 본 발명은 카메라 문자인식 기술을 휴대폰이나 다른 모바일 기기에 탑재하여 문자 인식을 실제 활용할 수 있도록 할 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시 예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 모바일 기기 등에 부착된 휴대형 카메라를 이용하여 획득한 문자영상에서 문자영역을 선택하여 가상문자크기를 알아내고 이 정보로부터 이진화시킬 부 윈도우 크기를 결정하여 국소 이진화한 후에 문자를 인식함으로써, 문자 추출 및 인식 성능을 향상시키고 메모리를 감소시키며 처리시간을 단축시킬 수 있는 효과가 있다.
즉, 본 발명은 주변 조명의 영향을 덜 받고 문자크기에 무관하게 카메라 문자영상을 인식하기 위해서 문자가 존재하는 영역을 미리 찾아 문자열을 추출하여 가상문자크기를 먼저 구한 후에, 그 가상문자크기로부터 부 윈도우의 크기를 정하여 문자영역을 국소 이진화를 수행하여 문자를 인식함으로써, 기존의 방법에서보다 더 나은 이진화 결과를 얻을 수 있어 카메라 문자인식의 성능을 향상시킬 수 있고, 또한 PDA나 휴대폰 등과 같은 휴대형 단말기에서 카메라 문자인식이 실행될 때 처리할 영상의 크기가 작아지므로 카메라 문자영상처리에 소요되는 메모리를 감소시키고 처리시간도 단축시킬 수 있는 효과가 있다.
또한 본 발명은 상기와 같이 카메라 문자영상처리에 소요되는 메모리를 감소시키고 처리시간도 단축시킬 수 있으므로, PDA나 휴대폰 등과 같은 휴대형 기기에 탑재하여 실재 활용할 수 있다는 큰 장점이 있다.

Claims (13)

  1. 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 장치에 있어서,
    휴대형 카메라를 이용하여 획득한 문자영상을 입력받기 위한 문자영상 입력 수단;
    상기 문자영상 입력 수단을 통하여 입력받은 카메라 문자영상을 처리하여 문자영역을 추출하기 위한 문자영역 추출 수단;
    상기 문자영역 추출 수단에서 추출한 문자영역에 대해 이진화를 수행하기 위한 이진화 수단;
    상기 이진화 수단에서 이진화한 문자영역에서 문자를 추출하기 위한 문자 추출 수단;
    상기 문자 추출 수단에서 추출한 문자의 특징을 추출하기 위한 특징 추출 수단; 및
    상기 특징 추출 수단에서 추출한 문자의 특징을 이용하여 문자를 인식하기 위한 문자 인식 수단
    을 포함하는 문자인식 장치.
  2. 제 1 항에 있어서,
    상기 문자영상 입력 수단을 통하여 입력받은 카메라 문자영상을 전처리하여 영상을 개선하기 위한 영상 전처리 수단;
    상기 영상 전처리 수단에서 영상 개선한 문자영상에 대해 에지 영상을 검출하기 위한 에지 검출 수단;
    상기 에지 검출 수단에서 검출한 에지 영상에 대해 화소를 팽창(Dilation)시키기 위한 화소 팽창 수단; 및
    상기 화소 팽창 수단으로부터의 문자영상에서 일정 폭을 가지면서 긴 라인을 형성하는 가상문자영역을 추출하기 위한 가상문자영역 추출 수단
    을 포함하는 문자인식 장치.
  3. 제 2 항에 있어서,
    상기 영상 전처리 수단은,
    컬러 영상을 명도 영상으로 변환시킨 후에 명도 레벨 정규화(gray-level normalization) 방식을 이용하여 명도 영상에서 부분영역에 위치하고 있는 화소 값들을 전체 레벨에 균등하게 확장시켜 배치시키는 방식으로 영상 전처리를 수행하여 배경으로부터 문자영역을 강조하는 것을 특징으로 하는 문자인식 장치.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 이진화 수단은,
    상기 추출한 가상문자영역 내에서 각각 이진화를 위한 임계치를 계산하여 국소 적응적 이진화를 수행하여 상기 문자 추출 수단에서 문자 획의 손실을 최대한 줄이면서 문자를 추출할 수 있도록 하는 것을 특징으로 하는 문자인식 장치.
  5. 제 4 항에 있어서,
    상기 문자 추출 수단은,
    상기 이진화 수단에서 국소 이진화한 문자영역에서 개별 문자의 구조적인 특징 정보를 이용하여 단어 및 개별 문자를 추출하고,
    상기 문자 인식 수단은,
    상기 특징 추출 수단에서 추출한 문자의 특징을 이용하여 문자의 유형을 분류한 후에 문자를 인식하는 것을 특징으로 하는 문자인식 장치.
  6. 제 5 항에 있어서,
    상기 문자 추출 수단은,
    문자 분할을 위하여 수직 투영 및 여백 정보를 이용하여 단어를 추출한 후에 연결 화소에 대하여 결합 및 분리 알고리즘을 적용하여 개별 문자를 추출하되, 문자 이외의 연결 화소 즉, 표, 그림, 국소 이진화 결과로 나타나는 문자 이외의 연 결 화소를 잡음으로 간주하여 제거하는 것을 특징으로 하는 문자인식 장치.
  7. 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한 문자인식 방법에 있어서,
    휴대형 카메라를 이용하여 획득한 문자영상을 입력받는 입력 단계;
    상기 입력받은 문자영상에 대하여 문자부분이 제대로 추출되도록 하기 위하여 영상 전처리를 수행하는 영상 전처리 단계;
    상기 영상 전처리한 문자영상에 대해서 에지 영상을 추출하는 단계;
    문자영역을 추출하기 위하여 상기 에지 영상의 화소를 팽창시키는 단계;
    상기 화소 팽창을 수행한 문자영상 중에서 문자영역을 추출하는 문자영역 추출 단계;
    상기 추출한 문자영역 내에서 이진화를 수행하는 이진화 단계;
    상기 이진화한 문자영역에서 문자를 추출하는 문자 추출 단계;
    상기 추출한 문자에 대해서 특징을 추출하는 단계; 및
    상기 추출한 문자를 인식하는 문자 인식 단계
    를 포함하는 문자인식 방법.
  8. 제 7 항에 있어서,
    상기 입력 단계는,
    카메라와 문자 사이의 거리를 다양하게 하여 휴대폰 카메라로 획득한 문자영상 및 다양한 문자 폰트를 대상으로 하여 휴대폰 카메라로 획득한 문자영상을 입력받는 것을 특징으로 하는 문자인식 방법.
  9. 제 7 항에 있어서,
    상기 영상 전처리 단계는,
    컬러 영상을 명도 영상으로 변환시킨 후에 명도 레벨 정규화(gray-level normalization) 방식을 이용하여 명도 영상에서 부분영역에 위치하고 있는 화소 값들을 전체 레벨에 균등하게 확장시켜 배치시키는 방식으로 영상 전처리를 수행하여 배경으로부터 문자영역을 강조하는 것을 특징으로 하는 문자인식 방법.
  10. 제 7 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 문자영역 추출 단계는,
    상기 화소 팽창을 수행한 문자영상 중에서 일정 높이를 가진 긴 선 영역을 가상문자영역으로 간주하여 추출하는 것을 특징으로 하는 문자인식 방법.
  11. 제 10 항에 있어서,
    상기 이진화 단계는,
    상기 추출한 가상문자영역 내에서 각각 이진화를 위한 임계치를 계산하여 국소 적응적 이진화를 수행하는 것을 특징으로 하는 문자인식 방법.
  12. 제 11 항에 있어서,
    상기 문자 추출 단계는,
    문자 분할을 위하여 수직 투영 및 여백 정보를 이용하여 단어를 추출한 후에 결합 및 분리 알고리즘을 이용하여 개별 문자를 추출하는 것을 특징으로 하는 문자인식 방법.
  13. 제 12 항에 있어서,
    상기 문자 인식 단계는,
    상기 추출한 개별 문자의 유형을 분류한 후에 문자를 인식하는 것을 특징으로 하는 문자인식 방법.
KR1020040103979A 2004-12-10 2004-12-10 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법 KR100667156B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040103979A KR100667156B1 (ko) 2004-12-10 2004-12-10 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040103979A KR100667156B1 (ko) 2004-12-10 2004-12-10 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20060065197A true KR20060065197A (ko) 2006-06-14
KR100667156B1 KR100667156B1 (ko) 2007-01-12

Family

ID=37160504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040103979A KR100667156B1 (ko) 2004-12-10 2004-12-10 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100667156B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100805294B1 (ko) * 2006-12-04 2008-02-20 삼성전자주식회사 통신 단말기 및 그의 폰트 생성 방법
KR101015663B1 (ko) * 2008-06-24 2011-02-22 삼성전자주식회사 문자인식장치에서의 문자인식방법 및 그 장치
KR101044652B1 (ko) * 2009-04-15 2011-06-29 한국과학기술원 터치스크린을 통한 카메라 영상의 문자열 인식 시스템 및 그 방법
US8320681B2 (en) 2008-06-19 2012-11-27 Samsung Electronics Co., Ltd Method and apparatus for recognizing characters
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
KR101313100B1 (ko) * 2011-10-24 2013-09-30 (주)엠비씨아카데미씨엔엠 영상물 가공 장치 및 이를 이용한 영상물 배포 시스템
KR101473713B1 (ko) * 2010-10-05 2014-12-24 에스케이플래닛 주식회사 문자 인식 장치 및 방법
US10013070B2 (en) 2016-03-29 2018-07-03 Korea Electronics Technology Institute System and method for recognizing hand gesture
US11436418B2 (en) 2018-12-07 2022-09-06 Electronics And Telecommunications Research Institute System and method for automatically translating characters in image

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101291195B1 (ko) 2007-11-22 2013-07-31 삼성전자주식회사 문자인식장치 및 방법

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100805294B1 (ko) * 2006-12-04 2008-02-20 삼성전자주식회사 통신 단말기 및 그의 폰트 생성 방법
US10089557B2 (en) 2008-06-19 2018-10-02 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
US8320681B2 (en) 2008-06-19 2012-11-27 Samsung Electronics Co., Ltd Method and apparatus for recognizing characters
US10803367B2 (en) 2008-06-19 2020-10-13 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
US8855429B2 (en) 2008-06-19 2014-10-07 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
US8553987B2 (en) 2008-06-19 2013-10-08 Samsung Electronics Co., Ltd Method and apparatus for recognizing characters using autofocus of a camera
US9218547B2 (en) 2008-06-19 2015-12-22 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
US10509989B2 (en) 2008-06-19 2019-12-17 Samsung Electronics Co., Ltd. Method and apparatus for recognizing characters
KR101015663B1 (ko) * 2008-06-24 2011-02-22 삼성전자주식회사 문자인식장치에서의 문자인식방법 및 그 장치
US8331672B2 (en) 2008-06-24 2012-12-11 Samsung Electronics Co., Ltd Method and apparatus for recognizing character in character recognizing apparatus
KR101044652B1 (ko) * 2009-04-15 2011-06-29 한국과학기술원 터치스크린을 통한 카메라 영상의 문자열 인식 시스템 및 그 방법
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
KR101473713B1 (ko) * 2010-10-05 2014-12-24 에스케이플래닛 주식회사 문자 인식 장치 및 방법
KR101313100B1 (ko) * 2011-10-24 2013-09-30 (주)엠비씨아카데미씨엔엠 영상물 가공 장치 및 이를 이용한 영상물 배포 시스템
US10013070B2 (en) 2016-03-29 2018-07-03 Korea Electronics Technology Institute System and method for recognizing hand gesture
US11436418B2 (en) 2018-12-07 2022-09-06 Electronics And Telecommunications Research Institute System and method for automatically translating characters in image

Also Published As

Publication number Publication date
KR100667156B1 (ko) 2007-01-12

Similar Documents

Publication Publication Date Title
KR101023389B1 (ko) 문자 인식 성능을 향상시키기 위한 장치 및 방법
Ryan et al. An examination of character recognition on ID card using template matching approach
JP6317772B2 (ja) 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
Chen et al. Automatic detection and recognition of signs from natural scenes
Gatos et al. Automatic table detection in document images
US20140193029A1 (en) Text Detection in Images of Graphical User Interfaces
Demilew et al. Ancient Geez script recognition using deep learning
KR100667156B1 (ko) 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법
CN111967286A (zh) 信息承载介质的识别方法、识别装置、计算机设备和介质
KR100593986B1 (ko) 영상화면 내의 글자 이미지를 인식하는 장치 및 방법
Kaundilya et al. Automated text extraction from images using OCR system
KR102167433B1 (ko) 다중 패턴 문자 영상 자동 생성 기반 문자 인식 장치 및 그 방법
Bhuvaneswari et al. Automatic Detection and Inpainting of Text Images
CN113076952B (zh) 一种文本自动识别和增强的方法及装置
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
KR100874747B1 (ko) 화소 이동 문서 영상 조합 인식 방법을 이용한 카메라 문자인식 장치 및 방법
Nor et al. Image segmentation and text extraction: application to the extraction of textual information in scene images
Emmanuel et al. Automatic detection and recognition of Malayalam text from natural scene images
Dinh et al. Low-complexity text extraction in Korean signboards for mobile applications
Akshay et al. Handwritten English Character Recognition and Speech Synthesis to aid Text-to-Speech Applications
KR20190015064A (ko) 블럽 기반의 문자 인식 방법 및 이를 위한 장치
RU2609069C2 (ru) Обнаружение текста в изображениях графических пользовательских интерфейсов
Al-Hashemi et al. Instant Arabic translation system for signboard images based on printed character recognition
Jambekar A Review of Optical Character Recognition System for Recognition of Printed Text
Kumar et al. Analysis of the key components of segmentation-free bilingual OCR for mobile phones

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121206

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 19