KR101905426B1 - 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템 - Google Patents

자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템 Download PDF

Info

Publication number
KR101905426B1
KR101905426B1 KR1020120003295A KR20120003295A KR101905426B1 KR 101905426 B1 KR101905426 B1 KR 101905426B1 KR 1020120003295 A KR1020120003295 A KR 1020120003295A KR 20120003295 A KR20120003295 A KR 20120003295A KR 101905426 B1 KR101905426 B1 KR 101905426B1
Authority
KR
South Korea
Prior art keywords
character information
point
code
structural feature
end point
Prior art date
Application number
KR1020120003295A
Other languages
English (en)
Other versions
KR20130082223A (ko
Inventor
윤호섭
김지은
반규대
이동진
김재홍
손주찬
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120003295A priority Critical patent/KR101905426B1/ko
Priority to US13/599,111 priority patent/US8934716B2/en
Publication of KR20130082223A publication Critical patent/KR20130082223A/ko
Application granted granted Critical
Publication of KR101905426B1 publication Critical patent/KR101905426B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 문자 인식의 정확도를 높이기 위하여 문자 정보를 순서화하는 방법에 관한 것으로, 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화(binarization)하고, 이진화된 문자 정보의 중심선을 추출하여 세선화(thinning)하는 전처리 하고, 전처리된 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)한 다음 정규화된 문자 정보를 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 순서화하는 단계를 포함한다. 본 발명에 따르면 입력 문자 정보의 각도 정규화 방법, 구조적 특징 위치 결정방법, 구조적 특징 숫자열 생성 방법 등을 제안함으로써, 자연영상으로부터 얻은 다양한 폰트의 문자를 각도 및 크기와 무관하게 강인하게 인식할 수 있다.

Description

자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템{Method and apparatus for ordering of off-line character from natural scene}
본 발명은 실외 환경에서 나타나는 다양한 폰트의 문자를 인식하기 위해 문자를 이루는 선들의 구조를 분석하고 순서로 이루어진 획으로 표현함으로써 문자 인식의 정확도를 높이는 방법에 관한 것이다.
종래의 구조적인 문자인식 방법은 온라인 입력에서 주로 사용되어 왔다. 즉, 전자 펜이나 터치를 이용해 감지된 정보를 문자의 획 정보를 시간 순으로 연속적으로 입력 받아, 각 획들의 구조적인 특성을 분석하고 이를 모델링하는 방법으로 인식을 시도하였다. 이러한 구조적인 문자인식 방법은 개개인의 필기 습관이 다양한 경우에도 획을 이루는 구조는 일정한 장점이 있기 때문에 적합하였다.
반면에 영상으로 입력 받은 문자를 인식하는 경우(OCR)는 주로 신경망을 이용한 통계적 인식방법이 주를 이루었다. 이러한 통계적인 인식방법의 경우는 폰트가 일정한 경우나 제한된 경우에는 높은 인식률이 보고 되고 있었으며 주로 스캐너를 이용한 문서 인식 등에 널리 사용되고 있었다. 그러나, 이러한 통계적인 인식방법은 특정한 폰트가 없는 자연환경의 외부 영상에 포함된 문자 인식의 방법으로는 모든 폰트의 변화를 학습 시킬 수 없기 때문에 높은 인식률을 기대하기 어려운 문제점이 있었다.
본 발명은 상기 종래 기술의 문제를 해결하기 위하여 안출된 것으로서, 자연영상에서 존재하는 다양한 폰트의 문자들을 인식하기 위해서 온라인(on-line) 인식 방법에서 주로 사용하는 구조적 문자인식 기법을 이용하여 자연영상에 포함된 문자정보를 전처리하고 전처리된 문자 정보의 끝점, 분기점등을 포함하는 구조적 특징점을 검출한 뒤 이에 대응되는 구조적 특징 코드를 할당하여 숫자열로 생성하는 방법을 제공하는 것을 목적으로 한다.
상기 기술적 과제를 해결하기 위한 본 발명의 일실시예에 따른 문자 정보의 순서화 방법은 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화(binarization)하고, 이진화된 문자 정보를 일정한 두께에 따른 정보로 세선화(thinning)하는 전처리 단계; 상기 전처리 단계에서 전처리된 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)하는 단계;
상기 정규화된 문자 정보를 상기 문자 정보의 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 숫자화된 정보로 변환하는 단계를 포함한다.
상기 문자 정보를 정규화하는 단계는 상기 전처리된 문자 정보를 구성하는 점 중에서 하나의 이웃하는 점을 가지는 문자획의 끝점을 검출하는 단계; 및 상기 끝점 코드가 할당된 끝점을 이용하여 상기 문자 정보의 기울어진 각도를 미리 설정된 방향에 따라 보정하는 단계를 포함한다.
상기 끝점을 검출하는 단계는 상기 문자 정보에서 끝점을 검출하여 끝점 코드를 할당하는 단계; 및 상기 끝점 코드가 할당된 끝점들에 대하여 미리 결정된 순서에 따른 끝점의 방문 순서를 설정하는 단계를 포함한다.
상기 기울어진 각도를 보정하는 단계는 상기 검출된 끝점 중 한 점을 기준점으로 하여 상기 기준점이 미리 설정된 n개의 방향과 이루는 각도가 최소가 되는 방향으로 상기 문자 정보를 회전하는 것이 바람직하다.
제 3 항에 있어서 상기 구조적 특징을 이용하여 순서화하는 단계에 앞서,
상기 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당하는 단계를 포함하고, 상기 순서화하는 단계는 상기 코드 또는 포인트가 할당된 문자 정보를 구조적 특징을 이용하여 순서화하는 것이 바람직하다.
상기 체인코드 또는 분기포인트를 할당하는 것은, 상기 검출된 끝점에 대하여 설정된 방문 순서에 따라 상기 문자 정보를 구성하는 각각의 점들을 방문하며 할당하는 것이 바람직하다.
상기 체인코드 또는 분기포인트를 할당하는 것은, 상기 끝점을 검출하는 단계에서 검출된 끝점이 없는 경우 상기 문자 정보가 포함하는 점 중에서 상대적으로 가장 왼쪽 위에 위치하는 점을 시작점으로 하여 미리 결정된 방문 순서에 따라 방문하며 할당하는 것이 바람직하다.
상기 설정 또는 결정된 방문 순서에 따라 상기 문자 정보의 점들을 방문하는 것은 상기 시작점에서 연속된 점들을 방문하되, 상대적 위치가 가장 왼쪽 위인 점을 우선순위로 하는 깊이 우선 탐색 법(depth first search)을 이용하여 방문하는 것이 바람직하다.
상기 체인코드(chain code) 또는 분기포인트를 할당하는 단계는 상기 방문 순서에 따라 방문한 점을 기준으로 획의 현재 진행 방향과 획의 이후 진행 방향이 이루는 각도가 미리 정한 임계값 보다 큰 경우 상기 방문된 점에 대하여 커브포인트를 할당하는 것이 바람직하다.
상기 임계값과 비교되는 각도는 상기 획의 현재 진행 방향과 획의 이후 진행 방향이 이루는 각도 중 작은 각도인 것이 바람직하다.
상기 순서화 단계는 상기 문자 정보의 구조적 특징에 대하여 할당된 끝점 코드, 분기 포인트 또는 커브 포인트에 대응되는 숫자 코드를 설정하는 구조적 특징 코드 설정단계; 및 상기 설정된 구조적 특징 코드에 가중치를 부여하여 숫자열화 된 구조적 특징 코드를 생성하는 숫자열 생성단계를 포함한다.
상기 구조적 특징 코드 생성단계는 상기 구조적 특징을 미리 결정된 숫자화 표현 방법에 따라 상기 숫자 코드를 설정하는 것이 바람직하다.
상기 숫자열 생성 단계는 상기 문자 정보에 할당된 숫자 코드를 상기 방문 순서에 따라 순서화하여 숫자열을 생성하는 것이 바람직하다.
상기 숫자열 생성 단계에서 가중치를 부여하는 것은 상기 생성된 숫자열의 상기 구조적 특징에 대하여 설정된 상기 숫자 코드를 상기 구조적 특징 위치들 간의 거리를 이용하여 상기 숫자 코드를 반복하는 것이 바람직하다.
상기 문자 정보의 순서화 방법은 상기 순서화 단계에서 생성된 숫자열을 이용하여 상기 문자 정보에 대한 숫자열을 일반화 하는 모델링 단계를 더 포함한다.
상기 기술적 과제를 해결하기 위한 본 발명의 일실시예에 따른 문자 정보의 순서화 장치는 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화(binarization)하고, 이진화된 문자 정보를 일정한 두께에 따른 정보로 세선화(thinning)하는 전처리부; 상기 전처리 부에서 전처리된 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)하는 정규화 부; 상기 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당하는 코드 할당부; 및 상기 코드 또는 포인트가 할당된 문자 정보를 문자 정보를 상기 문자 정보의 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 숫자화된 정보로 변환하는 순서화부를 포함한다.
상기 정규화부는 상기 전처리된 문자 정보를 구성하는 점 중에서 하나의 이웃하는 점을 가지는 문자획의 끝점을 검출하여 끝점 코드를 할당하는 끝점 코드 할당부; 및 상기 끝점 코드가 할당된 끝점을 이용하여 상기 문자 정보의 기울어진 각도를 미리 설정된 각도에 따라 보정하는 문자정보 회전부를 포함한다.
상기 순서화부는 상기 문자 정보의 구조적 특징에 대하여 할당된 끝점코드, 분기 포인트, 또는 커브 포인트에 대응되는 숫자 코드를 설정하는 구조적 특징 코드 생성부; 및 상기 생성된 구조적 특징 코드에 가중치를 부여하여 숫자열화 된 구조적 특징 코드를 생성하는 숫자열 생성부를 포함한다.
상기 문자 정보의 순서화 장치는 상기 순서화 단계에서 생성된 숫자열을 이용하여 상기 문자 정보에 대한 숫자열을 일반화 하는 모델링부를 더 포함한다.
상기 기술적 과제를 해결하기 위한 본 발명의 일실시예에 따른 문자 정보의 인식 방법은 문자 정보의 인식 방법에 있어서, 문자 정보가 포함된 영상 정보를 입력 받는 단계; 상기 입력된 영상 정보에서 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화하고, 이진화된 문자 정보의 중심선을 추출하여 세선화하는 전처리 단계; 미리 결정된 알고리즘에 따라 문자 정보를 끝점, 분기점 및 커브점을 포함하는 구조적 특징점에 가중치를 부가하여 숫자열 정보로 변환하여 학습된 모델링 정보를 이용하여 상기 전처리된 문자 정보를 인식하는 단계를 포함한다.
본 발명에 따르면, 기존의 온라인(on-line) 문자 인식 방법을 영상에서 얻은 오프라인(off-line) 문자인시 방법에 적용할 수 있어 자연환경에서 존재하는 다양한 폰트의 문자들을 쉽게 인식할 수 있으며, 본 발명에서는 폰트와 무관한 구조적 문자 인식의 장점을 영상으로부터 입력된 문자 정보에 적용하기 위해서 입력 문자열의 각도 정규화 방법, 구조적 특징 위치 결정방법, 구조적 특징 숫자열 생성 방법 등을 제안함으로써, 자연영상으로부터 얻은 다양한 폰트의 문자를 각도 및 크기와 무관하게 강인하게 인식할 수 있다.
도 1은 본 발명의 일실시예에 따른 문자 정보의 순서화 방법을 나타내는 흐름도이다.
도 2는 본 발명의 일실시예에 따른 문자 정보의 정규화 단계를 나타내는 흐름도이다.
도 3a는 본 발명의 일 실시예에 따라 문자 정보의 끝점을 검출하기 위한 3x3마스크를 나타내는 예시도이다.
도 3b는 본 발명의 일 실시예에 따라 문자 정보의 끝점 코드가 할당된 예를 나타내는 예시도이다.
도 3c는 본 발명의 일 실시예에 따라 문자 정보의 끝점 코드에 미리 결정된 순서에 따른 순서를 할당한 예를 나타내는 예시도이다.
도 4는 본 발명의 일 실시예에 따른 문자 정보의 각도를 보정하기 위한 각도를 계산하는 예를 나타내는 예시도이다.
도 5는 본 발명의 일 실시예에 따른 코드 또는 포인트를 할당하는 방법을 나타내는 흐름도이다.
도 6a는 본 발명의 일 실시예에 따른 체인코드의 할당을 위한 8방향 코드를 나타내는 예시도이다.
도 6b는 본 발명의 일 실시예에 따른 분기포인트를 판단하기 위한 마스크를 나타내는 예시도이다.
도 6c는 본 발명의 일 실시예에 따른 커브포인트를 판단하기 위한 5x5 마스크를 나타내는 예시도이다.
도 7은 본 발명의 일실시예에 따른 문자 정보에 코드 및 포인트를 할당한 결과를 예시하는 예시도이다.
도 8은 본 발명의 일실시예에 따른 문자 정보의 구조적 특징 점에 구조적 특징 코드를 할당한 예를 나타내는 예시도이다.
도 9는 본 발명의 일실시예에 따른 문자 정보를 구조적 특징 코드로 순서화 단계를 나타내는 흐름도이다.
도 10은 본 발명의 일실시예에 따른 문자 정보의 숫자열 생성단계에서 생성된 숫자열을 나타내는 예시도이다.
도 11은 본 발명의 일실시예에 따라 생성된 숫자열의 구조적 특징 코드에 가중치를 부가한 숫자열을 나타내는 예시도이다.
도 12는 본 발명의 일실시예에 따른 문자 정보의 순서화 장치를 나타내는 블록도이다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이하 설명 및 첨부된 도면들에서 실질적으로 동일한 구성요소들은 각각 동일한 부호들로 나타냄으로써 중복 설명을 생략하기로 한다. 또한 본 발명을 설명함에 있어 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다.
도 1은 본 발명의 일실시예에 따른 문자 정보의 순서화 방법을 나타내는 흐름도이다.
도 1에 따르면, 본 실시예에 따른 문자 정보의 순서화 방법은 영상정보에 포함된 문자정보를 입력 받아 이진화(binarization) 및 세선화(tinning)하는 전처리 단계(S100), 전처리된 문자정보를 정규화하는 단계(S200), 정규화된 문자정보에 포인트를 할당하는 단계(S300), 정규화된 문자정보에 할당된 포인트를 이용하여 끝점 또는 분기점을 포함하는 구조적 특징을 순서화 단계(S400)을 포함한다.
문자 정보의 전처리 단계(S100)는 영상정보에 포함된 문자정보를 입력받아 이진화하고 이진화된 영상정보를 세선화한다. 문자 정보를 이진화하는 것은 임계값(threshold)을 기준으로 낮은 값을 가지는 픽셀은 흑(0)으로 높은값을 가지는 픽셀은 백(255)으로 만드는 과정으로 영상정보를 흑과 백의 명암으로 표현하는 것이 바람직하다. 본 실시예에 따른 이진화는 영상 중에 대상물이 차지하고 있는 면적 비율을 알고 있는 경우에 명도 히스토그램에서 그 면적 비율 P%점을 임계값으로 하는 P-타일법(단순 임계치 방법), 명도값에 따른 픽셀값의 분포를 표현한 히스토그램에서 산 사이의 계곡에 해당하는 명도점을 이진화의 임계값으로 하는 모드(Mode)법, 영상 안의 모든 픽셀에 대해서 평균을 구하여 그 값을 임계값으로 하는 평균 이진화, 대략적인 임계값에서 출발하여 점차 반복적으로 입계값을 향상시키는 반복(iterative) 이진화, 전체 영상의 히스토그램을 이용하는 것이 아니라 영상의 일부분에 대한 히스토그램을 가지고 그 일부분만을 위한 임계값을 구하는 적응(adaptive) 이진화 방법을 포함할 수 있다.
문자 정보를 세선화(tining) 하는 것은 이진화된 문자 정보에 포함되는 선들에 대한 정보를 일정한 두께의 선들로 변환하는 것이다. 보다 구체적으로는 문자 정보에 포함된 두꺼운 선들을 한 픽셀을 이루는 선들에 대한 정보로 변환하는 것으로 두께가 한 픽셀로 이루어진 중심선을 추출하는 것이 바람직하다.
전처리된 문자정보를 정규화하는 단계(S200)는 전처리된 문자정보를 미리 결정된 기준에 따라 일반화 된 정보로 변환하는 단계이다. 정규화하는 단계(S200)은 도 2를 통해 구체적으로 설명한다.
도 2는 본 발명의 일실시예에 따른 문자 정보의 정규화 단계(S200)를 나타내는 흐름도이다. 도 2에 따르면 본 실시예에 따른 문자 정보의 정규화 방법은 문자 정보에 포함된 문자를 구성하는 획의 끝점을 검출하는 단계(S210), 검출된 끝점을 이용하여 문자정보의 기울어진 각도를 보정하는 문자정보 보정단계(S220)를 포함한다. 끝점 코드를 검출하는 단계는 끝점 코드를 검출하여 끝점 코드를 할당하는 단계(S212), 끝점 코드가 할당된 끝점 들에 대한 방문 순서를 설정하는 방문 순서 설정 단계(S214)를 포함한다.
끝점 코드를 할당하는 단계(S212)는 문자 정보에 포함된 획의 끝점을 검출하고 검출된 점이 끝점인 것을 나타내는 끝점 코드를 할당하는 단계이다. 본 실시예에 따른 끝점의 검출은 도 3a를 통해 설명한다. 끝점은 문자 정보에 포함된 각 획에 있어서 자기 자신을 기준점으로 8방향을 검색하였을 때 하나의 이웃하는 점만이 존재하는 위치인 것이 바람직하다. 끝점의 검출은 문자 정보에 포함된 각 획을 구성하는 모든 점에 대하여 도 3a에 따른 3x3 마스크를 이용하여 스캔하는 것이 바람직하다. 한 점(point) E에 대하여 8가지 A의 방향에 대응되는 점 중에서 하나의 점이 존재하는 경우 끝점인 것이 바람직하다. 검출된 끝점에 대하여 끝점인 것을 나타내는 끝점 코드를 할당하는 것이 바람직하다. 도 3b는 본 실시예에 따른 끝점 코드가 할당된 문자 정보를 예시하는 예시도로써, 문자 정보에서 검출된 네개의 끝점에 대하여 끝점 코드 E를 할당한 것을 예시한다.
끝점 코드가 할당된 문자 정보의 끝점의 방문 순서를 설정하는 단계(S214)는 끝점 코드가 설정된 끝점들의 미리 결정된 순서에 따른 방문 순서를 설정한다. 미리 결정된 순서에 따른 방문 순서는 도 3c를 통해 보다 상세하게 설명한다. 도 3c에 따르면 상술한 도 3b의 문자정보에 대한 전체영역을 4개의 블록으로 분할하고 각각의 블록에서 왼쪽, 위에 위치하는 끝점에 대하여 상대적으로 우선하는 순서를 갖도록 하는 것이 바람직하다. 블록에 있어서의 순서 역시 블록1, 블록2, 블록3, 블록 4의 순인 것이 바람직하다. 도 3c에 따르면 상기 끝점이 검출된 문자 정보의 각 끝점들의 방문 순서는 E1, E2, E3, E4 순으로 나타난다.
문자정보 보정단계(S220)는 끝점 중 한 기준점을 이용하여 방향각을 계산하는 단계(S222), 계산된 방향각을 이용하여 문자정보를 회전하는 단계(S224)를 포함한다.
기준점을 이용하여 방향각을 계산하는 단계(S222)는 끝점 중 한 점을 기준점으로 하여 상기 기준점이 미리 결정된 n개의 방향과 이루는 각도를 계산하는 단계이다. 끝점 중 하나의 기준점과, 문자 정보의 중심점에 대한 8방향이 이루는 각이 최소가 되는 각을 결정하는 것이 바람직하다. 본 실시예에 따른 기준점은 방문순서가 최선인 끝점인 것이 바람직하며 중심점은 문자 정보를 이루는 모든 점들의 위치에 대한 평균적인 위치인 것이 바람직하다. 도 4를 통해 구체적으로 설명하면 미리 결정된 n개의 방향은 중심점(p)과 n이 8인 변위가 를 이루는 8가지 방향인 것이 바람직하다. 방향각은 방문순서가 최선인 끝점(E1)을 기준점으로 하여, 중심점(p)에 대한 8가지 방향이 이루는 각 θ를 계산하는 것이 바람직하다
계산된 방향각을 이용하여 문자정보를 회전하는 단계(S224)는 입력된 문자 정보를 기울어지지 않은 정규화된 형태로 회전시킨다. 회전시키는 것은 방향각을 계산하는 단계(S222)에서 계산된 각도를 이용하여 각도가 최소가 되는 방향으로 문자정보를 회전하는 것이 바람직하다. 각도가 최소가 되는 방향은 방향각을 계산하는 단계(S222)에서 계산된 θ중 최소의 각에 대한 방향인 것이 바람직하다. 도 4를 참조하면 방향 3과 끝점 E1이 이루는 각 θ가 최소각이 되며 방향 3이 각도가 최소가 되는 방향이다. 따라서 문자 정보의 끝점 E1을 방향 3에 대응되도록 전체 문자정보를 회전하는 것이 바람직하다.
정규화된 문자정보에 코드를 할당하는 단계(S300)는 문자 정보의 정규화 단계(S200)에서 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당한다. 획의 진행방향은 문자 정보에 포함된 획 및 이를 구성하는 점들에 있어서 특정 점에 대한 다음 점의 획 상에서의 상대적인 위치인 것이 바람직하다. 체인코드는 도 6a를 통해 구체적으로 설명하면 문자정보를 구성하는 획의 특정 점과 획 상의 다음 점의 상대적 위치 정보를 숫자로 나타낸 코드인 것이 바람직하다. 특정 점(c)에 대한 다음점의 상대적인 위치를 대하여 1부터 8까지의 8개 방향으로 표현하는 것이 바람직하다. 획이 교차하는 것은 문자정보를 구성하는 획이 적어도 하나의 점을 공유하는 것일 수 있다. 본 실시예에 따른 획의 교차는 문자정보에 포함된 특정 점을 기준으로 3개 이상의 점으로 분기하는 것일 수 있으며, 분기 포인트는 상기 특정 점에 대하여 분기하는 것을 표시하는 것일 수 있다. 도 7을 참조하면 획이 교차하는 점에 대하여 분기포인트(B)가 할당되는 것이 바람직하다.
체인코드 또는 분기포인트를 할당하는 것은, 상기 검출된 끝점에 대하여 설정된 방문 순서에 따라 상기 문자 정보를 구성하는 각각의 점들을 방문하며 할당하는 것이 바람직하다. 상기 방문 순서는 도 5를 참조하여 구체적으로 설명한다.
도 5는 본 발명의 일 실시예에 따른 코드 또는 포인트를 할당하는 방법을 나타내는 흐름도이다.
도 5에 따르면 본 실시예에 따른 코드 또는 포인트의 할당 방법은 끝점 중 한 점을 시작점으로 하여 시작점을 방문하는 단계(S310), 시작점의 다음 점을 방문하는 단계(S315), 다음 점이 끝점인지 여부를 확인하는 단계(S320), 끝점인 경우 저장된 분기위치의 존재를 확인하는 단계(S325), 저장된 분기위치가 존재하는 경우 분기위치로 회귀하는 단계(S330), 회귀한 분기위치에서 방문되지 않은 다음 점을 방문하는 단계(315)를 포함하며, 끝점이 아닌 경우 분기점인지 여부를 확인하는 단계(S335), 분기점인 경우 분기점의 위치를 저장하고(340), 분기 포인트를 할당하는 단계(S345), 분기점에 대한 다음 점을 방문하는 단계(S315), 분기점이 아닌 경우 체인코드를 할당하고(S335) 다음 점을 방문하는 단계(S315)를 포함한다. 저장된 분기위치의 존재를 확인하는 단계(S325)에서 저장된 분기위치가 존재하지 않는 경우 방문을 종료한다.
시작점을 방문하는 단계(S310)는 본 실시예에 따르면 끝점 코드가 할당된 문자 정보의 방문 순서를 설정하는 단계(S214)에서 가장 선행하는 방문순서가 설정된 끝점을 방문하는 것이 바람직하다. 도 3c를 참조하면 가장 선행하는 방문순서가 설정된 끝점 E1을 시작점으로 하여 방문하는 것이 바람직하다. 끝점이 존재하지 않는 문자정보의 경우 끝점이 존재하지 않는 경우(숫자 8)는 문자 정보의 가장 왼쪽 위를 E1위치로 정한다.
시작점의 다음 점을 방문하는 단계(S315)는 미리 설정된 방문 순서에 따른 다음 점을 방문한다. 미리 설정된 방문 순서는 끝점의 방문 순서를 설정하는 단계(S214)에서 설정된 끝점의 방문 순서에 따라 상대적 위치가 가장 왼쪽 위인 점을 우선순위로 하는 깊이 우선 탐색 법(depth first search)을 이용하여 방문하는 것이 바람직하다. 깊이 우선 탐색 법은 한 정점을 방문한 후에 그에 이웃하고, 아직 방문하지 않은 한 정점을 선택하여 이로부터 다시 위 과정을 반복하는 방법인 것이 바람직하다. 본 실시예에 따르면 시작점에서 이웃하는 점을 방문하되 시작점이 분기점인 경우 상대적 위치가 가장 왼쪽 위인 점을 우선순위로 방문하는 것이 바람직하다. 상대적 위치가 가장 왼쪽 위인 점을 우선 순위로 하는 것은 도 7을 참조 하면 분기 포인트 B가 할당된 정점의 경우 방문하지 않은 정점 중 가장 왼쪽 위에 위치하는 정점(체인코드 3이 설정된 정점)을 방문하는 것이 바람직하다.
다음 점이 끝점인지 여부를 확인하는 단계(S320)는 다음 점으로 방문된 점이 끝점인지를 확인하는 단계이다. 끝점인 경우 저장된 분기위치의 존재를 확인하는 단계(325)에서 분기위치의 존재를 확인하고, 끝점이 아닌 경우 후술하는 분기점인지를 여부를 확인하는 단계에서 분기점 여부를 확인한다(S335).
분기점인지 여부를 확인하는 단계(S335)는 방문된 점이 끝점이 아닌 경우 3개 이상의 점으로 분기하는 분기점인지 여부를 확인한다. 분기점인 경우 분기위치를 저장하고(S340), 방문된 점에 분기포인트를 할당한다(S345). 분기점이 아닌 경우 체인코드를 할당하고(S350), 다음 점을 방문한다(S315).
분기위치를 저장하는 단계(S340)는 방문한 점이 분기점인 경우 상술한 우선순위 중 차 우선순위에 해당하는 점을 방문하기 위하여 분기위치를 저장하는 것이 바람직하다. 본 실시예에 따르면 분기위치를 저장하는 것은 LIFO(Last In First Out)방식에 따른 스택(Stack)구조를 이용하여 저장하는 것이 바람직하다.
방문된 점에 분기포인트를 할당하는 것(S345) 은 상술한 바와 같이 도 7에서 획이 교차하는 점에 대하여 분기포인트(B)를 할당하는 것이 바람직하다.
체인코드를 할당하는 단계(S350)는 도 7에서 각각의 점에 대하여 도 6a의 체인코드의 숫자코드를 할당하는 것이 바람직하다. 체인코드를 할당하는 단계(S350)는 커브포인트를 할당하는 단계(S355)를 포함한다.
커브포인트를 할당하는 단계(S355)는 방문한 점을 기준으로 현재의 획의 진행 방향과 현재 이후의 진행 방향이 이루는 각도가 미리 정한 임계값 보다 큰 경우 상기 방문된 점에 대하여 커브포인트를 할당하는 것이 바람직하다. 커브포인트의 할당은 도 6c를 참조하여 설명하면 도 6c의 5x5크기의 마스크를 이용하여 현재 방문된 점을 기준으로 획의 현재 진행방향과 획의 이후 진행 방향이 미리 정한 임계값으로 45도 이상 차이가 나면 상기 방문된 점에 커브포인트를 할당하는 것을 나타낸다. 현재 진행 방향은 도 6a의 체인코드에 따른 6번째 방향이나 이후 진행 방향은 1번째 방향이다. 따라서 진행방향이 임계값과 동일한 각도가 차이 나므로 방문된 점에 커브포인트 C를 할당하는 것이 바람직하다.
상기 각도는 상기 이전의 획의 진행 방향과 이후 획의 진행 방향이 이루는 각도 중 작은 각을 기준으로 임계값과 비교를 하는 것이 바람직하다. 작은 각은 도 6c에서 현재 진행 방향과 이후 진행 방향이 이루는 각, 각도 1과 각도 2중 각도 1인 것이 바람직하다.
다음 점이 끝점인지 여부를 확인하는 단계(S320)에서 다음 점으로 방문된 점이 끝점인 경우 저장된 분기위치의 존재를 확인한다(S325). 저장된 분기위치의 존재를 확인하는 단계(S325)는 상술한 바와 같이 분기위치를 저장하는 단계(S340)에서 저장된 분기 위치의 존재를 확인한다. 분기위치가 존재하는 경우 분기위치로 회귀하고(S330), 회귀한 분기위치를 기준으로 방문하지 않은 다음 점을 방문한다(S315). 분기위치의 존재를 확인하는 단계(S325)에서 저장된 분기위치가 존재하지 않는 경우 문자 정보를 구성하는 점의 모든 점을 방문한 것으로 판단하고 방문을 종료하는 것이 바람직하다.
분기위치로 회귀하는 단계(S330)은 저장된 분기위치에서 방문하지 않은 다음 점을 방문하기 위하여 분기위치로 돌아오는 단계이다. 다음 점을 방문하는 단계(S315)는 분기위치로 회귀하는 단계(S330)에서 회귀한 분기위치를 새로운 시작점으로 하여 방문하지 않은 점을 우선순위에 따라 방문하는 것이 바람직하다(S315).
정규화된 문자정보에 할당된 포인트를 이용하여 끝점 또는 분기점을 포함하는 구조적 특징을 순서화 단계(S400)는 도 9를 참조하여 설명한다.
도 9는 본 발명의 일실시예에 따른 문자 정보를 구조적 특징 코드로 순서화 단계를 나타내는 흐름도이다. 본 실시예에 따른 구조적 특징의 순서화 단계(S400)는 구조적 특징 코드를 생성하는 단게(S410), 구조적 특징 숫자열을 생성하는 단계(S420), 생성된 숫자열에 구조적 특징에 대한 가중치를 부여하는 단계(S430), 가중치가 부여된 숫자열을 문자정보에 대해 일반화 하는 모델링단계(S440)를 포함한다.
구조적 특징 점은 문자 정보의 끝점, 커브점, 분기점등을 포함하는 획의 특징인 것이 바람직하다. 구조적 특징 코드를 생성하는 단게(S410)는 문자 정보의 구조적 특징 점에 할당된 코드 또는 포인트에 대응되는 숫자코드를 생성하는 것이 바람직하다. 숫자코드를 생성하는 것은 미리 결정된 숫자화 표현 방법에 따라 구조적 특징 점의 코드 또는 포인트에 대응되는 숫자 정보를 생성하는 것이 바람직하다. 미리 결정된 숫자화 표현 방법은 본 실시예에 따르면 끝점 코드 E가 설정된 끝점에 대하여는 숫자코드 '0'을 할당하는 것이 바람직하고, 분기 코드 B가 할당된 분기점은 분기 위치의 개수에 따라 2개면 '92' 3개면 '93' 4개면 '94'등으로 할당하는 것이 바람직하다. 커브점은 현재 진행방향의 체인코드 값과 이후 진행방향의 체인코드 값을 할당하는 것이 바람직하다. 도 8은 입력된 문자정보에 대하여 끝점에 대하여 '0', 분기점에 대하여 '93' 커브점에 대하여 '61'이 구조적 특징 코드로 설정된 결과를 나타낸다.
구조적 특징 숫자열을 생성하는 단계(S420)는 문자 정보에 할당된 숫자 코드를 상기 방문 순서에 따라 순서화하여 숫자열을 생성하는 것이 바람직하다. 도 10을 참조하면 구조적 특징 숫자열을 생성하는 단계(S420)는 문자 정보를 구조적 특징 코드를 생성하는 단계(S410)에서 생성된 숫자 코드 및 체인코드를 할당하는 단계(S350)에서 할당된 체인코드를 이용하여 상술한 방문 순서에 따라 숫자열로 표현하는 것이 바람직하다.
생성된 숫자열에 구조적 특징에 대한 가중치를 부여하는 단계(S430)는 구조적 특징 점에 대하여 설정된 숫자 코드를 상기 구조적 특징 위치간의 거리를 이용하여 숫자 코드를 반복하는 것이 바람직하다. 체인코드로만 이루어진 숫자열은 단순히 인접한 두 위치간의 방향정보만을 표현하므로 문자의 전체적인 구조를 반영하지 못한다. 생성된 숫자열에 구조적 특징에 대한 가중치를 부여하는 단계(S430)는 체인코드 외에 끝점, 분기점, 커브 점들을 정의하였고, 이러한 점들이 문자를 이루는데 중요한 구조를 대표하므로 체인 코드와는 달리 가중치를 이용해 반복적으로 숫자코드를 부여하는 것이 바람직하다.
구조적 특징 점들의 가중치는 구조적 특징 점들의 숫자 코드를 반복해 줌으로써 설정하는 것이 바람직하다. 본 실시예에서 가중치는 각 구조적 특징 점의 위치간의 거리를 이용하는 것이 바람직하다. 즉, 끝점과 끝점 포인트간에 8개의 체인 코드 값이 존재한다면 각각의 끝점은 각각 4번씩 반복하게 설정하는 것이 바람직하다. 다른 경우로, 끝점 - 8개 체인코드 - 커브 포인트 - 6개 체인코드 - 끝점 형식으로 존재한다면 전체적으로 5(1+4)개끝점 - 8개 체인코드 - 8(4+1+3)개 커브포인트 - 6개 체인코드 - 4(1+3)개 끝점으로 표현된다. 여기서 1은 구조적 포인트 자신을 의미한다. 도 11을 참조하여 보다 구체적으로 설명하면 끝점 E1의 숫자코드는 3/2번 더 반복하여 표시되며, E2는 1/2번, E3는 1/2번, E4는 1/2번 더 반복하여 표시된다. 상기 반복횟수는 반올림한 반복횟수인 것이 바람직하다. 커브점 C의 경우 각각 3/2번, 3/2번 더 반복되며, 분기점 B는 3/2, 1/2, 1/2, 1/2번 더 각각 반복된다. 본 실시예에 따른 가중치가 부여된 최종 순서열은 도 11과 같다. 도 11의 볼드체로 표시된 숫자는 가중치에 따른 반복된 숫자코드를 의미한다.
가중치가 부여된 숫자열을 문자정보에 대해 일반화 하는 모델링단계(S440)는 인식하고자 하는 문자의 숫자열이 생성되면, 각 문자열의 숫자열에 대해 최소 50개 정도의 학습 데이터를 모델링하여 HMMHiden Markov Model)기법을 사용해 훈련시키는 것이 바람직하다. 본 실시예에 따라 숫자를 인식하고자 한다면, 0 ~ 9 각 숫자별 50개씩을 훈련한 10개의 HMM모델이 생성하고, HMM 기반의 인식장치는 순서열의 길이와 관계없이 입력된 문자(숫자)영상으로부터 대응되는 모델을 통하여 숫자를 인식한다.
도 12는 본 발명의 일 실시예에 따른 문자 정보의 순서화 장치를 나타내는 블록도이다. 도 12에 따르면 본 실시예에 따른 문자 정보의 순서화 장치(1)는 문자 영상을 입력 받고 전처리 하는 전처리부(100), 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)하는 정규화 부(200), 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당하는 코드 할당부(300), 코드 또는 포인트가 할당된 문자 정보를 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 순서화하는 순서화부(400), 상기 순서화 부에서 생성된 숫자열을 이용하여 상기 문자 정보에 대한 숫자열을 일반화 하는 모델링부(500), 상기 모델링된 숫자열들을 저장 또는 관리하는 데이터베이스부(600)을 포함한다.
전처리부(100)는 상술한 바와 같이 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화하고, 이진화된 문자 정보의 중심선을 추출하여 세선화한다(S100).
정규화 부(200)는 전처리된 문자 정보를 구성하는 점 중에서 하나의 이웃하는 점을 가지는 문자획의 끝점을 검출하여 끝점 코드를 할당하는 끝점 코드 할당부(210) 및 끝점 코드가 할당된 끝점을 이용하여 상기 문자 정보의 기울어진 각도를 미리 설정된 각도에 따라 보정하는 문자 정보 회전부(220)를 포함한다.
끝점 코드 할당부(210)는 문자 정보에 포함된 획의 끝점을 검출하고 검출된 끝점에 끝점인 것을 나타내는 끝점 코드를 할당하고(S212), 끝점 코드가 할당된 끝점들의 미리 결정된 순서에 따른 방문 순서를 설정한다(S214).
문자 정보 회전부(220)는 끝점 중 한 점을 기준점으로 하여 상기 기준점이 미리 결정된 n개의 방향과 이루는 각도를 계산하고(S222), 입력된 문자 정보를 기울어지지 않은 정규화된 형태로 회전시킨다(S224).
코드 할당부(300)는 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트 또는 획의 진행방향이 미리 결정된 임계각 이상으로 변경되는 경우 이를 나타내는 커브포인트를 할당한다(S300). 코드 할당부(300)에서 코드 또는 포인트를 할당하는 것은 미리 설정된 방문 순서에 따른 다음 점을 방문하는 것에 의해 방문된 점에 코드 또는 포인트를 할당하는 것이 바람직하다. 미리 설정된 방문 순서는 상술한 바와 같이상대적 위치가 가장 왼쪽 위인 점을 우선순위로 하는 깊이 우선 탐색 법(depth first search)을 이용하여 방문하는 것이 바람직하다.
순서화부(400)는 구조적 특징 코드를 생성하는 구조적 특징 코드 생성부(410), 구조적 특징 코드를 이용하여 숫자열을 생성하고, 생성된 숫자열에 구조적 특징에 대한 가중치를 부여하는 숫자열 생성부(420)를 포함한다.
구조적 특징 코드 생성부(410)는 문자 정보의 구조적 특징 점에 할당된 코드에 대응되는 숫자코드를 생성한다(S410). 구조적 특징 점은 문자 정보의 끝점, 커브점, 분기점등을 포함하는 획의 특징인 것이 바람직하다.
숫자열 생성부(420)는 문자 정보에 할당된 숫자 코드를 상기 방문 순서에 따라 순서화하여 숫자열을 생성하고(S420), 체인코드 외에 끝점, 분기점, 커브 점들을 정의하였고, 이러한 점들이 문자를 이루는데 중요한 구조를 대표하므로 체인 코드와는 달리 가중치를 이용해 반복적으로 숫자코드를 부여하는 것이 바람직하다(S430).
모델링부(500)는 본 실시예에 따른 인식하고자 하는 문자의 순서열이 생성되면, 각 문자열의 순서열에 대해 최소 50개 정도의 학습 데이터를 모델링하여 HMMHiden Markov Model)기법을 사용해 훈련시키는 것이 바람직하다(S440).
데이터베이스부(600)는 상기 모델링부(500)에서 모델링된 문자 정보에 대한 모델들의 정보를 저장 또는 관리한다. 각 숫자별 50개씩을 훈련한 10개의 HMM모델들의 정보를 저장 또는 관리하고, HMM 기반의 인식장치는 숫자열의 길이와 관계없이 입력된 문자(숫자)영상을 입력 받고 데이터베이스부(600)의 모델 중에서 대응되는 모델을 통하여 숫자를 인식하는 것이 바람직하다.
또한 미리 결정된 알고리즘에 따라 문자 정보의 끝점, 분기점 및 커브점을 포함하는 구조적 특징점에 가중치를 부가하여 숫자열로 표현된 모델링 정보를 이용하여 상기 전처리된 문자 정보를 인식하는 방법은 상술한 본 발명의 일실시예에 따른 알고리즘에 의해 학습된 모델링된 정보를 이용하여, 입력된 문자영상을 본 실시예에 따른 문자 정보의 순서화 방법에 따라 숫자열화하여 대응되는 모델을 통하여 문자를 인식하는 것이 바람직하다.
한편 본 발명의 문자 정보의 순서화 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트 들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다.
따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화(binarization)하고, 이진화된 문자 정보의 중심선을 추출하여 세선화(thinning)하는 전처리 단계;
    상기 전처리 단계에서 전처리된 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)하는 단계;
    상기 정규화된 문자 정보를 상기 문자 정보의 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 숫자화된 정보로 변환하는 순서화 단계를 포함하는 문자 정보의 순서화 방법
  2. 제 1 항에 있어서,
    상기 문자 정보를 정규화하는 단계는 상기 전처리된 문자 정보를 구성하는 점 중에서 하나의 이웃하는 점을 가지는 문자획의 끝점을 검출하는 단계; 및
    끝점 코드가 할당된 끝점을 이용하여 상기 문자 정보의 기울어진 각도를 미리 설정된 방향에 따라 보정하는 단계를 포함하는 문자 정보의 순서화 방법
  3. 제 2 항에 있어서,
    상기 끝점을 검출하는 단계는 상기 문자 정보에서 끝점을 검출하여 끝점 코드를 할당하는 단계; 및
    상기 끝점 코드가 할당된 끝점들에 대하여 미리 결정된 순서에 따른 끝점의 방문 순서를 설정하는 단계를 포함하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  4. 제 2 항에 있어서,
    상기 기울어진 각도를 보정하는 단계는 상기 검출된 끝점 중 한 점을 기준점으로 하여 상기 기준점이 미리 설정된 n개의 방향과 이루는 각도가 최소가 되는 방향으로 상기 문자 정보를 회전하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  5. 제 3 항에 있어서 상기 구조적 특징을 이용하여 순서화하는 단계에 앞서,
    상기 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당하는 단계를 포함하고,
    상기 순서화하는 단계는 상기 코드 또는 포인트가 할당된 문자 정보를 구조적 특징을 이용하여 순서화하는 것을 특징으로 하는 순서화 방법.
  6. 제 5 항에 있어서,
    상기 체인코드 또는 분기포인트를 할당하는 것은, 상기 검출된 끝점에 대하여 설정된 방문 순서에 따라 상기 문자 정보를 구성하는 각각의 점들을 방문하며 할당하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  7. 제 6 항에 있어서,
    상기 체인코드 또는 분기포인트를 할당하는 것은, 상기 끝점을 검출하는 단계에서 검출된 끝점이 없는 경우 상기 문자 정보가 포함하는 점 중에서 상대적으로 가장 왼쪽 위에 위치하는 점을 시작점으로 하여 미리 결정된 방문 순서에 따라 방문하며 할당하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  8. 제 7 항에 있어서,
    상기 설정 또는 결정된 방문 순서에 따라 상기 문자 정보의 점들을 방문하는 것은 상기 시작점에서 연속된 점들을 방문하되, 상대적 위치가 가장 왼쪽 위인 점을 우선순위로 하는 깊이 우선 탐색 법(depth first search)을 이용하여 방문하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  9. 제 7 항에 있어서,
    상기 체인코드(chain code) 또는 분기포인트를 할당하는 단계는 상기 방문 순서에 따라 방문한 점을 기준으로 획의 현재 진행 방향과 획의 이후 진행 방향이 이루는 각도가 미리 정한 임계값 보다 큰 경우 상기 방문된 점에 대하여 커브포인트를 할당하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  10. 제 9 항에 있어서,
    상기 임계값과 비교되는 각도는 상기 획의 현재 진행 방향과 획의 이후 진행 방향이 이루는 각도 중 작은 각도인 것을 특징으로 하는 문자 정보의 순서화 방법.
  11. 제 3 항에 있어서,
    상기 순서화 단계는 상기 문자 정보의 구조적 특징에 대하여 할당된 끝점 코드, 분기 포인트 또는 커브 포인트에 대응되는 숫자 코드를 설정하는 구조적 특징 코드 설정단계; 및
    상기 설정된 구조적 특징 코드에 가중치를 부여하여 숫자열화 된 구조적 특징 코드를 생성하는 숫자열 생성단계를 포함하는 문자 정보의 순서화 방법.
  12. 제 11 항에 있어서,
    상기 구조적 특징 코드 생성단계는 상기 구조적 특징을 미리 결정된 숫자화 표현 방법에 따라 상기 숫자 코드를 설정하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  13. 제 11 항에 있어서,
    상기 숫자열 생성 단계는 상기 문자 정보에 할당된 숫자 코드를 상기 방문 순서에 따라 순서화하여 숫자열을 생성하는 것을 특징으로 하는 문자 정보의 순서화 방법.
  14. 제 13 항에 있어서,
    상기 숫자열 생성 단계에서 가중치를 부여하는 것은 상기 생성된 숫자열의 상기 구조적 특징에 대하여 설정된 상기 숫자 코드를 상기 구조적 특징 위치들 간의 거리를 이용하여 상기 숫자 코드를 반복하는 것을 특징으로 하는 문자 정보의 순서화 방법
  15. 제 1 항에 있어서,
    상기 문자 정보의 순서화 방법은 상기 순서화 단계에서 생성된 숫자열을 이용하여 상기 문자 정보에 대한 숫자열을 일반화 하는 모델링 단계를 더 포함하는 문자 정보의 순서화 방법.
  16. 영상으로부터 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화(binarization)하고, 이진화된 문자 정보의 중심선을 추출하여 세선화(thinning)하는 전처리부;
    상기 전처리 부에서 전처리된 문자 정보를 미리 설정된 기준에 따른 문자 정보로 정규화(nomailzation)하는 정규화 부;
    상기 정규화된 문자 정보를 구성하는 각각의 점들에 대하여 획의 진행방향을 나타내는 체인코드(chain code) 또는 획이 교차함을 나타내는 분기포인트를 할당하는 코드 할당부; 및
    상기 코드 또는 포인트가 할당된 문자 정보를 상기 문자 정보의 끝점 또는 분기점을 포함하는 구조적 특징을 이용하여 숫자화된 정보로 변환하는 순서화부를 포함하는 문자 정보의 순서화 장치.
  17. 제 16 항에 있어서,
    상기 정규화부는 상기 전처리된 문자 정보를 구성하는 점 중에서 하나의 이웃하는 점을 가지는 문자획의 끝점을 검출하여 끝점 코드를 할당하는 끝점 코드 할당부; 및
    상기 끝점 코드가 할당된 끝점을 이용하여 상기 문자 정보의 기울어진 각도를 미리 설정된 각도에 따라 보정하는 문자정보 회전부를 포함하는 문자 정보의 순서화 장치
  18. 제 16 항에 있어서,
    상기 순서화부는 상기 문자 정보의 구조적 특징에 대하여 할당된 끝점코드, 분기 포인트, 또는 커브 포인트에 대응되는 숫자 코드를 설정하는 구조적 특징 코드 생성부; 및
    상기 생성된 구조적 특징 코드에 가중치를 부여하여 숫자열화 된 구조적 특징 코드를 생성하는 숫자열 생성부를 포함하는 문자 정보의 순서화 장치.
  19. 제 16 항에 있어서,
    상기 문자 정보의 순서화 장치는 상기 순서화부에서 생성된 숫자열을 이용하여 상기 문자 정보에 대한 숫자열을 일반화 하는 모델링부를 더 포함하는 문자 정보의 순서화 장치.
  20. 문자 정보의 인식 방법에 있어서,
    문자 정보가 포함된 영상 정보를 입력 받는 단계;
    상기 입력된 영상 정보에서 문자 정보를 추출하여 추출된 문자 정보를 미리 결정된 임계값을 통하여 이진화하고, 이진화된 문자 정보의 중심선을 추출하여 세선화하는 전처리 단계;
    미리 결정된 알고리즘에 따라 문자 정보를 끝점, 분기점 및 커브점을 포함하는 구조적 특징점에 가중치를 부가하여 숫자열정보로 변환하여 학습된 모델링 정보를 이용하여 상기 전처리된 문자 정보를 인식하는 단계를 포함하는 문자 정보의 인식 방법.







KR1020120003295A 2012-01-11 2012-01-11 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템 KR101905426B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120003295A KR101905426B1 (ko) 2012-01-11 2012-01-11 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템
US13/599,111 US8934716B2 (en) 2012-01-11 2012-08-30 Method and apparatus for sequencing off-line character from natural scene

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120003295A KR101905426B1 (ko) 2012-01-11 2012-01-11 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20130082223A KR20130082223A (ko) 2013-07-19
KR101905426B1 true KR101905426B1 (ko) 2018-10-10

Family

ID=48743977

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120003295A KR101905426B1 (ko) 2012-01-11 2012-01-11 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템

Country Status (2)

Country Link
US (1) US8934716B2 (ko)
KR (1) KR101905426B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491923B1 (ko) * 2013-08-08 2015-02-11 한국과학기술원 문자의 부분형태 모델을 이용하여 자연 영상에서 문자를 인식하는 시스템
CN103942550B (zh) * 2014-05-04 2018-11-02 厦门大学 一种基于稀疏编码特征的场景文本识别方法
CN104699405B (zh) * 2015-03-26 2019-03-29 联想(北京)有限公司 信息处理方法、信息处理装置和电子设备
CN105550686A (zh) * 2015-12-09 2016-05-04 小米科技有限责任公司 字符切分方法和装置
KR102622349B1 (ko) * 2018-04-02 2024-01-08 삼성전자주식회사 전자 장치 및 그 제어 방법
JP6929823B2 (ja) * 2018-11-16 2021-09-01 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2558682B2 (ja) * 1987-03-13 1996-11-27 株式会社東芝 知的ワ−クステ−シヨン
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
EP0831418B1 (en) * 1991-10-21 2002-03-13 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP3099771B2 (ja) * 1997-05-07 2000-10-16 日本電気株式会社 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
JP4006224B2 (ja) * 2001-11-16 2007-11-14 キヤノン株式会社 画像品質判定方法、判定装置、判定プログラム
JP4420877B2 (ja) * 2005-09-22 2010-02-24 シャープ株式会社 画像処理方法、画像処理装置、及び画像出力装置
US8005294B2 (en) 2006-11-29 2011-08-23 The Mitre Corporation Cursive character handwriting recognition system and method
US8139897B2 (en) * 2007-03-15 2012-03-20 Ricoh Company, Limited Detecting tilt in an image having different resolutions in different directions
CN102129560B (zh) 2010-01-18 2013-11-06 富士通株式会社 字符识别的方法和设备

Also Published As

Publication number Publication date
US20130177247A1 (en) 2013-07-11
KR20130082223A (ko) 2013-07-19
US8934716B2 (en) 2015-01-13

Similar Documents

Publication Publication Date Title
KR101905426B1 (ko) 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템
CN111695527B (zh) 一种蒙古文在线手写体识别方法
JP4745758B2 (ja) テキストおよびグラフィクスの空間認識およびグループ化
CN109343920B (zh) 一种图像处理方法及其装置、设备和存储介质
Awal et al. Towards handwritten mathematical expression recognition
CN111639646A (zh) 一种基于深度学习的试卷手写英文字符识别方法及***
KR20070110399A (ko) 인식 그래프
CN106164932B (zh) 用于识别音乐符号的方法和装置
US9286527B2 (en) Segmentation of an input by cut point classification
MXPA04009151A (es) Sistema y metodo para detectar un objeto dibujado a mano en una entrada de tinta.
CN113657098B (zh) 文本纠错方法、装置、设备及存储介质
CN112215236B (zh) 文本识别方法、装置、电子设备及存储介质
EP3828685B1 (en) Gesture stroke recognition in touch-based user interface input
CN113887337A (zh) 具有弯曲文本的***识别方法、***及存储介质
CN112686134A (zh) 手写识别方法、装置、电子设备和存储介质
CN113033543A (zh) 曲形文本识别方法、装置、设备及介质
CN107240185A (zh) 一种冠字号识别方法、装置、设备及存储介质
Suresh et al. Telugu Optical Character Recognition Using Deep Learning
Abdulla et al. Off-Line Arabic Handwritten Word Segmentation Using Rotational Invariant Segments Features.
CN114092931B (zh) 场景文字识别方法、装置、电子设备及存储介质
CN113658195B (zh) 图像分割方法、装置及电子设备
CN113468906A (zh) 图形码提取模型构建方法、识别方法、装置、设备和介质
JP4648084B2 (ja) 記号認識方法及び装置
Roy et al. Recognition of handwritten text: artificial neural network approach
Sarkar et al. A script independent technique for extraction of characters from handwritten word images

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant