KR20090053177A - 문자인식장치 및 방법 - Google Patents

문자인식장치 및 방법 Download PDF

Info

Publication number
KR20090053177A
KR20090053177A KR1020070119873A KR20070119873A KR20090053177A KR 20090053177 A KR20090053177 A KR 20090053177A KR 1020070119873 A KR1020070119873 A KR 1020070119873A KR 20070119873 A KR20070119873 A KR 20070119873A KR 20090053177 A KR20090053177 A KR 20090053177A
Authority
KR
South Korea
Prior art keywords
character recognition
unit
image
roi
character
Prior art date
Application number
KR1020070119873A
Other languages
English (en)
Other versions
KR101291195B1 (ko
Inventor
엄기완
이재원
김정은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070119873A priority Critical patent/KR101291195B1/ko
Priority to US12/076,280 priority patent/US8340426B2/en
Publication of KR20090053177A publication Critical patent/KR20090053177A/ko
Application granted granted Critical
Publication of KR101291195B1 publication Critical patent/KR101291195B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

문자인식장치 및 방법이 개시된다. 문자인식장치는 관심영역 혹은 오류영역이 표시되어 있는 영상과 문자인식결과를 디스플레이하는 표시부; 상기 표시부에 디스플레이되는 영상에 대하여 상기 관심영역을 설정하는 관심영역 설정부; 상기 관심영역 혹은 오류영역에 대한 문자인식을 수행하고, 문자인식결과를 상기 표시부로 제공하는 인식부; 및 상기 표시부에 디스플레이되는 영상에 대하여 오류영역을 설정하고, 설정된 오류영역에 대하여 사용자 입력에 의해 이미지 필사를 수행하고, 상기 이미지 필사를 통한 필기체 입력을 상기 인식부로 제공하는 오류수정부로 이루어진다.

Description

문자인식장치 및 방법 {Apparatus and method for recognizing characters}
본 발명은 문자인식장치 및 방법에 관한 것으로서, 보다 상세하게는 영상 촬영기능을 구비한 기기에 있어서 촬영된 영상에 포함된 문자를 인식하고, 인식결과 오인식된 문자를 사용자의 입력을 통하여 보정한 후 재인식하기 위한 문자인식장치 및 방법에 관한 것이다.
현재 모바일 폰과 같은 모바일 기기에 사용되는 문자입력방식으로는 키패드입력, 문자터치 입력, 혹은 필기체 입력 등이 있다. 그리고, 카메라 기능을 구비한 모바일 폰에서는 길거리의 안내판, 음식점의 메뉴판의 문자를 포함한 영상을 직접 촬영하여 문자를 인식하고, 인식된 문자에 대한 정보를 사용자에게 제공함으로써, 사용자가 친숙하지 않은 언어로 표현된 문자에 대해서도 그 의미를 알 수 있도록 하는 연구들이 진행 중에 있다.
문자입력방식 중 사용자의 필기체 입력의 경우 사용자마다 고유한 필기체 습관에 따라 글씨 모양이나 크기에 많은 차이가 있어 필기체의 다양한 변형이 존재하고, 그에 따라서 안정된 인식 성능을 보장하기가 어렵다. 특히, 모국어가 아닌 영어, 한자, 아랍어, 히브리어 등과 같은 비친숙어에 대해서는 사용자가 정확하게 입 력하기 힘들기 때문에 사용자의 필기체 입력에 따른 인식성능은 더욱 저하된다. 이는 음성인식에 있어서 비영어권 사용자가 발성한 영어에 대한 인식성능이 영어권 사용자에 비해 극히 저하되는 것과 동일한 이치이다.
이에 반하여, 카메라를 통해 얻어진 영상에 포함된 문자를 인식하는 것은 사용자의 키패드 입력이나 필기체 입력을 필요로 하지 않는 매우 유용한 방식이라 할 수 있다. 관광지의 안내문, 상점의 간판, 메뉴, 명함 등 입력대상 문자들이 기록되어 있는 매체에 상관없이 모바일 기기의 카메라로부터 문자영상들을 손쉽게 획득하여 인식할 수 있다. 한편, 촬영된 영상에 포함된 문자의 글자체가 인쇄체인 경우에 있어서는 필기체 입력이 갖는 다양성의 영향이 적다. 그러나, 그래픽체 형태의 문자에 대해서는 문자인식성능을 보장하기 어렵고, 문자를 포함한 영상을 촬영하는 환경이 무제한적이기 때문에 주변 조명이나 촬영 위치로 인하여 선명하지 못한 영상을 얻거나, 부정확한 포커스조절로 인하여 번짐(blurry) 현상을 포함하는 영상을 얻게 된다. 또한, 문자 인식이 정확하게 수행되지 않은 경우, 사용자가 동일한 문자를 포함한 영상을 재촬영하는 것도 불편하다.
이와 같은 문제점을 해결하기 위한 방편으로서, 키패드 입력방식은 모바일 기기에서 입력을 지원하지 않은 비친숙어 혹은 비모국어의 경우 입력이 불가능하고, 입력을 지원하더라도 비친숙어 혹은 비모국어의 문자입력방식을 숙지하는 것이 어렵다. 한편, 필기체 입력방식은 비친숙어 혹은 비모국어에 대한 사용자의 필기체 입력이 자연스럽지 못해 인식성능의 저하를 초래한다, 그리고 추가적인 이미지 프로세싱 방식은 많은 연산량을 필요로 하므로 저가의 프로세서를 탑재하는 모바일 기기의 특성상 실제 적용하기에는 근본적인 한계를 가진다.
본 발명이 해결하고자 하는 기술적 과제는 영상 촬영기능을 구비한 기기에 있어서 촬영된 영상에 포함된 문자를 인식하고, 인식결과 오인식된 문자를 사용자의 입력을 통하여 보정한 후 재인식하기 위한 문자인식장치 및 방법을 제공하는데 있다.
본 발명이 해결하고자 하는 다른 기술적 과제는 영상 촬영기능을 구비한 기기에 있어서 촬영된 영상에 포함된 문자를 사용자의 입력을 통하여 보정한 후 인식하기 위한 문자인식장치 및 방법을 제공하는데 있다.
상기한 기술적 과제를 해결하기 위하여 본 발명에 따른 문자인식장치는 관심영역 혹은 오류영역이 표시되어 있는 영상과 문자인식결과를 디스플레이하는 표시부; 상기 표시부에 디스플레이되는 영상에 대하여 상기 관심영역을 설정하는 관심영역 설정부; 상기 관심영역 혹은 오류영역에 대한 문자인식을 수행하고, 문자인식결과를 상기 표시부로 제공하는 인식부; 및 상기 표시부에 디스플레이되는 영상에 대하여 오류영역을 설정하고, 설정된 오류영역에 대하여 사용자 입력에 의해 이미지 필사를 수행하고, 상기 이미지 필사를 통한 필기체 입력을 상기 인식부로 제공하는 오류수정부로 이루어진다.
상기한 기술적 과제를 해결하기 위하여 본 발명에 따른 문자인식방법은 문자를 포함하는 영상을 디스플레이하는 단계; 상기 디스플레이된 영상에 대하여 관심 영역을 설정하는 단계; 상기 설정된 관심영역에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계; 상기 문자인식결과에 대응하여 오류영역을 설정하는 단계; 상기 설정된 오류영역에 포함된 문자의 오류를 수정하기 위하여 사용자 입력에 의하여 이미지 필사를 수행하는 단계; 및 상기 이미지 필사를 통한 필기체 입력에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계로 이루어진다.
상기한 다른 기술적 과제를 해결하기 위하여 본 발명에 따른 문자인식장치는 관심영역이 설정되어 있는 영상과 문자인식결과를 디스플레이하는 표시부; 상기 관심영역에 대한 문자인식을 수행하고, 문자인식결과를 상기 표시부로 제공하는 인식부; 상기 표시부에 디스플레이되는 영상에 대하여 상기 관심영역을 설정하는 관심영역 설정부; 및 상기 관심영역에 대하여 사용자 입력에 의하여 이미지 필사를 수행하고, 상기 이미지 필사를 통한 필기체 입력을 상기 인식부로 제공하는 이미지 필사부로 이루어진다.
상기한 다른 기술적 과제를 해결하기 위하여 본 발명에 따른 문자인식방법은 문자를 포함하는 영상을 디스플레이하는 단계; 상기 디스플레이된 영상에 대하여 관심영역을 설정하는 단계; 상기 설정된 관심영역에 대하여 사용자 입력에 의하여 이미지 필사를 수행하는 단계; 및 상기 이미지 필사를 통한 필기체 입력에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계로 이루어진다.
상기 문자인식방법은 바람직하게는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
본 발명의 문자인식장치 및 방법에 따르면, 모바일 기기 등에 부착된 카메라를 이용하여 획득한 영상으로부터 1차적으로 문자인식을 수행하고, 오류 발생시 오류 문자를 이미지 필사를 통하여 보정한 후 2차적으로 문자인식을 수행함으로써, 정확한 오류 보정이 가능하게 되어 인식성능을 향상시킬 수 있다. 그 결과, 인식된 문자를 질의어로 사용하는 검색시 우수한 검색성능을 보장할 수 있다. 한편, 미리 관심영역에 포함된 문자에 대하여 이미지 필사를 통하여 보정한 후 문자인식을 수행함으로써 오류발생율과 처리시간을 대폭적으로 감소시킬 수 있다.
이하, 본 발명의 실시예에 대하여 첨부된 도면을 참조하여 보다 상세하게 설명하고자 한다.
도 1은 본 발명의 일 실시예에 따른 문자인식장치의 구성을 나타낸 블럭도로서, 영상입력부(110), 표시부(120), 관심영역 설정부(130), 인식부(140) 및 오류수정부(150)를 포함하여 이루어진다. 필요한 경우, 문자인식장치는 저장부(160) 및/또는 통신부(170)를 옵션으로 구비할 수 있다. 한편, 도시되지 않았으나, 키패드 입력부와 통상적인 직접 필기체 입력부가 더 구비될 수 있다. 여기서, 직접 필기체 입력부는 소정의 입력영역이 설정된 표시부(120)와 전자펜과 같은 입력장치로 이루어질 수 있다. 그러나, 표시부(120)에 별도의 입력영역이 설정되지 않는 경우에는, 표시부(120) 전체를 입력영역으로 간주할 수 있다.
도 1을 참조하면, 영상입력부(110)는 모바일 기기에 구비된 카메라를 통하여 촬영된 문자를 포함한 영상을 입력한다. 다른 실시예에서는, 외부로부터 전송되는 문자를 포함한 영상이 입력되거나, 모바일 기기에 저장된 문자를 포함한 영상이 입력될 수 있다.
표시부(120)는 영상입력부(110)를 통하여 입력된 문자를 포함한 영상을 모바일 기기의 액정 화면상에 디스플레이시키거나, 인식부(140)에서의 문자인식 및 검색결과를 디스플레이시킨다.
관심영역 설정부(130)는 표시부(120)에 디스플레이된 영상에서 사용자 입력을 통하여 관심영역 즉, 문자영역을 설정한다. 이때, 사용자는 터치스크린용 스타일러스 펜과 같은 전자펜을 이용하여 액정 화면에서 관심영역을 설정할 수 있다. 설정된 관심영역은 인식부(140)로 제공된다.
인식부(140)는 관심영역 설정부(130)에서 설정된 관심영역에 대하여 문자인식을 수행하거나, 오류수정부(150)에서 설정된 오류영역에 대하여 문자인식을 수행한다. 문자인식방법은 내장된 인식 프로그램을 이용하여 수행될 수 있으며, 이때 널리 알려진 다양한 기법을 적용할 수 있다. 일예로는 광학문자판독기(Optical Character Reader)의 원리 즉, 인쇄물이나 이미지에 빛을 조사해 반사되는 광선의 양적 차이인 강약을 검출하여 문자를 인식 및 판독하는 원리를 소프트웨어적으로 구현한 OCR 프로그램을 이용하여 문자를 인식할 수 있다. 한편, 관심영역 설정부(130)가 구비되지 않을 경우, 인식부(140)에서는 표시부(120)에 디스플레이된 영상에서 문자영역을 검출하고, 검출된 문자영역에 대하여 문자인식을 수행한다. 인식부(140)가 문자사전을 데이터베이스화하여 구비하고 있는 경우에는 인식된 문자 로 문자사전을 검색하고, 검색된 정보를 표시부(130)로 제공한다. 한편, 인식부(140)가 문자사전을 구비하지 않는 경우, 인식된 문자는 통신부(170)를 통하여 미리 링크되어 있는 웹 서버(미도시)로 제공되고, 웹 검색을 통하여 얻어진 정보를 통신부(170)를 통하여 수신하여 표시부(120)로 제공한다. 한편, 다른 실시예에 따르면, 인식부(140)에서는 관심영역 설정부(130)에서 설정된 관심영역 혹은 오류수정부(150)에서 설정된 오류영역을 통신부(170)를 통하여 웹 서버로 제공하고, 웹상의 서버에서 문자인식 및 검색을 수행하여, 검색된 정보를 인식부(140)를 통하여 표시부(120)로 제공한다.
오류수정부(150)는 표시부(120)상에 문자인식 오류 즉, 검색된 결과가 존재하지 않는다는 정보 혹은 잘못된 정보가 표시된 경우 사용자의 입력에 의하여 오류를 수정한다. 구체적으로, 오류수정부(150)는 표시부(120)를 통하여 문자인식 오류가 표시되면, 사용자 입력을 통하여 오류영역을 설정하고, 설정된 오류영역을 확대처리한다. 관심영역 설정부(130)에서와 마찬가지로 사용자는 전자펜을 이용하여 액정 화면에서 오류영역을 설정할 수 있다. 사용자 입력을 통하여 설정된 오류영역이 확대처리되어 표시부(120)에 디스플레이되면, 오류수정부(150)는 확대처리된 오류영역에 대하여 이미지 필사를 통한 사용자 입력을 생성하여 인식부(140)로 제공한다. 마찬가지로, 사용자가 오류영역에 포함된 문자를 따라 덧쓰는 형태의 이미지 필사를 수행하기 위해서는 전자펜 등을 이용할 수 있다. 한편, 다른 실시예에 따르면, 오류수정부(150)는 오류수정방식으로서 이미지 필사, 키패드 입력, 및 필기체 입력 중 적어도 두개 이상을 구비하고, 사용자의 입력에 따라서 선택된 오 류수정방식에 의거하여 오류를 수정한다.
저장부(160)는 인식부(140)으로부터 제공되는 인식된 문자에 해당하는 정보를 자동적으로 혹은 사용자의 선택에 따라서 저장한다.
통신부(170)는 인식부(140)로부터 제공되는 인식된 문자를 웹 서버로 제공하거나, 웹 서버로부터 인식된 문자에 해당하는 정보를 수신하여 인식부(140)로 제공한다.
도 2는 도 1에 도시된 각 구성요소의 동작 결과에 따라서 표시부(120)에 디스플레이되는 정보를 도식화하여 나타낸 것으로서, 여행지에서 사용자가 접할 수 있는 안내문이 포함된 영상을 예로 든 것이다. 참조부호 210은 영상입력부(110)로부터 제공되는 촬영된 영상으로서, 관심영역이 표시된 상태를 나타내고, 참조부호 230은 인식부(140)에서 문자인식 및 검색이 수행된 이후 표시부(120)에 디스플레이되는 영상으로서, 문자인식 및 검색 결과를 나타내는 영역(235)을 포함한다. 참조부호 250은 오류수정부(150)에서 오류영역(255)이 설정된 경우 오류영역이 확대처리되어 표시부(120)에 디스플레이된 상태를 나타내며, 참조부호 270은 확대처리된 오류영역에 대하여 이미지 필사를 통한 사용자 입력이 인식부(140)로 제공된 경우, 인식부(140)에서 문자인식 및 검색이 수행된 이후 표시부(120)에 디스플레이되는 영상으로서, 문자인식 및 검색 결과를 나타내는 영역(275)을 포함한다.
도 3은 본 발명의 다른 실시예에 따른 문자인식장치의 구성을 나타낸 블럭도로서, 영상입력부(310), 표시부(320), 관심영역 설정부(330), 이미지 필사부(335), 및 인식부(340)를 포함하여 이루어진다. 필요한 경우, 문자인식장치는 저장 부(360) 및 통신부(370)를 옵션으로 구비할 수 있다. 한편, 도시되지 않았으나, 키패드 입력부와 통상적인 직접 필기체 입력부가 더 구비될 수 있다. 여기서, 영상입력부(310), 표시부(320), 저장부(360) 및 통신부(370)는 도 1에 도시된 것과 동일한 기능을 수행하므로 여기서는 세부적인 동작 설명을 생략하기로 한다.
도 3을 참조하면, 관심영역 설정부(330)는 표시부(320)에 디스플레이된 영상에서 사용자 입력을 통하여 관심영역 즉, 문자영역을 설정하고, 설정된 관심영역을 확대처리하여 표시부(320)로 제공한다.
이미지 필사부(335)는 사용자 입력을 통하여 설정된 관심영역이 확대처리되어 표시부(320)에 디스플레이되면, 확대처리된 관심영역에 대하여 이미지 필사를 통한 사용자 입력을 생성하여 인식부(340)로 제공한다.
인식부(340)는 이미지 필사부(335)를 통하여 입력된 관심영역에 대하여 문자인식을 수행하고, 이후 동작은 도 1에 도시된 인식부(140)에서와 동일하다.
도 4는 도 1에 도시된 오류수정부(150)의 동작을 설명하는 흐름도이다.
도 4를 참조하면, 411 단계에서는 표시부(120)에 디스플레이된 인식 및 검색결과를 참조하여 오류영역 즉, 수정하고자 하는 문자를 선택한다.
413 단계에서는 키패드 입력, 이미지 필사 및 필기체 입력 중 오류수정방식 즉, 입력방식을 선택한다.
415 단계에서는 413 단계에서 사용자가 오류수정방식으로 이미지 필사를 선택한 경우, 선택된 문자를 확대처리하고, 표시부(120)를 통하여 확대화면을 제공한다.
417 단계에서는 사용자가 확대화면에 포함된 문자에 대하여 이미지 필사를 수행하면, 이미지 필사동작에 따른 필기체 입력을 인식부(140)로 제공한다.
한편, 413 단계에서 사용자가 오류수정방식으로 필기체 입력을 선택한 경우, 419 단계에서는 표시부(120)에서 입력영역을 표시한다. 구체적으로, 표시부(120)의 임의의 영역에서 필기체 입력이 가능하나, 부가적으로 표시부(120)의 하단과 같은 별도의 영역에 필기체 입력을 위한 입력영역을 표시할 수 있다. 421 단계에서는 직접 필기체 입력부(미도시)를 통하여 사용자의 필기체를 입력한다. 423 단계에서는 417 단계 혹은 421 단계를 통하여 입력된 사용자의 필기체를 인식한다.
한편, 413 단계에서 사용자가 오류수정방식으로 키패드 입력을 선택한 경우, 425 단계에서는 키패드 입력부(미도시)를 통하여 문자를 입력한다. 키패드 입력부를 통한 문자 입력시에는 문자인식이 동시에 이루어질 수 있다.
427 단계에서는 423 단계 혹은 425 단계에서 수행된 오류영역의 문자인식결과 및 인식된 문자의 정보 예를 들면, 의미정보 혹은 검색정보를 표시부(120)에 디스플레이한다.
429 단계에는 인식된 문자의 정보를 저장할 것인지를 판단하고, 판단결과 저장하고자 하는 경우 431 단계에서 해당 영상의 문자인식결과를 저장부(160)에 저장한다.
도 5는 도 3에 도시된 관심영역 설정부(330) 및 이미지 필사부(335)의 동작을 설명하는 흐름도이다.
도 5를 참조하면, 511 단계에서는 표시부(320)에 디스플레이된 영상에서 관 심영역 즉, 인식하고자 하는 문자를 선택한다.
513 단계에서는 511 단계에서 사용자가 선택한 관심영역에 포함된 문자를 확대처리하고, 표시부(320)를 통하여 확대화면을 제공한다.
515 단계에서는 사용자가 확대화면에 포함된 문자에 대하여 이미지 필사를 수행하면, 이미지 필사동작에 따른 필기체 입력을 인식부(340)로 제공한다.
517 단계에서는 515 단계를 통하여 입력된 사용자의 필기체를 인식한다.
519 단계에서는 517 단계에서 수행된 관심영역의 문자인식결과 및 인식된 문자의 정보 예를 들면, 의미정보 혹은 검색정보를 표시부(320)에 디스플레이한다.
523 단계에는 인식된 문자의 정보를 저장할 것인지를 판단하고, 판단결과 저장하고자 하는 경우 525 단계에서 해당 영상의 문자인식결과를 저장부(360)에 저장한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 문자인식장치의 구성을 나타낸 블럭도이다.
도 2는 도 1에 도시된 각 구성요소의 동작 결과에 따라서 표시부에 디스플레이되는 정보를 도식화하여 나타낸 것이다.
도 3은 본 발명의 다른 실시예에 따른 문자인식장치의 구성을 나타낸 블럭도이다.
도 4는 도 1에 도시된 오류수정부의 동작을 설명하는 흐름도이다.
도 5는 도 3에 도시된 관심영역 설정부 및 이미지 필사부의 동작을 설명하는 흐름도이다.

Claims (21)

  1. 관심영역 혹은 오류영역이 표시되어 있는 영상과 문자인식결과를 디스플레이하는 표시부;
    상기 표시부에 디스플레이되는 영상에 대하여 상기 관심영역을 설정하는 관심영역 설정부;
    상기 관심영역 혹은 오류영역에 대한 문자인식을 수행하고, 문자인식결과를 상기 표시부로 제공하는 인식부; 및
    상기 표시부에 디스플레이되는 영상에 대하여 오류영역을 설정하고, 설정된 오류영역에 대하여 사용자 입력에 의해 이미지 필사를 수행하고, 상기 이미지 필사를 통한 필기체 입력을 상기 인식부로 제공하는 오류수정부를 포함하는 문자인식장치.
  2. 제1 항에 있어서, 상기 오류수정부는 상기 오류영역이 설정되면, 설정된 오류영역을 확대처리하여 상기 표시부로 제공하고, 확대처리된 오류영역에 대하여 이미지 필사를 수행하는 문자인식장치.
  3. 제1 항에 있어서, 상기 오류수정부는 사용자의 선택에 따라서 상기 이미지 필사를 통한 필기체 입력 이외에 키패드 입력 혹은 직접 필기체 입력을 통하여 상기 오류영역에 대한 문자입력을 수행하는 문자인식장치.
  4. 제1 항에 있어서, 상기 표시부, 상기 관심영역 설정부, 상기 인식부 및 상기 오류수정부가 모바일기기에 일체화되는 문자인식장치.
  5. 제1 항에 있어서, 상기 표시부, 상기 관심영역 설정부, 및 상기 오류수정부는 모바일기기에 일체화되고, 상기 인식부는 웹서버에 구현되는 문자인식장치.
  6. 관심영역이 설정되어 있는 영상과 문자인식결과를 디스플레이하는 표시부;
    상기 관심영역에 대한 문자인식을 수행하고, 문자인식결과를 상기 표시부로 제공하는 인식부;
    상기 표시부에 디스플레이되는 영상에 대하여 상기 관심영역을 설정하는 관심영역 설정부; 및
    상기 관심영역에 대하여 사용자 입력에 의하여 이미지 필사를 수행하고, 상기 이미지 필사를 통한 필기체 입력을 상기 인식부로 제공하는 이미지 필사부를 포함하는 문자인식장치.
  7. 제6 항에 있어서, 상기 이미지 필사부는 상기 관심영역이 설정되면, 설정된 관심영역을 확대처리하여 상기 표시부로 제공하고, 확대처리된 관심영역에 대하여 이미지 필사를 수행하는 문자인식장치.
  8. 제6 항에 있어서, 상기 표시부, 상기 관심영역 설정부, 상기 인식부 및 상기 이미지 필사부가 모바일기기에 일체화되는 문자인식장치.
  9. 제6 항에 있어서, 상기 표시부, 상기 관심영역 설정부, 및 상기 이미지 필사부는 모바일기기에 일체화되고, 상기 인식부는 웹서버에 구현되는 문자인식장치.
  10. 문자를 포함하는 영상을 디스플레이하는 단계;
    상기 디스플레이된 영상에 대하여 관심영역을 설정하는 단계;
    상기 설정된 관심영역에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계;
    상기 문자인식결과에 대응하여 오류영역을 설정하는 단계;
    상기 설정된 오류영역에 포함된 문자의 오류를 수정하기 위하여 사용자 입력에 의하여 이미지 필사를 수행하는 단계; 및
    상기 이미지 필사를 통한 필기체 입력에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계를 포함하는 문자인식방법.
  11. 제10 항에 있어서, 상기 오류영역 설정단계에서는 상기 오류영역이 설정되면, 설정된 오류영역을 확대처리하여 확대화면을 디스플레이하고, 상기 이미지 필사단계에서는 상기 확대화면에 포함된 문자에 대하여 이미지 필사를 수행하는 문자인식방법.
  12. 제10 항에 있어서, 상기 방법은
    상기 설정된 오류영역에 포함된 문자의 오류를 수정하기 위하여 키패드 입력을 수행하는 단계;
    상기 설정된 오류영역에 포함된 문자의 오류를 수정하기 위하여 직접 필기체입력을 수행하는 단계; 및
    사용자의 선택에 따라서 상기 이미지 필사를 통한 필기체 입력, 상기 키패드 입력 및 상기 직접 필기체 입력 중 하나를 오류수정방식으로 선택하는 단계를 더 포함하는 문자인식방법.
  13. 제10 항에 있어서, 상기 문자인식은 OCR 프로그램을 이용하여 수행되는 문자인식방법.
  14. 제10 항에 있어서, 상기 관심영역 혹은 오류영역은 전자펜을 이용하여 설정되는 문자인식방법.
  15. 제10 항에 있어서, 상기 문자인식결과를 디스플레이하는 단계에서는 인식된 문자를 이용하여 상기 장치가 일체화된 모바일기기에 탑재된 사전으로부터 얻어진 정보 혹은 웹서버상에 존재하는 사전을 검색하여 얻어지는 정보를 상기 문자인식결과로 제공하는 문자인식방법.
  16. 문자를 포함하는 영상을 디스플레이하는 단계;
    상기 디스플레이된 영상에 대하여 관심영역을 설정하는 단계;
    상기 설정된 관심영역에 대하여 사용자 입력에 의하여 이미지 필사를 수행하는 단계; 및
    상기 이미지 필사를 통한 필기체 입력에 대하여 문자인식을 수행하고, 문자인식결과를 디스플레이하는 단계를 포함하는 문자인식방법.
  17. 제16 항에 있어서, 상기 관심영역 설정단계에서는 상기 관심영역이 설정되면, 설정된 관심영역을 확대처리하여 확대화면을 디스플레이하고, 상기 이미지 필사단계에서는 상기 확대화면에 포함된 문자에 대하여 이미지 필사를 수행하는 문자인식방법.
  18. 제16 항에 있어서, 상기 문자인식은 OCR 프로그램을 이용하여 수행되는 문자인식방법.
  19. 제16 항에 있어서, 상기 관심영역은 전자펜을 이용하여 설정되는 문자인식방법.
  20. 제16 항에 있어서, 상기 문자인식결과를 디스플레이하는 단계에서는 인식된 문자를 이용하여 상기 장치가 일체화된 모바일기기에 탑재된 사전으로부터 얻어진 정보 혹은 웹서버상에 존재하는 사전을 검색하여 얻어지는 정보를 상기 문자인식결과로 제공하는 문자인식방법.
  21. 제10 항 내지 제20 항 중 어느 한 항에 기재된 문자인식방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020070119873A 2007-11-22 2007-11-22 문자인식장치 및 방법 KR101291195B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070119873A KR101291195B1 (ko) 2007-11-22 2007-11-22 문자인식장치 및 방법
US12/076,280 US8340426B2 (en) 2007-11-22 2008-03-14 Apparatus and method for recognizing characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070119873A KR101291195B1 (ko) 2007-11-22 2007-11-22 문자인식장치 및 방법

Publications (2)

Publication Number Publication Date
KR20090053177A true KR20090053177A (ko) 2009-05-27
KR101291195B1 KR101291195B1 (ko) 2013-07-31

Family

ID=40669773

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070119873A KR101291195B1 (ko) 2007-11-22 2007-11-22 문자인식장치 및 방법

Country Status (2)

Country Link
US (1) US8340426B2 (ko)
KR (1) KR101291195B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
KR20150059793A (ko) * 2012-10-18 2015-06-02 퀄컴 인코포레이티드 카드에 양각된 문자들의 검출
US9405744B2 (en) 2013-07-04 2016-08-02 Samsung Electronics Co., Ltd. Method and apparatus for managing image data in electronic device
US10095949B2 (en) 2015-10-30 2018-10-09 Xiaomi Inc. Method, apparatus, and computer-readable storage medium for area identification
CN110851349A (zh) * 2019-10-10 2020-02-28 重庆金融资产交易所有限责任公司 页面异常显示的检测方法、终端设备及存储介质
KR20240022783A (ko) 2022-08-12 2024-02-20 한국전력공사 다양한 폰트에 강건한 문자인식 시스템 및 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4851604B2 (ja) * 2010-01-27 2012-01-11 京セラ株式会社 携帯電子機器および携帯電子機器の制御方法
US8385652B2 (en) * 2010-03-31 2013-02-26 Microsoft Corporation Segmentation of textual lines in an image that include western characters and hieroglyphic characters
KR20120017670A (ko) * 2010-08-19 2012-02-29 삼성전자주식회사 화상 통신 방법 및 장치
CN103535019A (zh) * 2011-05-24 2014-01-22 惠普发展公司,有限责任合伙企业 图像的感兴趣区域
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
JP2015032050A (ja) * 2013-07-31 2015-02-16 株式会社東芝 表示制御装置、表示制御方法およびプログラム
CN104537362B (zh) * 2015-01-16 2017-12-01 中国科学院自动化研究所 一种基于域自适应的英文场景文字识别方法
CN106652854A (zh) * 2015-11-03 2017-05-10 国网山东新泰市供电公司 两用型红外感应语音提示标示牌及其操作方法
JP7247496B2 (ja) * 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556841B2 (en) * 1999-05-03 2003-04-29 Openwave Systems Inc. Spelling correction for two-way mobile communication devices
JP3986708B2 (ja) * 1999-06-28 2007-10-03 シャープ株式会社 文字認識誤り修正装置および文字認識誤り修正プログラムを記録したコンピュータで読取可能な記録媒体
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
KR20020054702A (ko) * 2000-12-28 2002-07-08 이인동 아이엠티-2000을 이용한 문자인식방법
JP2003178067A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
US7343049B2 (en) * 2002-03-07 2008-03-11 Marvell International Technology Ltd. Method and apparatus for performing optical character recognition (OCR) and text stitching
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
KR100593986B1 (ko) * 2002-09-11 2006-07-03 삼성전자주식회사 영상화면 내의 글자 이미지를 인식하는 장치 및 방법
US7542160B2 (en) * 2003-08-29 2009-06-02 Hewlett-Packard Development Company, L.P. Rendering with substituted validation input
KR100569194B1 (ko) 2003-12-19 2006-04-10 한국전자통신연구원 카메라 문서영상의 기하학적 왜곡 보정방법
US20050193018A1 (en) * 2004-02-29 2005-09-01 Per Rosdahl Utilizing a scannable URL (Universal Resource Locator)
US20050195221A1 (en) * 2004-03-04 2005-09-08 Adam Berger System and method for facilitating the presentation of content via device displays
US7629989B2 (en) * 2004-04-02 2009-12-08 K-Nfb Reading Technology, Inc. Reducing processing latency in optical character recognition for portable reading machine
US7499588B2 (en) 2004-05-20 2009-03-03 Microsoft Corporation Low resolution OCR for camera acquired documents
KR100598416B1 (ko) 2004-08-13 2006-07-07 조용균 인터넷 상에서 한자사전 서비스를 제공하는시스템
KR20060050746A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법
KR100667156B1 (ko) 2004-12-10 2007-01-12 한국전자통신연구원 휴대형 카메라로 획득한 문자영상의 문자영역선택을 통한문자인식 장치 및 그 방법
KR100746755B1 (ko) 2005-10-20 2007-08-06 안성준 문자인식을 통한 전자사전 기능을 갖는 피.엠.피 및 그제어 방법
US8509563B2 (en) * 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503780B2 (en) 2009-12-29 2013-08-06 Samsung Electronics Co., Ltd. Apparatus for detecting text recognition region and method of recognizing text
KR20150059793A (ko) * 2012-10-18 2015-06-02 퀄컴 인코포레이티드 카드에 양각된 문자들의 검출
US9405744B2 (en) 2013-07-04 2016-08-02 Samsung Electronics Co., Ltd. Method and apparatus for managing image data in electronic device
US10095949B2 (en) 2015-10-30 2018-10-09 Xiaomi Inc. Method, apparatus, and computer-readable storage medium for area identification
CN110851349A (zh) * 2019-10-10 2020-02-28 重庆金融资产交易所有限责任公司 页面异常显示的检测方法、终端设备及存储介质
KR20240022783A (ko) 2022-08-12 2024-02-20 한국전력공사 다양한 폰트에 강건한 문자인식 시스템 및 방법

Also Published As

Publication number Publication date
US20090136135A1 (en) 2009-05-28
KR101291195B1 (ko) 2013-07-31
US8340426B2 (en) 2012-12-25

Similar Documents

Publication Publication Date Title
KR101291195B1 (ko) 문자인식장치 및 방법
US9251428B2 (en) Entering information through an OCR-enabled viewfinder
US7424154B2 (en) Boxed and lined input panel
JP4995554B2 (ja) 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
US20160344860A1 (en) Document and image processing
US9158450B2 (en) Handwriting input device and handwriting input control program
US20070098263A1 (en) Data entry apparatus and program therefor
KR20150025452A (ko) 데이터 처리 방법 및 그 전자 장치
CN114402354A (zh) 一种图片识别翻译方法、装置、终端及介质
US20090198486A1 (en) Handheld electronic apparatus with translation function and translation method using the same
CN101639760A (zh) 联系信息输入方法及***
CN103718174A (zh) 用于搜索文本和以增强现实的方式显示发现的文本的***和方法
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
US20220222292A1 (en) Method and system for ideogram character analysis
KR19990036515A (ko) 문자 인식/수정 방법 및 장치
WO2008050187A1 (en) Improved mobile communication terminal
KR100615058B1 (ko) 휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치
CN112149680A (zh) 错字检测识别方法、装置、电子设备及存储介质
CN112163513A (zh) 信息选取方法、***、装置、电子设备及存储介质
US20110294522A1 (en) Character recognizing system and method for the same
JP4474231B2 (ja) 文書リンク情報取得システム
CN112365402B (zh) 智能组卷方法、装置、存储介质及电子设备
US10791272B1 (en) Image correction by expected location of symbols for document scanning and data extraction
JP5605208B2 (ja) 辞書機能を備えた電子機器およびプログラム
CN100386774C (zh) 显示识别的手写符号的方法和设备

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 6