KR101959831B1

KR101959831B1 - 이미지 인식 처리 장치 및 방법

Info

Publication number: KR101959831B1
Application number: KR1020170124548A
Authority: KR
Inventors: 구형일; 김소연; 장영인
Original assignee: 아주대학교산학협력단
Priority date: 2017-09-26
Filing date: 2017-09-26
Publication date: 2019-03-19

Abstract

이미지 인식 처리 장치 및 방법을 개시한다. 본 발명의 일 실시예에 따른 이미지 인식 처리 장치는, 전산화 대상의 이미지에서 텍스트 라인을 분리하고, OCR(Optical Character Reader)을 적용하여 문자를 인식하는 문자 인식부, 상기 인식된 문자들에서 적어도 하나의 필드를 추출하는 필드 추출부, 각 필드명의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드명에 대응하는 값으로 매칭하는 매칭부를 포함한다.

Description

이미지 인식 처리 장치 및 방법{Apparatus and method for image recognition processing}

본 발명은 이미지 인식 처리 장치 및 방법에 관한 것으로, 특히 템플릿(template)이 정해지지 않은 문서의 이미지를 인식하여 전산화하는 이미지 인식 처리 장치 및 방법에 관한 것이다.

과거의 병원에서는 환자의 인적사항, 병력, 건강상태 등 모든 정보를 종이차트에 기록하여 관리하였다. 그러나 데이터를 전산화하여 저장하는 EMR(electronic medical record)이 도입된 이후, 대부분의 병·의원에서는 종이차트를 사용하지 않고 있다.

한편, 과거 병·의원에서 사용한 종이 의무기록지, 종이 처방전과 X-ray 필름들은 병원의 기록물로 보관중이나, 이러한 아날로그 기록물들은 보관하기 힘든 점이 있다. 종이문서는 재질에 따라 몇십년이 지나면 기록된 텍스트의 형태를 알아보기 힘들어지기도 하고, 습도에 취약하여 곰팡이가 생길 수도 있으며, 보관 상태나 건물의 노후 정도에 따라 벌레나 쥐에 의한 손상이 발생하기도 한다. 또한, 아날로그 기록물들은 화재와 같은 비상상황 시 영구 손실이 발생하는 취약성이 있다.

종이문서의 특성에 기인한 이러한 문제들로 인해 이미 외국에서는 도서관 등의 소장자료를 전자화하는 작업을 진행중이며, 특히 네덜란드는 1470년 이후 출간된 모든 국내도서와 신문, 정기간행물을 전자화하는 작업을 진행중이다. 이처럼 아날로그 데이터를 디지털 데이터로 변환하는 것은 최근 과학기술 발달에 따른 세계적인 추세이다.

그런데, 신문 등의 기록매체에 쓰이는 문서인식시스템을 바로 종이 의무기록지, 처방전과 X-ray 필름 등의 아날로그 의료데이터에 적용하는 것에는 무리가 따른다. 의료기록은 단순히 신문이나 책처럼 바로 스캔해서 저장하기엔 그 데이터의 특성에 차이가 있다. 즉, 의료기록은 신문 등에 나타난 활자가 문장형인 것과 달리 환자의 나이/성별/전화번호/과거병력 및 알러지 유무 등이 표기되어 필드와 값으로 나뉘어 있다.

필드와 값으로 나뉜 형태의 문서를 인식하는 시스템은 기존에도 존재하나, 의료기록의 내용은 대부분 수기로 쓰여 있다. 더군다나 의료기록은 다른 기록매체들과 달리 의료계에서만 사용하는 약어로 쓰여 있고, 필기체가 많아 기존의 문서인식시스템을 바로 적용하기 어렵다. 또한, 기존의 문서인식시스템은 관공서나 회사 내부에서 쓰이는 것을 목적으로 하여 포맷이 정해져 있으나, 전국의 병·의료원은 서로 다른 레이아웃을 가진 템플릿을 사용하며, 하나의 병원 내에서도 정형외과, 산부인과 등 분과마다 사용하는 템플릿이 달라 의료데이터만을 대상으로 문서를 전산화하는 시스템이 필요하다.

전술한 바와 같이, 과거부터 누적된 아날로그형태의 막대한 의료기록들은 공간적 제약 및 소실의 위험이 있고, 특정 문서를 찾기 위해 오랜 시간이 걸리는 등 많은 불편함이 있으므로, 전산화할 필요성이 커지고 있다.

그러나, 종래 전산화를 위한 시스템들은 단순히 OCR(광학문자인식, optical character recognition) 등의 문자인식기술을 이용하여 활자를 디지털화하는 데 그치거나, 템플릿이 정해진 차트문서를 미리 등록해야 하는 제약이 있어 병·의원 및 분과별로 그 형태 및 템플릿이 다양한 의료현장의 의료데이터에 적용하기에는 한계가 있다. 뿐만 아니라 의료분야에서만 쓰이는 용어 및 약어가 있어 의료데이터만을 전산화하기 위한 시스템이 필요한 상황이다.

이에 관련하여, 발명의 명칭이 "이미지 처리 시스템 및 그 방법"인 한국등록특허 제10-0710568호가 존재한다.

본 발명의 목적은 템플릿을 미리 등록하지 않아도 다양한 템플릿의 문서를 인식하여 처리할 수 있는 이미지 인식 처리 장치 및 방법을 제공하는 것이다.

본 발명의 다른 목적은 종이의무기록부, 종이처방전 등의 문서와 X-Ray 필름 등의 의료기록들에 기록된 문자 및 그림을 인식하고, 사용자로 하여금 과거의 의료기록을 조회할 수 있도록 하는 이미지 인식 처리 장치 및 방법을 제공하는 것이다.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 이미지 인식 처리 장치는, 전산화 대상의 이미지에서 텍스트 라인을 분리하고, OCR(Optical Character Reader)을 적용하여 문자를 인식하는 문자 인식부, 상기 인식된 문자들에서 적어도 하나의 필드를 추출하는 필드 추출부, 각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값으로 매칭하는 매칭부를 포함한다.

바람직하게는, 상기 필드 추출부는 상기 인식된 문자들의 좌표 또는 글자체 정보에 근거하여 필드를 추출할 수 있다.

바람직하게는, 상기 필드 추출부는 체크박스 또는 기 설정된 특정 표시를 더 추출할 수 있다.

바람직하게는, 상기 매칭부는 필드와 값을 [고유식별정보;필드;값]의 구조체 형태로 정렬하고, 각 이미지에 대해 고유식별정보를 기준으로 상기 정렬된 데이터를 그룹핑(grouping)하여 색인하는 색인부를 더 포함할 수 있다.

바람직하게는, 상기 색인부는 상기 이미지에서 서식 라인을 인식하고, 상기 인식된 서식 라인에서 교차점 좌표를 추출하며, 상기 추출된 교차점 좌표에 근거하여 상기 이미지를 색인할 수 있다.

바람직하게는, 상기 이미지 인식 처리 장치는 상기 이미지에 그림 데이터가 포함된 경우, 상기 이미지에서 문자를 인식하여 제거하고, 상기 문자가 제거된 그림을 보정하며, 상기 보정된 그림에서 특징점을 추출하고, 상기 추출된 특징점과 상기 보정된 그림 데이터를 매칭하여 색인하는 그림 인식 처리부를 더 포함할 수 있다.

바람직하게는, 상기 이미지 인식 처리 장치는 고유식별정보 또는 그림의 특징점 정보를 기준으로 색인된 문자 데이터 또는 그림 데이터가 저장된 데이터베이스, 키워드가 검색정보로 입력된 경우 상기 데이터베이스로부터 상기 키워드를 포함하는 고유식별정보를 추출하고, 상기 추출된 고유식별정보에 해당하는 문자 데이터 또는 그림 데이터를 검색하며, 그림이 검색정보로 입력된 경우 상기 그림에서 특징점을 추출하고, 상기 데이터베이스로부터 상기 추출된 특징점과 유사도가 가장 높은 그림 데이터를 검색하는 검색부를 더 포함할 수 있다.

바람직하게는, 상기 데이터베이스는 서식 라인의 교차점 정보를 기준으로 색인된 문자 데이터 또는 그림 데이터를 더 저장하고, 상기 검색부는 특정 포맷의 문서 검색이 요청된 경우, 상기 데이터베이스로부터 상기 특정 포맷의 교차점 정보에 대응되는 문자 데이터 또는 그림 데이터를 검색할 수 있다.

바람직하게는, 상기 이미지 인식 처리 장치는 필드에 대한 정보가 저장된 필드 사전, 사용자로부터 필드를 입력받아 등록 또는 상기 필드 추출부에서 추출된 필드를 자동으로 등록하는 필드 등록부를 더 포함하고, 상기 필드 추출부는 상기 인식된 문자들에서 상기 필드 사전에 근거하여 필드를 추출할 수 있다.

상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 이미지 인식 처리 방법은, 이미지 인식 처리 장치가 문서를 인식하여 처리하는 방법에 있어서, 전산화 대상의 이미지에서 텍스트 라인을 분리하고, OCR(Optical Character Reader)을 적용하여 문자를 인식하는 단계, 상기 인식된 문자들의 좌표 및 글자체 정보에 근거하여 필드를 추출하는 단계, 각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값으로 매칭하는 단계를 포함한다.

본 발명에 따르면, 종이의무기록부, 종이처방전, X-Ray 필름 등의 의료기록들을 필드와 값으로 분리하여 저장함으로써, 템플릿을 미리 등록하지 않아도 다양한 템플릿의 문서를 인식하여 처리할 수 있다.

또한, 본 발명에 따르면, 다양한 템플릿 환경에서의 문서 인식이 가능하여 병의원에서 보관중인 의료기록들에 대해 사전분류작업이나 절차 없이 문서의 인식 및 분류를 수행할 수 있고, 이는 문서의 영구 보관을 가능하게 하며, 사용자로 하여금 과거 의료기록 조회를 용이하게 하는 효과가 있다.

또한, 본 발명에 따르면, 전산화한 데이터들이 대량으로 수집 및 관리되는 경우, 환자들의 정보를 바탕으로 한 데이터 분석에 기초적인 단계로써 쓰일 수 있고 나아가 빅데이터를 활용한 기술의 기초역할을 할 수 있다.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

도 1은 본 발명의 일 실시예에 따른 전산화 대상의 인식 처리 시스템을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 이미지 인식 처리 장치를 나타낸 블록도이다.
도 3은 본 발명의 일 실시예에 따른 필드 사전을 설명하기 위한 예시도이다.
도 4는 본 발명의 일 실시예에 따른 필드와 값을 매칭하는 방법을 설명하기 위한 예시도이다.
도 5는 본 발명의 일 실시예에 따른 교차점을 이용하여 문서를 분류하는 방법을 설명하기 위한 예시도이다.
도 6은 본 발명의 일 실시예에 따른 문서 이미지를 인식하여 처리하는 방법을 나타낸 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 문서 이미지에서 문자를 인식하여 저장하는 방법을 설명하기 위한 예시도이다.
도 8은 본 발명의 일 실시예에 따른 필름 이미지를 인식하여 처리하는 방법을 나타낸 흐름도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하에서는 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일 실시예에 따른 전산화 대상의 인식 처리 시스템을 나타낸 도면이다.

도 1을 참조하면, 전산화 대상의 인식 처리 시스템은 이미지 입력 장치(100), 이미지 인식 처리 장치(200)를 포함한다.

이미지 입력 장치(100)는 전산화 대상에 해당하는 이미지를 이미지 인식 처리 장치(200)에 제공하는 장치로, 예컨대, 문서 스캐너, 필름 전용 스캐너, 카메라, 팩스 등 전산화 대상을 컴퓨터 판독 가능한 이미지로 변환하는데 적합한 임의의 다른 장치를 포함할 수 있다. 여기서, 전산화 대상은 종이의무기록부, 종이처방전 등의 문서와 X-Ray 필름 등을 포함하나, 이에 제한을 두지 않는다.

이미지 인식 처리 장치(200)는 이미지 입력 장치(100)로부터 입력받은 이미지를 분석하여 문자 또는 그림을 인식하고, 인식된 문자 또는 그림을 색인하여 저장한다. 즉, 이미지 인식 처리 장치(200)는 종이의무기록부, 종이처방전 등의 문서 이미지, X-Ray 필름 이미지 등에 대해 문자인식을 수행하되, 템플릿을 미리 입력하지 않아도 문서에 담긴 정보를 전자화하여 저장한다. 이를 통해 이미지 인식 처리 장치(200)는 종이의무기록부, 종이처방전, X-Ray 필름 등의 의료기록들을 영구 저장할 수 있고, 사용자로 하여금 과거의 의료기록의 검색을 가능하게 한다.

한편, 이미지 인식 처리 장치(200)는 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 팜톱 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같은 디지털 기기에 포함되거나 연결될 수 있을 것이다.

이러한 이미지 인식 처리 장치(200)에 대한 상세한 설명은 도 2를 참조하기로 한다.

여기에서는 이미지 인식 처리 장치(200)가 이미지 입력 장치(100)로부터 전산화 대상에 해당하는 이미지를 입력받는 것으로 설명하였으나, 이미지 인식 처리 장치(200)는 통신망을 통해 다른 외부 장치로부터 전산화 대상에 해당하는 이미지를 수신할 수도 있다.

본 발명의 일 실시예에 따르면, 이미지 인식 처리 시스템은 이미지 인식 처리 장치(200)에 저장된 문서를 검색하는 사용자 단말(300)을 더 포함할 수 있다.

사용자 단말(300)은 키워드, 그림, 문서 포맷 등을 검색정보로 입력받으면, 검색정보를 포함하는 검색 요청 신호를 이미지 인식 처리 장치(200)로 전송하고, 이미지 인식 처리 장치(200)로부터 검색정보에 대응되는 검색결과를 수신한다. 이때, 이미지 인식 처리 장치(200)는 데이터베이스로부터 검색정보에 해당하는 데이터를 검색하고, 검색결과를 사용자 단말(300)에 제공한다. 예를 들어, 키워드가 검색정보로 입력된 경우, 이미지 인식 처리 장치(200)는 데이터베이스로부터 키워드를 포함하는 문자 데이터 또는 그림 데이터를 검색하여 사용자 단말(300)에 제공할 수 있다. 또한, 그림이 검색정보로 입력된 경우, 이미지 인식 처리 장치(200)는 입력된 그림에서 특징점을 추출하고, 데이터베이스로부터 상기 추출된 특징점과 유사도가 가장 높은 그림 데이터를 검색하여 사용자 단말(300)에 제공할 수 있다. 또한, 특정 문서 포맷이 검색정보로 입력된 경우, 이미지 인식 처리 장치(200)는 데이터베이스로부터 특정 포맷의 교차점 정보에 대응되는 문자 데이터 또는 그림 데이터를 검색하여 사용자 단말(300)에 제공할 수 있다.

도 2는 본 발명의 일 실시예에 따른 이미지 인식 처리 장치를 나타낸 블록도, 도 3은 본 발명의 일 실시예에 따른 필드 사전을 설명하기 위한 예시도, 도 4는 본 발명의 일 실시예에 따른 필드와 값을 매칭하는 방법을 설명하기 위한 예시도, 도 5는 본 발명의 일 실시예에 따른 교차점을 이용하여 문서를 분류하는 방법을 설명하기 위한 예시도이다.

도 2를 참조하면, 이미지 인식 처리 장치(200)는 입력부(210), 전처리부(220), 영역 추출부(230), 문자 인식부(240), 필드 추출부(250), 매칭부(260), 색인부(270), 그림 인식 처리부(280)를 포함한다.

입력부(210)는 전산화 대상에 해당하는 이미지를 수신 또는 획득한다. 여기서, 전산화 대상은 종이의무기록부, 종이처방전 등의 문서, X-Ray 필름 등 문자/그림 인식을 통해 전산화 및 분류를 요구하는 각종 대상을 포함할 수 있다. 따라서, 전산화 대상에 해당하는 이미지는 종이의무기록부, 종이처방전 등의 문서가 이미지로 변환된 문서 이미지, X-Ray 필름 등이 이미지로 변환된 필름 이미지를 포함할 수 있다.

전처리부(220)는 입력부(210)로부터 입력받은 이미지에 대해 OCR 인식률을 높이기 위해 이미지 프로세싱(image processing)에 의한 전처리를 수행한다.

즉, 전처리부(220)는 문서 여백의 스테이플과 접힌 자국, 도트 노이즈(dot noise: salt and pepper noise)를 포함한 문서 전반의 노이즈를 제거한다. 또한, 전처리부(220)는 이미지에 허프변환(hough transform)을 적용하여 라인(line)을 검출하고, 검출된 라인으로 이미지의 기울어짐 정도와 skew 정도를 파악하여 보정한다.

영역 추출부(230)는 전처리된 이미지의 구조를 분석하여 텍스트 영역을 추출한다. 여기서, 텍스트 영역은 텍스트 문자들을 포함하는 영역을 의미하고, 텍스트 영역 추출부(230)는 MSER(Maximally Stable Extremal Regions), 스트로크 폭 변환(Stroke Width Transform)방법 등을 이용하여 텍스트 영역을 추출할 수 있다.

바람직하게는, 영역 추출부(230)는 MSER을 이용하여 텍스트 영역을 추출할 수 있다. MSER은 이미지에서 영역 간 빛의 강도(intensity)의 임계치(threshold)를 바꾸며 임계치의 변화에 민감하지 않게 검출되는 영역을 추출하는 방법이다.

또한, 영역 추출부(230)는 전처리된 이미지 구조를 분석하여 텍스트 영역과 그림 영역을 추출(또는 구분)할 수 있다. 이때, 영역 추출부(230)는 이진화된 이미지의 영역에 따라 문서의 구조를 분석하여, 텍스트 영역과 그림 영역을 분류할 수 있다. 가령, 이진화된 이미지를 기 저장된 텍스트 표준 패턴과 비교하여 유사도가 높은 영역을 구획화하여 텍스트 영역으로 분류하고, 텍스트 표준 패턴과 유사도가 낮은 영역을 구획화하여 그림 영역으로 분류할 수 있다. 텍스트 표준 패턴은 다양한 글자체의 폰트 정보로서 데이터베이스의 형태로 저장되어 있을 수 있으며, 영역 추출부(230)가 문서의 구조를 분석하여 영역을 분류하는 과정에서 참조될 수 있을 것이다. 이때, 전체 문서에서 텍스트 영역 및 그림 영역이 차지하는 위치에 대한 정보가 저장될 수도 있다.

문자 인식부(240)는 텍스트 영역에서 텍스트 라인을 분리하고, OCR을 적용하여 문자를 인식한다. 이때, 문자 인식부(240)는 이미지에 포함된 곧은 백색 라인, 즉, 텍스트 사이에 포함된 직선 형태의 공백을 기준으로 텍스트 라인을 검출, 텍스트 영역에 대해 행간 주사(Projection)를 통해 텍스트 영역 내에 포함된 라인들을 검출, 가중 이동 평균을 이용하여 텍스트 라인을 검출 등 다양한 방법을 이용하여 텍스트 라인을 분리할 수 있다.

텍스트 라인이 분리되면, 문자 인식부(240)는 OCR을 통해 텍스트 라인 단위로 영문, 한글, 한자, 숫자, 기호 등을 포함하는 문자를 인식할 수 있다. 이때, 문자 인식부(240)는 인식된 문자의 이미지 픽셀에 대한 좌표를 추출할 수 있다.

필드 추출부(250)는 문자 인식부(240)에서 인식된 문자들에서 적어도 하나의 필드를 추출한다. 이때, 필드 추출부(250)는 필드에 대한 정보가 등록된 필드 사전에 근거하여 필드를 추출할 수 있다. 의료기록에는 공통적으로 환자의 성명과 성별, 생년월일, 주소 같은 개인정보뿐 아니라 혈압(B.P), 체온(Temp), 체중(B/W) 등의 기초적인 정보를 표기하는데, 이러한 정보가 필드일 수 있다. 따라서, 필드 사전에는 도 3과 같이 필드에 대한 정보가 등록된다. 또한, 필드 사전에는 각 필드에 대한 동의어, 유의어에 대한 정보도 함께 저장될 수 있다. 예컨대, 'ID'필드는 'No.' 또는 '환자정보'와 동일한 필드로 인식할 수 있다. 또한, '이름'필드는 '성명' 또는 'Name'과 동일한 필드로 인식할 수 있다. 이러한 필드는 항목, 필드명 등으로 칭할 수 있다.

또한, 필드 추출부(250)는 인식된 문자들의 좌표, 글자체 정보, 필드와 값을 구분하기 위해 설정된 특정 기호(예컨대, 세미콜론(;), 콜론(;) 등) 등에 근거하여 필드를 추출할 수 있다. 여기서, 글자체 정보는 인쇄체, 수기(手記) 등의 글자체, 폰트정보(폰트 크기, 폰트 굵기), 문자간격(장평, 간격 등), 효과(그림자, 윤곽선, 오목, 볼록 등) 등을 포함할 수 있다.

예를 들면, 필드 추출부(250)는 인식된 문자들이 인쇄체와 수기를 포함하는 경우, 인쇄체를 필드로 추출할 수 있다. 또한, 필드 추출부(250)는 텍스트 라인 단위로 인식된 문자가 복수개이고, 모두 인쇄체인 경우, 각 문자의 좌표, 폰트크기, 폰트두께, 문자간격 등에 근거하여 필드를 추출할 수 있다. 이처럼 이미지 인식 처리 장치(200)는 글자체 정보를 이용하여 인식된 문자가 필드인지 또는 필드에 대응하는 값인지를 판별함으로써, 수기, 약어, 필기체 등으로 쓰인 의료기록들을 전산화할 수 있다.

또한, 필드 추출부(250)는 체크박스 또는 기 설정된 특정 표시를 필드와 함께 추출할 수 있다. 문자 인식부(240)에서 인식된 문자들은 단순히 필드와 필드에 대응되는 값으로 구성된 것과 달리, '남□ 여□'와 같은 체크박스, 해당하는 사항에 표시(예컨대, 'O', 'Ⅴ' 등)로 필드에 대한 값을 구성할 수도 있다. 이런 경우, 필드 추출부(250)는 필드와 함께 표시된 체크박스, 특정 표시 등을 추출하여, '필드-값'으로 추출할 수 있다. 여기서, '필드-값'은 체크박스 또는 해당 사항에 표시하는 경우를 포함할 수 있다.

매칭부(260)는 필드 추출부(250)에서 추출된 각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값(value)으로 매칭한다. 이때, 매칭부(260)는 필드를 제외한 나머지 문자들을 대상으로 각 필드에 대응하는 값을 선택하여 매칭할 수 있다.

예를 들어, 도 4를 참조하여 필드와 값을 매칭하는 방법에 대해 설명하기로 한다. (a)는 필드가 ID No., 초진일, 환자이름, 성별이고, 값은 필드의 좌측에서 가장 가까운 문자인 이미지를 나타낸다. 이 경우, 매칭부(260)는 'ID No.'의 좌측 방향으로 가장 근거리의 문자 '2330', '초진일'의 좌측 방향으로 가장 근거리의 문자 '2017.03.01', '환자이름'의 좌측 방향으로 가장 근거리의 문자 '호야', '성별'의 좌측 방향으로 가장 근거리의 문자 '여'를 각 필드의 값으로 매칭시킨다. 그러면, 'ID No.-2330', '초진일-2017.03.01', '환자이름-호야', '성별-여'와 같이 필드와 값의 관계가 생성될 수 있다.

(b)는 필드가 ID No., 초진일, 환자이름, 성별이고, 값은 필드의 아래에서 가장 가까운 문자인 이미지를 나타낸다. 이 경우, 매칭부(260)는 'ID No.'의 아래 방향으로 가장 근거리의 문자 '2330', 초진일'의 아래 방향으로 가장 근거리의 문자 '2017.03.01', '환자이름'의 아래 방향으로 가장 근거리의 문자 '호야', '성별'의 아래 방향으로 가장 근거리의 문자 '여'를 각 필드의 값으로 매칭시킬 수 있다. 그러면, 'ID No.-2330', '초진일-2017.03.01', '환자이름-호야', '성별-여'와 같이 필드와 값의 관계가 생성될 수 있다.

한편, 고유식별정보(ID), 환자이름, 성별 등과 같이 값이 변하지 않는 필드가 있는 반면, '나이'와 같이 값이 변하는 필드가 존재할 수 있다. 이런 경우 매칭부(260)는 문서의 기록 시점에 기초하여 필드의 값을 계산하여 매칭시킬 수 있다.

예를 들어, 의료기록의 기록시점이 있는 경우, 매칭부(260)는 생년월일로부터 나이를 계산하여, '나이' 필드의 값을 매칭시킬 수 있다.

매칭부(260)는 필드와 값을 [고유식별정보;필드;값]의 구조체 형태로 정렬한다. 여기서, 고유식별정보는 환자를 구분하기 위해 각 환자에게 부여된 고유한 정보로, ID, 번호 등일 수 있다.

색인부(270)는 각 이미지에 대해 고유식별정보를 기준으로 구조체 형태로 정렬된 데이터를 그룹핑(grouping)하여 색인한다. 즉, 색인부(270)는 구조체 형태로 정렬된 데이터들을 동일한 ID로 그룹핑한다. 그러면, 각 환자별로 의료 기록들이 전산화될 수 있다.

또한, 색인부(270)는 이미지에서 서식 라인(또는 레이아웃)을 인식하고, 인식된 서식 라인에서 교차점 좌표를 추출하며, 추출된 교차점 좌표에 근거하여 이미지를 색인할 수 있다. 즉, 색인부(270)는 문서를 포맷(format)으로 구분하여 분류를 처리할 수 있다.

예를 들어, 도 5를 참조하면, 문서 이미지에서 선분을 검출하고, 선분의 교차점을 그 문서 포맷(format)의 signature로 이용할 수 있다. 따라서, 교차점 정보를 이용하여 같은 포맷의 문서를 검색할 수 있으며, 클러스터링(clustering)을 통해 유사한 문서(비슷한 지점에 교차점을 가지는 문서)끼리 그룹핑할 수 있다. 또한, 대표 포맷에 그림 위치를 명시해준다면 같은 포맷의 문서에 있는 모든 그림을 추출할 수 있고, 특정 포맷의 문서를 검색할 수 있다.

이처럼 문서의 선분 교차점을 문서 포맷의 시그너쳐로 사용함으로써, 병·의원 또는 분과별로 그 형태 및 템플릿이 다양한 의료기록들을 전산화할 수 있다. 또한, 병·의원 또는 분과별로 의료 기록들을 색인할 수 있다.

그림 인식 처리부(280)는 영역 추출부(230)에서 그림 영역이 추출된 경우, 그림 영역의 그림을 인식하여 색인한다. 이때, 그림 인식 처리부(280)는 문서 이미지의 그림인지 또는 필름 이미지의 그림인지에 따라 처리 방식이 상이할 수 있고, 이는 이미지에서 그림 영역이 차지하는 비율에 따라 문서 이미지인지 또는 필름 이미지인지를 판단할 수 있다. 예컨대, 이미지에서 그림 영역이 차지하는 비율이 기 설정된 제1 비율(예컨대, 70%) 이상인 경우 필름 이미지로 판단할 수 있고, 그림 영역이 차지하는 비율이 기 설정된 제2 비율(예컨대, 40%) 이하인 경우 문서 이미지에 포함된 그림이라고 판단할 수 있다.

먼저, 그림 영역이 문서 이미지에 포함된 경우, 그림 인식 처리부(280)는 그림 영역을 분석하여 해당 그림이 삽화와 서명 중 어떤 종류인지 분류하고, 인식된 그림에 대해 세그멘트(segment) 과정을 거쳐 구조화 형태로 정렬한다. 이때, 그림 인식 처리부(280)는 화소 밀도에 근거하여 삽화(illustration), 사진, 서명 등 그림 데이터 종류를 판별할 수 있고, 그림 영역에 대해 행간 주사(Projection)를 통해 그림 영역 내에 포함된 라인들을 분할하는 기능을 수행할 수 있으며, 이를 통해 [고유식별정보 ; 그림데이터 종류 ; 그림데이터]의 구성을 가지는 구조체 형태로 정렬할 수 있다.

다음으로, 필름 이미지인 경우, 그림 인식 처리부(280)는 이미지에서 문자를 인식하여 제거하고, 문자가 제거된 그림을 보정하며, 보정된 그림에서 특징점을 추출하고, 추출된 특징점과 보정된 그림 데이터를 매칭하여 색인한다.

구체적으로, 그림 인식 처리부(280)는 이미지에서 문자를 인식하고, 인페인팅(in-painting)기법을 이용하여 문자 부분을 제거한다. 그런 후, 그림 인식 처리부(280)는 문자가 제거된 그림에 대해 히스토그램 평활화(histogram equalization)를 통해 명암값의 분포를 균일하게 하여 보정을 수행한다. 그런 후, 그림 인식 처리부(280)는 보정된 그림에서 SIFT를 이용하여 특징점을 추출한다. 이때, 특징점은 그림 검색을 위한 데이터를 구성하기 위한 것이다. 따라서, 그림 인식 처리부(280)는 추출된 특징점과 보정된 그림 데이터를 매칭하여 색인한다. 이때, 보정된 그림 데이터와 추출된 특징점은 저장을 위해 [고유식별정보; 그림데이터; 특징점 벡터]의 구성을 가지는 구조체 형태로 정렬될 수 있다.

한편, 본 발명의 일 실시예에 따르면, 이미지 인식 처리 장치(200)는 데이터베이스(290), 검색부(295)를 더 포함할 수 있다.

데이터베이스(290)에는 고유식별정보, 서식라인의 교차점 정보, 그림의 특징점 정보 등을 기준으로 색인된 문자 데이터 또는 그림 데이터가 저장된다. 즉, 데이터베이스(290)는 이미지 인식 처리와 관련된 다양한 결과 데이터를 저장할 수 있다.

검색부(295)는 키워드가 검색정보로 입력된 경우 데이터베이스(290)로부터 상기 키워드를 포함하는 고유식별정보를 추출하고, 상기 추출된 고유식별정보에 해당하는 문자 데이터 또는 그림 데이터를 검색한다. 또한, 검색부(295)는 그림이 검색정보로 입력된 경우 입력된 그림에서 특징점을 추출하고, 데이터베이스(290)로부터 상기 추출된 특징점과 유사도가 가장 높은 그림 데이터를 검색한다. 또한, 검색부(295)는 특정 포맷의 문서 검색이 요청된 경우, 데이터베이스(290)로부터 상기 특정 포맷의 교차점 정보에 대응되는 문자 데이터 또는 그림 데이터를 검색할 수 있다.

전술한 바와 같이, 검색부(295)는 데이터베이스(290)에 저장된 문자 데이터 또는 그림 데이터를 조회할 수 있도록 한다. 이때, 문자 데이터는 데이터 중 값(value)을 쿼리로 사용하여 검색을 할 수 있도록 하고, 그림 데이터는 입력한 그림에 대해 특징점 추출을 수행하며 가장 유사한 특징점 벡터(feature vector)를 가지는 그림을 조회할 수 있도록 한다.

본 발명의 일 실시예에 따르면, 이미지 인식 처리 장치(200)는 필드를 필드 사전에 등록하는 필드 등록부(미도시)를 더 포함할 수 있다. 필드 등록부는 사용자로부터 필드를 입력받아 등록 또는 필드 추출부(250)에서 추출된 필드를 자동으로 등록할 수 있다. 이때, 필드 등록부는 등록 요청된 필드의 필드 사전에 존재 여부를 판단하여, 중복 등록을 방지할 수 있다. 이처럼 필드 사전에 등록되지 않은 필드를 자동으로 등록함으로써, 템플릿(template)이 정해지지 않은 다양한 문서를 인식하여 분류할 수 있다.

또한, 본 발명에 따른 이미지 인식 처리 장치(200)는 이미지 인식 처리를 위한 프로그램 또는 애플리케이션이 저장된 저장부(미도시)를 더 포함할 수 있다. 또한, 저장부는 이미지 인식 및 처리와 관련된 다양한 알고리즘들(예컨대, OCR 알고리즘, 필드 추출 알고리즘, 전처리 알고리즘 등)을 저장할 수 있다. 이러한 경우, 제어부는 저장부를 호출하여 필요한 알고리즘을 획득할 수 있다.

또한, 이미지 인식 처리 장치(200)는 이미지 인식 처리 장치(200)의 다양한 구성부들의 동작을 제어하는 제어부(미도시)를 더 포함할 수 있다.

본 발명의 일 실시예에 따르면, 입력부(210), 전처리부(220), 영역 추출부(230), 문자 인식부(240), 필드 추출부(250), 매칭부(260), 색인부(270), 그림 인식 처리부(280), 검색부(295)는 그 중 적어도 일부가 외부 단말 장치나 외부 서버 등과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈로서 이미지 인식 처리 장치(200)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 이미지 인식 처리 장치(200)와 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 전술한 특정 동작을 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.

상기와 같이 구성된 이미지 인식 처리 장치(200)는 종이의무기록부, 종이처방전 등의 문서와 X-Ray 필름 등의 의료기록들을 필드와 값으로 분리하여 저장함으로써, 템플릿을 미리 등록하지 않아도 다양한 템플릿의 문서를 인식하여 처리할 수 있다.

이하에서는 이미지 인식 처리 장치(200)가 문서 이미지와 X-Ray 필름과 같은 필름 이미지를 인식하여 처리하는 방법으로 나누어 설명하기로 한다.

도 6은 본 발명의 일 실시예에 따른 문서 이미지를 인식하여 처리하는 방법을 나타낸 흐름도, 도 7은 본 발명의 일 실시예에 따른 문서 이미지에서 문자를 인식하여 저장하는 방법을 설명하기 위한 예시도이다.

도 6을 참조하면, 이미지 인식 처리 장치는 문서 이미지가 입력되면(S600), 문서 이미지에 대해 OCR 인식률을 높이기 위해 이미지 프로세싱(image processing)에 의한 전처리를 수행한다(S610). 여기서, 전처리는 문서 여백의 스테이플과 접힌 자국, 도트 노이즈(dot noise: salt and pepper noise)를 포함한 문서 전반의 노이즈를 제거하고, 이미지의 기울어짐, skew 등의 보정을 포함할 수 있다.

단계 S610의 수행 후, 이미지 인식 처리 장치는 이미지의 구조를 분석하여 텍스트 영역을 추출한다(S620). 이때, 이미지 인식 처리 장치는 이미지 구조를 분석하여 텍스트 영역과 그림 영역으로 구분할 수 있다.

이미지 인식 처리 장치는 텍스트 영역에서 텍스트 라인을 분리하고(S630), OCR을 적용하여 문자를 인식한다(S640). 여기서, 이미지 인식 처리 장치는 텍스트 라인 단위로 영문, 한글, 한자, 숫자, 기호 등을 포함하는 문자를 인식하고, 인식된 문자의 이미지 픽셀에 대한 좌표를 추출할 수 있다.

이미지 인식 처리 장치는 인식된 문자들에서 필드, 체크박스(또는 특정 표시)를 추출한다(S650). 이때, 이미지 인식 처리 장치는 필드 사전에 근거하여 필드를 구분할 수 있다. 또한, 이미지 인식 장치는 인식된 문자들의 좌표, 글자체 정보, 필드와 값을 구분하기 위해 설정된 기호(예컨대, 세미콜론(;), 콜론(;) 등) 등에 근거하여 필드를 구분할 수도 있다. 그러면, '필드', '값에 해당하는 문자', '필드-값'으로 문자들이 구분될 수 있다. '필드-값'은 체크박스 또는 해당 사항에 표시하는 경우를 포함할 수 있다.

단계 S650이 수행되면, 이미지 인식 처리 장치는 각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값으로 매칭한다(S660). 이때, 이미지 인식 처리 장치는 필드와 값을 [고유식별정보;필드;값]의 구조체 형태로 정렬한다.

문서 이미지에 포함된 문자 데이터가 필드와 값이 구조체 형태로 정렬되면, 이미지 인식 처리 장치는 고유식별정보를 기준으로 구조체 형태로 정렬된 데이터를 그룹핑(grouping)하여 색인한다(S670).

한편, 단계 S620에서 추출한 결과 그림 영역이 존재하면, 이미지 인식 처리 장치는 그림 영역을 분석하여 해당 그림이 삽화와 서명 중 어떤 종류인지 분류하고(S680), 인식된 그림에 대해 세그멘트(segment) 과정을 거쳐 구조화 형태로 정렬한다(S690). 이때, 이미지 인식 처리 장치는 그림 영역에 대해 행간 주사(Projection)를 통해 그림 영역 내에 포함된 라인들을 분할하는 기능을 수행할 수 있고, 이를 통해 [고유식별정보 ; 그림데이터 종류 ; 그림데이터]의 구성을 가지는 구조체 형태로 정렬할 수 있다.

단계 S690이 수행되면, 이미지 인식 처리 장치는 단계 S670을 수행한다.

문서 이미지에서 문자를 인식하여 저장하는 방법에 대해 도 7과 같은 진료기록 차트를 참조하여 설명하기로 한다. (a)와 같은 진료기록차트에서, 이미지 인식 처리 장치는 A 텍스트 영역에서 ID No., 주소, 환자이름, 성별을 필드로 인식하고, 필드에 대응하는 값(2330, 수원시 매탄동, 호야, female)을 인식한다. 그러면, 이미지 인식 처리 장치는 인식된 문자 데이터를 (b)와 같은 구조체 형태로 정렬시켜 저장할 수 있다.

또한, 이미지 인식 처리 장치는 (a)에서 B 그림 영역을 인식하고, [2330 ; 삽화; 그림 데이터]와 같은 구조체 형태로 저장할 수 있다.

도 8은 본 발명의 일 실시예에 따른 필름 이미지를 인식하여 처리하는 방법을 나타낸 흐름도이다.

도 8을 참조하면, 이미지 인식 처리 장치는 필름 이미지가 입력되면(S800), 필름 이미지에 대해 OCR 인식률을 높이기 위해 이미지 프로세싱(image processing)에 의한 전처리를 수행한다(S810).

단계 S810의 수행 후, 이미지 인식 처리 장치는 이미지의 구조를 분석하여 텍스트 영역과 그림 영역을 구분한다(S820).

이미지 인식 처리 장치가 텍스트 영역에서 문자를 인식하고 색인하는 단계 S807부터 단계 S815는 도 6에 도시된 S630부터 단계 S670과 동일하므로, 그 설명은 생략하기로 한다.

전술한 바와 같이 문자 인식 및 처리가 완료되면, 이미지 인식 처리 장치는 입력받은 이미지에서 인식된 문자들을 제거하고(S817), 문자가 제거된 그림을 보정한다(S819). 이때, 이미지 인식 처리 장치는 인페인팅(in-painting)기법을 이용하여 문자 부분을 제거할 수 있다. 또한, 이미지 인식 처리 장치는 문자가 제거된 그림에 대해 히스토그램 평활화(histogram equalization)를 통해 명암값의 분포를 균일하게 하여 그림 보정을 수행할 수 있다.

단계 S819가 수행되면, 이미지 인식 처리 장치는 보정된 그림에서 SIFT를 이용하여 특징점을 추출하고(S821), 추출된 특징점과 보정된 그림 데이터를 구조체 형태로 정렬한다(S823). 이때, 이미지 인식 처리 장치는 보정된 그림 데이터와 추출된 특징점은 저장을 위해 [고유식별정보; 그림데이터; 특징점 벡터]의 구성을 가지는 구조체 형태로 정렬하고, 고유식별정보를 기준으로 구조체 형태로 정렬된 데이터를 그룹핑(grouping)하여 색인한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

100 : 이미지 입력 장치
200 : 이미지 인식 처리 장치
210 : 입력부
220 : 전처리부
230 : 영역 추출부
240 : 문자 인식부
250 : 필드 추출부
260 : 매칭부
270 : 색인부
280 : 그림 인식 처리부
290 : 데이터베이스
295 : 검색부
300 : 사용자 단말

Claims

전산화 대상의 이미지에서 텍스트 라인을 분리하고, OCR(Optical Character Reader)을 적용하여 문자를 인식하는 문자 인식부;
상기 인식된 문자들에서 적어도 하나의 필드를 추출하는 필드 추출부;
각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값으로 매칭하는 매칭부; 및
상기 이미지에 그림 영역이 포함된 경우, 상기 그림 영역의 그림 데이터가 문서 이미지의 그림 또는 필름 이미지의 그림인지를 판단하고, 그 판단결과 문서 이미지의 그림인 경우 해당 그림 데이터의 종류를 판별하여 해당 그림 데이터와 구조체 형태로 저장하고, 필름 이미지의 그림인 경우 해당 그림 데이터의 특징점을 추출하여 해당 그림 데이터와 구조체 형태로 저장하는 그림 인식 처리부
를 포함하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
상기 필드 추출부는,
상기 인식된 문자들의 좌표 또는 글자체 정보에 근거하여 필드를 추출하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
상기 필드 추출부는,
체크박스 또는 기 설정된 특정 표시를 더 추출하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
상기 매칭부는 필드와 값을 [고유식별정보;필드;값]의 구조체 형태로 정렬하고,
각 이미지에 대해 고유식별정보를 기준으로 상기 정렬된 데이터를 그룹핑(grouping)하여 색인하는 색인부를 더 포함하는 것을 특징으로 하는 이미지 인식 처리 장치.
제4항에 있어서,
상기 색인부는,
상기 이미지에서 서식 라인을 인식하고, 상기 인식된 서식 라인에서 교차점 좌표를 추출하며, 상기 추출된 교차점 좌표에 근거하여 상기 이미지를 색인하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
상기 그림 인식 처리부는, 상기 이미지에 그림 데이터가 포함된 경우, 상기 이미지에서 문자를 인식하여 제거하고, 상기 문자가 제거된 그림을 보정하며, 상기 보정된 그림에서 특징점을 추출하고, 상기 추출된 특징점과 상기 보정된 그림 데이터를 매칭하여 색인하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
고유식별정보 또는 그림의 특징점 정보를 기준으로 색인된 문자 데이터 또는 그림 데이터가 저장된 데이터베이스; 및
키워드가 검색정보로 입력된 경우 상기 데이터베이스로부터 상기 키워드를 포함하는 고유식별정보를 추출하고, 상기 추출된 고유식별정보에 해당하는 문자 데이터 또는 그림 데이터를 검색하며, 그림이 검색정보로 입력된 경우 상기 그림에서 특징점을 추출하고, 상기 데이터베이스로부터 상기 추출된 특징점과 유사도가 가장 높은 그림 데이터를 검색하는 검색부를 더 포함하는 것을 특징으로 하는 이미지 인식 처리 장치.
제7항에 있어서,
상기 데이터베이스는 서식 라인의 교차점 정보를 기준으로 색인된 문자 데이터 또는 그림 데이터를 더 저장하고,
상기 검색부는 특정 포맷의 문서 검색이 요청된 경우, 상기 데이터베이스로부터 상기 특정 포맷의 교차점 정보에 대응되는 문자 데이터 또는 그림 데이터를 검색하는 것을 특징으로 하는 이미지 인식 처리 장치.
제1항에 있어서,
필드에 대한 정보가 저장된 필드 사전; 및
사용자로부터 필드를 입력받아 등록 또는 상기 필드 추출부에서 추출된 필드를 자동으로 등록하는 필드 등록부를 더 포함하고,
상기 필드 추출부는 상기 인식된 문자들에서 상기 필드 사전에 근거하여 필드를 추출하는 것을 특징으로 하는 이미지 인식 처리 장치.
이미지 인식 처리 장치가 문서를 인식하여 처리하는 방법에 있어서,
전산화 대상의 이미지에서 텍스트 라인을 분리하고, OCR(Optical Character Reader)을 적용하여 문자를 인식하는 단계;
상기 인식된 문자들의 좌표 및 글자체 정보에 근거하여 필드를 추출하는 단계;
각 필드의 좌표를 기준으로 일정 방향 및 거리에 위치하는 문자를 해당 필드에 대응하는 값으로 매칭하는 단계를 포함하되,
상기 이미지에 그림 영역이 포함된 경우, 상기 그림 영역의 그림 데이터가 문서 이미지의 그림 또는 필름 이미지의 그림인지를 판단하고, 그 판단결과 문서 이미지의 그림인 경우 해당 그림 데이터의 종류를 판별하여 해당 그림 데이터와 구조체 형태로 저장하고, 필름 이미지의 그림인 경우 해당 그림 데이터의 특징점을 추출하여 해당 그림 데이터와 구조체 형태로 저장하는 것을 특징으로 하는 이미지 인식 처리 방법.