KR20030084589A - 마스크를 이용하여 문서 이미지 압축을 용이하게 하는시스템 및 방법 - Google Patents

마스크를 이용하여 문서 이미지 압축을 용이하게 하는시스템 및 방법 Download PDF

Info

Publication number
KR20030084589A
KR20030084589A KR10-2003-0018541A KR20030018541A KR20030084589A KR 20030084589 A KR20030084589 A KR 20030084589A KR 20030018541 A KR20030018541 A KR 20030018541A KR 20030084589 A KR20030084589 A KR 20030084589A
Authority
KR
South Korea
Prior art keywords
foreground
energy
background
mask
component
Prior art date
Application number
KR10-2003-0018541A
Other languages
English (en)
Other versions
KR100937543B1 (ko
Inventor
시마드패트릭와이.
렌샤에린엘.
린커제임스러셀
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/133,842 external-priority patent/US7263227B2/en
Priority claimed from US10/133,558 external-priority patent/US7164797B2/en
Priority claimed from US10/133,939 external-priority patent/US7392472B2/en
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20030084589A publication Critical patent/KR20030084589A/ko
Application granted granted Critical
Publication of KR100937543B1 publication Critical patent/KR100937543B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Character Discrimination (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

문서 이미지의 포그라운드(foreground)를 백그라운드(background)로부터 분리하는 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법이 제공된다. 본 발명은 영역들을 포그라운드와 백그라운드로 분할하도록 설계되는 화소 에너지 분석기를 포함한다. 본 발명은 합병된 영역이 임계 에너지를 초과하는 않았다면 영역들의 합병을 시도하도록 설계되는 합병 영역 컴포넌트를 더 제공한다. 합병된 영역들은 새로운 포그라운드와 새로운 백그라운드들로 분할된다. 그 후, 마스크 저장 컴포넌트가 바이너리(binary) 마스크에 분할(partitioning) 정보를 저장한다.

Description

마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법{SYSTEM AND METHOD FACILITATING DOCUMENT IMAGE COMPRESSION UTILIZING A MASK}
본 명세서는 2002년 4월 25일자로 출원된 "액티비티 디텍터(ACTIVITYDETECTOR)"라는 제목의 미국 실용신안 공보 제10/133,842호, 2002년 4월 25일자로 출원된 "클러스터링(CLUSTRING)"이라는 제목의 미국 실용신안 공보 제10/133,558호, 및 2002년 4월 25일자로 출원된 "레이아웃 분석(LAYOUT ANALYSIS)"라는 제목의 미국 실용신안 공보 제10/133,939호의 연속물이다.
본 발명은 일반적으로 문서 이미지 처리에 관한 것으로, 특히 문서 이미지의 포그라운드(foreground)를 백그라운드(background)로부터 분할하는(partitioning) 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법에 관한 것이다.
컴퓨터를 통해 이용할 수 있는 정보량은 컴퓨터 네트워크들, 인터넷 및 디지털 기억 수단들의 폭넓은 확산에 의해 크게 증가하고 있다. 정보량이 증가함에 따라 정보를 고속으로 전송하고 정보를 효율적으로 저장할 필요가 있다. 데이터 압축은 문서를 보다 효과적으로 전송하고 또는 저장하는 하나의 방식이다.
종래 데이터 압축 시스템들은 예를 들면 심볼 매칭(symble matching) 등의 다양한 압축 접근을 이용했다. 그러나, 이미지(들)을 갖는 문서들에 효과적으로 작용하는 일반적인 압축 접근들은, 예를 들면, 텍스트 및/또는 필기체를 갖는 문서에서는 잘 작용하지 않는다.
데이터 압축은 정보를 표시하는데 필요한 공간을 감소시킨다. 압축은 임의의 형식의 정보에 사용될 수 있다. 그러나, 이미지들, 텍스트, 음성, 및 영상을 포함하는 디지털 정보의 압축이 보다 중요하게 되고 있다. 일반적으로 데이터 압축은 표준 컴퓨터 시스템에 의해 사용된다. 그러나, 셀룰라/디지털 폰뿐만 아니라디지털 및 위성 텔레비전 등의, 다른 기술들도 한정되지는 않지만 데이터 압축을 이용한다.
데이터 압축은 여러가지 이유에서 중요하다. 데이터 압축에 의해 정보는 압축되지 않는 데이터보다 적은 공간에 저장될 수 있다. 대량의 정보에 대한 요구가 증가함에 따라, 대량의 정보를 공급하기 위한 데이터 압축이 요구될 수 있다. 기억 장치들의 사이즈는 크게 증가했지만, 정보에 대한 요구는 이들 사이즈 증가를 넘어서고 있다. 예를 들면, 압축되지 않은 이미지는 5 메가바이트의 공간을 차지할 수 있는 반면, 동일한 이미지가 압축되어 2.5 메가바이트의 공간만을 차지할 수 있다. 또한, 데이터 압축은 압축되지 않은 정보보다 많은 양의 압축된 정보를 전송할 수 있게 한다. 광대역, DSL, 케이블 모뎀 인터넷 등과 같이, 전송 속도의 증가에도 불구하고, 압축되지 않은 정보에 의해 전송 제한들이 쉽게 도달될 수 있다. 예를 들면, DSL 라인을 통한 압축되지 않은 이미지의 전송은 10분이 걸릴 수 있다. 그러나, 데이터 압축에 의하면, 약 1분 내에 동일한 이미지가 전송될 수 있다.
일반적으로, 무손실 및 손실의 2가지 형태의 압축이 있다. 무손실 압축에 의하면 압축 후에 정확히 원래의 데이터가 복구되지만, 손실 압축에 의하면 압축되지 않은 데이터와 원래의 데이터가 달라진다. 손실 압축은 원래 이미지으로부터의 데이터를 제거할 수 있기 때문에 더 나은 압축 속도를 가능하게 한다. 예를 들면, 중요한 텍스트를 압축하는 경우에 데이터를 정확하게 재현하지 못하는 것은 텍스트의 질과 판독가능성에 심각한 영향을 줄 수 있기 때문에, 무손실 압축이 이용될 수 있다. 임의의 양의 왜곡 또는 노이즈가 수용될 수 있거나 우리의 제한된 감각들에의해서는 지각될 수 없는 이미지 또는 중요하지 않은 텍스트에는 손실 압축이 사용될 수 있다.
데이터 압축은 특히 디지털 문서들에 적용가능하다. 디지털 문서들 또는 디지털 문서 이미지들은 문서들의 디지털 표시이다. 일반적으로, 디지털 문서들은 텍스터, 이미지들 및/또는 텍스트와 이미지들을 포함한다. 현재 디지털 데이터에 대해 적은 기억 공간을 사용하는 것에 부가하여, 현저한 질의 저하가 없는 컴팩트 기억장치가 서류없는 오피스(paperless office)를 가능하게 하는 현행 하드 카피(hard copies)의 디지털화를 장려할 것이다. 이러한 서류없는 오피스에 대한 노력은, 서류없는 오피스가 많은 이익을 제공하기 때문에, 정보에 대한 액세스를 가능하게 하고, 환경적 비용을 감소시키고, 저장 비용을 감소시키기 위한 사업상 중요한 목적이다. 또한, 압축을 통해 디지털 문서들의 파일 크기를 감소시킴으로써 인터넷 밴드폭의 보다 효율적인 사용이 가능해지고, 이에 의해 많은 정보의 고속 전송 및 네트워크 정체(congestion)의 감소가 가능해진다. 정보에 요구되는 저장의 감소, 효율적인 서류없는 오피스에 대한 움직임, 및 인터넷 대역 효율성의 증가는 압축 기술의 많은 중요한 장점들중 단지 일부이다.
디지털 문서들의 데이터 압축은 디지털 문서의 사용을 보다 관심있게 만드는 많은 목표를 갖는다. 첫째, 데이터 압축은 많은 양의 정보를 적은 양의 시간동안 압축 및 압축해제할 수 있어야 한다. 둘째, 데이터 압축은 디지털 문서를 정확하게 재생할 수 있어야 한다.
또한, 디지털 문서들의 데이터 압축은 문서의 목적을 이용해야 한다. 일부디지털 문서들은 하드 카피들을 파일링 또는 제공하는 데 사용된다. 다른 문서들은 개정 및/또는 편집될 수 있다. 현재의 데이터 압축은 검사시 텍스트 및/또는 이미지들의 리플로우(reflow)를 처리할 수 없고, 인식된 문자들에 압축 기술을 가능하게 하고 그것들을 워드 프로세서, PDA(personal digital assistants), 휴대폰 등에 리플로우하는 효율적이고 효과적인 수단들을 제공할 수 없다. 따라서, 하드 카피 오피스 문서들이 디지털 형식으로 스캔되면, 현재의 압축 기술은, 디지털화된 문서를 갱신, 보정, 또는 일반적으로 변경하는 것을 불가능하지는 않지만, 어렵게 한다.
다음은 본 발명의 일부 특징들의 기본적인 이해를 제공하기 위해 발명의 간단한 요약을 제시한다. 이 요약은 본 발명의 광범위한 개관은 아니다. 이는 본 발명의 중요한 컴포넌트들을 확인하거나 본 발명의 범위를 서술하기 위해 의도되지 않는다. 요약의 유일한 목적은 발명의 일부 개념을 후술되는 보다 상세한 설명에 대한 서두로서 간단한 형식으로 제시하는 것이다.
본 발명은 일반적으로 문서 이미지의 포그라운드와 백그라운드를 분리하는 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법에 관한 것이다. 본 발명의 하나의 특징에 따르면, 마스크 분리기 컴포넌트(mask seperator component)는 문서 이미지(즉, 문서(들)의 바이너리, RGB 및/또는 YUV 표시)를 입력으로서 수신한다. 마스크 분리기 컴포넌트는 문서 이미지를 처리하고 문서 이미지의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타내는 마스크(예를 들어, 바이너리)를 출력한다. 포그라운드(예를 들어, 텍스트 정보)와 백그라운드(예를 들어, 그래픽 정보)를 분리함으로써, 포그라운드 및/또는 백그라운드는 보다 효과적으로 압축될 수 있고, 이에 의해 파일 크기 및/또는 전송 시간을 감소시킬 수 있다. 그 후 마스크 및/또는 문서 이미지는 압축 시스템의 다른 부분(들)에 의해 처리될 수 있다(즉, 문서 이미지의 개선된 압축을 실현하기 위해). 예를 들면, 본 발명의 시스템 및/또는 방법은 텍스트, 필기체, 도면 등의 식별 및/또는 압축을 용이하게 하는, 전체 세그먼트된 계층화 이미지 시스템(segmented layered image system)에서 이용될 수 있다.
본 발명의 하나의 특별한 특징에 따르면, 마스트 분리기 컴포넌트는 화소 에너지 컴포넌트, 영역 합병 컴포넌트 및 마스크 저장 컴포넌트를 포함한다. 화소 에너지 컴포넌트는 포그라운드 및/또는 백그라운드의 에너지 분산(variance)(들)을 최소화하기 위해 문서 이미지의 영역(들)에 대한 화소 에너지(즉, 분산들)를 계산하도록 설계된다. 에너지(즉, 거리의 제곱의 합에 기초하여 측정된 에너지)는 포그라운드 및/또는 백그라운드에 대해 얻어질 수 있는 압축의 견적으로서 사용된다. 그러나, 계산 비용을 간단히 하기 위해, 문서 이미지들 영역들 및 각 영역에 대해 결정된 포그라운드와 백그라운드로 분할(예를 들어, 2화소 x 2화소)될 수 있고, (예를 들어, 적어도 부분적으로 포그라운드 및/또는 백그라운드의 에너지 분산(들)의 최소화에 기초함) 결정된다. 즉, 각 영역은 2개의 세트: 포그라운드에 속하는 화소들, 및 백그라운드에 속하는 화소들로 분리된다. 계산 비용을 더 최소화하기 위해, 화소 에너지 컴포넌트는 적어도 일시적으로 합병 영역 컴포넌트 및/또는 마스크 저장 컴포넌트에 의해 사용되는 계산 정보를 저장할 수 있다.
영역 합병 컴포넌트는, 잠재적인 합병 영역들의 새로운 포그라운드 및/또는 새로운 백그라운드의 에너지들이 제1 임계 에너지보나 작은 지에 대한 결정에 적어도 부분적으로 기초하여 문서 이미지의 영역들의 쌍들의 합병을 시도하도록 설계된다. 영역 합병 컴포넌트는 화소 에너지 컴포넌트에 의해 저장되는 계산 정보를 이용할 수 있다. 합병의 결과는 그 자체의 포그라운드 및 백그라운드 파티션(partition)에 의해 특징지어지는 보다 큰 영역이다. 합병 이전의 포그라운드였던 화소(들)는 합병된 영역의 백그라운드로 귀결될 수 있고 그 반대도 가능하다. 영역 합병 컴포넌트는 예컨대 새로운 백그라운드 및 새로운 포그라운드 에너지들의 최소화에 적어도 부분적으로 기초하여, 합병된 에너지의 적절한 포그라운드/백그라운드 파티션을 결정할 수 있다.
영역 합병 컴포넌트는 임계 에너지가 초과되거나 실질적으로 모든 문서들이 합병될 때까지 연속적으로 보다 큰 영역들을 합병하도록 계속 시도할 수 있다. 예를 들면, 영역 합병 컴포넌트는 수평으로 인접하는 2x2 영역들을 2x4 영역들로 합병할 수 있다. 그 후, 영역 합병 컴포넌트는 영역들을 4x4 영역으로 수직으로 합병할 수 있다. 일반적으로, 제1 임계 에너지값은, (예를 들면, 영역에 2 이상의 색이 있는 경우) 텍스트 등의 중요한 세부 사항(들)의 잠재적인 손실에 따라, 시도된 합병(들)이 여러개의 계조 레벨들을 포그라운드 또는 백그라운드로 분할하는 잠재적인 상황(들)을 완화하도록 선택될 수 있다. 한다. 따라서, 문서 이미지와 관련된 대부분의 텍스트 및/또는 그래픽 라인(들)을 캡쳐(capture)하는 마크스가 캡쳐될 수 있다.
일단 영역에 대해 합병이 완결되면, 이 영역에 대한 포그라운드 및 백그라운드의 파티션이 마스크를 구성한다. 예를 들면, 포그라운드에 속하는 화소(들)는 마스크에서 "1"로 할당될 수 있는 반면, 백그라운드에 속하는 화소(들)는 "0"으로 할당될 수 있다. 불행히도, 합병 동작시 포그라운드 및 백그라운드 파티션들의 트랙을 유지하는 것은 계산적으로 고가일 수 있다. (예를 들어, 보다 계산적으로 효과적인) 대안은, 합병된 영역의 실질적으로 모든 화소들의 평균을 계산하여 포그라운드에 대한 평균보다 큰 계조 레벨값을 갖는 화소를 할당하며, 나머지 화소는 백그라운드에 할당되도록 하는 것이다. 또는, 평균보다 큰 계조 레벨 값을 갖는 화소(들)는 백그라운드에 할당되고, 나머지 화소(들)는 포그라운드에 할당될 수 있다. 2가지 대안들은 시각적으로 차이가 없는 마스크들을 계산할 수 있다.
그 후, 마스크 저장 컴포넌트는 마스크의 포그라운드 및 백그라운드의 파티션과 관련된 정보를 저장하도록 설계된다. 따라서, 마스크는 문서 이미지의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타낸다.
본 발명의 다른 특징에 의하면, 계산 비용을 최소화하기 위해, 작은 영역(예를 들어, 4화소x4화소)에 대한 에너지가 화소 에너지 컴포넌트에 의해 계산될 수 있다. 에너지가 제2 임계 에너지보다 작으면, 실질적으로 모든 화소들은 포그라운드 또는 백그라운드에 할당될 수 있고, 나머지는 거의 비어있다. 에너지가 제2 임계 에너지보다 크거나 같으면, 분할(partitioning)은 상기한 바와 같이 진행될 수 있다. (예를 들어, 일정한 면적(들)을 갖는) 비교적 깨끗한 문서 이미지(들)에 대해, 계산 속도의 상당한 증가가 달성될 수 있다.
본 발명의 다른 특징에 의하면, 마스크의 사이즈를 최소화하기 위해, 최종 영역(즉, 제1 임계 에너지를 초화하지 않고 합병될 수 없는 영역)이 제3 임계 에너지보다 높은 평균 포그라운드와 평균 백그라운드 사이의 차를 가지면, 영역의 전체 평균이 중간 계조 레벨값(예를 들어, 계조레벨 값들이 0과 255 사이이면 127)보다 큰지 또는 작은지에 따라, 전체 영역은 선언된 포그라운드 또는 선언된 백그라운드이다. 약간의 디더링을(dithering) 갖는 칼라 문서에 있어서, 이들 영역에 대한 마스크는 이러한 최적이 없는 솔트 앤드 페퍼(salt and pepper)와 같고, 압축 비용이 높을 것이다. 제3 임계치는 중요한 텍스트를 손실하지 않고, 많은 경우의 스캐닝 프린트된 문서에서 나타나는 약간의 디더링(dithering)을 제거하도록 선택된다(즉, 많은 프린터들은 4 내지 6가지의 색들을 갖고 색들의 전체 팔레트를 생성하기 위해 디더링을 이용해야 함). 일 예에서는, 제3 임계치로는 40의 값이 좋은 선택이다.
본 발명의 또 다른 특징은 포그라운드 및/또는 백그라운드를 설명하기 위해 다항식 회귀(polynomial regression)를 이용하는 화소 에너지 컴포넌트를 제공한다.
본 발명의 다른 특징은 마스크 분리기 컴포넌트 및 포그라운드/백그라운드 세그멘터(segmenter)를 갖는 문서 이미지 분리 시스템을 제공한다. 마스크 분리기 컴포넌트는 문서 이미지(예를 들면, 텍스트 및/또는 필기체를 포함)를 처리하고, 어떤 화소들이 포그라운드에 있는지, 마스크의 백그라운드에 있는 지에 대한 정보를 저장할 수 있다. 그 후, 포그라운드/백그라운드 세그멘터는 마스크와 문서 이미지를 수신할 수 있고 문서 이미지를 포그라운드 이미지와 백그라운드 이미지로 분리할 수 있다.
본 발명의 또 다른 특징에 의하면, 문서 이미지 변환 컴포넌트, 마스크 분리 컴포넌트 및 포그라운드/백그라운드 분리 컴포넌트를 갖는 문서 이미지 압축 시스템이 제공된다. 선택적으로, 문서 이미지 압축 시스템은 마스크 인코더, 포그라운드 인코더 및/또는 백그라운드 인코더를 포함할 수 있다.
본 발명의 또 다른 특징은 화소 에너지 컴포넌트 및 마스크 저장 컴포넌트를 갖는 세그먼트된 계층화 이미지 시스템을 제공한다. 세그먼트된 계층화 이미지 시스템은 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA, 팩스, 디지털 카메라, 디지털 비디오 카메라 및/또는 비디오 게임 시스템을 포함하지만 이에 한정되지 않는 문서 이미지 어플리케이션들의 방대한 어레이에 사용될 수 있다.
본 발명의 다른 특징들은 마스크를 생성하는 방법, 마스크 분리 컴포넌트 및 마스크와 관련된 정보를 포함하는 2개 이상의 컴퓨터 프로세스들 사이에 전송되도록 설계된 데이터 패킷에 대한 컴퓨터 사용가능한 명령들을 갖는 컴퓨터 판독가능한 매체를 제공하며, 마스크는 문서 이미지의 포그라운드 및 백그라운드 중 적어도 하나에 화소들을 할당하고, 문서 이미지의 영역에 있는 화소들의 에너지 최소화 계산에 적어도 부분적으로 기초한다.
상기 및 관련된 목적을 달성하기 위해, 본 발명의 임의의 예시적인 특징들이 다음 설명과 첨부된 도면에 따라 기재되었다. 그러나, 이들 특징들은 발명의 원리들이 채용될 수 있는 각종 방법들 중 단지 소수에 대해 기술된 것이며, 본 발명은 모든 이러한 특징들 및 그 등가물들을 포함하도록 의도된다. 발명의 다른 이점들 및 진보적인 특징들은 도면과 함께 고려될 때 하기의 발명의 상세한 설명으로부터 명백해질 것이다.
도 1은 본 발명의 특징에 따른 마스크 분리기 컴포넌트(mask seperator component)의 블록도.
도 2는 본 발명의 특징에 따른 예시적인 문서 이미지.
도 3은 본 발명의 특징에 따른 도 2의 예시적인 문서 이미지와 관련된 마스크.
도 4는 본 발명의 특징에 따른 도 2의 예시적인 문서 이미지 및 도 3의 마스크와 관련된 백그라운드(background).
도 5는 본 발명의 특징에 따른 문서 이미지의 예시적인 2화소 x 2화소 영역.
도 6은 본 발명의 특징에 따른 문서 이미지의 예시적인 2화소 x 4화소 영역.
도 7은 본 발명의 특징에 따른 문서 이미지의 예시적인 4화소 x 4화소 영역.
도 8은 본 발명의 특징에 따른 마스크 생성 방법을 설명하는 순서도.
도 9는 도 8의 방법을 더 설명하는 순서도.
도 10은 본 발명의 특징에 따른 문서 이미지 분리 시스템의 순서도.
도 11은 본 발명의 특징에 따른 문서 이미지 압축의 블록도.
도 12는 본 발명의 특징에 따른 문서 이미지 압축의 블록도.
도 13은 본 발명의 특징에 따른 세그먼트된 계층화 이미지 시스템(segmented layered image system)의 블록도.
도 14는 본 발명에 따라 구성된 시스템에 대한 예시적인 동작 환경의 개략적인 블록도.
도 15는 본 발명에 따른 예시적인 통신 환경의 개략적인 블록도.
〈도면의 주요 부분에 대한 부호의 설명〉
100 : 마스크 분리기 컴포넌트
110 : 문서 이미지
120 : 마스크
130 : 화소 에너지 컴포넌트
140 : 영역 합병 컴포넌트
150 : 마스크 저장 컴포넌트
160 : 포그라운드/백그라운드 세그멘터 컴포넌트
170 : 포그라운드 이미지
180 : 백그라운드 이미지
이제 본 발명은 도면을 참조하여 기술되며, 전반적으로 유사한 컴포넌트들을 참조하기 위해 유사한 참조 부호들이 사용된다. 다음 기재에서, 설명의 편의상, 본 발명의 총체적인 이해를 제공하기 위해 다수의 특정 세부사항들이 기술된다. 그러나, 본 발명은 이들 특정 세부사항들 없이 실행될 수 있음은 자명하다. 다른 예에서, 본 발명의 설명을 용이하게 하기 위해 공지된 구조들 및 디바이스들이 블록도로 도시된다.
이 출원서에서 사용된 바와 같이, 용어 "컴포넌트(component)" 및 "시스템(system)"은 컴퓨터 관련 실체, 즉 하드웨어, 하드웨어와 소프트웨의 조합, 소프트웨어, 또는 실행중인 소프트웨어들 중 하나를 언급하도록 의도된다. 예를 들면, 컴포넌트는 프로세서에서 운영하는 프로세스, 프로세서, 오브젝트, 실행가능성, 실행의 스레드(a thread of execution), 프로그램, 및/또는 컴퓨터일 수 있지만, 이에 한정되지 않는다. 설명에 의하면, 서버에서 운영하는 어플리케이션 및 서버 모두는 컴포넌트일 수 있다. 하나 이상의 컴포넌트들은 프로세스 및/또는 실행의 스레드 내에 존재할 수 있고, 컴포넌트는 하나의 컴퓨터에 배치되거나 및/또는 2개 이상의 컴퓨터들 사이에 분배될 수 있다.
또한, "문서 이미지(document image)"는 하나 이상의 색(들)(예를 들면, 바이너리(즉, 흑/백), 계조 및/또는 칼라 문서(들))을 포함하는 문서(들)의 디지털 표시를 언급하도록 의도된다. 또한, 문서 이미지는 텍스트와 이미지들의 가능한 중첩에 의해 이미지(들), 텍스트 및/또는 이미지를 갖는 텍스트를 가질 수 있다. 문서 이미지는 문서(들)의 바이너리, RGB 및/또는 YUV 표시일 수 있다. RGB 문서 이미지는 적색, 녹색 및 청색 성분들을 표시한다. YUV 문서 이미지는 Y로 나타낸 루미네슨스(luminescence) 성분 및 U와 V로 나타낸 크로미넌스(chrominence) 성분들을 사용하여 표시된다. 하위비트들은 YUV 이미지의 시각적인 품질을 많이 희생하지 않고 크로미넌스 성분들 U 및 V를 표시하는데 사용된다. YUV 표시는 RGB 표시보다 일반적으로 보다 컴팩트하고 용이하게 사용하는 표시이다. 문서 이미지는 공통적으로 "화소들(pixels)"로서 칭해지는 이미지 컴포넌트들을 포함한다. 문서 이미지는 임의의 형상 또는 사이즈의 하나의 또는 멀티 페이지 문서에 기초할 수 있다.
도 1을 참조하여, 본 발명의 특징에 따른 마스크 분리기 컴포넌트(100)를 설명한다. 마스크 분리기 컴포넌트(100)는 (예를 들어, 보관되거나 전송되는 문서에 기초하여) 문서 이미지(100)를 수신한다. 예를 들면, 마스크 분리기 컴포넌트(100)는 문서 압축 시스템(도시하지 않음)의 일부일 수 있다. 문서 이미지(110)는 문서(들)의 바이너리, RGB 및/또는 YUV 표시일 수 있다. 마스크 분리기 컴포넌트(100)는 문서 이미지(110)를 처리하고, 문서 이미지(110)의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지의 여부를 나타내는 마스크(120)(예를 들면 바이너리)를 출력한다. 마스크(120) 및/또는 문서 이미지(110)는 그 후 문서 이미지(110)의 압축에 영향을 주기 위해 압축 시스템(도시하지 않음)의 다른 부분(들)에 의해 처리될 수 있다.
도 2를 참조하여, 예시적인 문서 이미지가 설명된다. 문서 이미지는 바(bar)를 따라 글자들 "C" 및 "O" 를 포함한다. 도 3은 본 발명의 특징에 따라 도 2의 예시적인 문서 이미지와 관련된 마스크를 예시한다. 도 4는 본 발명의 특징에 따라 도 2의 예시적인 문서 이미지 및 도 3의 마스크와 관련된 백그라운드를 예시한다. 점선은 백그라운드 "돈 캐어(don't care)" 화소들의 경계를 나타내며, 화소들은 점선을 포함하고, 문서 이미지들이 다시 조합될 때 적어도 부분적으로 마스크에 저장된 복구 정보에 기초하여 백그라운드에 포그라운드가 배치되기 때문에 점선 내의 화소들은 백그라운드의 "don't care"이다. 글자 "C" 및 "O" 및/또는 바가 일정한 칼라(들)이거나 스무스한 칼라 천이(들)를 갖는 경우에는, 각종 스무딩(smoothing) 및/또는 압축 기술(들)중 하나를 사용하여 포그라운드의 효과적인 압축을 달성할 수 있다. 배경의 효과적인 압축은, "돈 캐어" 화소(들)를 더 스무스한 천이(들)를 가능하게 하는 화소(값)들로 대체함으로써 달성될 수 있다. "don't care" 화소들을 채우기 위한 하나의 예시적인 간단한 알고리즘은 저주파 통과필터로 백그라운드를 처리한 후, 중요한 화소들을 다시 저장하는 것이다. 이들 두 단계들을 몇 번 반복한 후에, "don't care" 화소들은 스무스한 천이(들)를 가능하게 하는 값들을 갖게 되어 압축이 잘 될 것이다. 이 알고리즘의 간단한 개량은 저주파 통과 필터로 시작해서 각 반복시 저주파 통과 필터의 차단 주파수를 증가시키는 것이다. 포그라운드를 채우기 위해 유사한 알고리즘이 사용될 수 있다.
도 1을 다시 참조하면, 마스크 분리기 컴포넌트(100)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)를 포함한다.
화소 에너지 컴포넌트(130)는 문서 이미지(100)의 영역(들)에 대한 화소 에너지(즉, 분산들)를 계산하도록 설계된다. 예를 들면, 문서 이미지(110)가 YUV 표시인 경우에는, 화소 에너지 컴포넌트(130)는 Y 성분 및/또는 YUV 표시의 YUV 성분들의 적절한 조합에 기초하여 화소 에너지 분산들을 계산한다. 계산의 편의상, 포그라운드와 백그라운드가 영역에 걸쳐 일정하도록 가정될 수 있다. 이들 상수에 가까운 분산을 최소화하는 마스크(120)를 계산하는 것이 바람직하다. 분산은 포그라운드 및/또는 백그라운드에 대해 얻어질 수 있는 압축의 견적으로서 사용된다. 대안적으로, 영역(들)은 압축될 수 있고 비트수들은 정량적으로 측정될 수 있지만, 계산 비용은 높아지면 안된다. 따라서, 거리들의 제곱의 합에 기초하여 측정된 에너지인 분산의 계산은 압축 후의 포그라운드와 백그라운드의 사이즈의 수용가능한 견적이다.
영역은 N 화소들의 집합 S이고, 포그라운드 F 및 백그라운드 B는 F∪B=S 및 F∩B=Φ인 S의 파티션(partition)이라고 가정한다. f(x)가 화소 위치 x( x∈S)에서의 이미지 값이면, 포그라운드 및 백그라운드의 분산은 각각 다음과 같다:
(1)
(2)
여기서,는, 각각 포그라운드 및 백그라운드의 평균 화소값이고, NF및 NB는 각각 포그라운드 및 백그라운드의 화소수이다. 이들 분산들은 다음과 같이 표현될 수도 있다:
(3)
(4)
다음, 포그라운드 및/또는 백그라운드의 에너지(즉, 분산들)의 최소화에 적어도 부분적으로 기초하여, 화소 에너지 컴포넌트(130)에 의해 S의 적절한 파티션 F 및 B가 결정된다(즉, 이는 합 E=vF+vB를 최소화한다). 그러나, S의 적절한 파티션 F 및 B를 찾는 것은 2N개의 가능한 마스크가 있기 때문에 계산적으로 철저할 수 있다.
계산을 간략화시키기 위해, 문서 이미지는 예를 들어 2화소 x 2화소 영역들로 나누어질 수 있다. 도 5를 참조하면, 본 발명의 특징에 따른 문서 이미지의 2화소 x 2화소 영역이 예시된다. 4개의 화소들은 값들 V1, V2, V3및 V4를 갖는다. 각각의 2화소 x 2화소 영역들에서는, 단지 24=16개의 가능한 마스크들이 있다. 따라서, 이들 각각의 2화소 x 2화소 영역들에 대해, 최적 F 및 B를 찾을 수 있어, 모든 16개의 조합에 대한 E를 계산하고, 최소 에너지를 갖는 것을 이용함으로써 E=vF+vB를 최소화시킨다.
그러나, K-평균 클러스터링 알고리즘(K-means clustering algorithm)을 이용하면, K=2일 때, 문서 이미지가 스칼라 함수이기 때문에, 효율적으로 계산될 수 있는 결과를 산출하는 f(x)값들이 소트(sort)될 수 있다. 소트된 순서가 V1V2V3V4라고 가정하면, K-평균 클러스터링 알고리즘은, K=2일 때 3개의 가능한 파티션들을 산출한다:
가능한 가능한
포그라운드 백그라운드
V1V2V3V4
V1V2V3V4
V1V2V3V4
실질적으로 모든 다른 조합들은 동일하거나 더 높은 에너지를 가진다는 것을 볼 수 있다. 이는 인접하지 않는 값들의 그룹핑보다 낮은 분산을 갖는 인접하는값의 그룹핑이 항상 존재해야 하기 때문에 직관적이다. 소팅 순서가 다르면, 화소는 V1V2V3V4가 소팅되도록 항상 다시 라벨링될 수 있다. 그 후, 포그라운드와 백그라운드의 3개의 가능한 파티션들중 어느 것이 최저 에너지를 산출하는 지를 바로 결정한다. 중요하게도, 화소 에너지 컴포넌트(130)는 계산 비용을 최소화하기 위해, 부분합,,및/또는를 저장할 수 있다. 또한, 화소 에너지 컴포넌트(130)는 NF및/또는 NB를 따라 (즉, 영역 합병 컴포넌트(140) 및/또는 마스크 저장 컴포넌트(150)에 의해 사용되는) 부분합,,및/또는의 적어도 일부를 적어도 일시적으로 저장할 수 있다.
또한, 계산 비용을 최소화하기 위해, 작은 영역(예를 들어, 4화소 x 4화소)에 대한 에너지가 계산될 수 있다. 에너지가 임계량보다 작으면, 나머지는 비어있는 채로 모든 화소들이 포그라운드 또는 백그라운드에 할당될 수 있다. 에너지가 임계 에너지보다 크거나 같은 경우, 상기한 바와 같이 분할이 진행될 수 있다. 이 파티션이 최적일 수 없더라도, 임계값이 충분히 작으면 역효과는 관찰되지 않는다. 비교적 깨끗한 문서 이미지(들)(예를 들면, 일정한 면적(들)을 갖는)에 있어서, 계산 속도의 현저한 증가가 달성될 수 있다.
또한, 포그라운드와 백그라운드를 분리하는 마스크가 계산된 후에 실질적으로 일정한 영역(들)(즉, 완전한 포그라운드 또는 완전한 백그라운드)이 설정될 수있다. 예를 들면, 평균 포그라운드와 평균 백그라운드 사이의 차이가 실험적으로 결정될 수 있는 임의의 임계치보다 작으면(예를 들어, 40의 값은 0에서 255의 전체 계조 레벨들와 비교하여 사용될 수 있음), 전체 영역은 포그라운드나 백그라운드 중 어느 하나로 설정된다(평균이 1에 가까운지 또는 255에 가까운지에 따라).
도 1을 다시 참조하면, 문서 이미지(110)를 2화소 x 2화소로 분할하는 것에 의해, 화소 노이즈를 픽업(pick up)할 수 있는 별개의 포그라운드(들) 및 백그라운드(들)을 갖는 영역(들)이 생긴다. 이에 대해, 마스크(120)의 텍스트 및/또는 그래픽 선들을 캡쳐할 수 있는 목표에 부합하지 않는 솔트 앤드 페퍼(salt and pepper)와 같은 마스크(120)가 될 수 있다. 따라서, 영역 합병 컴포넌트(140)는 잠재적인 합병 영역들의 포그라운드 및/또는 백그라운드의 에너지들이 제1 임계 에너지보다 작은 지의 여부에 대한 결정에 적어도 부분적으로 기초하여 문서 이미지(110)의 영역들의 쌍들의 합병을 시도하도록 설계된다. 영역 합병 컴포넌트(140)는 화소 에너지 컴포넌트(130)에 의해 계산되고 저장된 NF및/또는 NB를 따라 부분합,,및/또는를 이용할 수 있다.
각각의 합병 후, 이 양들은 다시 계산되어야 하지만, 다행스럽게도, 이는 포그라운드 및 백그라운드 조합에 따라 이들 양들을 단지 합하는 것에 의해 일정한 시간에 수행된다. 모든 영역들에 대한 합은 각 파티션에 대해 일정하고,최적 파티션을 선택하기 위해 계산될 필요가 있다는 것에 유의해야 한다. 그러나, 영역들을 합병하지 않을 경우에도 이 양을 결정할 필요는 있을 것이다.
도 6을 다시 참조하여, 포그라운드 F1및 백그라운드 B1을 갖는 제1 영역과 포그라운드 F2및 백그라운드 B2를 갖는 제2 영역과의 가능한 합병에 대해 예시한다. 합병될 영역들의 에너지들이 제1 임계 에너지보다 작은 지를 결정할 때, 영역 합병 컴포넌트(150)는 새로운 포그라운드와 새로운 백그라운드의 그룹핑을 계산할 수 있다. 2개의 영역들 내의 에너지 분산들은 새로운 포그라운드와 새로운 백그라운드의 7가지 가능한 그룹핑을 가진다.
가능한 합병 영역의 가능한 합병 영역의
새로운 포그라운드 새로운 백그라운드
F1B1F2B2
F1B1F2B2
F1B2F2B1
F2F1B1B2
F1F2B1B2
F1B1F2B2
F1B2F2B1
가능한 그룹핑들중 적어도 하나가 제1 임계 에너지보다 작은 백그라운드 및/또는 포그라운드 에너지들을 제공하면, 영역 합병 컴포넌트(140)는 예를 들어 포그라운드 및 백그라운드 에너지(즉, E=vF+vB)의 최소화에 적어도 부분적으로 기초하여, 합병된 영역의 적절한 포그라운드/백그라운드 파티션을 결정할 수 있다. 이들 그룹핑들 중 어느 것도 제1 임계 에너지보다 낮은 에너지를 제공하지 않으면, 합병은 발생하지 않으며, 이들 영역들은 더 이상 합병이 고려되지 않는다. 디폴트 F1 및 F2가 포그라운드 화소들을 계산하는데 사용되는 반면, B1 및 B2가 백그라운드 화소들을 계산하는 데 사용될 것이다.
영역 합병 컴포넌트(140)는 제1 임계 에너지가 초과되거나 및/또는 실질적으로 모든 문서 이미지(110)가 합병될 때까지, 더 많은 영역들을 합병하려고 계속 시도할 수 있다. 예를 들면, 영역 합병 컴포넌트(140)는 도 6에 예시된 바와 같이 수평으로 인접하는 2x2 영역들을 2x4 영역들로 합병할 수 있다. 그 후, 영역 합병 컴포넌트(140)는 도 7에 예시된 바와 같이 영역들을 4x4 영역으로 수직 합병할 수 있다. 일반적으로, 제1 임계 에너지값은, (예를 들어, 영역에 2개 이상의 칼라가 있는 경우) 시도된 합병(들)이 여러개의 계조 레벨들을, 텍스트 등의 중요한 세부사항(들)의 잠재적인 손실을 갖는, 포그라운드 또는 백그라운드로 분할하는 잠재적인 상황(들)을 완화하도록 선택될 수 있다. 예를 들어 제1 영역이 백색 위에 회색으로 기입된 텍스트를 갖고 제2 영역이 대부분 흑색이면, 2개의 영역들의 합병에 의해 회색과 백색이 포그라운드로 되고 흑색이 결과로서의 합병된 영역의 백그라운드로 될 수 있기 때문에, 마스크(120)로부터의 실질적으로 모든 텍스트 정보가 손실된다. 그러나, 2가지의 색이 포그라운드 또는 백그라운드 중 하나에 합병될 때마다, 상수가 더 이상 이 영역에 바람직한 모델이 아니기 때문에, 그 영역에 대한 에너지의 가파른 증가가 발생한다.
또한, 실질적으로 모든 7가지 조합들에 대한 결과로서의 에너지를 계산하는 대안으로서, 포그라운드와 백그라운드의 평균은 소트될 수 있고, 소트된 평균에 대한 분할이 고려될 수 있다. 값 V1V2V3V4의 소팅에 대해서는 파티션의 수를 3으로 내린다(평균에 의해 소트 F1B1F2B2를 소트하고 순서에 관계하는 파티션들을 고려한다).
부가적으로 및/또는 대안적으로, 영역 합병 컴포넌트(120)는 주어진 영역들에 대한 근사치 f에 기초하여, 2개의 영역의 포그라운드들과 백그라운드들의 조합들의 제한된 서브세트를 평가할 수 있다. 영역 합병 컴포넌트(120)는 최소 누적 에너지와의 조합을 선택할 수 있다.
이러한 합병은 제1 임계치 이상의 에너지를 증가시키기 때문에 영역이 더이상 합병될 수 없으면, 이 영역의 화소는 포그라운드와 백그라운드로 분할될 수 있다. 이러한 파티션은 각각의 합병을 따라 행해질 수 있지만, 이는 계산적으로 고가일 수 있다. 또한, 합병 영역 컴포넌트(140)는 합병된 영역의 실질적으로 모든 화소 값들의 평균을 계산하여 평균보다 큰 값을 갖는 화소(들)을 포그라운드에 할당하고 남은 화소(들)를 백그라운드에 할당할 수 있다. 또한, 평균보다 큰 값을갖는 화소(들)는 백그라운드에 할당되고 남은 화소(들)는 포그라운드에 할당될 수 있다.
도 1을 다시 참조하면, 일단 영역 합병 컴포넌트(140)에 의해 합병이 고갈되면, 마스크 저장 컴포넌트(150)는 마스크(120)의 화소 에너지 컴포넌트(130) 및/또는 합병 영역 컴포넌트(140)에 의해 수행되는 포그라운드와 백그라운드의 파티션과 관련된 정보를 저장하도록 설계된다. 이에 의해, 마스크(120)는 문서 이미지(110)의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타낸다.
일 예에서, 계산 비용을 최소화하기 위해, 작은 영역(예를 들면, 4화소x4화소)에 대한 에너지는 화소 에너지 컴포넌트(130)에 의해 계산될 수 있다. 에너지가 제2 임계 에너지보다 낮으면, 실질적으로 모든 화소들은 포그라운드 또는 백그라운드에 할당되고 나머지는 거의 비어 있다. 에너지가 제2 임계 에너지 이상이면, 분할은 상기한 바와 같이 진행할 수 있다. (예를 들면, 일정 면적(들)을 갖는) 비교적 깨끗한 문서 이미지(들)에 대해서는, 계산 속도의 상당한 증가가 달성될 수 있다.
다른 예에서, 마스크의 크기를 최소화하기 위해, 최종 영역(예를 들면, 제1 임계치를 초과하지 않고 합병될 수 없는 영역)이 제3 임계치보다 높은 평균 포그라운드와 평균 백그라운드 사이의 차를 가지면, 영역의 전체적인 평균이 중간 계조 레벨 값(예를 들면, 계조 레벨 값들이 0과 255 사이라면 127)보다 크거나 작은 지에 따라, 전체 영역은 선언된 포그라운드이거나 선언된 백그라운드이다. 약간의 디더링을 갖는 칼라 문서에 있어서, 이들 영역에 대한 마스크는 이 최적화가 없는솔트 앤드 페퍼(salt and pepper)와 같을 것이고, 압축 비용이 높을 것이다. 제3 임계치는 중요한 텍스트를 손실하지 않고, 단지 스캐닝 프린트된 문서에서 보여지는 약간의 디더링의 많은 경우들을 제거하도록 선택된다(즉, 많은 프린터들은 4 내지 6의 색들을 갖고 색들의 전체 팔레트를 생성하도록 디더링(dithering)을 이용해야 한다). 예를 들면, 40의 값은 제3 입계치에 대한 좋은 선택일 수 있다.
마스크 분리기 컴포넌트(100)는, 포그라운드 및 백그라운드가 각각 일반적으로 일정하다는 가정하에서 설명되었다. 그러나, 본 발명의 특징에 따르면, 포그라운드 및/또는 백그라운드를 설명하기 위해 화소 에너지 컴포넌트(130)에 의해 다항식 복귀가 사용될 수 있다. 예를 들면, 포그라운드 및/또는 백그라운드의 다항식들이 평면의 식 αx+βy+μ라면, 에너지는 다음과 같이 정의될 것이다:
여기서, x,y는 화소 위치들을 나타내고, αF, βF및 μF는 vF를 최소화하는 스칼라들이고 αB, βB및 μB는 vB를 최소화하는 스칼라들이다. αF, βF및 μF는 3개의 미지수 및 3개의 식들의 선형 시스템인 수량들,,를 이용하여 일정한 시간 내에 해결될 수 있다. 유사하게, αB, βB및 μB는 유사한 방식으로 해결될 수 있다. 일반적으로 일정한 포그라운드 및/또는 백그라운드에 관하여 상기된 바와 같이, 화소 에너지 컴포넌트(130)는 에너지 최소화에 기초하여 영역을 포그라운드와 백그라운드로 분할하는 작은 영역들에 대한 화소 에너지의 계산을 진행한다. 그 후, 작은 영역들은, 각각의 시도된 합병에서 에너지(E)의 최소화에 적어도 부분적으로 기초하여 합병 영역 컴포넌트(140)에 의해 순차 합병되도록 시도된다. 그러나, 포그라운드들 및 백그라운드들은 평균에 의해 소트될 수 없기 때문에, 모든 7개의 조합들은 어떤 조합이 E를 최소화시키는 지를 알아내도록 테스트되어야 한다. 합병을 용이하게 하기 위해, 수량들,,,및 N이 포그라운드 및 백그라운드에 대한 각 영역에 대해 저장될 수 있다.
다시 계산 비용을 최소화하기 위해, 작은 영역(예를 들면, 4화소x4화소)에 대한 에너지는 화소 에너지 컴포넌트(130)에 의해 계산될 수 있다. 그러나, 화소 에너지 컴포넌트(130)는 영역에 대해 상수에 기초한 모델을 이용할 수 있고, 및/또는 다항식 회귀를 이용할 수 있다.
부가적으로 및/또는 대안적으로, 화소 에너지 컴포넌트(110)는 평면 회귀(planar regression)를 사용하여 에너지를 계산할 수 있다. 포그라운드 vF및 백그라운드 vB의 에너지는 다음과 같이 정의된다:
여기서, F는 포그라운드, B는 백그라운드, f(x,y)는 위치 x,y에서의 화소값이다. 또한, AF, BF, CF는 포그라운드 vF의 에너지를 최소화하기 위해 선택되고, AB, BB, CB는 백그라운드 vB의 에너지를 최소화하기 위해 선택된다. 예를 들면, 포그라운드 vF의 에너지의 최소화는 방정식계(3개의 미지수, 3개의 방정식)를 풀어서 얻을 수 있다:
여기서, 예를 들면:
백그라운드 vB의 에너지에 대해서도 유사한 계산을 할 수 있다.
도 1은 마스크 분리기 컴포넌트(100)에 대한 컴포넌트들을 예시하는 개략적인 도면이지만, 마스크 분리기 컴포넌트(100)는 그 용어가 본 명세서에 정의된 바와 같이, 하나 이상의 컴포넌트들로서 구현될 수 있다는 것을 이해해야 한다. 따라서, 마스크 분리기 컴포넌트(100)를 구현하도록 동작가능한 컴퓨터 실행가능한 컴포넌트들은, 본 발명에 따른 ASIC(application specific integrated circuit), CD(compact disc), DVD(digital video disk), ROM(read only memory), 플로피 디스크, 하드 디스크, EEPROM(electrically erasable programmable read only memory) 및 메모리 스틱을 포함하지만 이에 한정되지 않는 컴퓨터 판독가능한 매체에 저장될 수 있다.
상기되고 도시된 예시적인 시스템들의 관점에서, 본 발명에 따라 구현될 수 있는 방법은 도 8 및 도 9의 흐름도를 참조하여 잘 이해될 수 있다. 설명의 편의상, 방법이 일련의 블록들로서 도시되고 기재되지만, 본 발명에 따르면, 일부 블록을은 본 명세서에 도시되고 기재된 것과 상이한 블록들과는 다른 순서로 및/또는 동시에 발생할 수 있기 때문에, 본 발명은 블록들의 순서에 의해 제한되지 않는다는 것을 이해하고 인식해야 한다. 또한, 모든 예시된 블록들이 본 발명에 따른 방법을 구현하기 위해 요구되는 것은 아니다.
본 발명은 하나 이상의 컴포넌트들에 의해 실행되는, 프로그램 모듈과 같은 컴퓨터 실행가능한 명령들의 일반적인 문맥으로 기재될 수 있다. 일반적으로, 프로그램 모듈들은 특정 작업을 수행하거나 특정 요약 데이터 타입을 구현하는, 루틴들, 프로그램들, 오브젝트들, 데이터 구조 등을 포함한다. 일반적으로 프로그램 모듈들의 기능은 다양한 실시예들에서 요구되는 바와 같이 조합되거나 분배될 수 있다.
도 8 및 도 9를 참조하면, 본 발명의 특징에 따른 마스크 생성 방법(800)이 설명된다. 810에서, 문서 이미지의 영역에 대한 화소 에너지(즉, 변수들)가 계산된다. 예를 들면, 계산된 화소 에너지는, 영역의 다항식 회귀에 적어도 부분적으로 기초한 분산들일 수 있다. 또한, 계산된 화소 에너지 분산들은 영역의 실질적으로 모든 화소값들에 대해 거리의 제곱의 합으로 사용되는, 포그라운드에 대한 계산된 평균 화소값 및 백그라운드에 대해 계산된 평균 화소값을 이용하여 계산될 수 있다. 대안적으로, 계산된 화소 에너지 분산들은 백그라운드에 대한 화소값들의 합과 포그라운드에 대해 계산된 화소값들의 합을 이용하여 계산될 수 있다.
다음, 820에서, 포그라운드 및/또는 백그라운드의 화소 에너지를 최소화시키기 위한 영역에 대한 화소 파티션이 계산된다. 830에서, 문서 이미지의 실질적으로 모든 영역들이 분할되었는 지의 여부에 대해 결정된다. 830에서 결정이 NO이면, 810에서의 처리가 계속된다. 830에서의 결정이 YES이면, 840에서 처리가 계속된다.
다음, 840에서, 영역들의 인접한 쌍들은 합병되도록 시도된다. 850에서, 시도된 합병이 새로운 포그라운드 및/또는 새로운 백그라운드에서 초과되는 임계 에너지에 영향을 미치는 지에 대해 결정된다. 850에서의 결정이 YES이면, 860에서 처리가 계속된다. 850에서의 결정이 NO이면, 870에서, 영역들이 합병된다. 880에서, 합병된 영역의 새로운 포그라운드와 백그라운드 파티션이 계산된다. 885에서, 문서 이미지의 실질적으로 모든 영역들이 합병되도록 시도되었는 지의 여부가 결정된다. 885에서의 결정이 YES이면, 더이상 처리가 발생하지 않는다. 885에서의 결정이 NO이면, 840에서 처리가 계속된다.
860에서, 문서 이미지의 실질적으로 모든 영역들이 합병되도록 시도되었는 지에 대해 결정된다. 860에서의 결정이 NO이면, 890에서, 시도된 합병들의 포커스가 다음의 합병되지 않은 영역(예를 들면, 2화소x2화소)으로 이동한다. 860에서의결정이 YES이면, 더이상 처리가 발생하지 않는다.
다음, 도 10을 참조하여, 본 발명의 특징에 따른 문서 이미지 분리를 위한 시스템(1000)을 설명한다. 시스템(1000)은 마스크 분리기 컴포넌트(100) 및 포그라운드/백그라운드 세그멘터(segmenter)(160)를 포함한다. 마스크 분리기 컴포넌트(100)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)를 포함한다.
상기한 바와 같이, 본 발명의 특징에 따르면, 마스크 분리기 컴포넌트(100)는 입력으로서 문서 이미지(110)를 수신한다. 마스크 분리기 컴포넌트(100)는 출력으로서 마스크(120)를 생성하기 위해 문서 이미지를 처리한다.
포그라운드/백그라운드 세그멘터(160)는 마스크(120) 및 문서 이미지(110)를 입력으로서 수신한다. 마스크(120)에 적어도 부분적으로 기초하여, 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(110)는 포그라운드 이미지(170) 및 백그라운드 이미지(180)로 분리하도록 설계된다. 예를 들면, 마스크(120)에서 "1"에 의해 표시된 실질적으로 모든 화소(들)는 포그라운드 이미지(170)로 갈 수 있고 마스크(120)에서 "0"에 의해 표시된 실질적으로 모든 화소(들)는 백그라운드 이미지(180)로 갈 수 있다. 반대로, 예로서, 마스크(120)에서 "0"에 의해 표시된 실질적으로 모든 화소(들)는 포그라운드 이미지(170)로 갈 수 있고 마스크(120)에서 "1"에 의해 표시된 실질적으로 모든 화소(들)는 백그라운드 이미지(180)로 갈 수 있다.
예를 들면, 마스크 분리기 컴포넌트(100)는 (예를 들어, 텍스트와 관련된)화소들을 포그라운드로 분리하고, 어떤 화소가 마스크(120)의 포그라운드에 있는 지에 대한 정보를 저장함으로써 텍스트를 포함하는 문서 이미지(110)를 처리할 수 있다. 그 후, 포그라운드/백그라운드 세그멘터(160)는 마스크(120) 및 문서 이미지(110)를 수신할 수 있다. 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(110)를 포그라운드 이미지(170) 및 백그라운드 이미지(180)로 분리할 수 있다.
도 11을 참조하여, 본 발명의 특징에 따른 문서 이미지 압축을 위한 시스템(1100)이 설명된다. 시스템(1100)은 문서 이미지 변환 컴포넌트(1110), 마스크 분리 컴포넌트(100) 및 포그라운드/백그라운드 세그멘터 컴포넌트(160)를 포함한다. 포그라운드/백그라운드 세그멘터(160)는 마스크(120)와 문서 이미지(1150)를 입력들로서 수신한다. 마스크(120)에 적어도 부분적으로 기초하여, 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(1150)를 포그라운드 이미지(170) 및 백그라운드 이미지(180)로 분리하도록 설계된다.
도 12에 도시된 바와 같이, 시스템(1100)은, 선택적으로, 마스크 인코더(1120), 포그라운드 인코더(1130) 및/또는 백그라운드 인코더(1140)를 포함할 수 있다. 마스크 분리기 컴포넌트(110)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)을 포함한다. 선택적으로, 시스템(110)은 포그라운드 이미지 프로세서(1170) 및/또는 백그라운드 이미지 프로세서(1180)를 포함할 수 있다.
문서 이미지 변환 컴포넌트(1110)는 문서 이미지(1150)를 수신하고 문서 이미지의 변환된 표시(1160)를 출력한다. 예를 들면, 문서 이미지 변환 컴포넌트(1110)는 RGB 문서 이미지를 수신하고 RGB 문서 이미지의 YUV 표시를 출력할 수 있다.
마스크 인코더(1120)는 마스크(120)를 인코드하도록 설계된다. 예를 들면, 마스크(120)는 일반적으로 바이너리이기 때문에, 마스크 인코더(1120)는 마스크의 효율적인 압축을 달성하기 위해 종래의 바이너리 압축 기술(들)을 이용할 수 있다. 마스크 인코더(1120)은 마스크 비트 스트림을 출력한다.
포그라운드 인코더(1130)는 포그라운드 이미지(170)를 인코드하도록 설계된다. 포그라운드는 포그라운드 화소들, 및 "돈 캐어(don't care)" 화소들(즉, 원래 백그라운드에 속하는 화소(들))로 이루어지는 이미지이다. 포그라운드 이미지 프로세서(1170)는 압축을 용이하게 하고 변경된 포그라운드 이미지를 포그라운드 인코더(1130)에 제공하는 값들로 "돈 캐어" 화소들을 채우도록 사용될 수 있다. 예를 들면, 포그라운드 이미지(170)가 일반적으로 흑색의 텍스트 정보를 포함하는 경우에, 전체 포그라운드 이미지가 흑색이 되도록 "돈 캐어" 화소도 흑색으로 채워질 수 있다. 포그라운드 인코더(1130)는 JPEG, 웨이브렛(wavelets), 또는 다른 이미지 압축 알고리즘 등의 이미지 압축에 효과적인 압축 기술(들)을 이용할 수 있다. 포그라운드 인코더(1130)는 포그라운드 비트 스트림을 출력한다.
백그라운드 인코더(1140)는 백그라운드 이미지(180)를 인코드하도록 설계된다. 백그라운드는 백그라운드 화소들, 및 "돈 캐어(don't care)" 화소들(즉, 원래 포그라운드에 속하는 화소(들))로 이루어지는 이미지이다. 백그라운드 이미지 프로세서(1180)는 압축을 용이하게 하고 변경된 백그라운드 이미지를 백그라운드 인코더(1140)에 제공하는 값들로 "돈 캐어(don't care)" 화소들을 채우도록 사용될 수 있다. 예를 들면, 백그라운드 이미지(180)가 스무스 화이트 페이지(smooth white page)를 포함하는 경우에, 전체 백그라운드 이미지가 백색이 되도록, 텍스트가 있었던 위치에 배치되는 "돈 캐어(don't care)" 화소가 백색으로 채워질 수 있다. 백그라운드 인코더(1140)는 JPEG, 웨이브렛(wavelets), 또는 다른 이미지 압축 알고리즘 등의 이미지 압축에 효과적인 압축 기술(들)을 이용할 수 있다. 백그라운드 인코더(1140)는 백그라운드 비트 스트림을 출력한다.
예를 들면, "돈 캐어(don't care)" 화소들을 채우기 위한 간단한 알고리즘은 저주파 통과 필터로 이미지를 처리한 후, 중요한 화소들을 복구하는 것이다. 이들 2단계를 몇 번 반복한 후, "돈 캐어(don't care)" 화소들은 스무스한 천이(들)를 가능하게 하는 값들로 되어 압축이 잘 될 것이다. 이 알고리즘의 간단한 개량은, 초저주파 통과 필더로 시작해서 각 반복시 저주파 통과 필터의 차단 주파수를 증가시키는 것이다.
또한, 포그라운드 인코더(1130) 및/또는 백그라운드 인코더(1140)는 포그라운드 및/또는 백그라운드의 압축을 향상시키기 위해 마스크(120)를 이용할 수 있다. 다수의 인코더들 및/또는 디코더들은, 종속 발명과 관련되는 적어도 하나의 포그라운드 및 백그라운드의 화소 에너지 분산들의 최소화에 적어도 부분적으로 기초하여, 문서 이미지의 파티션에 적어도 부분적으로 기초하는 마스크를 이용한다는 것이 고려됨을 이해해야 한다. 본 발명과 관련되어 사용되기에 적합한 이러한 인코더 및/또는 디코더는 첨부된 클레임의 범위 내에 있도록 의도된다.
마스크 비트 스트림, 포그라운드 비트 스트림 및/또는 백그라운드 비트 스트림은 단일 비트 스트림으로 결합되거나 및/또는 예를 들어, 디코딩 시스템(도시하지 않음)에 개별적으로 전송될 수 있다. 디코딩 시스템은 마스크(120)를 얻기 위해 마스크 비트 스트림을 디코드할 수 있다. 대안적으로, 디코딩 시스템은 마스크(120)를 수신할 수 있다. 디코딩 시스템은 포그라운드 비트 스트림 및/또는 백그라운드 비트 스트림을 문서 이미지로 재결합하기 위해 마스크(120)를 이용할 수 있다.
본 발명의 시스템 및/또는 방법은 텍스트, 필기체, 도면 등의 식별 및 또는 압축을 용이하게 하는 전체 세그먼트된 계층화 이미지 시스템에서 이용될 수 있다. 또한, 당업자들은 본 발명의 시스템 및/또는 방법이 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA들, 팩스들, 디지탈 카메라들, 디지탈 비디오 카메라들 및/또는 비디오 게임 시스템들을 포함하지만 이에 한정되지 않는 문서 이미지 어플리케이션들의 방대한 어레이에 사용될 수 있다는 것을 알 것이다.
도 13을 참조하면, 세그먼트된 계층화 이미지 시스템(1300)이 설명된다. 시스템(1300)은 화소 에너지 컴포넌트(130) 및 마스크 저장 컴포넌트(150)를 포함한다.
화소 에너지 컴포넌트(130)는 문서 이미지의 영역에 대한 화소 에너지 분산들을 계산하도록 설계된다. 또한, 화소 에너지 컴포넌트(130)는 포그라운드 및 백그라운드 중 적어도 하나의 화소 에너지(즉, 분산들)의 최소화에 적어도 부분적으로 기초한 영역의 파티션을 계산하도록 더 설계되었다.
마스크 저장 컴포넌트(150)는 마스크의 파티션과 관련된 정보를 저장하도록 설계된다. 예를 들면, 시스템(1300)은 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA들, 팩스들, 디지탈 카메라들, 디지탈 비디오 카메라들 및/또는 비디오 게임 시스템들을 포함하지만 이에 한정되지 않는 문서 이미지 어플리케이션들의 방대안 여레이에 사용될 수 있다.
본 발명의 다양한 특징들에 추가의 환경을 제공하기 위해, 도 14 및 다음의 설명은, 본 발명의 다양한 특징들이 구현될 수 있는 하나의 가능하고 적합한 연산 환경(1410)에 대한 간단하고 일반적인 설명을 제공하도록 의도된다. 연산 환경(1410)은 하나의 가능한 연산 환경이지만 본 발명이 채용될 수 있는 연산 환경을 제한하도록 의도되지 않는다는 것을 이해해야 한다. 발명은 하나 이상의 컴퓨터에서 운영할 수 있는 컴퓨터 실행가능한 명령들의 일반적인 환경에서 설명되었지만, 본 발명은 다른 프로그램 모듈들의 조합으로 및/또는 하드웨어와 소프트웨어의 조합으로서 구현될 수도 있다는 것을 인식해야 한다. 일반적으로, 프로그램 모듈들은 특정 작업들을 수행하거나 특정 요약 데이터 타입을 구현하는, 루틴들, 프로그램들, 컴포넌트들, 데이터 구조들 등을 포함한다. 또한, 발명의 방법들은, 각각이 하나 이상의 관련 디바이스들과 동작적으로 결합될 수 있는 퍼스널 컴퓨터들, 핸드헬드(hand-held) 연산 디바이스들, 마이크로프로세서 기반의 또는 프로그램가능한 소비자 전자 기기 등 뿐만 아니라 단일 프로세서 또는 멀티 프로세서 컴퓨터 시스템, 미니컴퓨터들, 메인프레임 컴퓨터들을 포함하는 다른 컴퓨터 시스템 구성들에 실행될 수 있다는 것을 알 것이다. 본 발명의 예시된 특징들은 임의의 작업들이 통신 네트워크를 통해 링크되어 있는 리모트 프로세싱 디바이스들에 의해 수행되는 분산된 연산 환경들에서 실행될 수도 있다. 분산된 연산 환경에서는, 프로그램 모듈들이 로컬 및 리모트 메모리 기억 장치 모두에 배치될 수 있다.
도 14는 본 명세서에 기재된 시스템들 및 방법들을 지지하는 하나의 가능한 하드웨어 구성을 예시한다. 독립형 아키텍쳐가 예시되지만, 본 발명에 따라 임의의 적절한 연산 환경이 채용될 수 있다는 것을 이해해야 한다. 예를 들면, 독립형, 멀티프로세서, 분산형, 서버/클라이언트, 미니컴퓨터, 메인프레임, 수퍼컴퓨터, 디지털 및 아날로그를 포함하지만 이에 한정되지 않는 연산 아키텍쳐들이 본 발명에 따라 채용될 수 있다.
도 14를 참조하면, 본 발명의 다양한 특징들을 구현하는 예시적인 환경(1410)은 처리 유닛(1414), 시스템 메모리(1416), 및 시스템 메모리를 포함한 다향한 시스템 컴포넌트들을 처리 유닛(1414)에 결합시키는 시스템 버스(1418)를 포함하는 컴퓨터(1412)를 포함한다. 처리 유닛(1414)은 임의의 각종 상업적으로 유용한 프로세서들일 수 있다. 이중 마이크로프로세서들 및 다른 다중 프로세서들은 또한 처리 유닛(1414)으로서 사용될 수 있다.
시스템 버스(1418)는 메모리 버스 또는 메모리 컨트롤러, 주변 버스, 및 임의의 다양한 상업적으로 이용가능한 버스 아키텍쳐들을 이용하는 로컬 버스를 포함하는 여러 종류의 버스 구조들중 어느 것일 수 있다. 컴퓨터 메모리(1416)는 ROM(read only memory)(1420) 및 RAM(random access memory)(1422)를 포함한다.개시 동안과 같이, 컴퓨터(1412) 내의 소자들 사이의 정보를 전송하도록 돕는 기본적인 루틴을 포함하는, BIOS(basic input/output system)이 ROM(1420)에 저장되어 있다.
컴퓨터(1412)는 하드 디스크 드라이브(1424), 예를 들면 제거가능한 디스크(1428)로부터의 판독 또는 기입을 위한 자기 디스크 드라이브(1426), 및 CO-ROM 디스크(1424)를 판독하거나 다른 광학 매체로부터의 판독 또는 광학 매체로의 기입을 하는 광디스크 드라이브(1430)를 더 포함한다. 하드 디스크 드라이브(1424), 자기 디스크 드라이브(1426), 및 광디스크 드라이브(1430)은 하드 디스크 드라이브 인터페이스(1434), 자기 디스크 드라이브 인터페이스(1436), 및 광 드라이브 인터페이스(1438)에 의해 시스템 버스(1418)에 각각 접속된다. 컴퓨터(1412)는 일반적으로 컴퓨터 판독가능한 매체의 적어도 일부 형태를 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터(1412)에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있다. 제한되지 않는 예에 의하면, 컴퓨터 판독가능한 매체는 컴퓨터 기억 매체 및 통신 매체를 포함할 수 있다. 컴퓨터 기억 매체는 컴퓨터 판독가능한 명령들, 데이터 구조들, 프로그램 모듈들 또는 다른 데이터 등의 정보의 저장을 위한 임의의 방법 또는 기술에서 구현되는 휘발성과 비휘발성, 제거가능과 제거 불가능 매체를 포함한다. 컴퓨터 기억 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, DVD(digital versatile disks) 또는 다른 자기 기억 디바이스들, 또는 원하는 정보를 저장하는데 사용될 수 있고 컴퓨터(1412)에 의해 액세스될 수 있는 임의의 다른 매체들을 포함하지만, 이에 제한되지 않는다.통신 매체는 일반적으로 컴퓨터 판독가능한 명령들, 데이터 구조들, 프로그램 모듈들 또는 캐리어 웨이브 또는 다른 전송 메카니즘과 같이 변조된 데이터 신호의 다른 데이터를 구현하며, 임의의 정보 전달 매체를 포함한다. "변조된 데이터 신호(modulated data signal)"라는 용어는 신호의 정보를 인코드 하도록 설정되거나 변경된 그 특성들중 하나 이상을 갖는 신호를 의미한다. 제한되지 않는 예에 의하면, 통신 매체는 유선 네트워크 또는 직접 유선 접속과 같은 유선 매체, 및 아쿠스틱(acoustic), RF, 적외선 및 다른 무선 매체 등의 무선 매체를 포함한다. 상기한 것의 임의의 조합들도 컴퓨터 판독가능한 매체의 범위내에 포함되어야 한다.
다수의 프로그램 모듈들은 오퍼레이팅 시스템(1440), 하나 이상의 어플리케이션 프로그램들(1442), 다른 프로그램 모듈들(1444), 및 프로그램 비인터럽트 데이터(1446)를 포함한, 드라이버들과 RAM(1442)에 저장될 수 있다. 컴퓨터(1412)의 오퍼레이팅 시스템(1440)은 다수의 상업적으로 이용가능한 오퍼레이팅 시스템중 어느 것일 수 있다.
사용자는 키보드(1448) 및 마우스(1450) 등의 포인팅 디바이스(pointing device)를 통해 커맨드들과 정보를 컴퓨터(1412)에 입력할 수 있다. 다른 입력 디바이스들(도시하지 않음)은 마이크로폰, IR 리모트 컨트롤, 조이스틱, 게임 패드, 위성 접시, 스캐너 등을 포함할 수 있다. 이들 및 다른 입력 디바이스들은 종종 시스템 버스(1418)에 결합되는 직렬 포트 인터페이스(1452)를 통해 처리 유닛(1414)에 접속되지만, 병렬 포트, 게임 포트, USB(universal serial bus), IR 인터페이스 등의 다른 인터페이스들에 의해 접속될 수 있다. 모니터(1454), 또는다른 형태의 표시 디바이스는 또는 비디오 어댑터(1456) 등의 인터페이스를 통해 시스템 버스(1418)에 접속될 수 있다. 모니터에 부가하여, 컴퓨터는 일반적으로 스피커들, 프린터들 등의 다른 주변 출력 디바이스들(도시하지 않음)을 포함한다.
컴퓨터(1412)는 리모트 컴퓨터(들)(1458)와 같은 하나 이상의 리모트 컴퓨터들과의 논리적 및/또는 물리적 접속을 이용하여 네트워킹된 환경에서 동작할 수 있다. 리모트 컴퓨터(들)(1458)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 마이크로프로세서 기반의 오락 기기, 피어(peer) 디바이스 또는 다른 공통 네트워크 노드일 수 있지만, 설명의 편의상, 단지 메모리 기억 장치(1460)만이 예시되었지만 컴퓨터(1412)와 관련된 상기 소자들중 대다수 또는 모두를 포함할 수 있다. 설명된 논리적 접속들은 LAN(local area network)(1462) 및 WAN(wide area network)(1464)을 포함한다. 이러한 네트워킹 환경들은 오피스, 엔터프라이즈-와이드(enterprise-wide) 컴퓨터 네트워크들, 인트라넷들 및 인터넷에서 일반적이다.
LAN 네트워킹 환경에서 사용되는 경우, 컴퓨터(1412)는 네트워크 인터페이스 또는 어댑터(1466)를 통해 로컬 네트워크(1462)에 접속된다. WAN 네트워킹 환경에서 사용되는 경우, 컴퓨터(1412)는 일반적으로 모뎀(1468)을 포함하거나, LAN 상의 통신 서버에 접속되거나, 인터넷과 같이, WAN(1464)을 통한 통신들을 성립하는 다른 수단들을 갖는다. 내부 또는 외부에 있을 수 있는 모뎀(1468)은 직렬 포트 인터페이스(1452)를 통해 시스템 버스(1418)에 접속된다. 네트워킹된 환경에서, 컴퓨터(1412)와 관련하여 설명된 프로그램 모듈들, 또는 그 부분들은 리모트 메모리 기억 장치(1460)에 저장될 수 있다. 도시된 네트워크 접속들은 예시적이며, 컴퓨터들 사이의 통신 링크를 성립시키는 다른 수단들이 사용될 수 있다는 것을 이해해야 한다.
도 15는 본 발명이 상호작용할 수 있는 샘플 연산 환경(1500)의 개략적인 블록도이다. 시스템(1500)은 하나 이상의 클라이언트(들)(1510)을 포함한다. 클라이언트(들)(1510)는 하드웨어 및/또는 소프트웨어(예를 들면, 스레드들(threads), 프로세스들, 연산 디바이스들)일 수 있다. 시스템(1500)은 또한 하나 이상의 서버(들)를 포함한다. 서버(들)(1530)는 또한 하드웨어 및/또는 소프트웨어(예를 들면, 스레드들(threads), 프로세스들, 연산 디바이스들)일 수 있다. 서버들(1530)은 예를 들어 본 발명을 채용함으로써 수행되는 스레드들을 하우징(housing)할 수 있다. 클라이언트(1510)와 서버(1530) 사이의 하나의 가능한 통신은 두개 이상의 컴퓨터 프로세스들 사이에 전송되도록 설계된 데이터 패킷의 형태일 수 있다. 시스템(1500)은 클라이언트(들)(1510)와 서버(들)(1530) 사이의 통신들을 용이하게 하도록 채용될 수 있는 통신 프레임워크(1550)를 포함한다. 클라이언트(들)(1510)는 정보 로컬을 클라이언트(들)(1510)에 저장하도록 채용될 수 있는 하나 이상의 클라이언트 데이터 스토어(store)(들)에 동작가능하게 접속될 수 있다. 유사하게, 서버(들)(1530)는 정보 로컬을 서버(들)(1530)에 저장하도록 채용될 수 있는 하나 이상의 서버 데이터 스토어(들)에 동작가능하게 접속될 수 있다.
상기된 것은 본 발명의 예들을 포함한다. 물론, 본 발명의 기재를 위해 컴포넌트들 또는 방법들의 모든 생각할 수 있는 조합을 기재하는 것은 불가능하지만,당업자들은 본 발명의 많은 추가의 조합들 및 변형들이 가능하다는 것을 인식할 수 있다. 따라서, 본 발명은 첨부된 특허청구범위의 정신 및 범위에 속하는 모든 이러한 변경들, 수정들 및 변화들을 포함하도록 의도된다. 또한, 용어 "포함한다(include)"가 상세한 설명 및 특허청구범위에서 이용되는 경우에, 그러한 용어는 청구항에서 과도어로서 채용될 때 "포함하는(comprising)이 해석되는 것과 같이 용어 "포함하는(comprising)"과 유사한 방식으로 내포적인 것이다.
본 발명에 의하면, 일반적으로 문서 이미지의 포그라운드와 백그라운드를 분리하는 마스크를 이용하여 문서 이미지 압축을 용이하게 할 수 있다.

Claims (40)

  1. 문서 이미지의 영역에 대한 화소 에너지를 계산하고, 포그라운드(foreground)와 백그라운드(background) 중 적어도 하나의 화소 에너지의 최소화에 적어도 부분적으로 기초하여 영역의 파티션(partition)을 계산하기 위한 화소 에너지 컴포넌트(pixel energy component);
    화소 에너지의 최소화에 적어도 부분적으로 기초하여 문서 이미지의 영역들의 쌍들을 합병하는 영역 합병 컴포넌트(region merge component); 및
    상기 파티션과 관련된 정보를 마스크에 저장하기 위한 마스크 저장 컴포넌트(mask storage component)
    를 포함하는 세그먼트된 계층화 이미지 시스템(segmented layered image system).
  2. 제1항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 화소 에너지의 분산(variance)들을 계산하기 위해 다음 식들:
    여기서, F는 포그라운드,
    B는 백그라운드, f(x)는 화소의 값,
    는 포그라운드의 평균 화소값,
    는 백그라운드의 평균 화소값,
    NF는 포그라운드의 화소수, 및
    NB는 백그라운드의 화소수,
    을 이용하여 에너지 분산들을 계산하는 세그먼트된 계층화 이미지 시스템.
  3. 제1항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 화소 에너지의 계산을 위해 다음 식들:
    여기서, F는 포그라운드,
    B는 백그라운드, f(x,y)는 위치 x,y에서의 화소값,
    AF, BF, CF는 포그라운드 vF의 에너지를 최소화하기 위해 선택되고,
    AB, BB, CB는 백그라운드 vB의 에너지를 최소화하기 위해 선택됨,
    을 이용하여 에너지를 계산하는 세그먼트된 계층화 이미지 시스템.
  4. 제1항에 있어서, 상기 영역 합병 컴포넌트는 2개의 영역들의 포그라운드들과 백그라운드들의 조합들을 평가하고, 최소한의 누적 에너지(cumulative energy)와의 조합을 선택하는 세그먼트된 계층화 이미지 시스템.
  5. 제1항에 있어서, 상기 영역 합병 컴포넌트는 주어진 영역들에 대한 근사치 f에 기초하여, 2개의 영역들의 포그라운드들과 백그라운드들의 조합들의 제한된 서브세트를 평가하고, 최소한의 누적 에너지와의 조합을 선택하는 세그먼트된 계층화 이미지 시스템.
  6. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 사진 복사기.
  7. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 문서 스캐너.
  8. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 광학 문자 인식 시스템.
  9. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 PDA.
  10. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 팩스 장치.
  11. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 디지털 카메라.
  12. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 디지털 비디오 카메라.
  13. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 비디오 게임 시스템.
  14. 세그먼트된 계층화 이미지 시스템에서 사용되는 마스크를 생성하는 방법에 있어서,
    영역에 대한 화소 에너지를 계산하는 단계;
    상기 영역의 포그라운드와 백그라운드 중 적어도 하나의 계산된 화소 에너지에 적어도 부분적으로 기초하여 상기 영역을 분할하는 단계;
    상기 포그라운드와 상기 백그라운드 중 적어도 하나의 에너지의 최소화에 기초하여 영역들의 인접한 쌍들을 합병하는 단계; 및
    분할 정보를 마스크에 저장하는 단계
    를 포함하는 방법.
  15. 제14항에 있어서, 상기 영역에 대한 화소 에너지를 계산하는 단계는,
    포그라운드에 대한 화소값들의 합을 계산하는 단계;
    백그라운드에 대한 화소값들의 합을 계산하는 단계; 및
    상기 영역의 실질적으로 모든 화소들에 대한 거리의 제곱들의 합을 계산하는 단계를 더 포함하는 방법.
  16. 마스크 분리기 컴포넌트(mask separator component)에 있어서,
    문서 이미지의 영역에 대한 화소 에너지를 계산하고, 포그라운드 및 백그라운드 중 적어도 하나의 화소 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하기 위한 화소 에너지 컴포넌트;
    상기 병합된 영역이 제1 임계 에너지를 초과하는 지에 대한 결정에 적어도 부분적으로 기초하여 문서 이미지의 영역들의 쌍들을 합병하고, 상기 합병된 영역을 새로운 포그라운드와 새로운 백그라운드로 분할하기 위한 합병 영역 컴포넌트; 및
    상기 파티션과 관련된 정보를 마스크에 저장하기 위한 마스크 저장 컴포넌트
    를 포함하는 마스크 분리기 컴포넌트.
  17. 제16항에 있어서, 상기 문서 이미지는 문서의 YUV, RGB 및 바이너리 표시중 적어도 하나를 포함하는 마스크 분리기 컴포넌트.
  18. 제16항에 있어서, 상기 마스크는 상기 포그라운드와 상기 백그라운드의 파티션과 관련된 정보의 바이너리 표시인 마스크 분리기 컴포넌트.
  19. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 K-평균 클러스터링 알고리즘(K-means clustering algorithm)-여기서, K=2임-을 적어도 부분적으로 이용하여 영역에 대한 화소 에너지 분산들을 계산하는 마스크 분리기 컴포넌트.
  20. 제16항에 있어서, 상기 영역의 화소 에너지의 분산들을 계산하기 위해 다음 식들:
    여기서, F는 포그라운드,
    B는 백그라운드, f(x)는 화소값,
    는 포그라운드의 평균 화소값,
    는 백그라운드의 평균 화소값,
    NF는 포그라운드의 화소수, 및
    NB는 백그라운드의 화소수,
    을 이용하여 에너지 분산들을 계산하는 마스크 분리기 컴포넌트.
  21. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 화소 에너지의 계산과 관련된 정보의 적어도 일부를 적어도 일시적으로 저장하는 마스크 분리기 컴포넌트.
  22. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 다항식 회귀(polynomial regression)에 적어도 부분적으로 기초하여 상기 영역에 대한 화소 에너지를 계산하는 마스크 분리기 컴포넌트.
  23. 제16항에 있어서, 상기 영역 합병 컴포넌트의 분할은 상기 합병된 영역의 화소값들의 평균에 적어도 부분적으로 기초하는 마스크 분리기 컴포넌트.
  24. 제23항에 있어서, 상기 포그라운드에 할당되는 화소값은 평균보다 큰 마스크 분리기 컴포넌트.
  25. 제23항에 있어서, 상기 백그라운드에 할당되는 화소값은 평균보다 큰 마스크 분리기 컴포넌트.
  26. 제16항에 있어서, 문서 이미지는 YUV 표시이고 상기 화소 에너지 컴포넌트는 화소 에너지 계산시 적어도 상기 Y 성분을 이용하는 마스크 분리기 컴포넌트.
  27. 문서 이미지를 백그라운드와 포그라운드로 분할하는 마스크 생성 방법에 있어서,
    영역에 대한 화소 에너지를 계산하는 단계;
    상기 영역의 포그라운드와 백그라운드 중 적어도 하나의 계산된 화소 에너지에 적어도 부분적으로 기초하여 상기 영역을 분할하는 단계;
    새로운 포그라운드와 백그라운드에 관련된 임계 에너지가 상기 병합된 영역을 초과하지 않는다면 영역들의 인접한 쌍들을 합병하는 단계;
    상기 합병된 영역을 새로운 포그라운드와 새로운 백그라운드로 분할하는 단계; 및
    상기 분할 정보를 마스크에 저장하는 단계를 포함하는 방법.
  28. 제27항에 있어서, 상기 영역에 대한 화소 에너지를 계산하는 단계는,
    포그라운드에 대한 화소값들의 합을 계산하는 단계;
    백그라운드에 대한 화소값들의 합을 계산하는 단계; 및
    상기 영역의 실질적으로 모든 화소들의 거리들의 제곱의 합을 계산하는 단계를 포함하는 방법.
  29. 제27항에 있어서, 상기 영역에 대한 화소 에너지를 계산하는 단계는 상기 영역의 다항식 회귀(polynomial regression)에 적어도 부분적으로 기초하는 방법.
  30. 제27항에 있어서, 상기 영역을 분할하는 단계는 포그라운드와 백그라운드 중 적어도 하나의 화소 에너지를 최소화하는 단계를 더 포함하는 방법.
  31. 제27항에 있어서, 상기 합병된 영역을 분할하는 단계는 상기 합병된 영역의 화소값들의 평균을 계산하는 단계를 더 포함하는 방법.
  32. 제27항에 있어서, 상기 합병된 영역을 분할하는 단계는,
    상기 합병된 영역의 상기 포그라운드의 평균 화소값을 계산하는 단계;
    상기 합병된 영역의 상기 백그라운드의 평균 화소값을 계산하는 단계; 및
    상기 포그라운드의 평균 화소값과 상기 백그라운드의 평균 화소값 사이의 차가 제3 임계치보다 크면 화소들을 상기 포그라운드와 상기 백그라운드 중 하나에 할당하는 단계를 더 포함하는 방법.
  33. 제27항에 있어서, 상기 영역을 분할하는 단계는,
    상기 영역에 대한 에너지를 계산하는 단계; 및
    상기 에너지가 제2 임계 에너지보다 작으면 상기 영역의 화소들을 상기 포그라운드와 상기 백그라운드 중 하나에 할당하는 단계를 더 포함하는 방법.
  34. 문서 이미지를 수신하고 상기 문서 이미지의 변환된 표시를 출력하기 위한문서 변환 컴포넌트; 및
    상기 변환된 표시의 영역에 대한 화소 에너지를 결정하고 포그라운드와 백그라운드 중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 결정하기 위한 화소 에너지 컴포넌트를 포함하는 마스크 분리기 컴포넌트를 포함하고, 상기 마스크 분리기 컴포넌트는, 제1 임계 에너지가 초과되지 않았으면, 영역들의 쌍들을 합병하고 새로운 포그라운드와 새로운 백그라운드를 포함하는 화소들의 에너지의 최소화에 적어도 부분적으로 기초하여 합병된 영역들의 화소들을 새로운 포그라운드와 새로운 백그라운드로 분할하기 위한 합병 영역 컴포넌트를 더 포함하며, 상기 마스크 분리기 컴포넌트는, 마스크에 파티션 정보를 저장하기 위한 마스크 저장 컴포넌트를 더 포함하는 문서 이미지 압축 시스템.
  35. 제34항에 있어서, 상기 마스크에 저장된 정보에 적어도 부분적으로 기초하여 상기 변환된 표시를 포그라운드 이미지와 백그라운드 이미지로 분리하기 위한 포그라운드/백그라운드 세그멘터(segmenter) 컴포넌트를 더 포함하는 문서 이미지 압축 시스템.
  36. 제34항에 있어서, 포그라운드 인코더, 백그라운드 인코더 및 마스크 인코더중 적어도 하나를 더 포함하는 문서 이미지 압축 시스템.
  37. 제34항에 있어서, 상기 문서 변환 소자는 RGB 문서 이미지를 수신하고 상기 RGB 문서 이미지의 YUV 표시를 출력하기 위한 문서 이미지 압축 시스템.
  38. 2개 이상의 컴퓨터 프로세스들 사이에 전송되는데 적합한 데이터 패킷에 있어서,
    문서 이미지의 포그라운드와 백그라운드 중 적어도 하나에 화소들을 할당하고, 상기 문서 이미지의 영역 내의 화소들의 에너지의 최소화의 계산에 적어도 부분적으로 기초하는 마스크와 관련된 정보를 포함하는 데이터 패킷.
  39. 마스크 분리 컴포넌트에 대한 컴퓨터 사용가능한 컴포넌트들을 갖는 컴퓨터 판독가능한 매체에 있어서,
    문서 이미지의 표시의 영역에 대한 화소 에너지를 계산하고, 백그라운드와 포그라운드중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하기 위한 화소 에너지 컴포넌트;
    합병될 영역들이 임계 에너지를 초과하는지에 대한 결정에 적어도 부분적으로 기초하여 상기 문서 이미지의 표시의 영역들의 쌍들을 합병하고, 상기 포그라운드와 상기 백그라운드 중 적어도 하나의 화소들의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 합병된 영역을 포그라운드와 백그라운드로 분할하기 위한 합병 영역 컴포넌트; 및
    상기 포그라운드와 상기 백그라운드의 분할과 관련된 정보를 마스크에 저장하기 위한 마스크 저장 컴포넌트
    를 포함하는 컴퓨터 판독가능한 매체.
  40. 마스크 분리 컴포넌트(mask seperation component)에 있어서,
    문서 이미지의 표시의 영역에 대한 화소 에너지를 계산하는 수단;
    2개의 플레인(plane)들 중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하는 수단;
    합병될 상기 영역들이 임계 에너지를 초과하였는지에 대한 결정에 적어도 부분적으로 기초하여 상기 문서 이미지의 표시의 영역들의 쌍들을 합병하는 수단;
    상기 포그라운드와 상기 백그라운드 중 적어도 하나를 포함하는 화소들의 에너지의 최소화에 적어도 기본적으로 기초하여 영역들의 화소들을 포그라운드와 백그라운드들로 분할하는 수단; 및
    상기 파티션과 관련된 정보를 마스크에 저장하는 수단
    을 포함하는 마스크 분리 컴포넌트.
KR1020030018541A 2002-04-25 2003-03-25 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체 KR100937543B1 (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US10/133,558 2002-04-25
US10/133,842 US7263227B2 (en) 2002-04-25 2002-04-25 Activity detector
US10/133,939 2002-04-25
US10/133,558 US7164797B2 (en) 2002-04-25 2002-04-25 Clustering
US10/133,939 US7392472B2 (en) 2002-04-25 2002-04-25 Layout analysis
US10/133,842 2002-04-25
US10/180,771 2002-06-26
US10/180,771 US7110596B2 (en) 2002-04-25 2002-06-26 System and method facilitating document image compression utilizing a mask

Publications (2)

Publication Number Publication Date
KR20030084589A true KR20030084589A (ko) 2003-11-01
KR100937543B1 KR100937543B1 (ko) 2010-01-19

Family

ID=29554396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030018541A KR100937543B1 (ko) 2002-04-25 2003-03-25 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체

Country Status (7)

Country Link
US (2) US7110596B2 (ko)
EP (1) EP1388816B1 (ko)
JP (1) JP4295537B2 (ko)
KR (1) KR100937543B1 (ko)
CN (1) CN100470593C (ko)
ES (1) ES2600756T3 (ko)
TW (1) TWI244051B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US20040233477A1 (en) * 2003-05-21 2004-11-25 International Business Machines Corporation Digital halftoning
JP3738291B2 (ja) * 2003-06-09 2006-01-25 住友大阪セメント株式会社 三次元形状測定装置
US7202872B2 (en) * 2003-10-29 2007-04-10 Via Technologies, Inc. Apparatus for compressing data in a bit stream or bit pattern
FR2864857B1 (fr) * 2004-01-05 2006-03-03 Canon Kk Procede et dispositif d'optimisation de la taille d'un document numerique
US6992686B2 (en) * 2004-06-14 2006-01-31 Xerox Corporation System and method for dynamic control of file size
US7782339B1 (en) 2004-06-30 2010-08-24 Teradici Corporation Method and apparatus for generating masks for a multi-layer image decomposition
US8442311B1 (en) 2005-06-30 2013-05-14 Teradici Corporation Apparatus and method for encoding an image generated in part by graphical commands
US7616341B2 (en) * 2004-07-12 2009-11-10 Toshiba Corporation System and method for metadata controlled multi-configured halftone screening
AU2004242419A1 (en) * 2004-12-21 2006-07-06 Canon Kabushiki Kaisha Analysing digital image of a document page
US7567254B2 (en) * 2005-06-30 2009-07-28 Microsoft Corporation Parallel texture synthesis having controllable jitter
KR100708180B1 (ko) * 2005-09-22 2007-04-17 삼성전자주식회사 화상 압축 장치 및 방법
DE102006010763A1 (de) * 2006-03-08 2007-09-13 Netviewer Gmbh Hybrides Bildkompressionsverfahren
JP4764231B2 (ja) 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8175409B1 (en) 2006-12-01 2012-05-08 Adobe Systems Incorporated Coherent image selection and modification
US8004536B2 (en) * 2006-12-01 2011-08-23 Adobe Systems Incorporated Coherent image selection and modification
US7899247B2 (en) * 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
US7929729B2 (en) * 2007-04-02 2011-04-19 Industrial Technology Research Institute Image processing methods
KR101366596B1 (ko) 2007-08-03 2014-03-14 삼성전자주식회사 이차원 정지 화상에 대해 몰입감을 생성하는 방법 및시스템 그리고 상기 몰입감 생성을 위한 팩터 조절 방법,이미지 콘텐트 분석 방법 및 스케일링 파라미터 예측 방법
US7907778B2 (en) * 2007-08-13 2011-03-15 Seiko Epson Corporation Segmentation-based image labeling
US8391638B2 (en) 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US8204964B2 (en) 2008-08-06 2012-06-19 Microsoft Corporation Efficient size optimization of visual information or auditory information
US9355469B2 (en) 2009-01-09 2016-05-31 Adobe Systems Incorporated Mode-based graphical editing
CN101510304B (zh) * 2009-03-30 2014-05-21 北京中星微电子有限公司 一种分割获取前景图像的方法、装置和摄像头
WO2011005511A2 (en) * 2009-06-22 2011-01-13 Sony Corporation A method of compression of graphics images and videos
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
CN102474565B (zh) * 2009-09-09 2016-03-30 索尼公司 在无线hd1.1中用于图形模式压缩的比特流语法
WO2011068508A1 (en) * 2009-12-02 2011-06-09 Hewlett-Packard Development Company, Lp System and method of foreground-background segmentation of digitized images
US8582906B2 (en) * 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
CN102006473B (zh) * 2010-11-18 2013-03-13 无锡中星微电子有限公司 视频编码器和编码方法以及视频解码器和解码方法
US8965140B1 (en) * 2011-01-31 2015-02-24 Teradici Corporation Method and apparatus for encoding mixed content image sequences
US8891894B2 (en) * 2011-09-30 2014-11-18 Apple Inc. Psychovisual image compression
CN102890827B (zh) * 2011-10-09 2015-05-13 北京多看科技有限公司 一种扫描版文档重排版的方法
TWI479448B (zh) * 2012-07-06 2015-04-01 Univ Nat Taiwan 影像前處理方法及系統
US9460365B1 (en) * 2015-03-24 2016-10-04 Intel Corporation Clustered palette compression
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
US10922537B2 (en) * 2018-05-01 2021-02-16 Scribe Fusion, LLC System and method for processing and identifying content in form documents
CN108924557B (zh) * 2018-06-11 2022-02-08 海信视像科技股份有限公司 图像处理方法、装置、电子设备及存储介质
WO2020033967A1 (en) * 2018-08-10 2020-02-13 Buffalo Automation Group Inc. Training a deep learning system for maritime applications
CN111652144B (zh) * 2020-06-03 2023-09-26 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses
KR20210152992A (ko) * 2020-12-04 2021-12-16 한국전자통신연구원 이진 마스크를 사용하는 영상 인코딩/디코딩을 위한 방법, 장치 및 기록 매체
KR102595278B1 (ko) 2020-12-29 2023-10-27 부산대학교 산학협력단 표면결함검출 스캐너를 위한 이미지 데이터 저장 장치 및 방법

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3606546A (en) * 1969-05-13 1971-09-20 Dennison Mfg Co Photocopier
US3719922A (en) * 1971-06-24 1973-03-06 L Lopes Digital camera
FR2171518A5 (ko) * 1972-02-03 1973-09-21 Labo Electronique Physique
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
JPS60254871A (ja) 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
GB8525509D0 (en) 1985-10-16 1985-11-20 Int Computers Ltd Symbol pattern matching
EP0227848B1 (en) * 1985-12-17 1991-05-29 International Business Machines Corporation Image preprocessing procedure for noise removal
JP2675303B2 (ja) 1987-04-28 1997-11-12 キヤノン株式会社 文字認識方法
JPH0816918B2 (ja) 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US4924494A (en) * 1989-05-05 1990-05-08 Copam Electronics Corp. Fax machine equipped for simultaneous transmission and reception via two telephone lines
JPH0318986A (ja) 1989-06-15 1991-01-28 Ricoh Co Ltd 文字認識装置
JPH0832085B2 (ja) * 1989-10-18 1996-03-27 松下電器産業株式会社 表示機能付き選択呼出受信装置
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
JP2612383B2 (ja) 1991-02-19 1997-05-21 株式会社ピーエフユー 文字認識処理方式
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
US5598182A (en) * 1991-05-21 1997-01-28 Cambridge Animation Systems Limited Image synthesis and processing
US5434953A (en) * 1992-03-20 1995-07-18 Xerox Corporation Use of fast textured reduction for discrimination of document image components
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5454047A (en) * 1992-05-15 1995-09-26 Hughes Aircraft Company Optical method and system for generating expansion coefficients for an image processing function
US5721788A (en) * 1992-07-31 1998-02-24 Corbis Corporation Method and system for digital image signatures
US5402146A (en) * 1992-10-23 1995-03-28 International Business Machines Corporation System and method for video compression with artifact dispersion control
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
JP3422541B2 (ja) 1992-12-17 2003-06-30 ゼロックス・コーポレーション キーワードのモデル化方法及び非キーワードhmmの提供方法
US5384864A (en) 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
US5572604A (en) * 1993-11-22 1996-11-05 Lucent Technologies Inc. Method for pattern recognition using prototype transformations and hierarchical filtering
US5640468A (en) * 1994-04-28 1997-06-17 Hsu; Shin-Yi Method for identifying objects and features in an image
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
JP2630923B2 (ja) * 1994-12-05 1997-07-16 日本アイ・ビー・エム株式会社 画像認識方法及び装置
US5737455A (en) * 1994-12-12 1998-04-07 Xerox Corporation Antialiasing with grey masking techniques
DE4445386C1 (de) * 1994-12-20 1996-05-02 Ibm Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
US5572565A (en) * 1994-12-30 1996-11-05 Philips Electronics North America Corporation Automatic segmentation, skinline and nipple detection in digital mammograms
JP3640318B2 (ja) * 1995-09-01 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション ディジタル画像の符号化方法及びシステム
JP2761467B2 (ja) * 1995-03-29 1998-06-04 インターナショナル・ビジネス・マシーンズ・コーポレイション 画像切り出し装置及び文字認識装置
US5689585A (en) 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
US5883986A (en) 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
US5915044A (en) * 1995-09-29 1999-06-22 Intel Corporation Encoding video images using foreground/background segmentation
US5574511A (en) * 1995-10-18 1996-11-12 Polaroid Corporation Background replacement for an image
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
US6272253B1 (en) * 1995-10-27 2001-08-07 Texas Instruments Incorporated Content-based video compression
JP3756580B2 (ja) * 1995-11-07 2006-03-15 セイコープレシジョン株式会社 多層基板の製造方法及びその製造装置
US5828771A (en) * 1995-12-15 1998-10-27 Xerox Corporation Method and article of manufacture for determining whether a scanned image is an original image or fax image
JP2958396B2 (ja) * 1995-12-20 1999-10-06 富士ゼロックス株式会社 画像形成装置
US5910805A (en) * 1996-01-11 1999-06-08 Oclc Online Computer Library Center Method for displaying bitmap derived text at a display having limited pixel-to-pixel spacing resolution
US6345119B1 (en) * 1996-02-19 2002-02-05 Fujitsu Limited Handwritten character recognition apparatus and method using a clustering algorithm
US6901153B1 (en) * 1996-03-14 2005-05-31 Ati Technologies Inc. Hybrid software/hardware video decoder for personal computer
US5805739A (en) * 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
DE19615493A1 (de) 1996-04-19 1997-10-23 Philips Patentverwaltung Verfahren zur Bildsegmentierung
US6310972B1 (en) * 1996-06-28 2001-10-30 Competitive Technologies Of Pa, Inc. Shape adaptive technique for image and video compression
US5914748A (en) * 1996-08-30 1999-06-22 Eastman Kodak Company Method and apparatus for generating a composite image using the difference of two images
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5917964A (en) * 1996-12-23 1999-06-29 Lg Electronics, Inc. Method and apparatus for pre-processing image data of encoders
JP2836681B2 (ja) 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
US6108446A (en) * 1997-02-18 2000-08-22 Hoshen; Joseph Method and apparatus for extracting cluster shape features from digital images
US6321243B1 (en) * 1997-06-27 2001-11-20 Microsoft Corporation Laying out a paragraph by defining all the characters as a single text run by substituting, and then positioning the glyphs
US6108444A (en) 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
US5917951A (en) * 1997-10-03 1999-06-29 International Business Machines Corporation Clustered aperiodic mask
US6118890A (en) * 1997-11-12 2000-09-12 International Business Machines Corporation System and method for broad classification of biometric patterns
US6020972A (en) 1997-11-14 2000-02-01 Xerox Corporation System for performing collective symbol-based compression of a corpus of document images
US6144767A (en) * 1998-04-02 2000-11-07 At&T Corp Efficient convolutions using polynomial covers
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6285801B1 (en) * 1998-05-29 2001-09-04 Stmicroelectronics, Inc. Non-linear adaptive image filter for filtering noise such as blocking artifacts
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6072496A (en) * 1998-06-08 2000-06-06 Microsoft Corporation Method and system for capturing and representing 3D geometry, color and shading of facial expressions and other animated objects
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6233364B1 (en) * 1998-09-18 2001-05-15 Dainippon Screen Engineering Of America Incorporated Method and system for detecting and tagging dust and scratches in a digital image
US6326977B1 (en) * 1998-11-03 2001-12-04 Sharp Laboratories Of America, Inc. Rendering of YCBCR images on an RGS display device
EP1006714A3 (en) 1998-12-02 2001-09-19 Xerox Corporation Method of processing mixed raster content planes
US6564263B1 (en) * 1998-12-04 2003-05-13 International Business Machines Corporation Multimedia content description framework
JP2000175053A (ja) * 1998-12-07 2000-06-23 Xerox Corp 文書の圧縮ピクセルマップ表現を表す混合ラスタコンテントプレ―ンの処理方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6100825A (en) * 1998-12-31 2000-08-08 Microsoft Corporation Cluster-based data compression system and method
US6977664B1 (en) * 1999-09-24 2005-12-20 Nippon Telegraph And Telephone Corporation Method for separating background sprite and foreground object and method for extracting segmentation mask and the apparatus
JP3551908B2 (ja) 1999-09-24 2004-08-11 日本電信電話株式会社 背景スプライトと前景オブジェクトの分離方法、及びその装置
US6826727B1 (en) * 1999-11-24 2004-11-30 Bitstream Inc. Apparatus, methods, programming for automatically laying out documents
ATE509330T1 (de) 1999-12-04 2011-05-15 Luratech Imaging Gmbh Verfahren zur kompression von gescannten farb- und/oder graustufendokumenten
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
KR100337359B1 (ko) * 1999-12-15 2002-05-21 이계안 차량의 주행단 밀림 방지장치 및 그 제어방법
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
JP2001266158A (ja) 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
WO2001059576A1 (en) * 2000-02-12 2001-08-16 Adobe Systems Incorporated Text grid creation tools
JP2001256244A (ja) * 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
US6674900B1 (en) 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6738079B1 (en) * 2000-06-02 2004-05-18 Sun Microsystems, Inc. Graphical user interface layout customizer
US6975742B2 (en) * 2000-11-29 2005-12-13 Xerox Corporation Rate-distortion optimization system and method for image compression
US6839463B1 (en) * 2000-12-22 2005-01-04 Microsoft Corporation System and method providing subpixel-edge-offset-based determination of opacity
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법

Also Published As

Publication number Publication date
CN100470593C (zh) 2009-03-18
CN1458628A (zh) 2003-11-26
EP1388816A2 (en) 2004-02-11
EP1388816B1 (en) 2016-08-03
US7764834B2 (en) 2010-07-27
US20030202699A1 (en) 2003-10-30
ES2600756T3 (es) 2017-02-10
EP1388816A3 (en) 2005-11-16
TWI244051B (en) 2005-11-21
KR100937543B1 (ko) 2010-01-19
US7110596B2 (en) 2006-09-19
JP2003346166A (ja) 2003-12-05
JP4295537B2 (ja) 2009-07-15
TW200306501A (en) 2003-11-16
US20060274381A1 (en) 2006-12-07

Similar Documents

Publication Publication Date Title
KR100937543B1 (ko) 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체
JP4152789B2 (ja) クラスタリングシステムおよびクラスタリング方法
US7120297B2 (en) Segmented layered image system
JP4773678B2 (ja) 文書システム
US7397952B2 (en) “Don&#39;t care” pixel interpolation
US7343037B1 (en) Dynamic, locally-adaptive, lossless palettization of color and grayscale images
US7386166B2 (en) Systems and methods for connecting regions image data having similar characteristics
US5995665A (en) Image processing apparatus and method
US7386171B2 (en) Activity detector
US20050180647A1 (en) Systems and methods for organizing image data into regions
US20030202698A1 (en) Block retouching
US7206450B2 (en) Compression of bi-level images with explicit representation of ink clusters
JP4719924B2 (ja) 画像処理装置および画像処理方法
Malvar et al. Don't care” pixel interpolation
JPH0922462A (ja) 画像処理装置及びその方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141230

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20161220

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 11