KR940024626A - 자동문자 스크립트 판정방법 및 장치 - Google Patents

자동문자 스크립트 판정방법 및 장치 Download PDF

Info

Publication number
KR940024626A
KR940024626A KR1019940004752A KR19940004752A KR940024626A KR 940024626 A KR940024626 A KR 940024626A KR 1019940004752 A KR1019940004752 A KR 1019940004752A KR 19940004752 A KR19940004752 A KR 19940004752A KR 940024626 A KR940024626 A KR 940024626A
Authority
KR
South Korea
Prior art keywords
script
determining
feature
bounding box
spatial distribution
Prior art date
Application number
KR1019940004752A
Other languages
English (en)
Other versions
KR970002421B1 (ko
Inventor
스피쯔 로렌스
다비드 에이 훌
Original Assignee
가또 마사오
후지제록스 가부시끼가이샤
존. 이백
제록스 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가또 마사오, 후지제록스 가부시끼가이샤, 존. 이백, 제록스 코오포레이션 filed Critical 가또 마사오
Publication of KR940024626A publication Critical patent/KR940024626A/ko
Application granted granted Critical
Publication of KR970002421B1 publication Critical patent/KR970002421B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

자동 스크립트 판정장치는 문서의 원고화상의 그로스 스크립트형을 자동으로 판정한다. 연결요소 발생수단은 원고화상을 구성하는 화소들로부터 연결요소들을 발생한다. 경계박스 발생수단은 각각의 연결요소를 둘러싸는 경계박스를 발생한다.
중심판정수단은 각각의 경계박스마다 중심을 판정한다. 스크립트 특징 판정수단은 각각의 경계박스마다 하나 이상의 소정형의 특징들이 중심에 상관하는 위치들을 판정한다. 스크립트 판정수단은 전체 원고화상에 대해 위치된 스크립트 특징들의 분포를 판정하여 판정된 공간분포를 적어도 하나의 스크립트형에 대한 소정의 분포와 비교하여 원고화상의 스크립트형을 판정한다.

Description

자동문자 스크립트 판정방법 및 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 한쌍의 샘플원고 스크립트, 즉 로마어 스크립트와 아시아어 스크립트로 된 문서의 화상을 나타내는 도면, 제2도는 제1도에 보인 문서의 연결요소를 박스로 테두른 도면.

Claims (24)

  1. 문서상의 화상의 원고부분의 스크립트형을 판정하는 자동스크립트 판정장치에 있어서, 상기 문서를 주사하여 상기 문서상의 화상을 나타내며 또한 각 신호부분이 상기 화상의 복수의 화소들중 상응하는 것을 나타내는 데이타를 구성하는 복수의 신호부분들로 구성되는 디지탈 데이타 신호를 출력하는 스캐너와, 상기 디지탈 데이타 신호를 기억하기 위한 메모리와, 상기 화상의 원고부분의 스크립트형을 판정하기 위한 콘트롤러를 포함하되 상기 콘트롤러는 상기 복수의 신호부분들로부터 복수의 연결요소들을 판정하는 연결요소 발생수단과, 상기 복수의 연결요소들 개개마다 복수의 신호부분들 주위의 상응하는 경계박스를 판정하는 경계박스 판정수단과, 각각의 상응하는 경계박스의 중심을 판정하는 중심판정수단과, 각각의 상응하는 경계박스마다 적어도 하나의 소정형의 스크립트 특징에 상응하는 스크립트 특징을 위치시키는 특징판정수단과, 상기 위치된 스크립트 특징들의 공간분포를 판정하는 공간분포 판정수단과, 상기 판정된 공간분포를 상기 소정의 공간분포와 비교하는 비교수단과, 상기 문서의 판정된 스크립트형을 나타내는 신호를 출력하는 출력수단을 구비하는 것이 특징인 자동문자 스크립트 판정장치.
  2. 제1항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 적어도 하나의 요면체들, 블랙 패스들, 화이트 패스들, 블랙 및 화이트 패스들, 형상측정들, 연결요소 모집단들, 경계박스 종횡비, 경계박스영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  3. 제1항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 상향개방 요면체인 것이 특징인 자동문자 스크립트 판정장치.
  4. 제3항에 있어서, 상기 공간분포 판정수단은 각 상응하는 경계박스에 상관하는 원고부분의 상향개방요면체들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  5. 제3항에 있어서, 상기 공간분포 판정수단은 복수의 연결요소들중 상응하는 것의 중심에 상관하는 상향개방 요면체들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  6. 제1항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 블랙패스인 것이 특징인 자동문자 스크립트 판정장치.
  7. 제6항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소에 대해 상응하는 경계박스에 상관하는 블랙패스들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  8. 제7항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소의 중심에 상관하는 블랙패스들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  9. 제1항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소마다 상응하는 경계박스에 상관하는 적어도 하나의 소정의 스크립트 특징의 공간분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  10. 제9항에 있어서, 상기 공간분포 판정수단은 상응하는 연결요소의 중심에 상관하는 적어도 하나의 소정의 스크립트 특징의 공간분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
  11. 복수의 화소들을 포함하는 화상을 포함하며, 원고부분을 갖는 문서의 스크립트형을 판정하는 자동 스크립트 판정장치에 있어서, 원고부분을 나타내는 디지탈 데이타 신호를 입력하기 위한 수단으로서, 상기 디지탈 데이타 신호는 복수의 신호부분들을 포함하며, 각 신호부분은 상기 복수의 화소들중 하나에 상응하는 입력수단과, 상기 복수의 신호부분들로부터 복수의 연결요소들을 발생하기 위한 연결요소 발생수단과, 적어도 하나의 연결요소에 근거하여 적어도 하나의 소정형의 스크립트 특징에 상응하는 원고부분내의 스크립트 특징들을 확인하는 특징판정수단과, 상기 확인된 스크립트 특징들의 분포를 적어도 하나의 소정형의 스크립트 특징분포와 비교하여 그 비교결과에 따라 원고부분의 스크립트형을 판정하는 스크립트 판정수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  12. 제11항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들내의 상향개방 요면체들인 것이 특징인 자동문자 스크립트 판정장치.
  13. 제11항에있어서, 상기 특징판정수단은 복수의 연결요소들의 개개마다 복수의 신호부분들의 경계박스를 판정하는 경계박스 판정수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  14. 제13항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 경계박스들내의 블랙패스들인 것이 특징인 자동문자 스크립트 판정장치.
  15. 제13항에 있어서, 상기 특징판정수단은 각각의 경계박스마다 중심을 판정하는 중심판정수단과, 각각의 경계박스의 중심에 상관하는 각각의 경계박스내에 확인된 스크립트 특징들을 위치시키는 특징위치 수단을 더 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  16. 제15항에 있어서, 상기 스크립트 판정수단은 중심에 맞춰위치된 특징들의 공간분포를 판정하는 공간 분포 수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  17. 제16항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 상향개방 요면체들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  18. 제16항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 경계박스들내의 블랙패스들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  19. 제11항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 연결요소 요면체들, 블랙패스들, 화이트패스들, 블랙 및 화이트 패스들, 형상측정들 연결요소 모집단들, 경계박스 종횡비들, 경계박스 영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들중 적어도 하나를 포함하는 것이 특징인 자동문자 스크립트 판정장치.
  20. 문서의 원고부분의 스크립트형을 자동판정하는 방법에 있어서, 상기 원고부분을 포함하는 복수의 화소들로부터 복수의 연결요소들을 판정하는 단계와, 적어도 하나의 기선택된 스크립트형의 특징에 상응하는 복수의 연결요소들에 근거하여 원고부분의 스크립트 특징들의 위치들을 판정하는 단계와, 위치된 스크립트 특징들의 공간분포를 적어도 하나의 소정 스크립트 특징 공간분포와 비교하는 단계와, 상기 비교에 근거하여 상기 스크립트형을 판정하는 단계를 포함하는 것이 특징인 자동문자 스크립트 판정방법.
  21. 제20항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징은 복수의 연결요소들내의 상향개방 요면체들인 것이 특징인 자동문자 스크립트 판정방법.
  22. 제20항에 있어서, 상기 스크립트 특징의 위치들을 판정하는 단계는 상기 복수의 연결요소들 각각마다 상기한 연결요소를 둘러싸는 상응하는 경계박스를 판정하는 단계와, 각각의 상응하는 경계박스마다 중심을 판정하는 단계와, 상기 상응하는 경계박스의 중심에 상관하는 복수의 연결요소들 각각마다의 스크립트 특징들을 위치시키는 단계를 포함하는 것이 특징인 자동문자 스크립트 판정방법.
  23. 제22항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징은 각각의 경계박스내의 블랙패스인 것이 특징인 자동문자 스크립트 판정방법.
  24. 제20항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징으로서, 연결요소 요면체들, 블랙패스들, 화이트패스들, 블랙 및 화이트 패스들, 형상측정들, 연결요소 모집단들, 경계박스 종횡비들, 경계박스영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들을 포함하는 구룹으로부터 적어도 하나의 스크립트 특징을 선택하는 단계를 더 포함하는 것이 특징인 자동문자 스크립트 판정방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940004752A 1993-04-19 1994-03-11 자동문자 스크립트 판정방법 및 장치 KR970002421B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/047,515 1993-04-19
US8/047,515 1993-04-19
US08/047,515 US5444797A (en) 1993-04-19 1993-04-19 Method and apparatus for automatic character script determination

Publications (2)

Publication Number Publication Date
KR940024626A true KR940024626A (ko) 1994-11-18
KR970002421B1 KR970002421B1 (ko) 1997-03-05

Family

ID=21949410

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940004752A KR970002421B1 (ko) 1993-04-19 1994-03-11 자동문자 스크립트 판정방법 및 장치

Country Status (6)

Country Link
US (1) US5444797A (ko)
EP (1) EP0621552B1 (ko)
JP (1) JPH0721320A (ko)
KR (1) KR970002421B1 (ko)
DE (1) DE69423926T2 (ko)
TW (1) TW248600B (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69435214D1 (de) * 1993-12-10 2009-08-06 Ricoh Kk Verfahren zur Bilderkennung und zum Herausziehen und Erkennen eines spezifizierten Bildes aus einem Bildeingabesignal
US5699453A (en) * 1994-09-30 1997-12-16 Xerox Corporation Method and apparatus for logically tagging of document elements in the column by major white region pattern matching
US5757963A (en) * 1994-09-30 1998-05-26 Xerox Corporation Method and apparatus for complex column segmentation by major white region pattern matching
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法
DE69604481T2 (de) * 1995-01-31 2000-03-30 United Parcel Service Of America, Inc. Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
US5844991A (en) * 1995-08-07 1998-12-01 The Regents Of The University Of California Script identification from images using cluster-based templates
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
JP2738383B2 (ja) * 1996-02-29 1998-04-08 日本電気株式会社 宛名読み取り装置
US5955506A (en) * 1996-04-03 1999-09-21 Centaur Pharmaceuticals, Inc. Benzamides for neurodegenerative disorder treatment
US5909510A (en) * 1997-05-19 1999-06-01 Xerox Corporation Method and apparatus for document classification from degraded images
US6005986A (en) * 1997-12-03 1999-12-21 The United States Of America As Represented By The National Security Agency Method of identifying the script of a document irrespective of orientation
US6064767A (en) * 1998-01-16 2000-05-16 Regents Of The University Of California Automatic language identification by stroke geometry analysis
JP4320064B2 (ja) * 1998-07-10 2009-08-26 富士通株式会社 画像処理装置及び記録媒体
EP1393189A4 (en) 2001-05-02 2007-06-13 Bitstream Inc METHODS, SYSTEMS AND PROGRAMMING FOR DISPLAYING REDUCED CONTENTS USING A VARIABLE SCALE FACTOR
DE10126835B4 (de) * 2001-06-01 2004-04-29 Siemens Dematic Ag Verfahren und Vorrichtung zum automatischen Lesen von Adressen in mehr als einer Sprache
US7020338B1 (en) 2002-04-08 2006-03-28 The United States Of America As Represented By The National Security Agency Method of identifying script of line of text
US20040183817A1 (en) * 2002-12-03 2004-09-23 Bitstream Inc. Methods, systems, and programming for scaled display of web pages
US7512273B2 (en) * 2004-10-21 2009-03-31 Microsoft Corporation Digital ink labeling
JP2006253842A (ja) 2005-03-08 2006-09-21 Ricoh Co Ltd 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法
US7796837B2 (en) * 2005-09-22 2010-09-14 Google Inc. Processing an image map for display on computing device
JP5139716B2 (ja) * 2007-05-16 2013-02-06 キヤノン株式会社 画像検索装置及び画像検索方法
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8744171B1 (en) 2009-04-29 2014-06-03 Google Inc. Text script and orientation recognition
US7965894B2 (en) * 2009-06-30 2011-06-21 Konica Minolta Systems Laboratory, Inc. Method for detecting alterations in printed document using image comparison analyses
US8151186B1 (en) * 2011-03-11 2012-04-03 Google Inc. Comparing text pages using image features based on word positions
US20170068868A1 (en) * 2015-09-09 2017-03-09 Google Inc. Enhancing handwriting recognition using pre-filter classification

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
JPS5837779A (ja) * 1981-08-31 1983-03-05 Ricoh Co Ltd 文書処理装置
JPS58222384A (ja) * 1982-06-18 1983-12-24 Ricoh Co Ltd フオント識別方式
JPS5960574A (ja) * 1982-09-30 1984-04-06 Fujitsu Ltd 文字認識方式
US4802230A (en) * 1987-03-13 1989-01-31 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
US5181259A (en) * 1990-09-25 1993-01-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration General method of pattern classification using the two domain theory
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
JPH0540846A (ja) * 1991-08-06 1993-02-19 Oki Electric Ind Co Ltd 文書画像の和文・欧文判定方法

Also Published As

Publication number Publication date
JPH0721320A (ja) 1995-01-24
KR970002421B1 (ko) 1997-03-05
DE69423926D1 (de) 2000-05-18
EP0621552A2 (en) 1994-10-26
EP0621552B1 (en) 2000-04-12
US5444797A (en) 1995-08-22
DE69423926T2 (de) 2000-08-17
TW248600B (ko) 1995-06-01
EP0621552A3 (en) 1995-05-17

Similar Documents

Publication Publication Date Title
KR940024626A (ko) 자동문자 스크립트 판정방법 및 장치
KR960015594B1 (ko) 아시아어 자동판정방법 및 장치
US4300123A (en) Optical reading system
KR100394202B1 (ko) 화상 보정 장치
US5642202A (en) Scan image target locator system for calibrating a printing system
JP2000196879A (ja) 画像パラメ―タを表示する方法および装置
KR920005020A (ko) 수서 정보의 기계적 판독을 위한 개선된 분할 프로세스
US5659404A (en) Image reading apparatus for reading book-like documents
KR960002545B1 (ko) 프린트기판상의 랜드의 최소고리폭 검사 방법 및 장치
KR100668029B1 (ko) 탄성 모델을 이용한 인쇄 품질의 자동 검사 방법
EP0719032A2 (en) Apparatus for reading image and method therefor
JP5757931B2 (ja) 画像処理装置および画像読取装置
US5034825A (en) High quality image scanner
KR100260923B1 (ko) 화상의 국부 이치화 장치 및 방법
Boiangiu et al. Target Validation and Image Color Calibration
JPH0480885A (ja) カラー画像形成装置
JPS6310277A (ja) 画質検査装置
JPS6343037B2 (ko)
JPH04331563A (ja) 画像読み取り装置
KR930000935A (ko) 패턴 인식 장치
JPS63179748A (ja) 階調記録方式
KR970019538A (ko) 칼라 디스플레이의 색번짐 식별방법 및 상기 방법에 의한 자동식별장치
JPS63215262A (ja) 画像入力装置
JPH0199370A (ja) 読取部汚れ検出回路
JPS6032474A (ja) 画像処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20000222

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee