JP4553241B2 - 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 - Google Patents
文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 Download PDFInfo
- Publication number
- JP4553241B2 JP4553241B2 JP2004211884A JP2004211884A JP4553241B2 JP 4553241 B2 JP4553241 B2 JP 4553241B2 JP 2004211884 A JP2004211884 A JP 2004211884A JP 2004211884 A JP2004211884 A JP 2004211884A JP 4553241 B2 JP4553241 B2 JP 4553241B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- character
- character direction
- rectangle
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
請求項2の発明は、請求項1記載の文字方向識別装置において、前記行内矩形の配置情報を固定段階に量子化する手段は、複数の配置情報をそれぞれ、又は複数の配置情報の任意の組合せを1つのパラメータで固定段階に量子化することを特徴とする文字方向識別装置である。
請求項3の発明は、請求項2記載の文字方向識別装置において、前記行内矩形の配置情報は、文字行内における行内矩形の始点の高さ、即ち前記文字行の下端から行内矩形の上端までの長さ、及び行内矩形の高さ、及び行内矩形の幅、及び行内矩形内の黒画素密度、及び隣接する行内矩形との距離であることを特徴とする文字方向識別装置である。
請求項4の発明は、請求項1乃至3のいずれかに記載の文字方向識別装置を備えた文書処理装置である。
請求項5の発明は、行切り出しを行った原稿画像の文字行の行内矩形の配置情報に基いて文書画像の文字方向を識別する装置のコンピュータを、前記行内矩形の配置情報を固定段階に量子化する手段と、前記量子化された配置情報にシンボルを付与して、行内矩形のシンボル系列を作成する手段と、基準文書画像から作成した所定文字方向毎の前記シンボル系列からシンボルの並びの組み合わせを作成し、前記並びの組み合わせが生起する生起確率を文字方向別に演算する手段と、前記文字方向別の生起確率を前記シンボルの並びの組み合わせと対応させたエヌグラムモデルを作成する手段と、前記エヌグラムモデルを記憶させる手段と、原稿画像について作成された前記シンボルの並びの組み合わせの行内における生起確率演算を、前記文字方向別に記憶された前記シンボルの当該並びの組み合わせ毎に、行う手段と、前記シンボルの並びの組み合わせの最大生起確率を求める手段と、文字方向別に演算された前記基準文書画像のシンボルの当該並びの組み合わせの生起確率のうち、最大の生起確率である文字方向を原稿画像の当該行の文字の方向と判断する手段と、前記各行毎の判断結果を1枚の原稿用紙全体で集計し、多数決で文字の方向を決定する手段、として機能させるためのプログラムである。
請求項6の発明は、請求項5記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
はじめに、本発明の文字方向識別手法の基本的概念を説明する。本発明では、行切り出しを行い、切り出し処理で既に求めている行内矩形の結果を用いて、行内矩形の始点の高さ、矩形サイズ(高さ、幅)、黒画素密度、隣接矩形との距離など配置に関する情報を量子化し、シンボルに変換した後、それらの並びの傾向を、文字方向毎に用意された訓練用データから、文字方向別に学習し、記録し、文字方向識別対象行に対して、文字方向別に学習した傾向を適用することによって、当該行の文字方向別の出現しやすさを評価し、文字方向を判定するものである。
図1は、本発明の実施形態に係る文字方向識別装置の要部構成図であり、図中、100は文字方向識別装置、1は該文字方向識別装置を制御するCPU、2はCPU1を起動するためのプログラムが記憶されるROM、3は不図示のスキャナにより読み取られた原稿画像又はパソコンで作成された原稿画像又は通信回線を通して送信された原稿画像を記憶するハードディスク形のメモリ、4は文字方向識別処理をするためにハードディスクメモリに記憶された原稿画像等を一時的に読み出して展開するRAM、5は基準となる言語毎の訓練用データについて求めた配置情報のトリグラム表を記憶する不揮発性メモリ(NVRAM)、6はオペレータが各種入力を行うキーボード、7は入力状況等を表示する表示装置、8はCD-ROM等に記憶された本発明を実行するためのプログラム等を入力するドライバ、9はインターネット、LAN等の電気通信回線を介して原稿画像を送受信する通信装置である。
いま、オペレータは、キーボード6から文字方向識別の指示を入力すると、CPU1は、不図示のスキャナから入力された文字方向識別用文書の原稿画像(図2(A))について、黒画素の連結成分を求め、それと外接する矩形11,12,13・・・を求める(図2(B))。求めた外接矩形を、近隣同士を連結して文字行20に成長させる(図2(C))。外接矩形の成長を水平方向及び垂直方向の両方で実施すれば、水平行と垂直行の両方が切り出される。この時点では文字方向は不明であるので、切り出された文字行の文字の外接矩形(以下、行内矩形)に対して文字方向識別処理を行い、文字方向を識別する。行内矩形の作成処理及び文字行の切出し処理自体は、公知の手法を使えばよいので詳細説明は省略する。
並び傾向を求める手法として、情報理論学者クロード・エルウッド・シャノン(Claude Elwood Shannon 1916-2001)が提唱したエヌグラム(N-gram)モデルを使用する。エヌグラムモデルは、「ある言語単位の系列の中で、言語単位のN個の並びの組み合わせが、どの程度出現するか」を求めるモデルである。
行内矩形の始点の高さ(Ys/H) →15段階、
行内矩形の高さ(h/H) →8段階、
行内矩形の幅(W/H)、 →2段階
のようにシンボル系列変換する。そして、
行内矩形の始点の高さ(Ys/H) 15段階 →4bits、
行内矩形の高さ(h/H) 8段階 →3bits、
行内矩形の幅(W/H) 2段階 →1bit
で処理する。4bits+3bits+1bit=8bitsであるから、1byteの各ビットに全情報を格納することができる。
Claims (6)
- 行切り出しを行った原稿画像の文字行の行内矩形の配置情報に基いて文書画像の文字方向を識別する装置において、
前記行内矩形の配置情報を固定段階に量子化する手段と、
前記量子化された配置情報にシンボルを付与して、行内矩形のシンボル系列を作成する手段と、
基準文書画像から作成した所定文字方向毎の前記シンボル系列からシンボルの並びの組み合わせを作成し、前記並びの組み合わせが生起する生起確率を文字方向別に演算する手段と、
前記文字方向別の生起確率を前記シンボルの並びの組み合わせと対応させたエヌグラムモデルを作成する手段と、
前記エヌグラムモデルを記憶する手段と、
原稿画像について作成された前記シンボルの並びの組み合わせの行内における生起確率演算を、前記文字方向別に記憶された前記シンボルの当該並びの組み合わせ毎に、行う手段と、
前記シンボルの並びの組み合わせの最大生起確率を求める手段と、
文字方向別に演算された前記基準文書画像のシンボルの当該並びの組み合わせの生起確率のうち、最大の生起確率である文字方向を原稿画像の当該行の文字の方向と判断する手段と、
前記各行毎の判断結果を1枚の原稿用紙全体で集計し、多数決で文字の方向を決定する手段を備えたことを特徴とする文字方向識別装置。 - 請求項1記載の文字方向識別装置において、
前記行内矩形の配置情報を固定段階に量子化する手段は、
複数の配置情報をそれぞれ、又は複数の配置情報の任意の組合せを1つのパラメータで固定段階に量子化することを特徴とする文字方向識別装置。 - 請求項2記載の文字方向識別装置において、
前記行内矩形の配置情報は、文字行内における行内矩形の始点の高さ、即ち前記文字行の下端から行内矩形の上端までの長さ、及び行内矩形の高さ、及び行内矩形の幅、及び行内矩形内の黒画素密度、及び隣接する行内矩形との距離であることを特徴とする文字方向識別装置。 - 請求項1乃至3のいずれかに記載の文字方向識別装置を備えた文書処理装置。
- 行切り出しを行った原稿画像の文字行の行内矩形の配置情報に基いて文書画像の文字方向を識別する装置のコンピュータを、
前記行内矩形の配置情報を固定段階に量子化する手段と、
前記量子化された配置情報にシンボルを付与して、行内矩形のシンボル系列を作成する手段と、
基準文書画像から作成した所定文字方向毎の前記シンボル系列からシンボルの並びの組み合わせを作成し、前記並びの組み合わせが生起する生起確率を文字方向別に演算する手段と、
前記文字方向別の生起確率を前記シンボルの並びの組み合わせと対応させたエヌグラムモデルを作成する手段と、
前記エヌグラムモデルを記憶させる手段と、
原稿画像について作成された前記シンボルの並びの組み合わせの行内における生起確率演算を、前記文字方向別に記憶された前記シンボルの当該並びの組み合わせ毎に、行う手段と、
前記シンボルの並びの組み合わせの最大生起確率を求める手段と、
文字方向別に演算された前記基準文書画像のシンボルの当該並びの組み合わせの生起確率のうち、最大の生起確率である文字方向を原稿画像の当該行の文字の方向と判断する手段と、
前記各行毎の判断結果を1枚の原稿用紙全体で集計し、多数決で文字の方向を決定する手段、
として機能させるためのプログラム。 - 請求項5記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004211884A JP4553241B2 (ja) | 2004-07-20 | 2004-07-20 | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
US11/183,852 US7580571B2 (en) | 2004-07-20 | 2005-07-19 | Method and apparatus for detecting an orientation of characters in a document image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004211884A JP4553241B2 (ja) | 2004-07-20 | 2004-07-20 | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006031546A JP2006031546A (ja) | 2006-02-02 |
JP4553241B2 true JP4553241B2 (ja) | 2010-09-29 |
Family
ID=35657194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004211884A Expired - Fee Related JP4553241B2 (ja) | 2004-07-20 | 2004-07-20 | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7580571B2 (ja) |
JP (1) | JP4553241B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4607633B2 (ja) * | 2005-03-17 | 2011-01-05 | 株式会社リコー | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
US7516130B2 (en) * | 2005-05-09 | 2009-04-07 | Trend Micro, Inc. | Matching engine with signature generation |
JP4869841B2 (ja) | 2006-03-14 | 2012-02-08 | 株式会社リコー | 画像処理装置、画像方向判別方法、および画像方向判別プログラム |
JP4957922B2 (ja) * | 2006-06-07 | 2012-06-20 | 日本電気株式会社 | 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム |
US20080225340A1 (en) * | 2007-03-14 | 2008-09-18 | Ricoh Company, Limited | Image processing apparatus, image processing method, and computer program product |
US8065321B2 (en) * | 2007-06-20 | 2011-11-22 | Ricoh Company, Ltd. | Apparatus and method of searching document data |
US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
US8208725B2 (en) * | 2007-06-21 | 2012-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
WO2009001462A1 (ja) * | 2007-06-28 | 2008-12-31 | Fujitsu Limited | スプレッドシート生成プログラム、該プログラムを記録した記録媒体、スプレッドシート生成装置、およびスプレッドシート生成方法 |
US8340430B2 (en) * | 2007-07-10 | 2012-12-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
US8023741B2 (en) * | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting numerals in a digital image |
US8023770B2 (en) * | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying the orientation of a digital image |
US8160365B2 (en) * | 2008-06-30 | 2012-04-17 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
US8214733B2 (en) * | 2010-04-28 | 2012-07-03 | Lexmark International, Inc. | Automatic forms processing systems and methods |
CN102194117B (zh) * | 2010-03-05 | 2013-03-27 | 北京大学 | 文稿页面方向检测方法和装置 |
JP5337194B2 (ja) * | 2011-04-25 | 2013-11-06 | シャープ株式会社 | 画像処理装置 |
CN102855477B (zh) * | 2011-06-29 | 2014-12-17 | 富士通株式会社 | 识别图像块中文字的方向的方法和装置 |
US9025877B2 (en) * | 2013-01-04 | 2015-05-05 | Ricoh Company, Ltd. | Local scale, rotation and position invariant word detection for optical character recognition |
US9076058B2 (en) | 2013-01-29 | 2015-07-07 | Sharp Laboratories Of America, Inc. | Methods, systems and apparatus for determining orientation in a document image |
US9478146B2 (en) * | 2013-03-04 | 2016-10-25 | Xerox Corporation | Method and system for capturing reading assessment data |
JP6116531B2 (ja) * | 2014-08-08 | 2017-04-19 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
US9852348B2 (en) * | 2015-04-17 | 2017-12-26 | Google Llc | Document scanner |
CN108564035B (zh) * | 2018-04-13 | 2020-09-25 | 杭州睿琪软件有限公司 | 识别单据上记载的信息的方法及*** |
CN109872310A (zh) * | 2019-02-01 | 2019-06-11 | 东莞中科蓝海智能视觉科技有限公司 | 工件漏线及表面字符方向检测识别方法 |
CN109815932B (zh) * | 2019-02-02 | 2021-05-28 | 杭州大拿科技股份有限公司 | 一种试卷批改方法、装置、电子设备及存储介质 |
CN113313117B (zh) * | 2021-06-25 | 2023-07-25 | 北京奇艺世纪科技有限公司 | 一种识别文本内容的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01177179A (ja) * | 1988-01-06 | 1989-07-13 | Toshiba Corp | 文字列読取装置 |
JPH04195485A (ja) * | 1990-11-28 | 1992-07-15 | Hitachi Ltd | 画像情報入力装置 |
JPH11219407A (ja) * | 1997-11-28 | 1999-08-10 | Fujitsu Ltd | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP2004046723A (ja) * | 2002-07-15 | 2004-02-12 | Ricoh Co Ltd | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2905927A (en) * | 1956-11-14 | 1959-09-22 | Stanley F Reed | Method and apparatus for recognizing words |
JPS63155386A (ja) * | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
JP2530393B2 (ja) | 1991-06-28 | 1996-09-04 | 三菱電機株式会社 | キ―ロックスイッチ |
US5276742A (en) * | 1991-11-19 | 1994-01-04 | Xerox Corporation | Rapid detection of page orientation |
US5675815A (en) * | 1992-11-09 | 1997-10-07 | Ricoh Company, Ltd. | Language conversion system and text creating system using such |
JP3471578B2 (ja) * | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
JP3835652B2 (ja) | 1997-09-10 | 2006-10-18 | 株式会社リコー | 文書画像の日本語英語判定方法および記録媒体 |
TW457458B (en) * | 1998-06-01 | 2001-10-01 | Canon Kk | Image processing method, device and storage medium therefor |
US6798905B1 (en) * | 1998-07-10 | 2004-09-28 | Minolta Co., Ltd. | Document orientation recognizing device which recognizes orientation of document image |
US6862113B1 (en) * | 2000-05-19 | 2005-03-01 | Xerox Corporation | Assist channel coding with character classifications |
US6920247B1 (en) * | 2000-06-27 | 2005-07-19 | Cardiff Software, Inc. | Method for optical recognition of a multi-language set of letters with diacritics |
US7738706B2 (en) * | 2000-09-22 | 2010-06-15 | Sri International | Method and apparatus for recognition of symbols in images of three-dimensional scenes |
US7508984B2 (en) | 2003-07-31 | 2009-03-24 | Ricoh Company, Ltd. | Language recognition method, system and software |
JP4678712B2 (ja) | 2003-07-31 | 2011-04-27 | 株式会社リコー | 言語識別装置、プログラム及び記録媒体 |
US7653244B2 (en) * | 2005-02-22 | 2010-01-26 | Potts Wesley F | Intelligent importation of information from foreign applications user interface |
-
2004
- 2004-07-20 JP JP2004211884A patent/JP4553241B2/ja not_active Expired - Fee Related
-
2005
- 2005-07-19 US US11/183,852 patent/US7580571B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01177179A (ja) * | 1988-01-06 | 1989-07-13 | Toshiba Corp | 文字列読取装置 |
JPH04195485A (ja) * | 1990-11-28 | 1992-07-15 | Hitachi Ltd | 画像情報入力装置 |
JPH11219407A (ja) * | 1997-11-28 | 1999-08-10 | Fujitsu Ltd | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP2004046723A (ja) * | 2002-07-15 | 2004-02-12 | Ricoh Co Ltd | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US7580571B2 (en) | 2009-08-25 |
JP2006031546A (ja) | 2006-02-02 |
US20060018544A1 (en) | 2006-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4553241B2 (ja) | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 | |
EP1703444B1 (en) | Detecting an orientation of characters in a document image | |
US6850645B2 (en) | Pattern recognizing apparatus | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
US6327388B1 (en) | Identification of logos from document images | |
JPH07200745A (ja) | 少なくとも二つのイメージセクションの比較方法 | |
JP2005242579A (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
JP3640573B2 (ja) | バーコード読取り方法及びバーコード読取りシステム | |
JPH076206A (ja) | 自動文字分類装置 | |
US20050027511A1 (en) | Language recognition method, system and software | |
US20010043742A1 (en) | Communication document detector | |
JP4678712B2 (ja) | 言語識別装置、プログラム及び記録媒体 | |
JP6624120B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JPH06103411A (ja) | 文書読取装置 | |
US20080225340A1 (en) | Image processing apparatus, image processing method, and computer program product | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
JPH08161432A (ja) | 文字切り出し方法および文字切り出し装置 | |
JP2578767B2 (ja) | 画像処理方法 | |
KR910007032B1 (ko) | 한글 문서 인식장치의 문자열과 개별문자 절출방법 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JPH0562021A (ja) | 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム | |
JP2752499B2 (ja) | 文字読取り装置 | |
JP4819661B2 (ja) | 方向判定装置、画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP2851102B2 (ja) | 文字切出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070518 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100708 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4553241 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |