JP2001351089A - 画像管理装置および画像管理方法 - Google Patents

画像管理装置および画像管理方法

Info

Publication number
JP2001351089A
JP2001351089A JP2000174017A JP2000174017A JP2001351089A JP 2001351089 A JP2001351089 A JP 2001351089A JP 2000174017 A JP2000174017 A JP 2000174017A JP 2000174017 A JP2000174017 A JP 2000174017A JP 2001351089 A JP2001351089 A JP 2001351089A
Authority
JP
Japan
Prior art keywords
image
data
area
arrangement
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000174017A
Other languages
English (en)
Other versions
JP4480109B2 (ja
JP2001351089A5 (ja
Inventor
Makoto Takaoka
真琴 高岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000174017A priority Critical patent/JP4480109B2/ja
Publication of JP2001351089A publication Critical patent/JP2001351089A/ja
Publication of JP2001351089A5 publication Critical patent/JP2001351089A5/ja
Application granted granted Critical
Publication of JP4480109B2 publication Critical patent/JP4480109B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 管理される画像に関連する種々の情報を有効
に活用すること。 【解決手段】 画像を管理するために、所定の分類毎に
前記画像に含まれる各領域を識別し(103)、各々の
前記領域の内容を示す領域データを生成し(105−1
07)、前記画像中の、各々の前記領域の配置を示す配
置データを生成し(103)、各々の前記領域データと
前記配置データとを関連付けて保存する(110)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書等を示す画像
の管理に関する。
【0002】
【従来の技術】従来、紙文書を電子化して、文書画像デ
ータとして保存する場合は、ドキュメントスキャナ等で
スキャンして画像データを作成して保存する方法が採用
されている。この場合、文書画像データはデータ容量が
大きい場合が多いため、必要に応じて圧縮処理を施して
保存することも行われている。
【0003】ここで、ドキュメントスキャナの1度のス
キャンで作成される文書画像データを1ファイルとした
ときに、1つの紙文書から作成されるファイルは、通
常、複数にわたり、データベース管理されるのが一般的
であった。いわゆる文書データベースである。
【0004】データベースを用いると文書画像データの
ファイル1つ1つにキーワードを付加することができ、
検索に利用することができる。しかしながら、画像を丸
ごと保管し、キーワードを付加する作業は、かなり面倒
な作業であった。そこで、文書画像データを文字認識処
理し、全文検索可能な形式にし、これと文書画像データ
を共に管理保管する方法も提案されている。
【0005】図2は、文書画像データをデータベースに
登録保存する従来の処理の流れを示した図である。
【0006】図2(a)は、文書画像データに、キーワ
ードを付加してデータベースに登録する手法を採用した
従来の処理の流れを示した図である。紙文書201は、
202で、スキャナによって文書画像データ化される。
文書画像データ化されたファイルは、203でキーワー
ドが付加され、204で、データベースに登録および保
管される。データベース205の中には、キーワードを
保存するインデックス(206)と文書画像データの実
体(207)とが保管される。
【0007】一方、上述した処理では、キーワード入力
(203)の作業が面倒なため、図2(b)に示すよう
な文字認識を利用したデータベースへの登録も提案され
ている。この文字認識を利用する方法では、文字コード
がそのままキーワードと同じような役割を果たし、全文
検索による検索も可能となる。
【0008】図2(b)の210および211は、図2
(a)の201および202に示すものと同様である。
212では、文字認識処理が行われ、文書画像データ中
のテキスト(TEXT)コードが抽出され、文字コード
インデックス(216)が作成される。その後、213
で、文字コードインデックス(216)および文書画像
データ(217)が、データベースに登録・保管され
る。
【0009】キーワードインデックス215を利用する
場合と同様に、データベース214中に保存された文字
コードインデックス216を利用することにより、文書
画像データ217を特定することが可能であるため、利
用者は、キーワードインデックス215の入力なしで
も、文字コードインデックス216により検索が可能と
なった。
【0010】また、図2(a)または(b)に示す方法
によらず、通常のファイル保管方法でフォルダに保存す
る場合は、キーワードや文字コードのインデックスを付
したファイルの保管とはならないことから、保管するフ
ァイルについてTEXT形式のものも作成し、双方のフ
ァイルに実質的に同じ名前のファイル名を付し、同じ場
所に保存するなどの方法も提案されている。
【0011】このように、従来の文書画像の管理手法で
は、画像データのみならず、その検索等のために利用す
る種々の情報を画像データと共に管理されている。
【0012】
【発明が解決しようとする課題】しかしながら、従来の
文書画像データをデータベースに保存する方法では、登
録の際に、わざわざキーワードや文字認識によるコード
情報を付加しても、所望の実体の検索や取出後に、これ
らの付加情報を文書画像データの実体に添付することが
できないという問題があった。そのため、付加情報を別
ファイル中に取り込み、文書画像データにその付加情報
を含む別ファイルを添付して渡す方法がとられ、管理が
煩雑になっていた。
【0013】また、単にフォルダに保存した場合も、文
書の実体と付加情報が別々に管埋され、検索や所望の実
体の取出後に、文書画像データが引き渡されるのみで、
せっかく付加した情報は捨てられてしまうという問題が
あった。
【0014】要するに、従来の手法では、画像データの
管理のために作成された種々の情報を有効活用できない
という問題があった。
【0015】従って、本発明の目的は、管理される画像
に関連する種々の情報を有効に活用し得る画像管理装
置、画像管理方法及び記録媒体を提供することである。
【0016】
【課題を解決するための手段】本発明によれば、画像を
管理するための画像管理装置であって、所定の分類毎に
前記画像に含まれる各領域を識別し、各々の前記領域の
内容を示す領域データを生成する手段と、前記画像中
の、各々の前記領域の配置を示す配置データを生成する
手段と、各々の前記領域データと前記配置データとを関
連付けて保存する保存手段と、を備えたことを特徴とす
る画像管理装置が提供される。
【0017】また、本発明によれば、画像を管理するた
めの画像管理方法であって、所定の分類毎に前記画像に
含まれる各領域を識別し、各々の前記領域の内容を示す
領域データを生成する工程と、前記画像中の、各々の前
記領域の配置を示す配置データを生成する工程と、各々
の前記領域データと前記配置データとを関連付けて保存
する保存工程と、を含むことを特徴とする画像管理方法
が提供される。
【0018】また、本発明によれば、画像を管理するた
めに、コンピュータを、所定の分類毎に前記画像に含ま
れる各領域を識別し、各々の前記領域の内容を示す領域
データを生成する手段、前記画像中の、各々の前記領域
の配置を示す配置データを生成する手段、各々の前記領
域データと前記配置データとを関連付けて保存する保存
手段、として機能させるプログラムを記録した記録媒体
が提供される。
【0019】
【発明の実施の形態】以下、本発明の好適な実施の形態
について、添付図面を参照して説明する。
【0020】図1は、本発明の一実施形態に係るドキュ
メント管理装置の一部を示すブロック図である。この装
置において、保存管理の対象である文書画像データは、
画像解析がなされ、解析で得られた情報がレイヤ形式の
管理情報として付加される。以下、更に詳細に説明す
る。
【0021】101は、紙文書等を読取り文書画像デー
タを作成するスキャナである。この文書画像データは、
読み取られ紙文書の1または複数ページからなるデータ
を含むことができる。
【0022】文書画像データは、圧縮処理部104にお
いて、画像圧縮される。画像圧縮の方法には、例えば、
多値画像の場合は、JPEG圧縮を用いることができ、
また、2値画像の場合は、MMR圧縮を用いることがで
きるが、他の方法でも問題はない。圧縮された文書画像
データは、メモリ110に保存される。
【0023】ここで、本実施の形態においては、画像デ
ータ及びこれに関連するデータを特定の形式(以下、P
AF(Page Analysis Format)ともいう。)で保存す
る。そして、全体を示す文書画像データは、メモリ11
0上に構成された全体画像保存レイヤに保存される。
【0024】なお、本実施形態においては、文書画像デ
ータを圧縮部104において圧縮して保存することとし
たが、圧縮せずに原画像データのままで保存してもよ
い。この際、データ量が多い場合は、実体データを別の
メモリに保存し、メモリ110には、その実体データの
場所を特定するリンク情報のみを保存するようにしても
よい。
【0025】2値化処理部102では、文書画像のデー
タが多値画像データの場合に2値化処理を行う。これ
は、引きつづき処理されるレイアウト解析、文字認識処
理のために行われるものである。この2値化処理の目的
は、画質を向上させることを直接の目的とするのではな
く、文書画像に含まれるテキスト部分やピクチャ部分を
際立たせることである。2値化の処理として、例えば、
多値画像の濃度の平均値を算出し、最適なレベルで2値
化を行う方式を用いる。
【0026】レイアウト解析部103では、2値化処理
部102から出力された文書画像データを解析し、所定
の分類毎に文書画像に含まれる各領域を識別し、各領域
の画像データについての情報を作成する。本実施形態で
は、例えば、テキスト領域、表領域、ピクチャー(絵、
図形、写真等を含む)領域、及び、枠(フレーム)領域
を識別し、各領域の画像データについての情報を作成す
る。領域の分類の識別はこれに限られず、例えば、文書
画像中のタイトルが表示された領域を、タイトル領域と
して識別することもできる。
【0027】また、このレイアウト解析により得られた
情報(各領域の配置情報を含む。以下、レイアウト解析
情報という。)を作成し、これを、メモリ110のレイ
アウト情報レイヤに格納する。レイアウト解析部103
での処理には、公知の輪郭線追跡手法などによる処理が
適用でき、分類・領域識別が可能である。
【0028】文字認識処理部105では、テキスト領域
と識別された領域の画像に含まれる文字を認識するため
の文字認識処理を行う。認識されたテキストデータは、
メモリ110のテキスト&ベクトル保存レイヤに保存さ
れる。
【0029】表解析処理部106では、表領域と判別さ
れた領域に対して表解析を行う。表解析処理とは、表領
域と識別された領域の画像に含まれる表を解析する処理
であって、例えば、(1)表構造の解析(例えば、行数
X、列数Yからなる表の構成)(2)表の枠線の認識、
(3)表内セルの解析などの処理を行い、表解析情報を
出力する処理である。この表解析情報のうち、表の構造
に関する情報は、メモリ110のレイアウト情報レイヤ
に、表中の文字に関する情報はメモリ110のテキスト
&ベクトル保存レイヤに保存される。ここで、レイアウ
ト情報レイヤとテキスト&ベクトルレイヤは、別のレイ
ヤではあるが、リンクで密接に結びつけられ、関連付け
られている。
【0030】線画像ベクトル変換部107では、レイア
ウト解析部103で、フレームと呼ばれる大きな枠を含
む領域が認識された場合、その枠を表わすデータを所定
の形式のベクトルデータ化する処理(ベクトル変換とも
いう。)を行う。
【0031】例えば、枠が四角形の場合は、四角形の4
隅の位置座標を4つのベクトルに変換する処理を行う。
ただし、角が丸みをおびているなどの所定の場合には、
4つ以上のベクトル情報に変換することもある。この点
を図4を用いて説明する。
【0032】図4の402は、直線の枠で囲まれた線画
である。この枠をベクトル変換すると404に示したよ
うに4辺で囲まれた枠は、4つのベクトルの情報に変換
される。また、403に示すような4隅が内側に曲がっ
ている枠の場合は、405に示すように8つのベクトル
情報に変換される。この処理(上述の8つのベクトル情
報に変換する処理)は、実際には、画像の枠領域に対し
て輪郭線追跡処理を行い、その情報に基づき、4隅のベ
クトルを追加して持つか否かを判断し、追加するとした
場合にこの処理が行われる。その他、線画像ベクトル変
換部は、文書画像データ中の一般の線画もベクトル変換
される場合、これら線画像のベクトル情報も、フレーム
の情報同様に、領域の配置に関する情報はレイアウト情
報レイヤ、ベクトル情報はテキスト&ベクトル保存レイ
ヤに保存される。
【0033】部分画像切り出し部108では、レイアウ
ト解析処理部103での処理において認識された各領域
について文書画像データの切り出しが行われ、その領域
の分類にマッチした画像圧縮がなされる。
【0034】例えば、ピクチャ領域の画像データであっ
て、オリジナルの画像データ101が多値の場合、多値
画像圧縮であるJPEGが選択され、テキスト領域の場
合、多値よりも2値の画像データとして保持した方が好
都合の場合が多く、2値画像データとし、MMR圧縮を
行い、保存することができる。このように各分類別に適
応的に圧縮を行う。最も圧縮の方法は限定されない。
【0035】圧縮の結果得たデータは、メモリ110の
部分画像保存レイヤに保持する。
【0036】上述の各部での処理により、メモリ110
上にレイヤ構成をもつ文書画像データに関する情報が一
つのファイルとして保存される。
【0037】この情報の作成において、所定の場合に
は、特定のレイヤについての情報を削除することができ
る。例えば、全体画像のデータと部分画像のデータと
は、実質的に同じ情報を重複して持つこととなるため、
文書画像がテキストや表を含むものではなく、複数のピ
クチャから構成される場合は、全体画像を削除して、部
分画像のみを保存するのでも良い。一方、全体画像が複
数のテキスト領域から構成される場合は、テキストデー
タも保存するため、情報の形態が異なり、重複して持っ
ても左程無駄ではない。
【0038】以上述べた本実施の形態に係るレイヤ構成
をとることにより、所定のレイヤ毎に必要な情報を保持
することが可能となった。これは、本レイヤ構造をとる
場合の特徴である。図1の111は、そのレイヤ構成が
視覚的に分かるように、レイヤ構成を模式的に示した図
である。
【0039】次に、図5を用いて、保存される情報につ
いて、さらに詳細に説明する。
【0040】文書画像データ501の全体に対してレイ
アウト解析を行うと、タイトル(TITLE)、テキスト(T
EXT)、ピクチャ(PICTURE)という分類毎の領域を識別
する。それぞれの領域のデータは、502に示された木
構造でデータ保存される。各領域のデータは、リージョ
ン(REGION)と呼ばれる矩形情報を持ち、その矩形の配
置情報(不図示)も保持する。
【0041】図5の501では3つのリージョン(REGI
ON)が保持され、タイトル(TITLE)、テキスト(TEX
T)、ピクチャ(PICTURE)等の分類の情報が保存されて
いる。
【0042】タイトルリージョンに関しては、その位置
関係、文字の大きさ等の情報に基づき、テキスト分類の
サブ分類としてTitleという情報を付加している。
【0043】502のテキストリージョンの木構造は、
イメージリンク(image_link)、イメージインフォ(im
age_info)、コード(code)といった子の木を有する構
造である。これには、テキスト領域の部分画像と、その
配置情報、及び、文字認識処理により得られるテキスト
データが付加される。実際どのようにリンクされるか
は、後述する。
【0044】同様に、ピクチャリージョンについては、
イメージリンク(image_link)、イメージインフォ(im
age_info)が付加される。こちらには、コード(code)
という子はない。
【0045】図6に、図5で説明した形態の情報保存
を、実際の文書画像データに当てはめた例を示す。図7
には、さらに詳細な記述方法を示した。本実施の形態に
おける情報の作成は、XML(eXtensible Markup Lang
uage)を用いて行われる。図7の701に、処理対象の
文書画像データを示す。
【0046】本文書画像データは、レイアウト解析処理
部での処理の結果、タイトル(TITLE)、テキスト(TEX
T)、ピクチャ(PICTURE)の領域に認識される。各分類
の領域のデータは、さらに必要な情報処理が施され、情
報が付加され、その結果、702に示すタグ付きの文書
フォーマットの画像情報が生成される。
【0047】各タグには、それぞれ意味付けがされてい
る。ここで意味付けとは、木構成において、ある特定の
タグには、決められた意味内容を有するタグが配置され
るということである。
【0048】例えば、<PAF_REG>のタグは、終了タグ
</PAF_REG>の間に、テキストを保持する<TXT>タグ
や画像を保持する<PICTURE>タグを配置することがで
きる。
【0049】例えば、 <PAF_REG> <TXT>This is a TITLE</TXT> <PICTURE>..\Meeting\document1.mmr</PICTURE> </PAF_REG> のようにである。すなわち、<PAF_REG>タグは、子の
木として、<TXT>と<PICTURE>が配置可能という事に
なる。また、<TXT>には、<BLK_IMG>タグと<BLK_OC
R>タグを保持することが可能である。
【0050】例えば、 <PAF_REG> <TXT>This is a TITLE <BLK_IMG href=..\Meeting\配布資料.mmr/> <BLK_OCR href=..\Meeting\OCRファイル /> </TXT> </PAF_REG> である。
【0051】以上では、保存管理の対象である文書画像
データをそのまま保存するのではなく、文書画像データ
についての所定の解析情報も付加して保存することが可
能な構成について説明してきた。
【0052】次に図3を用いて、作成・保存した情報の
うち、所定の情報を取出す方法について説明する。
【0053】図3のメモリ301は、図1に示すメモリ
110と同じであり、上述した手法で各情報が保存され
ている。
【0054】抽出処理部302は、出力形式選択指示3
03に従って、所望のレイヤから必要な情報を抽出す
る。この抽出は、従来1ページ単位でしか扱えなかった
のに対して、文書画像データの中の表のみを取出すとい
った文書内コンテンツレベルでの抽出も可能である。こ
れは、先に説明したように、本実施形態では、文書内の
コンテンツにそれぞれタグを設定しているため、そのタ
グを頼りに抽出することが可能となったことによる。例
えば、図6で示した文書画像データの”TITLE”の部分
画像を抽出したいと指示すれば、その部分のみ持ってく
ることができる。この文書内コンテンツは、1ページの
コンテンツのみならず複数ページに渡るコンテンツを持
ってくることも可能である。
【0055】出力形式変換部304は、文書全体あるい
は、文書内コンテンツを抽出したものに対して、所望の
アプリケーションで読み込める形式に変換する処理部で
ある。これは、引き続き次の処理部とともに説明を行
う。
【0056】図3の305は、出力形式変換部304で
変換された、テキスト(Text)中心文書である。これ
は、ワープロ文書のように文章主体の書類の中にピクチ
ャが存在するような書類である。このような出力形式
は、ワープロソフト等のアプリケーションソフトのため
に設けられる。例えば、マイクロソフト社のワード(商
標)のなどのソフトウエア向けの形式である。テキスト
(Text)中心文書305を、GUIを用いて表示したと
きの例を309に示した。この場合、テキスト領域の画
像データとしてはテキストデータとして保存されている
データを用い、ピクチャ(PICTURE)領域についてはそ
のまま部分画像のデータを用いる。表領域については、
その表構造を表解析情報に基づき作成し、その表内セル
のデータを文字情報に基づき作成する。
【0057】画像中心文書306は、305と同様に、
マイクロソフト社のパワーポイント(PowerPoint(商
標))のようなソフトウエア向けの出力形式である。1
つ1つの文書内コンテンツの表示には、基本的に部分画
像を用いる。部分画像の集まりにより、文書を構成す
る。しかしながら、利用者の指示により、ある部分はテ
キストデータを渡してもよい。画像中心文書306を、
GUIを用いて表示したときの例を310に示した。
【0058】表中心文書307は、305等と同様にマ
イクロソフト社のエクセル(商標)のようなソフトウエ
ア向けの出力形式である。表ソフトへ挿入するデータ
は、上述の表解析処理結果が表形式情報に変換されてか
ら渡される。表中心文書307を、GUIを用いて表示
したときの例を311に示した。
【0059】また、要約文書308は、管理情報付き画
像データ301のテキスト&ベクトル保存レイヤから抽
出されたテキスト情報に対し、要約処理がなされた結果
得られる、簡略化した文書をいう。要約処理には、文章
についてなされる形態素解析などの公知の手法が適用で
き、文章相互のつながりや段落の切れなどの情報に基づ
いて行う、いくつかの手法が知られている。そのような
処理を行う、要約処理エンジンにより、要約が作成され
る。312に、要約文章に画像のサムネール画像を付加
して作成されたレポート文書を示す。
【0060】以上説明したように、本実施形態では、利
用者が望む所定の文書内コンテンツを抽出することが可
能となると共に、画像と文字コードが混在する場合でも
表示することが可能である。さらに、文書画像データを
通常のファイル管理におけるファイルの状態で保存し、
電子文書について用いるのと同様な全文検索ツールによ
り検索が可能となる。
【0061】次に、図8は、文書画像データを上述した
手順で複数ページ保存し、その文書画像データと同列で
電子文書も統合管理する電子バインダを表す図である。
【0062】紙文書801は、スキャナ等を用いて読み
取られて文書画像データが得られる。その際、上述の処
理により、メモリ110のレイヤ構成のフォーマット
で、各レイヤ別、矩形領域の情報が保存される。
【0063】電子文書802は、ワープロ等により電子
情報として保持されていた文書である。この電子情報
は、本ドキュメント管理に適したフォーマットに変換さ
れ、Clear File803が得られる。この処理は、XML
保存形式で保存することにより実現される。
【0064】一般に、電子文書には、文字情報、ベクト
ル情報、PICTURE、表といった属性別に情報が保存され
ている。しかしながら、電子文書の形式は、作成された
アプリケーションに依存するため、他のアプリケーショ
ンによって作成された電子文書の保存形式は不明であっ
た。そのため、他のアプリケーションによって作成され
た電子文書の情報を取出すことは困難であった。しかし
ながら、XML形式は、公開性やドキュメントを人間が
読むことを保証する可読性のあり、独自性を排除するこ
とになった。また前記属性は、共通化された表現で記述
されつつある。803をClear Fileと名称付けたのは、
文書画像データや独自形式電子文書が共通の土台で扱え
るようになる意味合いで付けたものであり、Clear File
803は、複数ページのドキュメントフォーマットで作
成される。
【0065】804に、これらを束ねた電子バインダを
示した。従来、電子文書802は、形式が異なるため同
列で扱うことはできなかった。しかしながら、両者と
も、文書を管理する前記タグを用いることにより公開性
があることおよびXML記述という同一の表現を用いて
いることから、統合が可能でとなった。
【0066】図9に、電子バインダの木構造の例を示し
た。901内のSHEETとは、1ページの文書画像データ
である。この中に解析情報であるレイアウト記述、及び
文字認識結果が格納される。
【0067】次に、下のDocumentというタグは、電子文
書からの情報の保存形式である。この電子文書には、レ
イアウト記述とその中身である各要素別情報が保管され
ている。例えば、表について、枠線はVector記述
で保持され、表の中の文字はCode情報で保持されて
いる。木の構造は異なるが、文書内の要素別に記述され
ているため、文書内コンテンツ管理が可能となる。
【0068】図8において、電子バインダを開いて表示
した例を805に示した。805の右側に各保存されて
いる文書のサムネール画像を示し、左側にバインダ内か
ら所望のコンテンツを抽出して表示した例を示す。ここ
で、文書内の各コンテンツの各属性が管理されているた
め、例えば、表だけを抽出したりすることも可能とな
る。
【0069】なお、本発明は、複数の機器(例えば、ホ
ストコンピュータ、インタフェース機器、リーダ、プリ
ンタなど)から構成されるシステムに適用しても、一つ
の機器からなる装置(例えば、複写機、ファクシミリ装
置など)に適用してもよい。
【0070】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウエアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0071】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書き込まれた後、そのプログラムコードの指
示に基づき、その機能拡張カードや機能拡張ユニットに
備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0072】本発明を上述記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。
【0073】
【発明の効果】以上説明したように、本発明によれば、
管理される画像に関連する種々の情報を有効に活用する
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るドキュメント管理装
置の一部を示すブロック図である。
【図2】(a)及び(b)は、文書画像データをデータ
ベースに登録する従来の処理の流れを示した図である。
【図3】本発明の一実施形態に係るドキュメント管理装
置の一部を示すブロック図である。
【図4】線画像ベクトル変換部107で、フレームをベ
クトル変換する方法についての例を示す図である。
【図5】文書画像データの中の各分類別に情報を保存す
る際の保存形態についての例を示す図である。
【図6】実際の文書画像と文書画像データの保存形態を
照らし合わせた例を示す図である。
【図7】実際のドキュメントフォーマットの例を示す図
である。
【図8】電子バインダの例を示す図である。
【図9】電子バインダの木構成例を示す図である。

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 画像を管理するための画像管理装置であ
    って、 所定の分類毎に前記画像に含まれる各領域を識別し、各
    々の前記領域の内容を示す領域データを生成する手段
    と、 前記画像中の、各々の前記領域の配置を示す配置データ
    を生成する手段と、 各々の前記領域データと前記配置データとを関連付けて
    保存する保存手段と、を備えたことを特徴とする画像管
    理装置。
  2. 【請求項2】 前記保存手段は、 前記画像の全体を示す全体画像データを、各々の前記領
    域データと前記配置データとに関連付けて保存すること
    を特徴とする請求項1に記載の画像管理装置。
  3. 【請求項3】 前記全体画像データを圧縮する手段を備
    え、 前記保存手段は、圧縮された前記全体画像データを保存
    することを特徴とする請求項2に記載の画像管理装置。
  4. 【請求項4】 各々の前記領域の画像を示す部分画像デ
    ータを前記領域の全部又は一部について生成する手段を
    備え、 前記保存手段は、前記部分画像データを、各々の前記領
    域データと前記配置データとに関連付けて保存すること
    を特徴とする請求項1に記載の画像管理装置。
  5. 【請求項5】 前記分類には、テキスト、表、枠、若し
    くは、ピクチャーが含まれることを特徴とする請求項1
    に記載の画像管理装置。
  6. 【請求項6】 前記分類がテキストである前記領域の前
    記領域データには、該領域の画像に含まれる文字を示す
    テキストデータが含まれることを特徴とする請求項5に
    記載の画像管理装置。
  7. 【請求項7】 前記分類が表である前記領域の前記領域
    データには、該領域の画像に含まれる表の構造及び表の
    枠線の配置を示すデータ、及び、表に含まれる文字を示
    すテキストデータが含まれることを特徴とする請求項5
    に記載の画像管理装置。
  8. 【請求項8】 前記分類が枠である前記領域の前記領域
    データには、該領域の画像に含まれる枠線の配置を示す
    データが含まれることを特徴とする請求項5に記載の画
    像管理装置。
  9. 【請求項9】 管理される画像を文書から読取る手段を
    備えたことを特徴とする請求項1に記載の画像管理装
    置。
  10. 【請求項10】 保存された前記領域データを、前記属
    性単位又は前記領域データ単位で読み出す手段を備えた
    ことを特徴とする請求項1に記載の画像管理装置。
  11. 【請求項11】 画像を管理するための画像管理方法で
    あって、 所定の分類毎に前記画像に含まれる各領域を識別し、各
    々の前記領域の内容を示す領域データを生成する工程
    と、 前記画像中の、各々の前記領域の配置を示す配置データ
    を生成する工程と、 各々の前記領域データと前記配置データとを関連付けて
    保存する保存工程と、を含むことを特徴とする画像管理
    方法。
  12. 【請求項12】 画像を管理するために、コンピュータ
    を、 所定の分類毎に前記画像に含まれる各領域を識別し、各
    々の前記領域の内容を示す領域データを生成する手段、 前記画像中の、各々の前記領域の配置を示す配置データ
    を生成する手段、 各々の前記領域データと前記配置データとを関連付けて
    保存する保存手段、として機能させるプログラムを記録
    した記録媒体。
JP2000174017A 2000-06-09 2000-06-09 画像管理装置および画像管理方法 Expired - Lifetime JP4480109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000174017A JP4480109B2 (ja) 2000-06-09 2000-06-09 画像管理装置および画像管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000174017A JP4480109B2 (ja) 2000-06-09 2000-06-09 画像管理装置および画像管理方法

Publications (3)

Publication Number Publication Date
JP2001351089A true JP2001351089A (ja) 2001-12-21
JP2001351089A5 JP2001351089A5 (ja) 2007-08-02
JP4480109B2 JP4480109B2 (ja) 2010-06-16

Family

ID=18676141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000174017A Expired - Lifetime JP4480109B2 (ja) 2000-06-09 2000-06-09 画像管理装置および画像管理方法

Country Status (1)

Country Link
JP (1) JP4480109B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2006092046A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 文書表示装置、文書表示装置の制御方法及びプログラム
JP2009069933A (ja) * 2007-09-11 2009-04-02 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法および画像処理プログラム
JP2014203249A (ja) * 2013-04-04 2014-10-27 株式会社東芝 電子機器およびデータ処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140471A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 画像入力装置
JPH10320412A (ja) * 1997-05-22 1998-12-04 Tec Corp 文書作成装置
JPH11120185A (ja) * 1997-10-09 1999-04-30 Canon Inc 情報処理装置及びその方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140471A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 画像入力装置
JPH10320412A (ja) * 1997-05-22 1998-12-04 Tec Corp 文書作成装置
JPH11120185A (ja) * 1997-10-09 1999-04-30 Canon Inc 情報処理装置及びその方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2006092046A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 文書表示装置、文書表示装置の制御方法及びプログラム
JP4572640B2 (ja) * 2004-09-22 2010-11-04 富士ゼロックス株式会社 文書表示装置、文書表示装置の制御方法及びプログラム
JP2009069933A (ja) * 2007-09-11 2009-04-02 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法および画像処理プログラム
JP2014203249A (ja) * 2013-04-04 2014-10-27 株式会社東芝 電子機器およびデータ処理方法

Also Published As

Publication number Publication date
JP4480109B2 (ja) 2010-06-16

Similar Documents

Publication Publication Date Title
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
US7552381B2 (en) Check boxes for identifying and processing stored documents
JP3289968B2 (ja) 電子的文書処理のための装置および方法
US6353840B2 (en) User-defined search template for extracting information from documents
TW464811B (en) Storage management system for document image database
US7050630B2 (en) System and method of locating a non-textual region of an electronic document or image that matches a user-defined description of the region
CA2136902C (en) Method and system for utilizing file storage sheets
Déjean et al. A system for converting PDF documents into structured XML format
US20130054595A1 (en) Automated File Name Generation
US20140122479A1 (en) Automated file name generation
EP2354966A2 (en) System and method for visual document comparison using localized two-dimensional visual fingerprints
US20020102022A1 (en) Detecting and utilizing add-on information from a scanned document image
US6510243B1 (en) Image processing apparatus for managing image data
JP2006085733A (ja) ファイリング・検索装置およびファイリング・検索方法
CN112052749A (zh) 档案的归档方法、装置、电子设备及计算机可读存储介质
EP1672473A2 (en) Stamp sheet
JP2008146605A (ja) 画像処理装置及びその制御方法
US20090100023A1 (en) Information processing apparatus and computer readable information recording medium
US20060167899A1 (en) Meta-data generating apparatus
JPH08147446A (ja) 電子ファイリング装置
JP4261988B2 (ja) 画像処理装置及び方法
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP2008158777A (ja) 画像処理装置及び方法、コンピュータプログラム及び記憶媒体
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JPH0934903A (ja) ファイル検索装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070611

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070611

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070611

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080818

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090824

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091019

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091023

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100312

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100315

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 4