JP2003016070A - 画像蓄積管理装置及び画像蓄積管理方法 - Google Patents

画像蓄積管理装置及び画像蓄積管理方法

Info

Publication number
JP2003016070A
JP2003016070A JP2001200369A JP2001200369A JP2003016070A JP 2003016070 A JP2003016070 A JP 2003016070A JP 2001200369 A JP2001200369 A JP 2001200369A JP 2001200369 A JP2001200369 A JP 2001200369A JP 2003016070 A JP2003016070 A JP 2003016070A
Authority
JP
Japan
Prior art keywords
data
bibliographic information
image
input
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001200369A
Other languages
English (en)
Inventor
Tatsuo Ito
達雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001200369A priority Critical patent/JP2003016070A/ja
Publication of JP2003016070A publication Critical patent/JP2003016070A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Record Information Processing For Printing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】リンク関係にある文書間の関係を画像データ間
にも設定して、画像間の関連付けや他の情報へのリンク
情報を保持したまま画像データになっても、関連情報へ
のリンクの情報を失わないようにする。 【解決手段】プリンタドライバ6は入力データを印字デ
ータに変換するとともに入力データから書誌情報を取り
出し、取り出した書誌情報を印字データに埋め込む。書
誌情報抽出部7は印字データを解析して書誌情報を抽出
しデータ蓄積装置11に送るとともに印字データをプリ
ンタ4と画像変換部8に送る。プリンタ4は送られた印
字データを記録媒体に印刷する。画像変換部8は送られ
た印字データを画像データに変換してデータ蓄積装置1
1に送る。データ蓄積装置11は送られた画像データを
書誌情報と関連させてデータベース12に格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書等の印字デ
ータを画像データとして蓄積管理するとともに、蓄積し
た画像データを参照したり再利用することができる画像
蓄積管理装置及び画像蓄積管理方法に関するものであ
る。
【0002】
【従来の技術】従来から文書等のデータをプリンタで印
刷する画像データとして蓄積して管理し、後で検索して
表示したり印刷できる画像蓄積管理システムが使用され
ている。この画像データを蓄積するために、例えば特開
平11−195128号公報に示す電子文書作成装置で
は、PostScript内のコメント行にコマンドを埋め込み、
画像データを文書作成に利用している。
【0003】
【発明が解決しようとする課題】従来の画像蓄積管理シ
ステムにおいて、対象とする画像がWebページ等のよう
に他のページへのリンクを持っている場合、本来の画像
データになった場合、リンクを辿ることができず、リン
クという情報量が減ってしまう。この現象はWebページ
だけでなく、Wordで作った文書やNotesで作成したデー
タベースなども他のドキュメントや画像データへのリン
クの情報を持っているため、同様の現象が起きる。ま
た、リンク先の画像を印刷した場合はリンク元の画像と
関連があるにもかかわらず、従来の画像管理では無関係
になってしまう。
【0004】この発明はかかる短所を改善し、リンク関
係にある文書間の関係を画像データ間にも設定して、画
像間の関連付けや他の情報へのリンク情報を保持したま
ま画像データになっても、関連情報へのリンクの情報を
失わないことができる画像蓄積管理装置及び画像蓄積管
理方法を提供することを目的とするものである。
【0005】
【課題を解決するための手段】この発明に係る画像蓄積
管理装置は、印刷する文書等を入力するデータ入力装置
とデータ処理装置とプリンタ及びファイルサーバを有
し、データ処理装置はプリンタドライバと書誌情報抽出
部と画像変換部を有し、プリンタドライバは、入力した
文書等の入力データを印字データに変換するとともに、
文書等の入力データから書誌情報を取り出す書誌情報取
得機能と、印字データに書誌情報を埋め込む書誌情報埋
込機能を有し、書誌情報抽出部は書誌情報を埋め込んだ
印字データから書誌情報を抽出し、画像変換部は印字デ
ータを画像データに変換し、プリンタは印字データを記
録紙等の記録媒体に印刷し、ファイルサーバはデータ蓄
積装置とデータベースを有し、データ蓄積装置は画像変
換部で変換された画像データを書誌誌情報抽出部で抽出
した書誌情報と関連させてデータベースに格納すること
を特徴とする。
【0006】上記プリンタドライバは、印刷する文書等
の入力データからテキストを取り出し、テキスト自体を
書誌情報として扱い印字データに埋め込むと良い。
【0007】また、書誌情報から任意の位置の文字列を
キーワードとして抽出し、キーワードと一致する他の文
書の書誌情報も関連付けて格納することが望ましい。
【0008】この発明に係る画像蓄積管理方法は、印刷
する文書等を入力し、入力した文書等の入力データを印
字データに変換するとともに文書等の入力データから書
誌情報を取り出し、印字データを印刷するとともに印字
データを画像データに変換し、変換した画像データを書
誌情報と関連させてデータベースに格納することを特徴
とする。
【0009】
【発明の実施の形態】図1はこの発明の画像蓄積管理装
置の構成を示すブロック図である。図に示すように画像
蓄積管理装置1は、データ入力装置2とデータ処理装置
3とプリンタ4及びファイルサーバ5を有する。データ
入力装置2は例えばスキャナ等からなり文書等を読み取
る。データ処理装置3はプリンタドライバ6と書誌情報
抽出部7と画像変換部8を有する。プリンタドライバ6
は、データ入力装置2から入力した文書等の入力データ
を印字データに変換するとともに、文書等の入力データ
から書誌情報を取り出す書誌情報取得機能9と、印字デ
ータに書誌情報を埋め込む書誌情報埋込機能10を有す
る。書誌情報抽出部7は書誌情報を埋め込んだ印字デー
タから書誌情報を抽出する。画像変換部8は印字データ
を画像データに変換する。プリンタ4は印字データを記
録紙等の記録媒体に印刷する。ファイルサーバ5はデー
タ蓄積装置11とデータベース12を有する。データ蓄
積装置11は画像変換部8で変換された画像データをデ
ータベース12に格納し、格納した画像データの画像I
Dを取得する。また、データ蓄積装置11は所得した画
像IDと書誌情報抽出部7で抽出した書誌情報をデータ
ベース12に格納し、ネットワークに接続されたパソコ
ン(PC)13から検索情報として書誌情報が入力され
ると、書誌情報によりデータベース12から画像データ
を取得してPC13に出力する。
【0010】上記のように構成された画像蓄積管理装置
1でデータ入力装置2から入力した文書等の入力データ
を処理するときの動作を図2のフローチャートを参照し
て説明する。
【0011】データ入力装置2で文書等の文書データを
データ処理装置3に入力すると(ステップS1)、プリ
ンタドライバ6は入力した文書データを印字データに変
換する(ステップS2)。この変換する印字データは任
意のもので良く、例えばPostScriptデータに変換する。
このプリンタドライバ6で文書データをPostScriptに変
換するときに、一時的に作成されるファイルあるいはPo
stScript内又は対象文書自体からテキスト領域を判定し
てテキストを取り出す。また、その文書固有の書誌情報
を書誌情報取得機能9により取得する(ステップS
3)。この書誌情報は、例えばファイル名称や、入力日
時情報や、データ入力装置2のシリアル番号及び認識可
能であれば利用者の名前など著作権保護に必要な情報を
含む。次にプリンタドライバ6の書誌情報埋込機能10
により文書のテキストや書誌情報をPostScriptのコメン
ト行に付加して書誌情報抽出部7に送る(ステップS
4)。書誌情報抽出部7は送られた書誌情報を埋め込ん
だ印字データのコメント行を解析して書誌情報を抽出
し、抽出した書誌情報をファイルサーバ5のデータ蓄積
装置11に送るとともに印字データをプリンタ4と画像
変換部8に送る(ステップS5)。プリンタ4は送られ
た印字データを記録紙等の記録媒体に印刷する(ステッ
プS6)。一方、画像変換部8は送られた印字データを
画像データに変換してデータ蓄積装置11に送る(ステ
ップS7)。データ蓄積装置11は送られた画像データ
をデータベース12に格納し、格納した画像データの画
像IDを取得する(ステップS8)。この画像データを
データベース12に格納するとき、画像データが白黒2
値の場合は、MMR等圧縮をかけてTIFFデータとして
格納し、画像データがカラー画像や多値画像の場合は、
JPEGのデータとして格納する。その後、データ蓄積
装置11は所得した画像IDと書誌情報抽出部7で抽出
した書誌情報をデータベース12に格納する(ステップ
S9)。この書誌情報をデータベース12に格納すると
き、テキストデータからキーワードを抽出し、抽出した
キーワードをキーとしても登録しておく。但し、対象と
なるテキスト領域が見つけられない場合は、データベー
ス12に格納後あるいは前に、画像データに対してOC
Rをかけてテキストを抽出し、キーワードの抽出に利用
する。また、書誌情報を改変不可にしたい場合は、画像
データと書誌情報を任意の電子透かし等の技術で分離不
能な形態に加工しても良い。
【0012】このようにして文書等をプリンタ4で印刷
するためにデータ入力装置2から文書データを入力する
だけで、自動的に画像データをデータベース12に蓄積
することができる。また、データベース12に蓄積した
画像データを適切な書誌情報をキーとして管理してオリ
ジナルの文書を特定することができるから、画像だけで
なく、画像とオリジナルの文書を関連付けることができ
る。
【0013】次に、データベース12に蓄積した画像を
ネットワークに接続されたPC13で検索するときの動
作を図3のフローチャートを参照して説明する。
【0014】PC13から検索情報として書誌情報がフ
ァイルサーバ5に入力されると(ステップS11)、デ
ータ蓄積装置11は入力した書誌情報によりデータベー
ス12から画像IDを検出する(ステップS12)。そ
して検出した画像IDに応じた画像データをデータベー
ス12から取得してPC13に送る(ステップS1
3)。PC13は送られた画像データを表示装置に表示
する(ステップS14)。このように書誌情報を検索情
報として利用し、必要とする画像データを容易に検索す
ることができる。
【0015】また、前記テキストデータからキーワード
を抽出し、抽出したキーワードをキーとして登録してお
くときに、キーワードの任意の文字列をキーとして抜き
出してリンク情報として保存し、このリンク情報とキー
ワードが一致する他の文書の書誌情報が有れば、関連画
像としてデータベース12に登録しておくと良い。例え
ばURLを意味する「http://」が含まれている文字列
等や任意の指定文字列に続く文字列をキーとして抜き出
す。例えば、html文書なら「<a href=」の後には、他ペ
ージや文書へのリンクを意味する文字列が続く。それら
のキーをリンク情報として保存する。このようにして画
像を検索するときに関連する画像も同時に表示すること
ができる。
【0016】
【発明の効果】この発明は以上説明したように、印刷す
る文書等を入力し、入力した文書等の入力データを印字
データに変換するとともに文書等の入力データから書誌
情報を取り出し、印字データを印刷するとともに印字デ
ータを画像データに変換し、変換した画像データを書誌
情報と関連させてデータベースに格納するようにしたか
ら、文書等を印刷するために入力するだけで、自動的に
画像データをデータベースに蓄積することができる。ま
た、データベースに蓄積した画像データを適切な書誌情
報をキーとして管理してオリジナルの文書を特定するこ
とができるから、画像だけでなく、画像とオリジナルの
文書を関連付けることができる。
【0017】また、印刷する文書等の入力データからテ
キストを取り出し、テキスト自体を書誌情報として扱い
印字データに埋め込むことにより、検索用に使用する書
誌情報をOCRで得られた文字列よりも信頼度の高い文
字列として得ることができ、画像データの検索の精度を
上げることができる。
【0018】さらに、書誌情報から任意の位置の文字列
をキーワードとして抽出し、キーワードと一致する他の
文書の書誌情報も関連付けて格納することにより、画像
を参照するときに関連している画像も同時に表示した
り、関連している画像データを削除又はコピーするとき
に、関連する画像データと連携をとり、同時に削除した
りコピーすることができるとともに注意を促すメッセー
ジを出す等のシステムの操作性向上やデータ管理に利用
することができる。
【図面の簡単な説明】
【図1】この発明の画像蓄積管理装置の構成を示すブロ
ック図である。
【図2】画像データの蓄積処理を示すフローチャートで
ある。
【図3】画像データの検索処理を示すフローチャートで
ある。
【符号の説明】
1;画像蓄積管理装置、2;データ入力装置、3;デー
タ処理装置、4;プリンタ、5;ファイルサーバ、6;
プリンタドライバ、7;書誌情報抽出部、8;画像変換
部、9;書誌情報取得機能、10;書誌情報埋込機能、
11;データ蓄積装置、12;データベース、13;P
C。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 印刷する文書等を入力するデータ入力装
    置とデータ処理装置とプリンタ及びファイルサーバを有
    し、 データ処理装置はプリンタドライバと書誌情報抽出部と
    画像変換部を有し、プリンタドライバは、入力した文書
    等の入力データを印字データに変換するとともに、文書
    等の入力データから書誌情報を取り出す書誌情報取得機
    能と、印字データに書誌情報を埋め込む書誌情報埋込機
    能を有し、書誌情報抽出部は書誌情報を埋め込んだ印字
    データから書誌情報を抽出し、画像変換部は印字データ
    を画像データに変換し、 プリンタは印字データを記録紙等の記録媒体に印刷し、 ファイルサーバはデータ蓄積装置とデータベースを有
    し、データ蓄積装置は画像変換部で変換された画像デー
    タを書誌誌情報抽出部で抽出した書誌情報と関連させて
    データベースに格納することを特徴とする画像蓄積管理
    装置。
  2. 【請求項2】 上記プリンタドライバは、印刷する文書
    等の入力データからテキストを取り出し、テキスト自体
    を書誌情報として扱い印字データに埋め込む請求項1記
    載の画像蓄積管理装置。
  3. 【請求項3】 上記書誌情報から任意の位置の文字列を
    キーワードとして抽出し、キーワードと一致する他の文
    書の書誌情報も関連付けて格納する請求項1又は2記載
    の画像蓄積管理装置。
  4. 【請求項4】 印刷する文書等を入力し、入力した文書
    等の入力データを印字データに変換するとともに文書等
    の入力データから書誌情報を取り出し、印字データを印
    刷するとともに印字データを画像データに変換し、変換
    した画像データを書誌情報と関連させてデータベースに
    格納することを特徴とする画像蓄積管理方法。
JP2001200369A 2001-07-02 2001-07-02 画像蓄積管理装置及び画像蓄積管理方法 Pending JP2003016070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001200369A JP2003016070A (ja) 2001-07-02 2001-07-02 画像蓄積管理装置及び画像蓄積管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001200369A JP2003016070A (ja) 2001-07-02 2001-07-02 画像蓄積管理装置及び画像蓄積管理方法

Publications (1)

Publication Number Publication Date
JP2003016070A true JP2003016070A (ja) 2003-01-17

Family

ID=19037503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001200369A Pending JP2003016070A (ja) 2001-07-02 2001-07-02 画像蓄積管理装置及び画像蓄積管理方法

Country Status (1)

Country Link
JP (1) JP2003016070A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723999B1 (ko) 2005-04-05 2007-06-04 후지제롯쿠스 가부시끼가이샤 전자 문서 관리 시스템, 화상 형성 장치, 전자 문서 관리 방법 및 컴퓨터 판독 가능한 기록 매체
JP2007286758A (ja) * 2006-04-13 2007-11-01 Ricoh Co Ltd 画像保存システムおよび画像形成システム
JP2008015579A (ja) * 2006-07-03 2008-01-24 Canon Inc データ管理システム
JP2008146605A (ja) * 2006-12-13 2008-06-26 Canon Inc 画像処理装置及びその制御方法
JP2010026649A (ja) * 2008-07-16 2010-02-04 Ricoh Co Ltd データ中継装置、画像形成方法、プログラムおよび記録媒体
US7734830B2 (en) 2004-09-01 2010-06-08 Brother Kogyo Kabushiki Kaisha Information storage device and information storage method
JP2013175213A (ja) * 2013-04-11 2013-09-05 Ricoh Co Ltd データ中継装置、画像形成方法、プログラムおよび記録媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734830B2 (en) 2004-09-01 2010-06-08 Brother Kogyo Kabushiki Kaisha Information storage device and information storage method
KR100723999B1 (ko) 2005-04-05 2007-06-04 후지제롯쿠스 가부시끼가이샤 전자 문서 관리 시스템, 화상 형성 장치, 전자 문서 관리 방법 및 컴퓨터 판독 가능한 기록 매체
JP2007286758A (ja) * 2006-04-13 2007-11-01 Ricoh Co Ltd 画像保存システムおよび画像形成システム
JP2008015579A (ja) * 2006-07-03 2008-01-24 Canon Inc データ管理システム
US8294928B2 (en) 2006-07-03 2012-10-23 Canon Kabushiki Kaisha Data management system to extract text data
JP2008146605A (ja) * 2006-12-13 2008-06-26 Canon Inc 画像処理装置及びその制御方法
US8073255B2 (en) 2006-12-13 2011-12-06 Canon Kabushiki Kaisha Keyword generation process
JP2010026649A (ja) * 2008-07-16 2010-02-04 Ricoh Co Ltd データ中継装置、画像形成方法、プログラムおよび記録媒体
JP2013175213A (ja) * 2013-04-11 2013-09-05 Ricoh Co Ltd データ中継装置、画像形成方法、プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US7996362B2 (en) Image processing apparatus, image processing system, and control method therefor
CN100478947C (zh) 文档信息处理设备及文档信息处理方法
EP1873626A2 (en) Printing control method, printing control device, printing system, terminal device, program, and recording medium
US7640269B2 (en) Image processing system and image processing method
US7283267B2 (en) Data processing device, data processing method, and data processing program for recognizing characters in a URL
US8644546B2 (en) Method and systems for processing text found in images
JP3518304B2 (ja) 情報閲覧システム
US20040268254A1 (en) Document management system
JP2009163743A (ja) 画像処理装置および画像処理方法
US9489380B2 (en) Methods and apparatus for management of unconsciously captured documents
JP2008234203A (ja) 画像処理装置
US20080243818A1 (en) Content-based accounting method implemented in image reproduction devices
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP2003016070A (ja) 画像蓄積管理装置及び画像蓄積管理方法
CN101261636B (zh) 检索装置、检索***及检索装置的控制方法
US20090083316A1 (en) Information processing apparatus, information processing method, and information processing program
JP2008311828A (ja) 画像処理装置、画像処理方法、そのプログラムおよび記録媒体
US20110161322A1 (en) Image forming apparatus, information processing apparatus, data processing server, and information processing method
JP4827543B2 (ja) 画像処理方法、および、その装置
JP3265198B2 (ja) 構造化文書作成装置、構造化文書作成方法、通信装置、および通信方法
US20050025348A1 (en) Method of and apparatus for processing image data
JP2011028503A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2007280105A (ja) アップロード要求装置、アップロード要求方法およびアップロード要求プログラム
JP2005149210A (ja) 画像処理装置及びその制御方法、プログラム
JP3682861B2 (ja) ファクシミリサーバとそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090901