JPH09204511A - ファイリング装置 - Google Patents

ファイリング装置

Info

Publication number
JPH09204511A
JPH09204511A JP8010170A JP1017096A JPH09204511A JP H09204511 A JPH09204511 A JP H09204511A JP 8010170 A JP8010170 A JP 8010170A JP 1017096 A JP1017096 A JP 1017096A JP H09204511 A JPH09204511 A JP H09204511A
Authority
JP
Japan
Prior art keywords
headline
document image
article
keyword
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8010170A
Other languages
English (en)
Inventor
Tomoyuki Ishihara
朋幸 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8010170A priority Critical patent/JPH09204511A/ja
Publication of JPH09204511A publication Critical patent/JPH09204511A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 新聞・雑誌等の記事の内、使用者の設定した
キーワードが見出しに含まれている記事だけファイリン
グする。 【解決手段】 イメージセンサと、キーワードを入力す
るキーボードと、CPUを備え、CPUにより、イメー
ジセンサで読み取った新聞・雑誌等の記事面の文書画像
から見出しとその見出しに対応する本文の記事を切り出
し、切り出した見出しについて文字認識処理を行い見出
しの文字コードを得、見出しの文字コードにキーワード
が含まれているか否かを判定し、キーワードが含まれて
いる見出しの文字コードとその見出しに対応する本文の
記事の文書画像とを関連づけて記憶装置にファイリング
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、新聞・雑誌等の
記事を文書画像として読み取ってファイリングするファ
イリング装置に関する。
【0002】
【従来の技術】従来、この種のファイリング装置として
は、特開平3−14184号公報に記載のような文書画
像再配置ファイリング装置が知られている。これにおい
ては、新聞・雑誌等の記事を文書画像として読み取った
後、見出しの領域と本文の領域とを自動的に判別し、各
々の文書画像の領域を切り出し、これらの画像領域の各
々に対して文字認識処理を施して文字コードデータを
得、見出しのデータと本文のデータとを別々に管理する
形でファイリングしておき、呼び出す際は文字コードデ
ータに含まれる文字列を入力指定する方法により見出し
のデータ、本文のデータをそれぞれ別々に検索し、目的
の見出しのデータと本文のデータを再配置して表示する
ようにしている。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな従来のファイリング装置においては、使用者が必要
としない記事も含めた全ての記事の見出し領域、本文領
域の文書画像に対して文字認識処理を行なうようにして
いるため、ファイリングの際、かなりの処理時間を必要
とする。そして、使用者が必要としない記事も含めた全
ての記事のデータをファイリングするため、膨大な容量
の記憶装置が必要となる。
【0004】また、本文と見出しとを関連づけてファイ
リングしていないため、ファイリングされている一つの
記事を画面表示もしくは印刷する際には、見出しに対応
する本文を使用者が判断し、見出し及び本文をそれぞれ
呼び出した上で画面表示もしくは印刷する必要があり、
記事の呼び出しに手数を必要とする。
【0005】さらに、記事のデータをファイリングする
際に、新聞等の発行日の情報をファイリングしていない
ため、記事のデータがいつ出版されたものであるのかを
知ることができないという問題があった。
【0006】この発明は、このような事情を考慮してな
されたもので、新聞・雑誌等の記事の内、使用者の設定
したキーワードが見出しに含まれている記事についてだ
け、見出しの文字コードとその見出しに対応する本文の
記事の文書画像とを関連づけてファイリングするように
したファイリング装置を提供するものである。
【0007】
【課題を解決するための手段】図1はこの発明の構成を
示すブロック図である。この図に示すように、この発明
は、新聞・雑誌等の記事面を文書画像として光学的に読
み取る文書画像読み取り手段101と、読み取られた文
書画像から見出しを切り出すとともにその見出しに対応
する本文の記事を切り出す画像領域切り出し手段102
と、切り出された見出しの文書画像について文字認識処
理を行い見出しの文字コードを得る文字認識処理手段1
03と、文字列からなるキーワードを入力する入力手段
104と、見出しの文字コードにキーワードが含まれて
いるか否かを判定するキーワード判定手段105と、キ
ーワードが含まれている見出しの文字コードとその見出
しに対応する本文の記事の文書画像とを関連づけて記憶
するファイル記憶手段106を備えてなるファイリング
装置である。
【0008】この発明において、文書画像読み取り手段
101としては、新聞・雑誌等の記事面を文書画像とし
て光学的に読み取ることが可能なものであればよく、光
学式のイメージスキャナを用いることが望ましいが、C
CDカメラのような装置を用いることもできる。
【0009】画像領域切り出し手段102、文字認識処
理手段103及びキーワード判定手段105としては、
CPU,ROM,RAM等を含むマイクロコンピュータ
を用いるのが便利である。
【0010】入力手段104としては、文字列を入力す
ることが可能なキーボードを用いることが好ましいが、
ペン、マウス、もしくはトラックボールのような各種の
ポインティングデバイスを用いることもできる。ファイ
ル記憶手段106としては、磁気ディスク装置やフロッ
ピーディスク装置のような各種の記憶装置を用いること
ができる。
【0011】この発明によれば、新聞・雑誌等の記事面
が文書画像読み取り手段101によって読み取られる
と、読み取られた新聞・雑誌等の記事面の文書画像か
ら、画像領域切り出し手段102によって見出しとその
見出しに対応する本文の記事が切り出され、文字認識処
理手段103によって、切り出された見出しの文書画像
が文字認識されて見出しの文字コードが得られる。
【0012】そして、キーワード判定手段105によっ
て、見出しの文字コードにキーワードが含まれているか
否かが判定され、ファイル記憶手段106により、キー
ワードが含まれた見出しの文字コードとその見出しに対
応する本文の記事の文書画像とが関連づけられて記憶さ
れる。したがって、キーワードが見出しに含まれている
記事だけを選択してファイリングすることができる。
【0013】上記構成においては、入力手段104を複
数のキーワードが入力可能な構成とし、キーワード判定
手段105を、見出しの文字コードに複数のキーワード
の内のいずれかが含まれているか否かを判定するように
構成することが好ましい。
【0014】このように構成した場合には、見出しの文
字コードに複数のキーワードのうちいずれかが含まれて
いれば、これらのキーワードの含まれた見出しに対応す
る本文の記事の文書画像が、見出しの文字コードに関連
づけられて記憶される。したがって、複数のキーワード
の内のいずれかが見出しに含まれている記事だけを選択
してファイリングすることができる。
【0015】また、上記構成においては、文書画像読み
取り手段101によって読み取られた文書画像から日付
表示領域を切り出す日付表示領域切り出し手段と、切り
出された日付表示領域の文書画像について文字認識処理
を行い日付の文字コードを得る日付認識処理手段とをさ
らに設けた構成とし、ファイル記憶手段106を、キー
ワードが含まれた見出しの文字コードとその見出しに対
応する本文の記事の文書画像とを日付の文字コードに関
連づけて記憶するように構成することが好ましい。
【0016】このように構成した場合には、新聞等の日
付表示領域から得られた日付の文字コードが、見出しの
文字コードとその見出しに対応する本文の記事の文書画
像とに関連づけられて記憶される。したがって、日付の
文字コードで記事の発行日を知ることができる。また、
記事を日付で検索することが可能となる。
【0017】上記構成においては、日付の文字コードを
文字画像化して本文の記事の文書画像に追加する追加手
段をさらに設けた構成とすることがより好ましい。
【0018】このように構成した場合には、新聞等の日
付表示領域から得られた日付の文字コードが文字画像化
されて本文の記事の文書画像に追加された上で、日付の
文字コードが、見出しの文字コードとその見出しに対応
する本文の記事の文書画像とに関連づけられて記憶され
る。したがって、本文の記事の文書画像を表示あるいは
印刷したときに日付も同時に表示あるいは印刷すること
ができる。
【0019】
【発明の実施の形態】以下、図面に示す実施例に基づい
てこの発明を詳述する。なお、これによってこの発明が
限定されるものではない。
【0020】図2はこの発明を日本語ワードプロセッサ
に適用した一実施例の構成を示すブロック図である。本
日本語ワードプロセッサは、キーボード、CPU、メモ
リ、表示装置、印字装置等の公知の基本的な装置から構
成されている。したがって、以下においては、それらの
基本的な装置については説明を省略する。また、仮名漢
字変換機能のような日本語ワードプロセッサとしての基
本機能についてはすでに備えているものとして説明を行
う。
【0021】本日本語ワードプロセッサの内、ファイリ
ング装置として機能する部分だけを説明すれば、本ファ
イリング装置は、キーワード登録部1と、文書画像読み
取り部2と、記事領域切り出し部3と、日付表示領域切
り出し部4と、見出し領域切り出し部5と、文字認識処
理部6と、日付情報抽出部7と、日付追加部8と、キー
ワード判定部9と、データファイル記憶部10から構成
されている。
【0022】上記において、キーワード登録部1は、文
字列からなるキーワードを入力することが可能なキーボ
ードと、入力されたキーワードを記憶可能なRAMから
構成される。文書画像読み取り部2は、光学式のイメー
ジセンサーから構成される。記事領域切り出し部3、日
付表示領域切り出し部4、見出し領域切り出し部5、文
字認識処理部6、日付情報抽出部7、日付追加部8、及
びキーワード判定部9は、CPUから構成される。デー
タファイル記憶部10は、フロッピーディスク装置、磁
気ディスク装置等の記憶装置から構成される。
【0023】キーワード登録部1は、キーボードから入
力された必要な記事の見出しに含まれるキーワードをR
AMに登録する。文書画像読み取り部2は、新聞・雑誌
などの紙面全体の文書画像を光学的に読み取る。記事領
域切り出し部3は、各記事の画像領域を切り出す。日付
表示領域切り出し部4は、新聞紙面の上欄にある日付表
示領域を切り出す。見出し領域切り出し部5は、各記事
の見出しの領域を切り出す。
【0024】文字認識処理部6は、日付表示領域切り出
し部4で切り出された文書画像と見出し領域切り出し部
5で切り出された文書画像に対して文字認識処理を施し
て日付表示領域の文字コードデータと見出し領域の文字
コードデータを得る。日付情報抽出部7は、文字認識処
理部6により文字認識処理して得られた日付表示領域の
文字コードデータより日付の情報を抽出する。日付追加
部8は、記事領域切り出し部3で切り出された記事の画
像に、日付情報抽出部7により抽出された日付情報を文
字化した画像を追加する。キーワード判定部9は、文字
認識処理部6により文字認識処理して得られた見出しの
文字コードデータにキーワード登録部2で登録されたキ
ーワードが含まれているか否かを判定する。
【0025】データファイル記憶部10は、キーワード
判定部9によって見出しにキーワードが含まれていると
判定された場合、その見出しの文字コードデータと、日
付情報抽出部7で得られた日付の情報と、その見出しに
含まれているキーワードと、その見出しに対応し日付追
加部8により日付の文字画像が追加された記事の文書画
像データ(記事画像データ)とを、それぞれ関連づけて
記憶装置にファイリングする。
【0026】新聞紙面から必要な記事のファイリングを
行う場合の具体的な例を、図3を用いて以下に説明す
る。ファイリングしたい記事の見出しに含まれるキーワ
ードとして、例えば「AA」と「BB」の2つが使用者
によって設定され、キーワード登録部1によってすでに
登録されているものとする。
【0027】まず、使用者の操作によって、文書画像読
み取り部2は、図3に示す新聞紙面全体の文書画像を読
み取る。その後、この文書画像より新聞紙面の上欄にあ
る日付表示領域11を切り出し、この日付表示領域11
の画像に対して文字認識処理を行い文字コードデータを
得る。
【0028】この切り出しの具体的処理においては、ま
ず、紙面全体の文書画像の上端より一定距離以内の領域
内の黒画素を検出して、一定長さ以上に黒画素が水平方
向に連続している場合、これを紙面上部の横罫線と認識
する。次に、この横罫線より一定距離以内上側の文書画
像領域を切り出し、この領域内で黒画素の連結領域を検
出すると、これを文字とみなして文字認識処理を施し、
文字コードデータを得る。
【0029】この文字コードデータより年、月、日、曜
日の文字が検出されるので、これらの文字の前の数字及
び文字を認識する事により、図3の例であれば1995
年9月11日の月曜日に発行されたという情報を得、こ
れをメモリに記憶する。
【0030】次に、紙面全体の文書画像より記事12、
記事13、記事14の各領域と、それらの各領域に対応
する見出し15、見出し16、見出し17の各領域とを
切り出す。
【0031】具体的な方法としては、例えば紙面全体の
文書画像について一定値以内の黒画素の連結を検索し、
これを内包できる最小限の大きさの正方形領域を文字矩
形とする。見出しの文字は一般に本文の文字より大きい
ので、あらかじめ規定する閾値より大きな文字矩形を検
出するとこれを見出し文字であると認識し、この文字矩
形と一定の誤差の範囲で同じ大きさの文字矩形が等間隔
で並んでいることを検出すると、この文字矩形の並びの
全体を含む領域を見出し領域であると判断して、この領
域の画像データを切り出す。
【0032】次に、紙面全体の文書画像について水平方
向および垂直方向に一定長さ以上の黒画素の連続を検出
した場合、これを罫線であると認識し紙面を縦罫線と横
罫線に囲まれたいくつかの区画に分ける。各区画をその
内部にある見出し領域の指し示す本文の記事の領域であ
ると判断して、紙面より各本文の記事の領域を切り出
す。そして、見出し15、見出し16、見出し17に対
して、それぞれ見出し番号1、見出し番号2、見出し番
号3を付す。
【0033】次に、見出し番号1である見出し15の文
書画像に対して文字認識処理を施し、文字コードデータ
を得る。この見出し15の文字コードデータに対して先
に設定したキーワードが含まれているか否かを判定す
る。
【0034】具体的には、見出しの文字コードデータ列
内に先に登録しておいたキーワードの文字コードデータ
列と一致する文字コードデータ列がある場合には、見出
しにキーワードが含まれていると判断する。これによ
り、本例においては、見出し番号1の見出し15に「A
A」というキーワードが含まれていることがわかる。
【0035】この場合に、見出し15にキーワードが含
まれているので、見出し15に対応する記事12の本文
の文書画像データに、先に得た日付の情報を文字化した
画像を追加した後、見出しの文字コードデータと、先に
得た日付情報の数値データと、見出しに含まれているキ
ーワードと、記事画像データとを関連づけて記憶装置に
ファイリングする。
【0036】ファイリングされたデータの構造は、例え
ば図4に示す様になる。このように、各データは、ファ
イル情報21、見出しの文字コードデータ22、日付デ
ータ23、キーワード24、記事画像データ25、ファ
イル終了コード26の順でファイルされる。
【0037】ファイル情報21はファイルの大きさなど
一般的なファイル情報である。見出しの文字コードデー
タ22は記事画像データ25に対応する見出しの文字コ
ードデータである。日付データ23は日付の数値データ
であり、図3の例では“19950911”という数値
データである。キーワード24は見出しに含まれていた
キーワードの文字コードデータであり、図3の例では
“AA”という文字コードデータである。記事画像デー
タ25は当該記事の領域の文書画像データである。ファ
イル終了コード26はファイルの最後を示すコードであ
る。
【0038】このようにしてファイリングされた記事の
画像は図5に示すように表示される。この表示例に示す
ように、記事画像データには日付情報が追加されている
ので、記事画像の表示時には、追加された日付情報の文
字画像31が記事画像とともに表示される。
【0039】以上で見出し番号1の記事についてのファ
イリングを終了し、次に見出し番号2の記事についての
ファイリングに移行する。見出し番号2の記事について
のファイリングでは、まず、見出し16の領域の文書画
像データに対して文字認識処理を施して文字コードデー
タを得る。このデータに対して先に設定したキーワード
が含まれているか否かを判定すると、この見出しにはキ
ーワードは含まれていない。したがって、この見出し番
号2の記事についてのファイリングは行わない。
【0040】ここまで処理した見出し番号は2であり、
最後の見出しではないので次に見出し番号3の記事につ
いてのファイリングに移行する。見出し番号3の記事に
ついてのファイリングでは、まず、見出し17の領域の
文書画像データに対して文字認識処理を施して文字コー
ドデータを得る。このデータに対して先に設定したキー
ワードが含まれるか否かを判定すると、「BB」という
キーワードが含まれていることがわかる。
【0041】したがって、先に切り分けられている、こ
の見出し17に対応する記事14の領域の文書画像デー
タに先に得た日付の情報を文字化した画像を追加した
後、見出しの文字コードデータと、先に得た日付情報の
数値データと、見出しに含まれているキーワードと、記
事画像データとを関連づけて記憶装置にファイリングす
る。
【0042】ここまで処理した見出しの番号は3であ
り、最後の見出しである。したがって、この紙面に対す
る処理は終了する。次の紙面について引続き検索、ファ
イリング処理を行うか否かを使用者のオペレーションに
より選択し、引続き処理を行う場合は次の紙面の日付表
示領域の切り出しより処理を開始する。
【0043】次に、このような実施例の動作を図6及び
図7に示すフローチャートに従い説明する。図6はキー
ワードを登録する場合の処理内容を示すフローチャート
である。キーワードの登録においては、まず、使用者
は、ファイリングしたい記事の見出しに含まれる文字列
をキーワードとして登録する(ステップS1)。複数の
キーワードを登録したい場合は、必要なだけ登録する
(ステップS2)。
【0044】具体的には、使用者がキーボードからキー
ワードとして登録したい文字列を入力すると、この文字
列に対応した文字コードデータがRAMに記憶される。
RAMにはこのように複数のメモリ領域を設定してお
く。
【0045】図7はファイリングの処理内容を示すフロ
ーチャートである。ファイリングの処理においては、ま
ず、文書画像読み取り部2によって紙面全体の文書画像
を読み取り(ステップS3)、新聞の最上欄の日付が表
示された画像領域を切り出して文字認識処理を行い、日
付情報を得る(ステップS4)。すなわち、文字認識し
た文字コードデータ内で年、月、日の文字を検索して、
これらの文字の前の数字により発行年月日の情報を得、
これを年、月、日の数値データに変換し、専用のメモリ
に記憶しておく。
【0046】次に、紙面全体の画像より、各見出しの領
域と、各見出しが指し示す記事の領域とを切り出す(ス
テップS5)。次に、切り出された各記事の見出しの領
域に対して、それぞれ1番から順に番号付けをする(ス
テップS6)。
【0047】次に、1番目に番号付けされた見出し番号
1の領域の文書画像データに対して文字認識処理を行
い、見出しの文字コードデータを得(ステップS7)、
見出しの文字コードデータに先に登録したキーワードの
うち何れかが含まれているか否かを判定する(ステップ
S8)。
【0048】ここで、見出しの文字コードデータに何れ
のキーワードも含まれていない場合には、その見出しが
指し示す記事はファイリングしないものとして、ステッ
プS11に進む。一方、キーワードが含まれているとき
には、切り出された記事の領域の文書画像データに、日
付の情報を文字化した画像を追加する(ステップS
9)。
【0049】そして、日付情報の文字画像が追加された
記事の文書画像データに、見出しの文字コードデータ
と、日付情報の数値データと、見出しに含まれているキ
ーワードとを、各々関連づけて記憶装置にファイリング
する(ステップS10)。
【0050】これは、例えば記事の文書画像データに、
データヘッダとしてこの記事を指し示す見出しの文字コ
ードデータ、日付の情報を示すデータ、見出しに含まれ
ているキーワードの文字コードデータを付加して、ひと
つのファイルとして記憶装置にファイリングする。
【0051】記事の文書画像データを、見出し、日付、
キーワードと各々関連づけてファイリングした後には、
見出し番号からその見出しが最後の見出しであるか否か
を判定する(ステップS11)。
【0052】ここで、見出しが最後の見出しでなけれ
ば、ステップS7へ戻って、次の見出しの領域の文書画
像データに対する文字認識処理へ移る。見出しが最後の
見出しであれば、次の紙面について、引続き検索、ファ
イリング処理を行うか否かを使用者が判断する(ステッ
プS12)。この使用者の判断において、次の紙面につ
いて処理を続ける場合は、ステップS3に戻って、次の
紙面に対する日付表示領域の切り出しから処理を開始す
る。現在の紙面で処理を完了する場合は、動作を終了す
る。
【0053】このようにして、新聞・雑誌等の記事の
内、使用者の設定したキーワードが“見出し”に含まれ
ている記事についてだけ、見出しの文字コードデータ
と、出版日の情報と、キーワードと、見出しに対応する
本文の画像データとを関連づけてファイリングする。
【0054】すなわち、はじめに使用者が必要な記事の
見出しに含まれるキーワードを登録しておいて、新聞・
雑誌の記事のファイリングを開始すると、文書画像読み
取り部2により紙面全体を読み取った後、日付表示領
域、各見出しの領域、各記事の領域を切り出す。そし
て、日付表示領域の文書画像に対して文字認識処理を施
して日付情報を得、各見出しの領域の文書画像データに
対して文字認識処理を施して見出しの文字コードデータ
を得、この見出しの文字コードデータにあらかじめ登録
しておいたキーワードが含まれているか否かを判定し
て、含まれている場合には、この見出しに対応する記事
の領域の文書画像データに先に得た日付情報を文字画像
化して追加する。そして、この日付情報を追加した記事
画像データに、見出しの文字コードデータと、先に得た
日付情報と、見出しの文字コードデータに含まれていた
キーワードの文字コードデータとを関連づけてファイリ
ングする。
【0055】したがって、必要な記事を手作業で1つず
つ切り抜いてファイリングするような時間と手間をかけ
ずに記事のファイリングができる。また、このようなフ
ァイリング方式であれば、紙面上の全ての記事をファイ
リングするシステムのように不必要な記事をファイリン
グしないので、無駄な処理時間や無駄な記憶容量を必要
としない。
【0056】さらに、ファイリングされた記事のデータ
を呼び出す際に、見出し文やファイリングされた際のキ
ーワードや発行日付などを手掛かりに検索する事が容易
であるし、逆に呼び出された記事データの発行日付や記
事がファイリングされた際のキーワードを知る事が容易
である。
【0057】
【発明の効果】この発明によれば、キーワードが見出し
に含まれている記事だけを選択してファイリングするこ
とができる。
【図面の簡単な説明】
【図1】本発明の構成を示すブロック図である。
【図2】本発明を日本語ワードプロセッサに適用した一
実施例の構成を示すブロック図である。
【図3】本発明により処理される新聞紙面の例を示す説
明図である。
【図4】本発明によりファイリングされたデータ構造の
例を示す説明図である。
【図5】本発明によりファイリングされた記事の表示例
を示す説明図である。
【図6】実施例の動作を示すフローチャートである。
【図7】実施例の動作を示すフローチャートである。
【符号の説明】
1 キーワード登録部 2 文書画像読み取り部 3 記事領域切り出し部 4 日付表示領域切り出し部 5 見出し領域切り出し部 6 文字認識処理部 7 日付情報抽出部 8 日付追加部 9 キーワード判定部 10 データファイル記憶部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 新聞・雑誌等の記事面を文書画像として
    光学的に読み取る文書画像読み取り手段と、 読み取られた文書画像から見出しを切り出すとともにそ
    の見出しに対応する本文の記事を切り出す画像領域切り
    出し手段と、 切り出された見出しの文書画像について文字認識処理を
    行い見出しの文字コードを得る文字認識処理手段と、 文字列からなるキーワードを入力する入力手段と、 見出しの文字コードにキーワードが含まれているか否か
    を判定するキーワード判定手段と、 キーワードが含まれている見出しの文字コードとその見
    出しに対応する本文の記事の文書画像とを関連づけて記
    憶するファイル記憶手段を備えてなるファイリング装
    置。
  2. 【請求項2】 入力手段が複数のキーワードを入力する
    ことが可能であり、キーワード判定手段が、見出しの文
    字コードに複数のキーワードの内のいずれかが含まれて
    いるか否かを判定することを特徴とする請求項1記載の
    ファイリング装置。
  3. 【請求項3】 文書画像読み取り手段によって読み取ら
    れた文書画像から日付表示領域を切り出す日付表示領域
    切り出し手段と、 切り出された日付表示領域の文書画像について文字認識
    処理を行い日付の文字コードを得る日付認識処理手段を
    さらに備え、 ファイル記憶手段が、キーワードが含まれている見出し
    の文字コードとその見出しに対応する本文の記事の文書
    画像とを日付の文字コードに関連づけて記憶することを
    特徴とする請求項1記載のファイリング装置。
  4. 【請求項4】 文書画像読み取り手段によって読み取ら
    れた文書画像から日付表示領域を切り出す日付表示領域
    切り出し手段と、 切り出された日付表示領域の文書画像について文字認識
    処理を行い日付の文字コードを得る日付認識処理手段
    と、 日付の文字コードを文字画像化して本文の記事の文書画
    像に追加する追加手段をさらに備え、 ファイル記憶手段が、キーワードが含まれている見出し
    の文字コードとその見出しに対応する本文の記事の文書
    画像とを日付の文字コードに関連づけて記憶することを
    特徴とする請求項1記載のファイリング装置。
JP8010170A 1996-01-24 1996-01-24 ファイリング装置 Pending JPH09204511A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8010170A JPH09204511A (ja) 1996-01-24 1996-01-24 ファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8010170A JPH09204511A (ja) 1996-01-24 1996-01-24 ファイリング装置

Publications (1)

Publication Number Publication Date
JPH09204511A true JPH09204511A (ja) 1997-08-05

Family

ID=11742815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8010170A Pending JPH09204511A (ja) 1996-01-24 1996-01-24 ファイリング装置

Country Status (1)

Country Link
JP (1) JPH09204511A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247237A (ja) * 1996-12-30 1998-09-14 Ricoh Co Ltd 文書画像処理装置および文書画像処理方法および情報記録媒体
US7965293B2 (en) 2000-09-04 2011-06-21 Minolta Co., Ltd. Image processing device, image processing method, and image processing program for reconstructing data
JP2015084183A (ja) * 2013-10-25 2015-04-30 国立大学法人 大分大学 新聞記事アーカイブシステム
JP2018113567A (ja) * 2017-01-11 2018-07-19 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247237A (ja) * 1996-12-30 1998-09-14 Ricoh Co Ltd 文書画像処理装置および文書画像処理方法および情報記録媒体
US7965293B2 (en) 2000-09-04 2011-06-21 Minolta Co., Ltd. Image processing device, image processing method, and image processing program for reconstructing data
JP2015084183A (ja) * 2013-10-25 2015-04-30 国立大学法人 大分大学 新聞記事アーカイブシステム
JP2018113567A (ja) * 2017-01-11 2018-07-19 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
US10659654B2 (en) 2017-01-11 2020-05-19 Kyocera Document Solutions Inc. Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US5860075A (en) Document data filing apparatus for generating visual attribute values of document data to be filed
JP4377494B2 (ja) 情報入力装置
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
JP2713622B2 (ja) 表形式文書読取装置
JPH05250408A (ja) 取り込んだ情報で文書画像を復号することなく選択した文書の重要な部分を補完するための方法
KR870011552A (ko) 문서 등록 방식
JPH04321183A (ja) ファイリング装置の文書登録方法
US5854860A (en) Image filing apparatus having a character recognition function
JPH09204511A (ja) ファイリング装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2007011683A (ja) 文書管理支援装置
JPH08153110A (ja) 文書ファイリング装置及び方法
JP4501731B2 (ja) 画像処理装置
JPS63219061A (ja) 文字処理装置
JP3928739B2 (ja) 文書ファイリングシステム
JP3000349B2 (ja) キー入力編集方法及び編集装置
JP3424942B2 (ja) 対訳画像形成装置
JPH06274551A (ja) 画像ファイリング装置
JP2907947B2 (ja) 光学文字読取システム
JP2829186B2 (ja) 光学的文字読取装置
JPH0830624A (ja) 解読支援装置
JPH03206583A (ja) 文字認識装置
JPH07182474A (ja) 電子ファイル装置