JP2003196270A - 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体 - Google Patents

文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体

Info

Publication number
JP2003196270A
JP2003196270A JP2001398405A JP2001398405A JP2003196270A JP 2003196270 A JP2003196270 A JP 2003196270A JP 2001398405 A JP2001398405 A JP 2001398405A JP 2001398405 A JP2001398405 A JP 2001398405A JP 2003196270 A JP2003196270 A JP 2003196270A
Authority
JP
Japan
Prior art keywords
information
document
document information
processing apparatus
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001398405A
Other languages
English (en)
Inventor
Yoshinori Nagata
義典 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001398405A priority Critical patent/JP2003196270A/ja
Priority to US10/319,487 priority patent/US20030126553A1/en
Priority to CNB021598444A priority patent/CN1312610C/zh
Publication of JP2003196270A publication Critical patent/JP2003196270A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文書情報の概要の把握に用いることが可能
で、データ量が小さく、また文書情報に対する全文検索
等の処理に用いることが可能な概略情報を生成する文書
情報処理方法、文書情報処理装置、通信システム、コン
ピュータプログラム、及び記録媒体を提供する。 【解決手段】 文書情報処理装置10では、文書作成用
アプリケーションにて作成された文書情報に基づいて、
文書情報と同様の文字情報を含み文書情報の量の削減に
用いる中間情報を生成し(S101)、文書情報又は中
間情報に含まれる単語情報を抽出し(S102)、抽出
した単語情報を、必要に応じて情報量を削減した中間情
報に付加して概略情報を生成する(S103)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字情報を含む文
書情報を処理する文書情報処理方法、その方法を適用し
た文書情報処理装置、その装置を用いた通信システム、
その装置を実現するためのコンピュータプログラム、及
びそのプログラムを記録してあるコンピュータでの読み
取りが可能な記録媒体に関し、特にページ数及びデータ
量等の量が大きい文書情報の内容を容易に把握すること
が可能な概略情報を生成する文書情報処理方法、文書情
報処理装置、通信システム、コンピュータプログラム、
及び記録媒体に関する。
【0002】
【従来の技術】電子文書である文書情報を作成するため
の様々な文書作成用アプリケーションプログラム(以
下、文書作成用アプリケーションという)が市場に提供
されており、このような文書作成用アプリケーションプ
ログラムを用いて、様々な書式で構成される文字情報、
画像情報、及び図表情報等の多様な情報を含む文書情報
が作成されている。そして文書作成用アプリケーション
利用した数多くの文書情報が作成されることに伴い、作
成された文書情報を効率的に利用及び管理するためのシ
ステムが求められている。
【0003】例えば特開平8−241306号公報で
は、文書情報の作成日時及び文字情報等の情報を含む属
性情報を作成し、作成した属性情報を用いて文書情報を
管理する文書情報処理装置(公報中では文書処理装置)
を開示している。特開平8−241306号公報にて開
示される文書情報処理装置において作成した属性情報
は、文書作成用アプリケーション依存性が無く、また文
字情報を含んでいるためキーワード検索等の処理が行え
るので、文書情報を管理する上での効率性を向上させる
という効果が望める。
【0004】
【発明が解決しようとする課題】しかしながら特開平8
−241306号公報にて開示されている文書情報処理
装置が作成する属性情報では、元となる文書情報に含ま
れる書式等の全ての情報を保持しようとするため、デー
タ量が大きくなるという問題があり、属性情報のデータ
量が大きい場合、文書情報の後方のページに相当する情
報を破棄する必要が生じるため、破棄されたページの文
字情報をも削除することになり、全文検索等の文字情報
を用いた検索処理ができなくなるという問題がある。
【0005】本発明は斯かる事情に鑑みてなされたもの
であり、元の文書情報と同様の文字情報を含む中間情報
を生成すると共に、文書情報又は中間情報から単語情報
を抽出し、抽出した単語情報を中間情報に付加した概略
情報を生成し、特に中間情報のデータ量が予め設定して
いる設定値を超える場合に、中間情報から色数、書体、
及び書式等の情報を削減することにより、中間情報に単
語情報を付加した概略情報は、データ量が小さいだけで
なく、全ての単語情報を含んでいるため全文検索等の文
字情報を用いた検索処理に用いることができ、これによ
り文書情報を効率的に利用及び管理することが可能な文
書情報処理方法、その方法を適用した文書情報処理装
置、その装置を用いた通信システム、その装置を実現す
るためのコンピュータプログラム、及びそのプログラム
を記録してあるコンピュータでの読み取りが可能な記録
媒体の提供を目的とする。
【0006】
【課題を解決するための手段】本発明に係る文書情報処
理方法は、文字情報を含む文書情報を処理する文書情報
処理方法において、前記文書情報に基づいて、該文書情
報と同様の文字情報を含む中間情報を生成し、前記文書
情報又は前記中間情報から単語を示す単語情報を抽出
し、抽出した単語情報を前記中間情報に付加した概略情
報を生成することを特徴とする。
【0007】本発明に係る文書情報処理方法では、デー
タ量が小さい中間情報に単語情報を付加した概略情報を
生成することにより、生成した概略情報は、データ量が
小さいだけでなく、全ての単語情報を含んでいるため、
全文検索等の文字情報を用いた検索処理に用いることが
でき、これにより概略情報の元である文書情報を効率的
に利用及び管理することが可能である。
【0008】本発明に係る文書情報処理装置は、文字情
報を含む文書情報を処理する文書情報処理装置におい
て、前記文書情報に基づいて、該文書情報と同様の文字
情報を含む中間情報を生成する手段と、前記文書情報又
は生成した中間情報に含まれる文字情報から単語を示す
単語情報を抽出する抽出手段と、抽出した単語情報を前
記中間情報に付加した概略情報を生成する手段とを備え
ることを特徴とする。
【0009】本発明に係る文書情報処理装置では、中間
情報に単語情報を付加した概略情報を生成することによ
り、生成した概略情報は、全ての単語情報を含んでいる
ため、全文検索等の文字情報を用いた検索処理に用いる
ことができ、これにより概略情報の元である文書情報を
効率的に利用及び管理することが可能である。
【0010】本発明に係る文書情報処理装置は、前記中
間情報の量を求める手段と、求めた中間情報の量を、予
め設定している所定値と比較する手段と、前記中間情報
の量が、所定値より大きいと判定した場合に、中間情報
の量を削減する削減手段とを備えることを特徴とする。
【0011】本発明に係る文書情報処理装置では、中間
情報のデータ量等の量が設定値を超える場合に、中間情
報に含まれる情報を削減することで、概略情報のデータ
量が大きくなることを防止することが可能である。
【0012】本発明に係る文書情報処理装置は、前記削
減手段は、前記中間情報の一部を削除する削減方法を含
むことを特徴とする。
【0013】本発明に係る文書情報処理装置では、中間
情報の一部が削減されているので、概略情報のデータ量
を小さくすることが可能である。
【0014】本発明に係る文書情報処理装置は、前記中
間情報の一部とは、前記中間情報が示す文書の後方のペ
ージに関する情報であることを特徴とする。
【0015】本発明に係る文書情報処理装置では、文書
の導入部となる先頭の部分を中間情報として残すことに
より、概略情報の中の中間情報を示す部分から、文書情
報の内容を効率的に確認することが可能である。
【0016】本発明に係る文書情報処理装置は、前記削
減手段は、色に関する情報を変換する削減方法を含むこ
とを特徴とする。
【0017】本発明に係る文書情報処理装置では、色数
及び色彩等の色に関する情報の削減、例えば24ビット
カラー画像をグレースケール画像に変換することによ
り、概略情報のデータ量を小さくすることが可能であ
る。
【0018】本発明に係る文書情報処理装置は、前記削
減手段は、文字情報の書体に関する情報を変換する削減
方法を含むことを特徴とする。
【0019】本発明に係る文書情報処理装置では、明朝
体及びゴシック体等の書体に関する情報を削減すること
により、概略情報のデータ量を小さくすることが可能で
ある。
【0020】本発明に係る文書情報処理装置は、前記削
減手段は、文書の書式に関する情報を変換する削減方法
を含むことを特徴とする。
【0021】本発明に係る文書情報処理装置では、行数
及び桁数並びに余白等の書式に関する情報を削減するこ
とにより、概略情報のデータ量を小さくすることが可能
である。
【0022】本発明に係る文書情報処理装置は、前記文
書情報は図形に関する情報を含み、前記削減手段は、図
形に関する情報を変換する削減方法を含むことを特徴と
する。
【0023】本発明に係る文書情報処理装置では、図
形、特に線画の線幅及び線種等の情報を削減することに
より、概略情報のデータ量を小さくすることが可能であ
る。
【0024】本発明に係る文書情報処理装置は、前記削
減手段は、第1の削減方法にて、中間情報の量を削減す
る手順と、削減した後の中間情報の量を所定値と比較す
る手順と、比較により中間情報の量が所定値より大きい
と判定した場合に、前記第1と異なる第2の削減方法に
て中間情報の量を更に削減する手順とを含むことを特徴
とする。
【0025】本発明に係る文書情報処理装置では、複数
の削減手段を備えている場合に、夫々の削減手段を順番
に実行するので、概略情報のデータ量が大きくなること
を防止することが可能である。
【0026】本発明に係る文書情報処理装置は、前記削
減方法の優先順位を受け付ける手段を備え、前記削減手
段は、受け付けた優先順位に従って削減すべくなしてあ
ることを特徴とする。
【0027】本発明に係る文書情報処理装置では、複数
の削減手段を実行する順番を設定し、必要に応じて特定
の削減手段の実行を制限することにより、利用者の利用
状況に即した概略情報を生成することが可能である。
【0028】本発明に係る文書情報処理装置は、前記文
書情報を不可逆圧縮した画像情報を生成する手段と、生
成した画像情報及び前記中間情報の量の大きさを比較す
る手段と、比較により画像情報が、前記中間情報より量
が小さいと判定した場合に、画像情報を新たな中間情報
として置換する手段とを備えることを特徴とする。
【0029】本発明に係る文書情報処理装置では、文書
情報に基づいて、表示サイズを縮小しJPEG及びGI
F等の形式で不可逆圧縮した画像情報であるサムネイル
画像等の画像情報を生成し、生成した画像情報が中間情
報よりデータ量が小さければ、画像情報を中間情報とし
て用いることにより、概略情報を小さくすることが可能
である。
【0030】本発明に係る文書情報処理装置は、文字情
報を含む文書情報を処理する文書情報処理装置におい
て、前記文書情報を不可逆圧縮した画像情報を生成する
手段と、前記文書情報に含まれる文字情報から単語を示
す単語情報を抽出する抽出手段と、抽出した単語情報を
生成した画像情報に付加した概略情報を生成する手段と
を備えることを特徴とする。
【0031】本発明に係る文書情報処理装置では、文書
情報に基づいて、表示サイズを縮小しJPEG及びGI
F等の形式で不可逆圧縮した画像情報であるサムネイル
画像等の画像情報を生成し、生成した画像情報に単語情
報を付加した概略情報を生成することにより、生成した
概略情報は、データ量が小さいだけでなく、全ての単語
情報を含んでいるため、全文検索等の文字情報を用いた
検索処理に用いることができ、これにより概略情報の元
である文書情報を効率的に利用及び管理することが可能
である。
【0032】本発明に係る文書情報処理装置は、前記抽
出手段は、文字情報から、形態素解析により抽出した自
立語を単語情報として抽出すべくなしてあることを特徴
とする。
【0033】本発明に係る文書情報処理装置では、形態
素解析を用いて単語情報を抽出することにより、日本語
で作成された文書情報に対して、効率的な検索に用いら
れる単語情報を抽出することが可能となる。
【0034】本発明に係る文書情報処理装置は、生成し
た概略情報を可逆圧縮する手段を備えることを特徴とす
る。
【0035】本発明に係る文書情報処理装置では、ZI
P、LZH、及びCAB等の形式の可逆圧縮を行うこと
により、概略情報のデータ量を小さくすることが可能で
ある。
【0036】本発明に係る通信システムは、本発明に係
る文書情報処理装置と、該文書情報処理装置と通信する
通信装置と、前記文書情報処理装置及び通信装置と通信
する記録装置とを備え、前記文書情報処理装置は、前記
文書情報を前記記録装置に記録させる手段と、前記文書
情報を記録した位置を指示する指示情報及び前記概略情
報を前記通信装置へ送信する手段とを備えることを特徴
とする。
【0037】本発明に係る通信システムでは、サーバコ
ンピュータを用いた記録装置に元の文書情報を記録し、
クライアントコンピュータを用いた通信装置へ概略情報
を送信することにより、通信装置を操作する操作者は概
略情報を確認して、文書情報が必要であると判断した場
合に限り文書情報を記録装置から取り寄せることができ
るので、通信負荷及び通信装置での容量負荷を軽減する
ことが可能であり、特に通信負荷の軽減については、複
数の通信装置へ同報送信にて概略情報を送信する場合に
有効である。
【0038】本発明に係るコンピュータプログラムは、
コンピュータに、文字情報を含む文書情報を処理させる
コンピュータプログラムにおいて、コンピュータに、前
記文書情報に基づいて、該文書情報と同様の文字情報を
含む中間情報を生成させる手順と、コンピュータに、前
記文書情報又は前記中間情報から単語を示す単語情報を
抽出させる手順と、コンピュータに、抽出した単語情報
を前記中間情報に付加した概略情報を生成させる手順と
を含むことを特徴とする。
【0039】本発明に係るコンピュータプログラムで
は、汎用型のクライアントコンピュータ等のコンピュー
タにて実行することで、コンピュータが文書情報処理装
置として動作するので、中間情報に単語情報を付加した
概略情報を生成することにより、生成した概略情報は、
全ての単語情報を含んでいるため、全文検索等の文字情
報を用いた検索処理に用いることができ、これにより概
略情報の元である文書情報を効率的に利用及び管理する
ことが可能である。
【0040】本発明に係るコンピュータでの読み取りが
可能な記録媒体は、コンピュータに、文字情報を含む文
書情報を処理させるコンピュータプログラムを記録して
ある、コンピュータでの読み取りが可能な記録媒体にお
いて、コンピュータに、前記文書情報に基づいて、該文
書情報と同様の文字情報を含む中間情報を生成させる手
順と、コンピュータに、前記文書情報又は前記中間情報
から単語を示す単語情報を抽出させる手順と、コンピュ
ータに、抽出した単語情報を前記中間情報に付加した概
略情報を生成させる手順とを含むコンピュータプログラ
ムを記録してあることを特徴とする。
【0041】本発明に係るコンピュータでの読み取りが
可能な記録媒体では、記録されているコンピュータプロ
グラムを、汎用型のクライアントコンピュータ等のコン
ピュータにて実行することで、コンピュータが文書情報
処理装置として動作するので、中間情報に単語情報を付
加した概略情報を生成することにより、生成した概略情
報は、全ての単語情報を含んでいるため、全文検索等の
文字情報を用いた検索処理に用いることができ、これに
より概略情報の元である文書情報を効率的に利用及び管
理することが可能である。
【0042】
【発明の実施の形態】以下、本発明をその実施の形態を
示す図面に基づいて詳述する。図1は本発明の文書情報
処理装置の構成を示すブロック図である。図1中10
は、クライアントコンピュータを用いた本発明の文書情
報処理装置であり、文書情報処理装置10は、内部通信
網(LAN)等の通信網NWに接続している。文書情報
処理装置10は、本発明の文書情報処理装置用のコンピ
ュータプログラムPG及びデータ等の各種情報を記録し
たCD−ROMドライブ等の記録媒体RECから記録さ
れている各種情報を読み取る補助記憶手段12、補助記
憶手段12により読み取った各種情報を記録するハード
ディスク等の記録手段13を備えている。そして記録手
段13からコンピュータプログラムPG及びデータ等の
各種情報を読み取り、情報を一時的に記憶するRAM1
4に記憶させてCPU11により実行することで、クラ
イアントコンピュータは本発明の文書情報処理装置10
として動作する。
【0043】さらに文書情報処理装置10は、マウス及
びキーボード等の入力手段15、モニタ及びプリンタ等
の出力手段16、並びにLANボード等の通信手段17
を備えている。また記録手段13には、本発明のコンピ
ュータプログラムPGだけでなく、電子文書を作成する
ための文書作成用アプリケーション及び後述する文書情
報の変換に要する仮想プリンタドライバ等の様々なコン
ピュータプログラムが記録されている。
【0044】次に本発明の文書情報処理装置10にて生
成される概略情報について説明する。本発明の文書情報
処理装置10では、文書作成用アプリケーションを用い
て作成された電子文書に基づいて、その概要を把握する
ことができ、また全文検索等の文字情報を用いた検索処
理に用いることが可能な概略情報を後述する方法にて生
成する機能を有している。
【0045】図2は本発明の文書情報処理装置10の概
略情報生成処理の概要を示すフローチャートである。文
書情報処理装置10では、上述したように文書作成用ア
プリケーションにて作成された文書情報に基づいて、文
書情報と同様の文字情報を含み文書情報の量の削減に用
いる中間情報を生成する(S101)。なお中間情報
は、必要に応じて情報量の削減が行われる。また文書情
報に含まれる単語情報を抽出し(S102)、抽出した
単語情報を、必要に応じて情報量の削減が行われた中間
情報に付加して概略情報を生成する(S103)。
【0046】ステップS101にて生成される中間情報
とは、文書情報を構成する内容を含み、生成した文書作
成用アプリケーションに依存しない情報であり、特開平
8−241306号公報にて開示されている属性情報等
の情報がこれに該当する。即ち文書作成用アプリケーシ
ョンには様々な種類があり、一の種類の文書作成用アプ
リケーションを用いて作成された電子文書である文書情
報は、作成に用いた一の種類の文書作成用アプリケーシ
ョンに対する依存性が高く、他の種類の文書作成用アプ
リケーションでは、出力させることができない場合が多
い。そこで一の種類の文書作成用アプリケーションを用
いて作成された電子文書である文書情報を、特定の文書
作成用アプリケーションに依存することがなく、他の種
類の文書作成用アプリケーションでも出力させることが
可能な中間情報を生成する処理を行う。特定の文書作成
用アプリケーションに依存することがない中間情報を生
成する方法の一つとして、プリンタである出力手段16
から出力する場合に、文書情報を出力手段16から出力
させることが可能な形式に変換する機能を利用するとい
う方法がある。
【0047】図3は本発明の文書情報処理装置10にて
生成される中間情報の構成を示す概念図である。図3に
示すように文書情報に基づいて生成された中間情報は、
ページ数Mを示す情報と、1ページ目からMページ目ま
での各ページについての内容を示すページ毎の情報とに
より構成されている。夫々のページの内容を示す情報と
しては、各ページの文書を構成する要素である文字列、
線画、及び画像等のオブジェクトの個数Nを示す情報
と、各オブジェクトについての種類、位置、固有情報、
並びにオブジェクトの内容を示すデータ等の情報が示さ
れており、固有情報としては、例えばオブジェクトが線
画の場合、線幅及び線種等の情報が示される。
【0048】出力手段16から出力させることが可能な
形式に変換する機能を利用して、図3に示す構成を有す
る中間情報を作成する場合、文書情報処理装置10に対
する操作方法としては、記録手段13に記録されている
仮想プリンタドライバをインターフェースとして設定さ
れている仮想的なプリンタに対して出力させる操作を行
うことになり、文書情報処理装置10では、操作を受け
付けて、仮想プリンタドライバの処理により文書情報に
基づく中間情報を生成する。
【0049】なお仮想プリンタドライバにより、仮想的
なプリンタを想定して変換する方法は、あくまでも一例
であり、他の方法により変換してもよい。ただし特定の
文書作成用アプリケーションに依存しない中間情報を生
成するのは、特定の文書作成用アプリケーションに依存
しない概略情報を生成するためであり、特定の文書作成
用アプリケーションに対する依存性が高くてもよい場
合、具体的には、特定の文書情報処理装置10上でのみ
使用する概略情報を生成する場合及び使用する文書作成
用アプリケーションが統一されている場合等の特定の文
書作成用アプリケーションだけを利用する条件下におい
ては、文書情報と同じ内容の中間情報を一時的な情報
(テンポラリファイル)として生成し、これを文書情報
に基づく中間情報としてもよい。
【0050】次に本発明の文書情報処理装置10の概略
情報生成処理を詳細に説明する。文書情報処理装置10
を操作し、文書情報に基づく概略情報の生成を所望する
操作者は、中間情報のデータ量を削減する削減方法の選
択及び選択した削減方法の優先順位を指定する入力を行
う。
【0051】図4は本発明の文書情報処理装置10から
出力される画像を示す説明図である。図4では、削減方
法選択及び優先順位指定のための画像を示しており、左
側のウィンドウに示されている削減方法の一覧から所望
する削減方法を選択し、追加を示す矢印をクリックする
ことにより、削減方法が選択されて適用する削減方法と
して右側のウィンドウに移動し、また選択された削減方
法を削除する場合は、右側のウィンドウに示されている
適用する削減方法の一覧から削除を所望する削減方法を
選択し、削除を示す矢印をクリックすることにより、選
択された削減方法が左側のウィンドウに移動する。また
右側のウィンドウに示されている適用する削減方法の一
覧では、優先順位の高い削減方法から低い削減方法へ、
上から下へ順番に並んで示されており、所望する削減方
法を選択し、優先順位を上げることを示す矢印又は下げ
ることを示す矢印をクリックすることにより、優先順位
を変更することができる。そしてOKと示された箇所を
クリックすることにより、文書情報処理装置10は、削
減方法選択及び優先順位指定が完了し、概略情報の生成
が開始される。
【0052】なお以下の説明では、削減方法として色情
報の削減、書体情報の削減、書式情報の削減、及び図形
情報の削減が選択され、優先順位が高い方から色情報の
削減、書体情報の削減、書体情報の削減、及び図形情報
の削減として指定されたものとする。ただし本発明の文
書情報処理装置10の削減方法は、上述した方法に限る
ものではなく、また削減方法を全て選択する必要もな
い。
【0053】図5乃至図7は本発明の文書情報処理装置
10の概略情報生成処理を示すフローチャートである。
文書情報処理装置10では、削減方法選択及び優先順位
指定の入力を受け付け(S201)、文書情報に基づい
て、文書情報と同様の文字情報を含む中間情報を生成し
(S202)、文書情報又はステップS202にて生成
した中間情報から文字情報を抽出し(S203)、抽出
した文字情報から形態素解析により自立語を単語情報と
して抽出する(S204)。このとき形態素解析処理に
より、動詞等の活用形がある単語については、基本形に
変換する処理がなされる。ステップS203にて文字情
報を抽出する抽出元の情報としては、基本的には文書情
報が用いられるが、文書情報と同様の文字情報を含んで
いるステップS202にて生成した中間情報を文書情報
とみなし、中間情報から文字情報を抽出してもよい。た
だし後述するように情報を削減した後の中間情報は、文
書情報と同様の文字情報を必ずしも含んでいるわけでは
ないので、情報を削減する前の中間情報から文字情報を
抽出しなければならない。
【0054】そして生成した中間情報のページ数及びデ
ータ量等の量を予め設定されている設定値と比較し(S
205)、ステップS205の比較により設定値より大
きいと判定した場合(S206:YES)、指定してい
る優先順位に従って、優先順位が1位である削減方法、
ここでは色数及び色彩等の色に関する情報の変換、例え
ば24ビットカラー画像をグレースケール画像に変換す
る削減方法にて、中間情報の量を削減し(S207)、
情報量を削減した後の中間情報の量を予め設定されてい
る設定値と比較する(S208)。
【0055】ステップS208の比較により設定値より
大きいと判定した場合(S209:YES)、指定して
いる優先順位に従って、優先順位が2位である削減方
法、ここでは明朝体及びゴシック体等の書体に関する情
報を変換する削減方法にて、ステップS207で情報量
を削減した中間情報の量を更に削減し(S210)、情
報量を削減した後の中間情報の量を予め設定されている
設定値と比較する(S211)。
【0056】ステップS211の比較により設定値より
大きいと判定した場合(S212:YES)、指定して
いる優先順位に従って、優先順位が3位である削減方
法、ここでは行数及び桁数並びに余白等の書式に関する
情報を変換する削減方法にて、ステップS210にて情
報量を削減した中間情報の量を更に削減し(S21
3)、情報量を削減した後の中間情報の量を予め設定さ
れている設定値と比較する(S214)。
【0057】ステップS214の比較により設定値より
大きいと判定した場合(S215:YES)、指定して
いる優先順位に従って、優先順位が4位である削減方
法、ここでは図形、特に線幅及び線種等の情報を変換す
る削減方法にて、ステップS213にて情報量を削減し
た中間情報の量を削減し(S216)、情報量を削減し
た後の中間情報の量を予め設定されている設定値と比較
する(S217)。なお文書中の罫線の線幅及び線種並
びに図表等の情報もこのとき削減されるが、罫線の線種
及び線幅については書式に関する情報としてもよく、ま
た図表についても別途処理により削減するような設定で
あってもよい。
【0058】そしてステップS217の比較により設定
値より大きいと判定した場合(S218:YES)、中
間情報が示す文書の一部である後方のページに関する情
報を削除する削減方法にて、ステップS216にて情報
量を削減した中間情報の量を更に削減し(S219)、
記録手段13又はRAM14に中間情報を一時的に記録
する(S220)。ステップS219にて示す後方のペ
ージに関する情報を削減する処理は、事前に選択してい
なくとも実行されるが、逆に予めページに関する情報の
削減を行わないように設定しておくことにより、最終的
な中間情報の量が所定値を越えた場合でも、ステップS
219に示す処理を行わないようにすることも可能であ
る。
【0059】なおステップS205の比較により中間情
報の量が設定値より小さいと判定した場合(S206:
NO)、ステップS208の比較により中間情報の量が
設定値より小さいと判定した場合(S209:NO)、
ステップS211の比較により中間情報の量が設定値よ
り小さいと判定した場合(S212:NO)、ステップ
S214の比較により中間情報の量が設定値より小さい
と判定した場合(S215:NO)、又はステップS2
17の比較により中間情報の量が設定値より小さいと判
定した場合(S218:NO)、以降の削減処理は行わ
ず、ステップS218に進み中間情報の一時的な記録を
行う(S220)。
【0060】そして文書情報に基づいて、表示サイズを
縮小しJPEG及びGIF等の形式で不可逆圧縮した画
像情報、即ちサムネイル画像等の画像情報を生成し(S
221)、生成した画像情報と、ステップS220にて
記録した中間情報との量の大きさを比較する(S22
2)。なお文書情報に基づいて画像情報を生成するので
はなく、ステップS202にて生成した中間情報に基づ
いて画像情報を生成し、大きさの比較に用いるようにし
てもよい。
【0061】ステップS222の比較により画像情報
が、前記中間情報より量が小さいと判定した場合(S2
23:YES)、画像情報を新たな中間情報として置換
して(S224)、一時的に記録する。なおステップS
222の比較により画像情報が、前記中間情報より量が
大きいと判定した場合(S223:NO)、中間情報の
置換は行わない。そしてステップS204にて抽出した
単語情報を、一時的に記録された中間情報に付加して概
略情報を生成する(S225)。このようにして概略情
報が生成される。
【0062】図8は本発明の文書情報処理装置10にて
生成される概略情報の構成を示す概念図である。概略情
報には、単語情報として、単語数Mを示す情報と、文書
情報から抽出した単語1から単語Mまでの単語が含まれ
ており、更に必要に応じて情報量を削減された中間情報
が含まれている。
【0063】なお生成した概略情報は、更に量の削減を
行うため、ZIP、LZH、及びCAB等の形式の可逆
圧縮が行われる(S226)。
【0064】前記実施の形態では、文書情報の色、書
体、書式、及び図形等の各種オブジェクトを含む中間情
報を用いる形態を示したが、本発明はこれに限らず、各
種オブジェクトに対する削減処理は行わず、文書情報か
ら生成したサムネイル画像等の画像情報に基づいて概略
情報を生成する形態でもよい。
【0065】次に各種オブジェクトに対する削減処理を
行わずに概略情報を生成する処理を説明する。図9は本
発明の文書情報処理装置10の画像情報に基づく概略情
報生成処理を示すフローチャートである。文書情報処理
装置10では、文書情報に基づいてサムネイル画像等の
画像情報を生成する(S301)。また文書情報から文
字情報を抽出し(S302)、抽出した文字情報から形
態素解析により自立語を単語情報として抽出する(S3
03)。そして抽出した単語情報を、ステップS301
にて生成した画像情報に付加して概略情報を生成し(S
304)、更に概略情報を可逆圧縮する(S305)。
なお文書情報に基づいて画像情報を生成するのではな
く、概略情報生成処理におけるステップS202と同様
の処理にて中間情報を生成し、生成した中間情報に基づ
いて画像情報を生成するようにしてもよい。
【0066】次に本発明の文書情報処理装置10を用い
た通信システムの実施例について説明する。 実施例1 図10は本発明の実施例1における通信システムを示す
概念図である。文書情報処理装置10は、社内LAN等
の通信網NWに接続しており、通信網NWにはサーバコ
ンピュータを用いた記録装置20及びクライアントコン
ピュータを用いた複数台の通信装置30,30,…が接
続されている。
【0067】図11は本発明の実施例1における通信シ
ステムの構成を示すブロック図である。文書情報処理装
置10の構成は、図1を用いて説明した構成と同様であ
るので、図1及びその説明を参照するものとし、その説
明を省略する。
【0068】記録装置20は、CPU21、記録手段2
2、RAM23、及び通信手段24を備えている。
【0069】通信装置30は、CPU31、記録手段3
2、RAM33、入力手段34、出力手段35、及び通
信手段36を備えている。
【0070】次に本発明の実施例1における通信システ
ムにて用いられる文書情報処理装置10、記録装置2
0、及び通信装置30の文書情報記録処理を図12に示
すフローチャートを用いて説明する。文書情報処理装置
10では、文書作成用アプリケーションを用いて作成し
た文書情報に基づいて、概略情報を生成する(S40
1)。そして文書情報を記録装置20の所定の記録位置
に記録させるべく、記録位置を指定して文書情報を記録
装置20へ送信し(S402)、さらに記録位置を指示
するネットワークパス等の指示情報及び概略情報を複数
の通信装置30,30,…へ電子メール等の通信方法に
より同報送信する(S403)。
【0071】記録装置20では、文書情報を受信し(S
404)、受信した文書情報を指定された記録位置に記
録する(S405)。
【0072】また各通信装置30,30,…では、指示
情報及び概略情報を受信し(S406)、受信した指示
情報及び概略情報を記録手段32に記録する(S40
7)と共に、出力手段35から出力する(S408)。
なお概略情報がZIP、LZH,及びCAB等の形式の
可逆圧縮が行われている場合、出力時に概略情報の展開
が行われる。通信装置30を操作する操作者は、出力さ
れた概略情報を確認することにより文書情報の内容を把
握することができ、また概略情報を用いて文書情報に対
する全文検索を行うことができる。
【0073】次に本発明の実施例1における通信システ
ムにて用いられる記録装置20及び通信装置30の文書
情報要求処理を図13に示すフローチャートを用いて説
明する。通信装置30を操作する操作者は、出力された
概略情報に対応する文書情報を要求する場合、指示情報
により指定された記録装置20の記録位置にアクセスす
る(S501)。
【0074】記録装置20では、アクセスを受け付け
(S502)、指定された記録位置に記録されている文
書情報を通信装置30へ送信する(S503)。
【0075】通信装置30では、文書情報を受信し(S
504)、受信した文書情報を記録する(S505)と
共に、出力手段35から出力する(S506)。なお記
録装置20に記録し、必要に応じて通信装置30へ送信
する情報としては、文章情報に代替して中間情報を用い
てもよい。
【0076】次に本発明の実施例1における通信システ
ムにて用いられる通信装置30の操作を、通信装置30
から出力される画像を示す説明図である図14乃至図1
6を用いて説明する。図14は、記録手段32に記録し
た概略情報を出力させた状態を示しており、図示されて
いない概略情報も含めて複数の概略情報が、通信装置3
0に記録されていることが示されている。
【0077】そして図15では、全文検索のためのキー
として「明細書」という単語を入力し、検索を実行した
結果が出力された状態を示しており、「明細書」という
単語を含む単語情報を有する概略情報が2つ抽出された
ことを確認することができる。左方に示されている概略
情報を示す画像を指示する入力を行うことにより、概略
情報に含まれる中間情報が拡大して表示され、表示され
た中間情報を確認することができ、また右方に表示され
た指示情報(ネットワークパス)を指示する入力を行う
ことにより、指示情報により指定された記録装置20の
記録位置にアクセスすることができる。
【0078】さらに図16では、記録装置20から受信
した文書情報が出力された状態を示している。
【0079】実施例2 図17は本発明の実施例2における通信システムを示す
概念図である。実施例2は、実施例1における記録装置
30を代替する装置として、PDA(Personal Digital
Assistants)及び携帯電話等の移動通信端末装置40を
用いた形態であり、更に通信網NWにはクライアントコ
ンピュータを用いた受信装置50が接続されている。文
書情報処理装置10から記録装置20へ文書情報を送信
し、通信装置30を代替する移動通信端末装置40へ概
略情報を送信する文書情報記録処理については実施例1
と同様の処理にて行われる。
【0080】ただし移動通信端末装置40から記録装置
20にアクセスして、文書情報の送信を要求する文書情
報要求処理は行われず、移動通信端末装置40から受信
装置50のネットワークパス等の送信先情報を記録装置
20に伝える転送要求を行い、記録装置20では、送信
先情報により示される受信装置50へ文書情報を転送す
る。これにより受信装置50では、文書情報を確認する
ことが可能となる。
【0081】実施例1及び実施例2では、文書情報処理
装置10から通信装置30又は移動通信端末装置40へ
電子メールにて概要情報を送信する例を示したが、通信
網NWを介したオンラインによる通信ではなく、概要情
報をCD−ROM、フレキシブルディスク、及びメモリ
カード等の記録媒体に記録し、記録媒体に記録された概
要情報を通信装置30又は移動通信端末装置40にて読
み取る形態でもよく、また通信網NWは、LAN等の内
部通信網に限らず、インターネット等の外部通信網であ
ってもよい。
【0082】前記実施の形態では、中間情報の量が大き
い場合に情報量を削減する形態を示したが、本発明はこ
れに限らず、中間情報の量を比較することなく情報量の
削減を行うようにしてもよい。
【0083】
【発明の効果】以上詳述した如く本発明に係る文書情報
処理方法、文書情報処理装置、通信システム、コンピュ
ータプログラム、及び記録媒体では、元の文書情報と同
様の文字情報を含む中間情報を生成すると共に、文書情
報又は中間情報から単語情報を抽出し、抽出した単語情
報を中間情報に付加した概略情報を生成し、特に中間情
報のデータ量が予め設定している設定値を超える場合
に、中間情報から色数、書体、及び書式等の情報を削減
することにより、中間情報に単語情報を付加した概略情
報は、データ量が小さいだけでなく、全ての単語情報を
含んでいるため全文検索等の文字情報を用いた検索処理
に用いることができ、これにより文書情報を効率的に利
用及び管理することが可能である等、優れた効果を奏す
る。
【0084】また本発明では、複数の削減方法に対し
て、適用する方法及びその優先順位を指定することがで
きるので、利用者の利用状況に即した概略情報を生成す
ることが可能である等、優れた効果を奏する。
【0085】さらに本発明では、文書情報に基づいて、
表示サイズを縮小しJPEG及びGIF等の形式で不可
逆圧縮した画像情報であるサムネイル画像等の画像情報
を生成し、生成した画像情報に単語情報を付加した概略
情報を生成することにより、生成した概略情報は、デー
タ量が小さいだけでなく、全ての単語情報を含んでいる
ため、全文検索等の文字情報を用いた検索処理に用いる
ことができ、これにより概略情報の元である文書情報を
効率的に利用及び管理することが可能である等、優れた
効果を奏する。
【0086】
【図面の簡単な説明】
【図1】本発明の文書情報処理装置の構成を示すブロッ
ク図である。
【図2】本発明の文書情報処理装置の概略情報生成処理
の概要を示すフローチャートである。
【図3】本発明の文書情報処理装置にて生成される中間
情報の構成を示す概念図である。
【図4】本発明の文書情報処理装置から出力される画像
を示す説明図である。
【図5】本発明の文書情報処理装置の概略情報生成処理
を示すフローチャートである。
【図6】本発明の文書情報処理装置の概略情報生成処理
を示すフローチャートである。
【図7】本発明の文書情報処理装置の概略情報生成処理
を示すフローチャートである。
【図8】本発明の文書情報処理装置にて生成される概略
情報の構成を示す概念図である。
【図9】本発明の文書情報処理装置の画像情報に基づく
概略情報生成処理を示すフローチャートである。
【図10】本発明の実施例1における通信システムを示
す概念図である。
【図11】本発明の実施例1における通信システムの構
成を示すブロック図である。
【図12】本発明の実施例1における通信システムにて
用いられる文書情報処理装置、記録装置、及び通信装置
の文書情報記録処理を示すフローチャートである。
【図13】本発明の実施例1における通信システムにて
用いられる記録装置及び通信装置の文書情報要求処理を
示すフローチャートである。
【図14】本発明の実施例1における通信システムにて
用いられる通信装置から出力される画像を示す説明図で
ある。
【図15】本発明の実施例1における通信システムにて
用いられる通信装置から出力される画像を示す説明図で
ある。
【図16】本発明の実施例1における通信システムにて
用いられる通信装置から出力される画像を示す説明図で
ある。
【図17】本発明の実施例2における通信システムを示
す概念図である。
【符号の説明】
10 文書情報処理装置 20 記録装置 30 通信装置 40 移動通信端末装置 50 受信装置 NW 通信網 PG コンピュータプログラム REC 記録媒体

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 文字情報を含む文書情報を処理する文書
    情報処理方法において、 前記文書情報に基づいて、該文書情報と同様の文字情報
    を含む中間情報を生成し、 前記文書情報又は前記中間情報から単語を示す単語情報
    を抽出し、 抽出した単語情報を前記中間情報に付加した概略情報を
    生成することを特徴とする文書情報処理方法。
  2. 【請求項2】 文字情報を含む文書情報を処理する文書
    情報処理装置において、 前記文書情報に基づいて、該文書情報と同様の文字情報
    を含む中間情報を生成する手段と、 前記文書情報又は生成した中間情報に含まれる文字情報
    から単語を示す単語情報を抽出する抽出手段と、 抽出した単語情報を前記中間情報に付加した概略情報を
    生成する手段とを備えることを特徴とする文書情報処理
    装置。
  3. 【請求項3】 前記中間情報の量を求める手段と、 求めた中間情報の量を、予め設定している所定値と比較
    する手段と、 前記中間情報の量が、所定値より大きいと判定した場合
    に、中間情報の量を削減する削減手段とを備えることを
    特徴とする請求項2に記載の文書情報処理装置。
  4. 【請求項4】 前記削減手段は、前記中間情報の一部を
    削除する削減方法を含むことを特徴とする請求項3に記
    載の文書情報処理装置。
  5. 【請求項5】 前記中間情報の一部とは、前記中間情報
    が示す文書の後方のページに関する情報であることを特
    徴とする請求項4に記載の文書情報処理装置。
  6. 【請求項6】 前記削減手段は、色に関する情報を変換
    する削減方法を含むことを特徴とする請求項3乃至請求
    項5のいずれかに記載の文書情報処理装置。
  7. 【請求項7】 前記削減手段は、文字情報の書体に関す
    る情報を変換する削減方法を含むことを特徴とする請求
    項3乃至請求項6のいずれかに記載の文書情報処理装
    置。
  8. 【請求項8】 前記削減手段は、文書の書式に関する情
    報を変換する削減方法を含むことを特徴とする請求項3
    乃至請求項7のいずれかに記載の文書情報処理装置。
  9. 【請求項9】 前記文書情報は図形に関する情報を含
    み、 前記削減手段は、図形に関する情報を変換する削減方法
    を含むことを特徴とする請求項3乃至請求項8のいずれ
    かに記載の文書情報処理装置。
  10. 【請求項10】 前記削減手段は、 第1の削減方法にて、中間情報の量を削減する手順と、 削減した後の中間情報の量を所定値と比較する手順と、 比較により中間情報の量が所定値より大きいと判定した
    場合に、前記第1と異なる第2の削減方法にて中間情報
    の量を更に削減する手順とを含むことを特徴とする請求
    項3乃至請求項9のいずれかに記載の文書情報処理装
    置。
  11. 【請求項11】 前記削減方法の優先順位を受け付ける
    手段を備え、 前記削減手段は、受け付けた優先順位に従って削減すべ
    くなしてあることを特徴とする請求項10に記載の文書
    情報処理装置。
  12. 【請求項12】 前記文書情報を不可逆圧縮した画像情
    報を生成する手段と、 生成した画像情報及び前記中間情報の量の大きさを比較
    する手段と、 比較により画像情報が、前記中間情報より量が小さいと
    判定した場合に、画像情報を新たな中間情報として置換
    する手段とを備えることを特徴とする請求項2乃至請求
    項11のいずれかに記載の文書情報処理装置。
  13. 【請求項13】 文字情報を含む文書情報を処理する文
    書情報処理装置において、 前記文書情報を不可逆圧縮した画像情報を生成する手段
    と、 前記文書情報に含まれる文字情報から単語を示す単語情
    報を抽出する抽出手段と、 抽出した単語情報を生成した画像情報に付加した概略情
    報を生成する手段とを備えることを特徴とする文書情報
    処理装置。
  14. 【請求項14】 前記抽出手段は、文字情報から、形態
    素解析により抽出した自立語を単語情報として抽出すべ
    くなしてあることを特徴とする請求項2乃至請求項13
    のいずれかに記載の文書情報処理装置。
  15. 【請求項15】 生成した概略情報を可逆圧縮する手段
    を備えることを特徴とする請求項2乃至請求項14のい
    ずれかに記載の文書情報処理装置。
  16. 【請求項16】 請求項2乃至請求項15のいずれかに
    記載の文書情報処理装置と、 該文書情報処理装置と通信する通信装置と、 前記文書情報処理装置及び通信装置と通信する記録装置
    とを備え、 前記文書情報処理装置は、 前記文書情報を前記記録装置に記録させる手段と、 前記文書情報を記録した位置を指示する指示情報及び前
    記概略情報を前記通信装置へ送信する手段とを備えるこ
    とを特徴とする通信システム。
  17. 【請求項17】 コンピュータに、文字情報を含む文書
    情報を処理させるコンピュータプログラムにおいて、 コンピュータに、前記文書情報に基づいて、該文書情報
    と同様の文字情報を含む中間情報を生成させる手順と、 コンピュータに、前記文書情報又は前記中間情報から単
    語を示す単語情報を抽出させる手順と、 コンピュータに、抽出した単語情報を前記中間情報に付
    加した概略情報を生成させる手順とを含むことを特徴と
    するコンピュータプログラム。
  18. 【請求項18】 コンピュータに、文字情報を含む文書
    情報を処理させるコンピュータプログラムを記録してあ
    る、コンピュータでの読み取りが可能な記録媒体におい
    て、 コンピュータに、前記文書情報に基づいて、該文書情報
    と同様の文字情報を含む中間情報を生成させる手順と、 コンピュータに、前記文書情報又は前記中間情報から単
    語を示す単語情報を抽出させる手順と、 コンピュータに、抽出した単語情報を前記中間情報に付
    加した概略情報を生成させる手順とを含むコンピュータ
    プログラムを記録してあることを特徴とするコンピュー
    タでの読み取りが可能な記録媒体。
JP2001398405A 2001-12-27 2001-12-27 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体 Pending JP2003196270A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001398405A JP2003196270A (ja) 2001-12-27 2001-12-27 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
US10/319,487 US20030126553A1 (en) 2001-12-27 2002-12-16 Document information processing method, document information processing apparatus, communication system and memory product
CNB021598444A CN1312610C (zh) 2001-12-27 2002-12-27 文档信息处理方法,文档信息处理装置,通信***和存储器产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001398405A JP2003196270A (ja) 2001-12-27 2001-12-27 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003196270A true JP2003196270A (ja) 2003-07-11

Family

ID=19189346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001398405A Pending JP2003196270A (ja) 2001-12-27 2001-12-27 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体

Country Status (3)

Country Link
US (1) US20030126553A1 (ja)
JP (1) JP2003196270A (ja)
CN (1) CN1312610C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346519A (ja) * 2004-06-04 2005-12-15 Fuji Xerox Co Ltd 画像表示装置、画像表示方法及びそのプログラム
JP2010224358A (ja) * 2009-03-25 2010-10-07 Konica Minolta Holdings Inc 情報表示装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4135659B2 (ja) * 2004-03-09 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 フォーマット変換装置およびファイル検索装置
EP1603072A1 (de) * 2004-06-02 2005-12-07 CCS Content Conversion Specialists GmbH Verfahren und Einrichtung zur Strukturanalyse eines Dokuments
JP4160548B2 (ja) * 2004-09-29 2008-10-01 株式会社東芝 文書要約作成システム、方法、及びプログラム
US7685136B2 (en) * 2005-01-12 2010-03-23 International Business Machines Corporation Method, system and program product for managing document summary information
JP2010140459A (ja) * 2008-02-22 2010-06-24 Ricoh Co Ltd プログラムと印刷データ変換装置とコンピュータ読み取り可能な記録媒体
JP2010244388A (ja) * 2009-04-08 2010-10-28 Pioneer Electronic Corp 情報提供装置、情報提供方法、及び情報提供用プログラム
JP2014036691A (ja) * 2012-08-10 2014-02-27 Hoya Corp 内視鏡装置
JP2014117890A (ja) * 2012-12-18 2014-06-30 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2077274C (en) * 1991-11-19 1997-07-15 M. Margaret Withgott Method and apparatus for summarizing a document without document image decoding
US5590317A (en) * 1992-05-27 1996-12-31 Hitachi, Ltd. Document information compression and retrieval system and document information registration and retrieval method
JPH08241306A (ja) * 1994-11-01 1996-09-17 Fuji Xerox Co Ltd 文書処理装置
JPH08204967A (ja) * 1995-01-20 1996-08-09 Nec Corp データ符号化装置
US5717940A (en) * 1995-04-28 1998-02-10 Ricoh Company, Ltd. Method of selecting a target document using features of an example page
US5867164A (en) * 1995-09-29 1999-02-02 Apple Computer, Inc. Interactive document summarization
JP3612125B2 (ja) * 1995-12-14 2005-01-19 株式会社東芝 情報フィルタリング方法および情報フィルタリング装置
JP3579204B2 (ja) * 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
JP3001047B2 (ja) * 1997-04-17 2000-01-17 日本電気株式会社 文書要約装置
CA2242158C (en) * 1997-07-01 2004-06-01 Hitachi, Ltd. Method and apparatus for searching and displaying structured document
US6857102B1 (en) * 1998-04-07 2005-02-15 Fuji Xerox Co., Ltd. Document re-authoring systems and methods for providing device-independent access to the world wide web
JP2000048215A (ja) * 1998-07-27 2000-02-18 Sharp Corp データ処理装置及びその制御プログラムを記憶した媒体
US6336124B1 (en) * 1998-10-01 2002-01-01 Bcl Computers, Inc. Conversion data representing a document to other formats for manipulation and display
EP1145140A3 (en) * 1999-06-15 2002-11-13 Koninklijke Philips Electronics N.V. Invisible encoding of attribute data in character based documents and files
JP2001051997A (ja) * 1999-08-11 2001-02-23 Sony Corp 文書データ作成装置、文書データ作成方法、及び記録媒体
US6766287B1 (en) * 1999-12-15 2004-07-20 Xerox Corporation System for genre-specific summarization of documents
JP2001344175A (ja) * 2000-05-31 2001-12-14 Net Village Co Ltd 携帯端末におけるテキストデータの送受信方法
US6934909B2 (en) * 2000-12-20 2005-08-23 Adobe Systems Incorporated Identifying logical elements by modifying a source document using marker attribute values
US20030229850A1 (en) * 2002-06-07 2003-12-11 Calvin Lue Web browser

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346519A (ja) * 2004-06-04 2005-12-15 Fuji Xerox Co Ltd 画像表示装置、画像表示方法及びそのプログラム
US7646928B2 (en) 2004-06-04 2010-01-12 Fuji Xerox Co., Ltd. Image display control apparatus, image display apparatus, image displaying method and program thereof
JP4491777B2 (ja) * 2004-06-04 2010-06-30 富士ゼロックス株式会社 画像表示装置、画像表示方法及びそのプログラム
JP2010224358A (ja) * 2009-03-25 2010-10-07 Konica Minolta Holdings Inc 情報表示装置

Also Published As

Publication number Publication date
CN1438589A (zh) 2003-08-27
CN1312610C (zh) 2007-04-25
US20030126553A1 (en) 2003-07-03

Similar Documents

Publication Publication Date Title
US8380012B2 (en) Document imaging and indexing system
US7386599B1 (en) Methods and apparatuses for searching both external public documents and internal private documents in response to single search request
US20030210428A1 (en) Non-OCR method for capture of computer filled-in forms
JP2006350867A (ja) 文書処理装置、文書処理方法、プログラム及び情報記録媒体
CN101739224A (zh) 略图创建方法以及图像形成装置
JP2007042092A (ja) 電子ドキュメント処理装置、方法およびプログラム
US20130031150A1 (en) Executing Transcription Requests on Files
US9489380B2 (en) Methods and apparatus for management of unconsciously captured documents
JP2003196270A (ja) 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
JPH09325928A (ja) メッセージ通信方法及び装置
US20010002471A1 (en) System and program for processing special characters used in dynamic documents
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
JP4135659B2 (ja) フォーマット変換装置およびファイル検索装置
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2008310816A (ja) 複数のマークアップ・ページ・データをコンパクトに表現するシステムおよび方法
US7528982B2 (en) Printer, print instruction terminal, printing system, printing program, and printing method
JP2007331312A (ja) 印刷装置、印刷制御方法、プログラム、記憶媒体
US20040054971A1 (en) System and method for managing patent documents
JP2006343976A (ja) 電子帳票提供方法及び電子帳票サーバ装置
JP2004265425A (ja) メッセージ通信方法及び装置
JP2006285581A (ja) 文書管理装置
JPH08147445A (ja) 文書管理方法及びそれを実現する文書処理装置
JP2002015266A (ja) 電子帳票システム
JP2003099398A (ja) メッセージ通信方法及び装置
JP2009134457A (ja) プログラム及び画像ファイル管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070802

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070823

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070921