JP4666996B2 - 電子ファイリングシステム、電子ファイリング方法 - Google Patents

電子ファイリングシステム、電子ファイリング方法 Download PDF

Info

Publication number
JP4666996B2
JP4666996B2 JP2004307160A JP2004307160A JP4666996B2 JP 4666996 B2 JP4666996 B2 JP 4666996B2 JP 2004307160 A JP2004307160 A JP 2004307160A JP 2004307160 A JP2004307160 A JP 2004307160A JP 4666996 B2 JP4666996 B2 JP 4666996B2
Authority
JP
Japan
Prior art keywords
document
style sheet
registered
reduced image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004307160A
Other languages
English (en)
Other versions
JP2006119915A (ja
JP2006119915A5 (ja
Inventor
武司 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004307160A priority Critical patent/JP4666996B2/ja
Priority to US11/256,023 priority patent/US8332745B2/en
Priority to CNB2005101095300A priority patent/CN100461173C/zh
Priority to KR1020050099499A priority patent/KR100834196B1/ko
Priority to EP20050256534 priority patent/EP1650682A3/en
Publication of JP2006119915A publication Critical patent/JP2006119915A/ja
Publication of JP2006119915A5 publication Critical patent/JP2006119915A5/ja
Application granted granted Critical
Publication of JP4666996B2 publication Critical patent/JP4666996B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書を管理・保管する電子ファイリングシステムに関するもので、特に管理(ファイリング)する文書の縮小画像を生成する装置・方法・プログラムに関連する。
近年、文書をスキャナ等で読み込むなどして作成した文書のイメージデータに文書管理情報を関連付けて記憶し、これらの文書情報に対して検索、表示、印刷等を行なう電子ファイリング装置(文書管理装置)が発表されている。このような電子ファイリング装置では、従来、文書管理情報(文書名、ページ数、登録日、キーワードなど)を文書と関連付けて登録し、文書の一覧や検索結果リストなどを表示する場合には、文書を識別するための情報として、これらの文書管理情報を表示している。
しかし、このような文書管理情報のみでは、その文書の概要を一見して識別するのは困難である。そのため、文書の縮小画像(サムネイル)を作成、登録し、それを文書の一覧や検索結果リストなどにおいて表示することができる電子ファイリング装置も提案されている(例えば特許文献1)。
図10は、文書一覧や検索結果リストにおいて縮小画像を表示する、一般的な電子ファイリング装置の機能構成例を示す図である。このような電子ファイリング装置は、例えば、図10に示すように、文書読み込み部1000、縮小画像作成部1001、文書記憶部1002、表示制御部1003とを備えている。これらのうち、文書読み込み部1000は、ファイルシステム上に置かれているファイルデータや、不図示のデバイスからもしくはネットワーク経由で受け取る文書データを読み込む。また、縮小画像作成部1001は、文書読み込み部1000により読み込まれた文書データが画面などに表示される場合に出力される描画データを作成し、その描画データからドットの間引き等により、適当な大きさに縮小したイメージデータを作成する。文書登録部1002は、文書読み込み部1000により読み込まれた文書データと、縮小画像作成部1001により作成された文書の縮小画像データとを関連付けて記憶する。そして、表示制御部1003は、文書記憶部1002に記憶されている文書データや縮小画像の表示制御を行ない、例えば、図11に示すような縮小画像による文書の一覧表示を行なう。
このときに作成される縮小画像は、主に先頭ページとして出力されるページから作成されることが多い。
また、一方、特許文献2のように、文書を印刷や表示させる際、複数の要素から構成される文書の内容を効率的に把握できるようにするために文書の要素をフィルタリングして重要な順に要素をページの先頭から配置していき、該配置されたページを印刷(または表示)する情報処理方法も考えられている。
特開平10−240724号公報 特開2002−32364号公報
しかしながら、上述した従来の技術では、文書の縮小画像から文書の概要を識別することはできるものの、縮小画像(サムネイル)から識別できるのは文書全体のレイアウトぐらいであり、文書に記されている文字を判読することは難しい。このため、レイアウトが似ている文書や、大きな文字や図形などがなく、特徴の少ないレイアウトの文書などを、上記縮小画像から識別することは非常に困難であるという問題がある。
特に、XML文書などのように基本的に一様な文字サイズのテキストのみで構成される文書データから縮小画像を作成した場合には、その傾向が顕著である。例えば、図12に示したXML文書データが良い例である。1200は電子ファイリングシステムに入力・保管させたい元の文書データであり、1201はその文書データから作成した縮小画像である。電子ファイリングシステムのユーザはこの縮小画像から、文書の内容を理解することは非常に困難であるといえる。
また、特許文献2のように、文書の構造を解析し、重要度の高い順番に配置しなおした場合には、表示される要素は厳選されるが、引用文献2では縮小画像(サムネイル)の作成については考慮されていないので、縮小画像化すれば同じ問題が存在する。さらに、重要な順に要素を配置していくので、元のレイアウトが全く無視されてしまう。したがって、仮に同じ書式の文書が存在する場合でも、レイアウトで比較することができず、類似の文書であるかどうかを視覚的に判別することが逆に困難になるという問題もある。
上記課題を解決するために、本発明の電子ファイリングシステムは、構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであるスタイルシートと複数のフォルダとを用いて、文書に縮小画像を関連付けて登録管理する電子ファイリングシステムであって、ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定手段と、登録対象の文書を入力する入力手段と、前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定手段で予め設定されたスタイルシートを取得するスタイルシート取得手段と、前記スタイルシート取得手段で取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換手段と、前記変換手段で前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成手段と、前記縮小画像生成手段で生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録手段と、を有することを特徴とする。
上記課題を解決するために、本発明の電子ファイリング方法は、構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであるスタイルシートと複数のフォルダとを用いて、文書に縮小画像を関連付けて登録管理するシステムを制御するための電子ファイリング方法であって、スタイルシート設定手段が、ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定ステップと、入力手段が、登録対象の文書を入力する入力ステップと、スタイルシート取得手段が、前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定ステップで予め設定されたスタイルシートを取得するスタイルシート取得ステップと、変換手段が、前記スタイルシート取得ステップで取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換ステップと、縮小画像生成手段が、前記変換ステップで前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成ステップと、登録手段が、前記縮小画像生成ステップで生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録ステップと、を有することを特徴とする。
上記課題を解決するために、本発明のコンピュータプログラムは、コンピュータを、ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定手段、登録対象の文書を入力する入力手段、前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定手段で予め設定されたスタイルシートを取得するスタイルシート取得手段、前記スタイルシート取得手段で取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換手段、前記変換手段で前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成手段、前記縮小画像生成手段で生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録手段、として機能させ、前記スタイルシートは構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであることを特徴とする。
本発明によれば、XML文書などのように基本的にテキストのみで構成される文書データから縮小画像を作成した場合にも、その文書において重要とされる文字列や部分を判読可能なように強調することができる。このため、レイアウトが似ている文書や、大きな文字や図形などがなく、特徴の少ないレイアウトの文書などからでも、一覧したときに文書の内容を識別することが可能な縮小画像を生成することが可能となる。
また、同一の文書書式の場合、同じ個所が強調されるため、同じレイアウトの定型文書であれば、書式追加して縮小画像とした際にも、視覚的にレイアウト比較することで同一書式文書として判別することも可能である。
強調部分に関しては、単語を一律変換したり、文章を構文解析や意味解析したりして判断するわけではなく、ユーザ自身が半構造化文書の構造や構造定義などから簡易に強調部分と強調方法を指定可能なので、強調部分の指定が非常に正確で、強調部分を誤認識する事はほとんどなくすことができる。
さらに、保管単位ごとに強調方法・書式・スタイルを切り替えることが可能であるため、文書分類と密接に関連した形で重要部分を定義できる。
(実施例1)
以下、本発明に係わる一実施形態について図面を参照して説明する。
図1は、本発明の特徴を最もよく表わす図面であり、本実施形態における構成の一例を示している。
0100は入力されたデータがXML(eXtensible Markup Language)文書であるかどうかを判定するXML形式判定部であり、0101はXMLデータを文書ファイリングシステム(文書管理システム)に対して入力しようとするときに、入力したいXMLデータの指定、格納先フォルダの指定などを行う文書入力制御部であり、0102は保管単位(例えば、文書登録先のフォルダごとやキャビネットごと)に登録されているスタイルシートを取り出すスタイルシート取出部であり、0103は入力されたXMLデータに対して、保管単位から取り出されたスタイルシートを適用してデータ変換処理を行い、中間データを生成させるスタイルシート適用部であり、0104は生成された中間データから縮小画像(サムネイル)を生成する縮小画像生成部であり、0105は生成された縮小画像と入力文書データ(例えばXML文書)を関連付けて文書ファイリングシステムのデータベースに格納するDB格納部である。また、0106はフォルダなどの保管単位(保管部)に対して、スタイルシートを登録するスタイルシート登録部であり、各保管単位(例えばフォルダ)に対してそれぞれ独自のスタイルシートを登録することが可能である。
図2は上記構成における、本実施形態による縮小画像の生成方法および装置を説明するフローチャートである。特に、フローチャート2−1はスタイルシートを文書保管単位に対して登録するフローについて、フローチャート2−2はXMLデータ文書が文書ファイリングシステムのデータベースに格納される際に縮小画像が生成される過程を表すフローについての図である。
また、図3は、本実施例を適用した場合と、従来の方法を適用した場合、それぞれにおけるデータの変遷の一例を表したものであり、このデータを用いて説明を行う。
フローチャート2−2に関して説明する。まずステップ0205で文書ファイリングシステムに文書データ0300を入力して保管させようとすると、XML形式判定部0100はステップ0206で、指定されたデータがXMLであるかどうかをチェックし、XMLであると判定されれば、スタイルシート取出部0102がステップ0207で、文書保管先のフォルダに登録されているスタイルシート(ここではXSLT(XML Stylesheet Language Transformations)を例として説明する)を取得する。なお、文書保管先のフォルダは、ユーザにより指示されているか、ファイリングシステムにより自動的に決められているものとする。
次に、ステップ0208において、スタイルシート適用部0103が入力されたXMLデータ0300をステップ0207で取得したXSLTデータによって変換し、中間データ0301を生成する。生成された中間データ0301からステップ0209にて縮小画像生成部0104が縮小画像0303を作成する。最後にステップ0210でDB格納部0105が縮小画像0303と入力指定したXMLデータ0300を関連付けてデータベース(DB)に格納する。なお、本実施例1では、ステップ0206でXMLデータでないと判断された場合は、従来技術と同様に、入力された文書をそのまま縮小したような縮小画像が作成されてデータベースに格納されるものとする。
一方、図3のXMLデータ0300に対して、従来の技術で縮小画像を作成した場合、XMLデータは、図3に示すようにテキストデータをイメージにした中間データ0302を縮小して、縮小画像0304が作成される。図3のように、従来技術で作成された縮小画像0304に比べて、本発明で作成された縮小画像0303は文書を判別しやすくなっている。
なお、上記ステップ0207で取り出されるXSLTデータは、XMLフローチャート2−1の各ステップを実行することにより登録される。まず、ステップ0201でユーザが保管単位(例えばフォルダ)に対して登録するXSLTデータを指定する。次に、ステップ0202で、スタイルシート登録部0106は当該指定されたXSLTデータを対象保管単位ごともしくは複数の保管単位に対して登録することができる(例えば、フォルダごとに登録したり、複数のフォルダを束ねる親フォルダに登録することができる)。
この保管単位ごともしくは複数の保管単位に対してスタイルシートを登録できるという特徴により、ユーザが構成したフォルダ構成から考えて一番有用な部分を強調するように変更することができる。図4はその具体例を表した図であり、Case1にあるようにフォルダ構成0403が分野別に構成されている場合と、Case2にあるようにフォルダ構成0406が会社別に構成されている場合とを示している。同じXMLデータ0400を入力した場合、Case1やCase2のように異なるフォルダ構成であれば、おのずと縮小画像内で強調したい部分が異なってくる。Case1では分野別にフォルダが構成されている(つまり、登録されているフォルダによって分野を判別可能である)ので、各フォルダ内に登録されている文書の縮小画像からは、分野よりも会社が判別できるようにしたい。そこで、category(分野)に対応する値である「Stock」は強調せず、Company(会社)に対応する値である「XXX Company」を強調するようなXSLTデータを該フォルダに登録しておき、そのXSLTデータを用いてXMLデータ0400を中間データ1(0401)に変換し、その後縮小画像0402を作成している。一方、Case2では、会社別にフォルダが構成されている(つまり、登録されているフォルダによって会社名を判別可能である)ので、各フォルダ内に登録されている文書の縮小画像からは、会社よりも分野が判別できるようにしたい。そこで、Company(会社)に対応する値は強調されず、Category(分野)に対応する値である「Stock」が強調するようなXSLTデータを該Case2のフォルダに登録しておけば、そのXSLTデータを用いて中間データ0404に変換し、縮小画像0403を作成することができる。
本実施形態によれば、XML文書などのように基本的にテキストのみで構成される文書データから縮小画像を作成した場合にも、その文書において重要とされる文字列や部分を判読可能なように強調することができる。このため、レイアウトが似ている文書や、大きな文字や図形などがなく、特徴の少ないレイアウトの文書などからでも、一覧したときに文書の内容を識別することが可能な縮小画像を生成することが可能となる。
さらに、保管単位ごとに強調方法・書式・スタイルを切り替えることが可能であるため、文書分類と密接に関連した形で重要部分を定義できる。
なお、本実施例では、XML形式の文書を例として用いたが、その他の形式の構造化文書であってもよく、その場合は、その形式の文書を変換するためのスタイルシートを用いて変換した後、縮小画像を生成することになる。
(実施例2)
実施例1では、ステップ0206で、入力文書が既に構造化されている文書(例としてXML文書とした)であると判定した場合にステップ0207以降の処理を行なうこととしたが、図5のフローチャートに示すように、ステップ0206でXMLデータかどうかを判定した際に、XMLデータでないと判定すると、ステップ0500に進んで入力データをXML化し、その後、実施例1で説明したようなステップ0207以降の処理を行うようにしてもよい。なお、XML化処理は、例えば、レイアウト解析や構文解析・意味解析などを行なうことにより、適切なタグをつけて、入力文書を構造化(XML化)する。
本実施形態によれば、XML以外の入力データに対しても、その文書において重要とされる文字列や部分を判読可能なように強調することができる。このため、レイアウトが似ている文書や、大きな文字や図形などがなく、特徴の少ないレイアウトの文書などからでも、一覧したときに文書の内容を識別することが可能な縮小画像を生成することが可能となる。
さらに、保管単位ごとに強調方法・書式・スタイルを切り替えることが可能であるため、文書分類と密接に関連した形で重要部分を定義できる。
(実施例3)
実施例1または2では、入力されるXSLTデータは格納先フォルダに登録されている唯一のXSLTデータによって、書式変換を行っていた。本実施例3では、XSLTデータを登録する際に、対応するスキーマ情報も同時に登録できるようにすることで、1つのフォルダに対して複数のXSLTデータを登録することができる。図6のフローチャートに示すように、0206で入力データがXMLデータと判別された後(もしくは、0500で入力データをXML化した後)、入力XMLデータのスキーマをチェックし、そのチェックしたスキーマに対応するXSLTデータが該フォルダに登録されているか判断(入力されたXML文書のスキーマに基づき、そのXML文書を処理対象とするのが妥当か判断)し、登録されていれば、ステップ0207でそのスキーマに対応するXSLTデータを用いて変換を行うようにし、登録されていなければ、ステップ0602に進んで、従来方式で縮小画像を生成する(もしくは、文書登録拒否する)など別処理を行わせるようにしても良い。
本実施例3によれば、フォルダに対して複数のXSLTデータを登録させた上で、かつ、入力されるXMLのスキーマに従って対応するスタイルシートを自動的に選択させることが可能となり、一つのフォルダに複数のスキーマに対応したデータが入力されるような場合でも、適切な部分を強調表示させた縮小画像を生成できる。
(実施例4)
実施例3では、ユーザが入力する文書のスキーマに対応しているスタイルシートをあらかじめ用意して登録しておいてやる必要があったが、入力されたXMLデータが登録されているスキーマにとって妥当なXMLデータで無かった場合、その時点で、ユーザがどの部分を強調すべきかを指定できるようなUIを通して自動的にXSLTを生成させても良い。
図7は、本実施形態による縮小画像の生成方法および装置を説明するフローチャートである。また、図8は、本実施例4における構成の一例を示している。
文書入力制御部0101がXMLデータを受け取った後、ステップ0600にて、そのXMLのスキーマチェックを行うため、スキーマ取出し部0800は、格納先として指定されたフォルダに登録されているスキーマを取出す。ステップ0601で入力XMLデータが登録されているスキーマにとって妥当であると判断された場合は前述した実施例3と同様に、対応するXSLTデータを用いてステップ0207以降の処理を行う。一方、ステップ0601で入力XMLデータが登録されているスキーマにとって妥当でないと判断された場合、ステップ0700へと進み、新スキーマ構成要素抽出部0802で入力XMLデータのスキーマからデータを構成している要素(XMLの場合は、要素や属性など)を抜き出し、スキーマ構成要素表示部0803で一覧表示を行う。図9は入力されたと仮定するXMLデータとそのスキーマから、構成要素を抽出し、ダイアログ上に一覧表示した例である。ユーザはこのようなGUIからどの構成要素に対してどのような書式変換を適用するかを指定することが可能(例えば文字に色をつけたり書体を変えたりサイズを変えたりなどの変換を指定できる)で、この処理を書式指定部0804がステップ0701にて行う。このステップ0701での入力をうけてステップ0702にてスタイルシート生成部0805はスタイルシートを生成する。生成されたスタイルシートはステップ0703でスタイルシート登録部0106を通して格納先フォルダに対して登録される。
本実施形態によれば、フォルダに対して登録されているXSLTデータに対応していないXMLデータが入力される場合にも、対応するXSLTデータを随時生成することが可能となり、ユーザがデータを入力する際に、対応するXSLTが登録されているかどうかにかかわらず、データを入力して、識別率の良い縮小画像を生成することができる。
(実施例5)
前記実施例3や4では、一つのスキーマに対応するXSLTデータは一つであると暗黙に仮定していたが、一つのスキーマに対して複数のXSLTデータを登録できるようにしても良い。この場合、XMLデータ入力時に、スキーマチェックで妥当と判断されたスキーマに対して登録されているXSLTの中からどのXSLTを指定するのかをユーザが指定するように構成する。
本実施形態によれば、同一のフォルダ内に格納する必要があって、かつ特定の文書だけ別の強調表現を行いたい場合にも、柔軟に対応することが可能となる。
(実施例6)
前記実施例では、格納先フォルダごとに適用するXSLTデータを切り替えていたが、本実施例6では、更に、データタイプによって、適用するXSLTデータを切り替えるようにする。例えば、BMPデータからXML化して抽出したデータに関してはスタイルシートA、TIFFデータからXML化して抽出したデータに関してはスタイルシートBというように、入力元文書のデータタイプによって切り替えることを特徴とする。
本実施例によれば、入力される文書のデータタイプに従って対応するスタイルシートを自動的に選択させることが可能となり、データタイプに応じて適切な部分を強調表示させた縮小画像を生成できる。
(実施例7)
本実施例7では、前述した実施例の条件に加え、データ入力を行うもしくは縮小画像作成処理を行うユーザやアカウント情報に従って、取出されるXSLTデータを切り替えられるようにする。
このように構成することにより、ユーザごとに作成する縮小画像データを切り替えることが可能となり、縮小画像からどのユーザが入力したデータかを判別することが可能となる。
(実施例8)
前記実施形態では、同一のスキーマ、同一のフォルダ、同一のユーザ、同一のアカウントならば適用されるXSLTデータも同一であったが、本実施例8では、フォルダに対してもしくは、XSLTデータに対して、XPath式を登録しておき、そのXPath式の条件を満たすか満たさないかで適用するXSLTデータを切り替えるようにしても良い。例えば、News文書を入力する場合、文書Aの記事は既に期限切れの話なので、タイトルは強調しないが、文書Bに関してはタイトルを強調するなどの使い分けができる。
本実施形態によれば、入力するデータの内容によって、強調する部分を変更することが可能となる。
(実施例9)
前記実施形態では、格納先フォルダをユーザが指定することを前提としていたが、自動振り分け用のフォルダに対して文書が入力されると、入力文書のスキーマに従って、格納先フォルダが自動的に決まるようにしても良い。
例えば、自動振り分け用フォルダに対して、スキーマデータと対応XSLTデータと格納先フォルダ名をセットとして登録しておく。あるXMLデータがそのフォルダに入力されると、そのXMLデータのスキーマチェックが行われ、妥当だと判断されたXSLTデータを用いてXMLデータを変換した後、縮小画像が生成される。そして、データが登録される際に、そのスキーマに対応して登録されている格納先フォルダに自動的に振り分けられるようにする。
本実施形態によれば、格納先フォルダをユーザが決めてから入力する必要がなく、同一スキーマの文書は同一のフォルダ内に集めることができる。これによって、スタイルシートで強調すべき点をさらに絞り込むことが可能になり、システム全体としての文書の探しやすさが向上する。
(その他の実施例)
なお、実施例1乃至9に示したような本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、コンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施例における構成図 本発明の実施例のフローチャート図 本発明の実施例におけるデータ遷移の一例 本発明の実施例における具体的な適用例 本発明の実施例2のフローチャート図 本発明の実施例3のフローチャート図 本発明の実施例4のフローチャート図 本発明の実施例4における構成図 本発明で利用するXSLT作成のためのGUIの一例 一般的な電子ファイリング装置の機能構成例を示す図 従来の縮小画像による文書の一覧表示の例 XMLデータとそのXMLデータから生成される従来の縮小画像
符号の説明
0100 XML形式判定部
0101 文書入力制御部
0102 スタイルシート取出部
0103 スタイルシート適用部
0104 縮小画像生成部
0105 DB格納部
0106 スタイルシート登録部
0800 スキーマ取出し部
0801 スキーマチェック部
0802 新スキーマ構成要素抽出部
0803 スキーマ構成要素表示部
0804 書式指定部
0805 スタイルシート生成部

Claims (5)

  1. 構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであるスタイルシートと複数のフォルダとを用いて、文書に縮小画像を関連付けて登録管理する電子ファイリングシステムであって、
    ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定手段と、登録対象の文書を入力する入力手段と、
    前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定手段で予め設定されたスタイルシートを取得するスタイルシート取得手段と、
    前記スタイルシート取得手段で取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換手段と、
    前記変換手段で前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成手段と、
    前記縮小画像生成手段で生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録手段と、
    を有することを特徴とする電子ファイリングシステム。
  2. 前記構造化文書はXML形式の文書であり、前記スタイルシートはXSLT形式のデータであることを特徴とする請求項1に記載の電子ファイリングシステム。
  3. 構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであるスタイルシートと複数のフォルダとを用いて、文書に縮小画像を関連付けて登録管理するシステムを制御するための電子ファイリング方法であって、
    スタイルシート設定手段が、ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定ステップと、
    入力手段が、登録対象の文書を入力する入力ステップと、
    スタイルシート取得手段が、前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定ステップで予め設定されたスタイルシートを取得するスタイルシート取得ステップと、変換手段が、前記スタイルシート取得ステップで取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換ステップと、縮小画像生成手段が、前記変換ステップで前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成ステップと、登録手段が、前記縮小画像生成ステップで生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録ステップと、
    を有することを特徴とする電子ファイリング方法。
  4. コンピュータを、
    ユーザの指示に基づいて、前記複数のフォルダの各々に対して、文書内の強調させる所定部分が異なる複数のスタイルシートのいずれかを設定するスタイルシート設定手段、登録対象の文書を入力する入力手段、
    前記複数のフォルダの中から前記登録対象の文書の保管先としてユーザによって指定された保管先フォルダに対して前記スタイルシート設定手段で予め設定されたスタイルシートを取得するスタイルシート取得手段、
    前記スタイルシート取得手段で取得したスタイルシートを用いて、前記登録対象の文書の対応する部分が強調されるように変換する変換手段、
    前記変換手段で前記登録対象の文書の対応する部分が強調されるように変換された後の文書から縮小画像を生成する縮小画像生成手段、
    前記縮小画像生成手段で生成された縮小画像と前記登録対象の文書とを関連付けて前記指定された保管先フォルダに登録する登録手段、
    として機能させ
    前記スタイルシートは構造化文書の構造に対して該文書内の所定部分が強調されるように文書を変換するための書式情報を付与することが可能な前記構造化文書に対応する形式のデータであることを特徴とするコンピュータプログラム。
  5. 請求項4に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2004307160A 2004-10-21 2004-10-21 電子ファイリングシステム、電子ファイリング方法 Expired - Fee Related JP4666996B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004307160A JP4666996B2 (ja) 2004-10-21 2004-10-21 電子ファイリングシステム、電子ファイリング方法
US11/256,023 US8332745B2 (en) 2004-10-21 2005-10-20 Electronic filing system and electronic filing method
CNB2005101095300A CN100461173C (zh) 2004-10-21 2005-10-21 电子归档***和电子归档方法
KR1020050099499A KR100834196B1 (ko) 2004-10-21 2005-10-21 전자 파일링 시스템 및 전자 파일링 방법
EP20050256534 EP1650682A3 (en) 2004-10-21 2005-10-21 Electronic filing system and electronic filing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004307160A JP4666996B2 (ja) 2004-10-21 2004-10-21 電子ファイリングシステム、電子ファイリング方法

Publications (3)

Publication Number Publication Date
JP2006119915A JP2006119915A (ja) 2006-05-11
JP2006119915A5 JP2006119915A5 (ja) 2007-12-06
JP4666996B2 true JP4666996B2 (ja) 2011-04-06

Family

ID=35762548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004307160A Expired - Fee Related JP4666996B2 (ja) 2004-10-21 2004-10-21 電子ファイリングシステム、電子ファイリング方法

Country Status (5)

Country Link
US (1) US8332745B2 (ja)
EP (1) EP1650682A3 (ja)
JP (1) JP4666996B2 (ja)
KR (1) KR100834196B1 (ja)
CN (1) CN100461173C (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133511A (ja) * 2005-11-08 2007-05-31 Ricoh Co Ltd 文書管理装置、文書管理プログラム及び記録媒体
US7814425B1 (en) * 2005-12-30 2010-10-12 Aol Inc. Thumbnail image previews
US8271542B1 (en) * 2006-01-03 2012-09-18 Robert V London Metadata producer
JP2007200235A (ja) * 2006-01-30 2007-08-09 Brother Ind Ltd リムーバブルメディア装置、リムーバブルメディア装置制御プログラムおよびネット機器制御プログラム
CN101201909A (zh) * 2006-12-15 2008-06-18 鸿富锦精密工业(深圳)有限公司 专利电子送件回执文件的管理***及方法
JP2008225932A (ja) * 2007-03-14 2008-09-25 Just Syst Corp データ処理装置及びデータ処理方法
JP4591467B2 (ja) * 2007-03-28 2010-12-01 ブラザー工業株式会社 印刷装置と印刷方法
JP4924281B2 (ja) 2007-08-15 2012-04-25 ブラザー工業株式会社 画像処理装置及びプログラム
JP5440004B2 (ja) 2008-10-20 2014-03-12 セイコーエプソン株式会社 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム
JP5293086B2 (ja) 2008-10-28 2013-09-18 セイコーエプソン株式会社 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム
KR20100053186A (ko) 2008-11-12 2010-05-20 삼성전자주식회사 썸네일 생성 방법 및 화상형성장치
CN106649436A (zh) * 2016-09-08 2017-05-10 东软集团股份有限公司 数据归档方法与装置
US11086829B2 (en) * 2020-01-02 2021-08-10 International Business Machines Corporation Comparing schema definitions using sampling

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259640A (ja) * 1999-03-04 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 構造化文書カスタマイズ表示方法及びシステム及びサーバ装置及びクライアント装置構造化文書カスタマイズ表示プログラムを格納した記憶媒体
JP2002157274A (ja) * 2000-08-09 2002-05-31 Mitsubishi Heavy Ind Ltd 電子ファイル装置とそのシステム作成方法及び書類データの選択方法
JP2002312401A (ja) * 2001-04-11 2002-10-25 Canon Inc 電子ファイリング装置及びその制御方法、記憶媒体並びにプログラム
JP2003131930A (ja) * 2001-10-26 2003-05-09 Nec Corp コンテンツ変換処理装置、スタイルシート自動選択方法、およびそのプログラム
JP2003162532A (ja) * 2001-08-08 2003-06-06 Xerox Corp サムネイル生成方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717940A (en) * 1995-04-28 1998-02-10 Ricoh Company, Ltd. Method of selecting a target document using features of an example page
US5751287A (en) * 1995-11-06 1998-05-12 Documagix, Inc. System for organizing document icons with suggestions, folders, drawers, and cabinets
JPH10240724A (ja) 1997-02-28 1998-09-11 Canon Inc 文書管理装置及びシステム及び方法
US7047248B1 (en) * 1997-11-19 2006-05-16 International Business Machines Corporation Data processing system and method for archiving and accessing electronic messages
US7100106B1 (en) * 1998-12-14 2006-08-29 Microsoft Corporation Mirroring operations performed on linked files and folders
DE60025085T2 (de) * 1999-02-04 2006-06-29 Matsushita Electric Industrial Co., Ltd., Kadoma Detektor für ein zu bedruckendes objekt und druckdetektionsverfahren
US6826597B1 (en) 1999-03-17 2004-11-30 Oracle International Corporation Providing clients with services that retrieve data from data sources that do not necessarily support the format required by the clients
US6356908B1 (en) * 1999-07-30 2002-03-12 International Business Machines Corporation Automatic web page thumbnail generation
EP1074925B8 (en) * 1999-08-06 2011-09-14 Ricoh Company, Ltd. Document management system, information processing apparatus, document management method and computer-readable recording medium
WO2001042989A2 (en) * 1999-11-30 2001-06-14 Broadvision Inc. Customization of output content based on device type
JP2002032364A (ja) * 2000-07-14 2002-01-31 Ricoh Co Ltd 文書情報処理方法、文書情報処理装置及び記録媒体
US6822663B2 (en) * 2000-09-12 2004-11-23 Adaptview, Inc. Transform rule generator for web-based markup languages
US6964025B2 (en) * 2001-03-20 2005-11-08 Microsoft Corporation Auto thumbnail gallery
US20020147847A1 (en) * 2001-04-09 2002-10-10 Sun Microsystems, Inc. System and method for remotely collecting and displaying data
US6999972B2 (en) * 2001-09-08 2006-02-14 Siemens Medical Systems Health Services Inc. System for processing objects for storage in a document or other storage system
EP1437885A4 (en) 2001-09-10 2006-05-31 Nikon Technologies Inc DIGITAL CAMERA SYSTEM, PICTURE MEMORY DEVICE AND DIGITAL CAMERA
US6996781B1 (en) * 2001-10-31 2006-02-07 Qcorps Residential, Inc. System and method for generating XSL transformation documents
JP2003150586A (ja) * 2001-11-12 2003-05-23 Ntt Docomo Inc 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体
CA2484355A1 (en) * 2002-05-02 2003-11-13 Sarvega, Inc. System and method for transformation of xml documents using stylesheets
JP2004307160A (ja) 2003-04-08 2004-11-04 Sekisui Chem Co Ltd 成形ロール
US7620889B2 (en) * 2004-12-20 2009-11-17 Microsoft Corporation Method and system for linking data ranges of a computer-generated document with associated extensible markup language elements
JP5383234B2 (ja) * 2009-02-03 2014-01-08 キヤノン株式会社 情報処理装置及び印刷制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259640A (ja) * 1999-03-04 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 構造化文書カスタマイズ表示方法及びシステム及びサーバ装置及びクライアント装置構造化文書カスタマイズ表示プログラムを格納した記憶媒体
JP2002157274A (ja) * 2000-08-09 2002-05-31 Mitsubishi Heavy Ind Ltd 電子ファイル装置とそのシステム作成方法及び書類データの選択方法
JP2002312401A (ja) * 2001-04-11 2002-10-25 Canon Inc 電子ファイリング装置及びその制御方法、記憶媒体並びにプログラム
JP2003162532A (ja) * 2001-08-08 2003-06-06 Xerox Corp サムネイル生成方法
JP2003131930A (ja) * 2001-10-26 2003-05-09 Nec Corp コンテンツ変換処理装置、スタイルシート自動選択方法、およびそのプログラム

Also Published As

Publication number Publication date
KR20060049116A (ko) 2006-05-18
CN100461173C (zh) 2009-02-11
KR100834196B1 (ko) 2008-05-30
US20060087668A1 (en) 2006-04-27
EP1650682A3 (en) 2006-11-22
EP1650682A2 (en) 2006-04-26
JP2006119915A (ja) 2006-05-11
US8332745B2 (en) 2012-12-11
CN1763748A (zh) 2006-04-26

Similar Documents

Publication Publication Date Title
US8332745B2 (en) Electronic filing system and electronic filing method
KR100897635B1 (ko) 문서 관리 시스템 및 그 방법과 정보 처리 장치 및 그 제어 방법
JP4423613B2 (ja) 電子化サービスマニュアル生成方法、電子化サービスマニュアル生成装置、電子化サービスマニュアル生成用プログラム並びにこのプログラムが記録された記録媒体
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US8869023B2 (en) Conversion of a collection of data to a structured, printable and navigable format
EP1538534A2 (en) Generation of a PPML template from a PDF document
JP3776866B2 (ja) 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
US20020095443A1 (en) Method for automated generation of interactive enhanced electronic newspaper
US20040163049A1 (en) Document processing method
KR101814120B1 (ko) 이미지를 전자문서에 삽입하는 방법 및 이를 수행하는 장치
MXPA04001932A (es) Metodo y sistema para mejorar la funcion de copiado de una aplicacion de programa de computadora.
US20070150494A1 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US9286272B2 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US20070214185A1 (en) Document management system, method and program therefor
JP4934181B2 (ja) 付加画像処理システム、画像形成装置及び付加画像追加方法
US20100188674A1 (en) Added image processing system, image processing apparatus, and added image getting-in method
US20080010583A1 (en) Computer-readable medium storing markup documents, and method and apparatus of processing the markup documents
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体
JP4255538B2 (ja) 構造化文書蓄積検索装置
JP4013748B2 (ja) 文書生成装置
JP2011150447A (ja) レイアウト支援装置、レイアウト支援方法、プログラム
Hansen et al. PDF Format for RFCs
Masinter et al. RFC 7995: PDF Format for RFCs
JP2013161375A (ja) 編集システム
JP2008186090A (ja) データ生成装置、データ生成方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071022

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100608

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100908

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees