JP5428967B2 - 文書処理システム及び文書処理プログラム - Google Patents

文書処理システム及び文書処理プログラム Download PDF

Info

Publication number
JP5428967B2
JP5428967B2 JP2010058533A JP2010058533A JP5428967B2 JP 5428967 B2 JP5428967 B2 JP 5428967B2 JP 2010058533 A JP2010058533 A JP 2010058533A JP 2010058533 A JP2010058533 A JP 2010058533A JP 5428967 B2 JP5428967 B2 JP 5428967B2
Authority
JP
Japan
Prior art keywords
document
similar
document element
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010058533A
Other languages
English (en)
Other versions
JP2011192089A (ja
Inventor
信雄 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010058533A priority Critical patent/JP5428967B2/ja
Priority to US12/869,350 priority patent/US8970871B2/en
Publication of JP2011192089A publication Critical patent/JP2011192089A/ja
Application granted granted Critical
Publication of JP5428967B2 publication Critical patent/JP5428967B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Bioethics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書処理システム及び文書処理プログラムに関する。
従来より、文書等のデータの偽造や不正使用を防止するための技術が知られている。例えば、印刷物の背景に、複写すると浮き出て印刷されるようなイメージを印刷して、複写時に複写であることが容易にわかるような技術が知られている。
また、印刷元を容易に特定できるようにする技術として、印刷指示をおこなった者の氏名や社員番号等を用紙の端などに明示的に印刷する技術や、文書データにマイクロ文字や微小ドットの組み合わせを印刷する技術、画像に電子透かしを埋め込む印刷技術が知られている。
また、例えば、下記特許文献1には、不正使用発見のための情報として、文書等に含まれる文字または記号について、当該文字または記号と似た形状をもつ文字または記号と置換する文字情報編集加工装置が開示されている。具体的には、例えば、文書等に含まれる「ー」(長音記号)を「−」(ハイフン)に置換することや、「口」(漢字)を「ロ」(カタカナ)で置換することにより、見た目にはほとんどわからない固有の情報を埋め込む装置が開示されている。
特開2000−352928号公報
本発明は、配布する文書または文書データの受け取り側に、不正使用防止の意図を知られることなく、当該文書または文書データに固有情報を埋め込む文書処理システム及び文書処理プログラムを提供することを目的とする。
請求項1に記載の文書処理システムは、記録すべき固有情報を取得する固有情報取得部と、文書データに含まれる1又は複数の文書要素にそれぞれ関連する複数の類似文書要素群から、前記固有情報に応じた1の類似文書要素のそれぞれを選出する類似文書要素選出部と、前記各文書要素が前記類似文書要素選出部により選出される前記類似文書要素に置換された置換文書データを取得する置換文書データ取得部と、を含むことを特徴とする。
請求項2に記載の文書処理システムは、請求項1に記載の発明において、前記文書処理システムは、更に、前記1又は複数の文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部と、前記位置情報取得部により取得される前記各文書要素を、前記位置情報に関連付けて、前記類似文書要素群を記憶部に登録する登録部と、を有することを特徴とする。
請求項3に記載の文書処理システムは、請求項2に記載の発明において、前記文書処理システムは、更に、前記置換文書データに含まれる1又は複数の文書要素それぞれに関する類似文書要素群を取得する類似文書要素取得部と、前記置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部と、前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する前記固有情報を取得する固有情報取得部と、を含むことを特徴とする。
請求項4に記載の文書処理システムは、請求項2に記載の発明において、前記記憶部は、前記置換文書データを配布する配布先に関連する情報を、前記固有情報と関連付けて記憶することを特徴とする。
請求項5に記載の文書処理システムは、請求項2に記載の発明において、前記文書処理システムは、更に1又は複数の文書要素を指定する文書要素指定部を有することを特徴とする。
請求項6に記載の文書処理システムは、請求項2に記載の発明において、前記登録部は、前記類似文書要素群を構成する各類似文書要素に、順に0から始まる類似文書要素番号を関連付けて登録することを特徴とする。
請求項7に記載の文書処理システムは、請求項6に記載の発明において、前記登録部は、各文書要素を順にテーブルの形式で登録し、前記テーブルの1番目の文書要素については1の値を、該1番目の文書要素に関する重みとして、2番目以降の文書要素については、Nを2以上の整数とした場合、N−1番目の重みに該N−1番目の文書要素の類似文書要素群に含まれる類似文書要素の個数を乗じた値を重みとして、各文書要素と関連付けて登録することを特徴とする。
請求項8に記載の文書処理システムは、請求項7に記載の発明において、前記固有情報は、前記各文書要素に関連づけられた各重みと、各類似文書要素番号に応じた情報であることを特徴とする。
請求項9に記載の文書処理システムは、文書データに含まれる1又は複数の文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部と、前記位置情報取得部により取得される前記各文書要素の位置情報に関連付けて類似文書要素群を記憶部に登録する登録部と、を含むことを特徴とする。
請求項10に記載の文書処理システムは、文書データに含まれる1又は複数の文書要素それぞれに関する類似文書要素群を取得する類似文書要素取得部と、置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部と、前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する固有情報を取得する固有情報取得部と、を含むことを特徴とする。
請求項11に記載の文書処理プログラムは、記録すべき固有情報を取得する固有情報取得部と、文書データに含まれる1又は複数の文書要素にそれぞれ関連する複数の類似文書要素群から、前記固有情報に応じた1の類似文書要素のそれぞれを選出する類似文書要素選出部と、前記各文書要素が前記類似文書要素選出部により選出される前記類似文書要素に置換された置換文書データを取得する置換文書データ取得部、としてコンピュータを機能させることを特徴とする。
請求項12に記載の文書処理プログラムは、文書データに含まれる1又は複数の文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部と、前記位置情報取得部により取得される前記各文書要素の位置情報に関連付けて類似文書要素群を記憶部に登録する登録部、としてコンピュータを機能させることを特徴とする。
請求項13に記載の文書処理プログラムは、文書データに含まれる1又は複数の文書要素それぞれに関する類似文書要素群を取得する類似文書要素取得部と、置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部と、前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する固有情報を取得する固有情報取得部、としてコンピュータを機能させることを特徴とする。
請求項1、2、4乃至12の発明によれば、不正使用の意図を知られずに固有情報を文書または文書データに埋め込み、文書の不正使用を防止する。
請求項3及び13の発明によれば、配布された文書または文書データから自動的に固有情報を取得することにより、配布先が特定されることになる。
本発明の実施形態における文書処理システムの概略を示す図である 本発明の実施形態における文書処理装置の概略を示す図である。 本発明の実施形態における文書処理装置を機能的に示す図である。 本発明の実施形態におけるテーブルを説明するための図である。 本発明の実施形態における元文書作成処理を示すフローチャートである。 本発明の実施形態における配布用文書作成処理を説明するためのフローチャートである。 本発明の本実施の形態における照合装置の構成を機能的に説明するための図である。 本発明の本実施の形態における照合装置の照合処理のフローチャートを示す図である。 本発明の変形例を説明するための図である。
以下、本発明の実施形態について、図面を参照しつつ説明する。なお、図面については、同一又は同等の要素には同一の符号を付し、重複する説明は省略する。
図1は、本発明の実施形態における文書処理システムの概略を示す図である。図1に示すように、文書処理システム100は、文書処理装置101、データ形成装置102、コンピュータ103を有する。なお、当該文書処理装置101、データ形成装置102、コンピュータ103は、通信ネットワーク104を通じて互いに接続される。
文書処理装置101は、例えば、パーソナルコンピュータ等のコンピュータシステムで構成される。具体的には、図2に示すように、文書処理装置101は、制御部201と、当該制御部201と接続された記憶部202、操作部203、表示部204、及び、通信部205により構成される。
制御部201は、例えば、CPU等であって、記憶部202に格納されたプログラムに従って動作する。なお、本実施の形態において制御部201が実行する処理の詳細については、後述する。
記憶部202は、例えば、ハードディスクやROMやRAM等の情報記録媒体で構成され、制御部201によって実行されるプログラムを保持する情報記録媒体である。また、記憶部202は、例えば、制御部201のワークメモリとしても動作する。
操作部203は、例えば、キーボードや、マウス等のインターフェースで構成され、ユーザーの操作指示に応じて、当該操作の内容を制御部201に出力する。
表示部204は、例えば、液晶ディスプレイやCRTディスプレイ等の表示装置であって、制御部201からの指示に従い、情報を表示する。
通信部205は、例えば、ネットワークインターフェースであって、制御部201からの指示にしたがって、通信ネットワーク104を介して情報を送受信する。
なお、図1に示したコンピュータ103も、図2に示した文書処理装置101と同様の構成を有する。
また、データ形成装置102は、例えば、プリンタ、FAX、コピー機、または、それらの複合機等であって、通信ネットワーク104を通じた文書処理装置101からの制御情報に基づいて、紙等の媒体に文書データを印刷、または、文書データを形成するとともに、通信ネットワーク104を介して、所定の配布先である例えば、コンピュータ103に当該データを送信する。
なお、図1においては、文書処理装置101、データ形成装置102、及び、コンピュータ103のみを示したが、通信ネットワーク104には、更に、1または複数のコンピュータ103やその他の情報機器が接続され得る。
図3は、文書処理装置を機能的に示す図である。なお、図3に示す当該文書処理装置100の機能は、主に制御部201により実行される。これらの機能は、例えば、記憶部202に記憶されたプログラムを実行することにより実現される。なお、当該プログラムは、例えば、通信ネットワーク104を介して、ダウンロードされて提供されてもよいし、または、CD−ROMやDVD−ROM等のコンピュータで読み取り可能な各種の情報記録媒体によって提供されてもよい。
文書データ取得部301は、ユーザーの操作部203への指示操作に基づいて作成された文書データを取得する。具体的には、例えば、記憶部202等の情報記録媒体に記憶されたワードプロセッサープログラムを用いて、ユーザーが表示部204を見ながら、操作部203を用いて入力した文書データを取得する。
なお、当該文書データは、当該文書処理装置101の外部(例えば、コンピュータ103)に記憶された文書データであってもよい。この場合、当該文書データは、例えば、通信ネットワーク104を通じて、文書データ取得部301により取得されることはいうまでもない。また、文書データは、文書の他、図形、写真、表等任意のデータを含み得る。
文書要素指定部302は、ユーザーの操作部203への指示操作に基づいて、文書データ中の文書要素を指定する。具体的には、例えば、表示部204に表示された文書データを参照しつつ、当該文書データに含まれる1または複数の文書要素を、ユーザーが操作部203を用いることにより、指定することによって行う。なお、文書要素とは、文書データ中の単語または「、」や「。」「“」等の記号をいう。
類似文書要素取得部303は、指定された文書要素の類似文書要素群を取得する。類似文書要素群の取得は、例えば、ユーザーが辞書を検索し、検索した類似文書要素のうち当該文書要素と置換可能な1以上の類似文書要素を操作部203により選択することにより取得する。
この際、例えば、文書要素の指定に応じて、あらかじめ記憶部202やコンピュータ103に記憶された類似文書要素辞書が検索され、当該文書要素の類似文書要素群が表示される構成としてもよい。そして、当該表示された類似文書要素群の一部または全部をユーザーが選択することにより、類似文書要素群を取得する構成としてもよい。
ここで、類似文書要素群とは、文書要素の1または複数の類似文書要素で構成される。また、各類似文書要素とは、対応する文書要素と類似の意味を有し、かつ、対応する文書要素と置換しても、文章として不自然にならないものをいう。また、本実施の形態においては、置換可能か否かは、ユーザーが判断する。これはたとえ類似文書要素であっても、置換すると文書として不自然となることを防止するためである。
位置情報取得部304は、上記文書要素の指定に基づいて、文書データ中における当該文書要素の位置情報を取得する。例えば、文書データ中における何番目の単語または何文字目か等の情報を位置情報として取得する。なお、取得された位置情報は、対応する文書要素に関連づけて記憶部202に記憶される。
登録部305は、当該指定された各文書要素についての類似文書要素群を、後述する各類似文書要素の各類似文書要素番号、及び、各文書要素に対応する重みとともに、例えば、図4に示したテーブルの形式で登録される。なお、図4に示したテーブルは例示であって、各文書要素、その類似文書要素群、類似文書要素番号、重みが関連付けて登録される限り、異なる構成であってもよい。
図4に示すように、当該テーブルは、文書要素毎に、左から順に番号、文書要素、類似文書要素、類似文書要素番号及び重みを有する。
番号は、例えば、上記文書要素指定部302により指定された文書要素が指定された順序を示す。文書要素は、上記文書要素指定部302により指定された文書要素を示す。したがって、図4は、文書要素として、順に文書要素である「文書」乃至「類義語」が指定され、各文書要素に対応して番号1乃至8が順に割り当てられた状態を示す。
類似文書要素は、類似文書要素取得部303により取得された各文書要素についての各類似文書要素を示す。図4は、文書要素「文書」の類似文書要素として「文書」及び「ドキュメント」が、文書要素「単語」の類似文書要素として、「単語」、「ワード」、及び「トークン」が登録された状態を示す。なお、その他の文書要素についても同様に図4に示すように登録される。
類似文書要素番号は、上記各類似文書要素に0から順に昇順に割り当てる番号である。例えば、図4は、文書要素「文書」の類似文書要素については、類似文書要素「文書」について0、類似文書要素「ドキュメント」について1が登録され、文書要素「単語」の類似文書要素については、類似文書要素「単語」について0、類似文書要素「ワード」について1、類似文書要素「トークン」について2が登録された状態を示す。なお、その他の文書要素についても、同様に図4に示すように登録される。類似文書要素の順序は、例えば、ユーザーが類似文書要素として選択した順序であればよい。
重みについては、1番目の文書要素についての重みとして、1を割り当て、N番目の文書要素についての重みとして、N−1番目の重みにN−1番目の類似文書要素の数を乗じた数を割り当てる。ここで、Nは2以上の整数を表す。
つまり、2番目の文書要素についての重みとしては、1番目の文書要素の重み情報に1番目の文書要素についての類似文書要素数を乗じた数を割り当てる。例えば、図4においては、1番目の文書要素の重み情報は1であり、類似文書要素の個数は2であるので、1に2を乗じた数である2を、2番目の重み情報として割り当てる。
3番目の重みとしては、2番目の文書要素の重み情報に2番目の文書要素の類似文書要素数を乗じた数を割り当てる。例えば、図4においては、2番目の文書要素の重み情報は2であり、2番目の文書要素の類似文書要素個数は3であるので、2に3を乗じた数である6を、3番目の重み情報として割り当てる。以下同様にして算出された重みを各文書要素に割り当てる。
登録部305は、上記のようにして登録されたテーブルを、例えば、記憶部202や文書処理装置101外部のコンピュータ103等における情報記録媒体に記憶する。なお、この際文書ファイルとして、文書データと関連付けて、保存してもよい。
登録データ取得部306は、記憶部202その他の情報記録媒体に記憶された上記テーブルを取得する。なお、文書ファイルとして保存した場合は、文書ファイルを開くことによって取得されてもよい。
固有情報取得部307は、ユーザーの操作部203への指示操作に従って入力された固有情報を取得する。ここで、固有情報とは、個別の情報であればよく、例えば、社員番号や運転免許証の番号等であってもよい。
類似文書要素選出部308は、上記固有情報に応じて、各文書要素についての類似文書要素群から各類似文書要素を選出する。なお、ここでは説明の簡略化のため、上記固有情報が、下記のようにして取得される固有番号と同一である場合について説明するが、上記固有情報は、当該固有番号と1対1に対応する限り同一でなくてもよい。なお、下記の説明においては、実際の処理においては、固有番号から各類似文書要素群が選出されるが、説明の容易化のため、まず、逆の順序から、つまり、固有番号の算出から説明する。
固有番号は、上記テーブルにおいて、N番目の文書要素の重みにN番目の当該文書要素について選択された類似文書要素番号を乗じた数の総和で計算される。具体的には、例えば、図4に示すように、文書データ中の指定された各文書要素について、類似文書要素「ドキュメント」「単語」「同義語」「ワード」「プリント」「類義語」「ユニーク」「類語」が選択されている場合、上記テーブルに従い、固有番号は下記式(1)のように計算される。
(1)(1×1)+(2)(2×0)+(3)(6×1)+(4)(18×1)+(5)(54×1)+(6)(108×0)+(7)(324×0)+(8)(648×2)=1375 ・・・(1)
なお、上記式(1)において、説明をわかりやすくするために、テーブルにおける番号1乃至8に相当する記号(1)乃至(8)を付しているのであって、固有番号の算出に使用される数を示すものではない。
上記のようにして、各文書要素における各類似文書要素の選択により、個別の固有番号が算出される。
ここで、上記のようにして算出される固有番号が、上記固有情報と対応している場合、当該固有情報に応じて、上記の式(1)を逆に計算することにより、各類似文書要素を選出することができる。このように構成することで、1の固有番号に対して、1の各類似文書要素の組み合わせが対応する。言い換えれば、固有情報に応じて、各文書要素について各類似文書要素群から1の類似文書要素を選出する。
なお、上記の説明においては、固有情報と固有番号が同一であることを想定して説明したが、上述のように1の固有情報から1の固有番号を導くように関連づけることができる限り、異なる番号であってもよい。
例えば、固有情報が社員番号である場合であれば、社員番号の全部または一部の数字の小さい順から、固有番号の小さい順に対応するようにして1の社員番号から1の固有番号が導かれるようにしてもよい。この場合、社員番号が固有情報として取得されると、当該固有情報から固有番号を導き、当該固有番号に応じて上記のような各類似文書要素の組み合わせを求める。また、この場合、固有情報と固有番号との関係情報が、例えば記憶部202等の情報記録媒体に記憶されており、固有情報から固有番号が導き出せるように構成される。
置換文書データ取得部309は、上記類似文書要素選出部308の選出結果に基づき、文書データ中の各文書要素を各類似文書要素に置換した置換文書データを作成するとともに、当該置換文書データを記憶部202に記憶する。
なお、上記においては、元文書作成部310と配布用文書作成部311を、文書処理装置101と一体として形成する構成としたが、別個の文書処理装置として形成してもよい。
次に、当該文書処理装置101の処理につきフローチャートを用いて説明する。まず、当該文書処理装置101の元文書作成処理について説明する。ここで、元文書作成処理とは、固有情報を文書データに埋め込む前の準備段階の処理をいう。
なお、ここでは、「印刷される文書中の文章の中からいくつかの単語を抽出し、辞書から類似文書要素を探し出し、別の単語に置き換えて印刷する。その際、出力者ごとに選択する類似文書要素を変化させ、出力者ごとにユニークな出力が得られる。出力者と類似文書要素の組み合わせを紐付けしておき、後から出力物を見てどの出力者が出力したものかどうか特定できるような文書生成システム。」という文書データを例として説明する。
図5は、当該元文書作成処理を示すフローチャートである。まず、文書データ取得部301は、文書データを取得する(S101)。具体的には、例えば、上述のように記憶部202等の情報記録媒体に記憶されたワードプロセッサープログラム等を用いて、ユーザーが表示部204を見ながら、キーボードやマウス等の操作部203を用いて入力した文書データを取得する。
次に、取得された文書データ中の文書要素を指定した後(S102)、当該指定した文書及びその類似文書要素群を取得するとともに(S103)、当該指定された文書要素の位置情報を取得する(S104)。なお、位置情報の取得と類似文書要素群の取得は異なる順序であってもよい。また、文書要素の指定及び類似文書要素群の取得については上述のとおりである。
次のS105において、全ての文書要素の指定が終了していない場合には、S102に戻り、S102乃至S104を繰り返す。
一方、S105において、全ての文書要素を指定したと判断した場合には、類似文書要素群及び位置情報を登録する(S106)。具体的には、例えば上述の図4に示したテーブルとして登録する。このとき、上記の類似文書要素番号及び重みについても同時に登録することは上述のとおりである。
以上のようにして、元文書作成フローが終了する。なお、上記フローチャートは一例であって、上記で示した処理と実質的に同一の処理を行うことができる限り異なる処理であってもよい。例えば、登録のタイミングについては、文書要素の指定や類似文書要素群の取得の際に登録される構成としてもよい。
次に、配布用文書作成処理について説明する。ここで、配布用文書作成処理とは、配布先毎に異なるデジタル情報、つまり、本実施の形態においては例えば固有情報、を埋め込んだ配布用文書を作成することをいう。
図6は、配布用文書作成処理を説明するためのフローチャートである。配布用文書作成処理が開始されると、上記元文書作成フローにおいて作成された登録データ、つまり、上記テーブルを取得する(S201)。これは、例えば、配布コマンドを実行することにより、行われる。
次に、固有情報を配布先情報とともに取得する(S202)。具体的には、例えば、上記コマンドを実行すると表示部204に情報入力画面が表示され、当該情報入力画面において、配布先の名称や氏名、住所、または電話番号等の配布先情報及び固有情報を、ユーザーが操作部203を用いて入力することにより取得する。ここで、配布先情報は、固有情報に関連付けて記憶部202に記憶される。
次に、固有情報に応じて、取得したテーブルに含まれる各類似文書要素の中から、各文書要素についての各類似文書要素を選出する(S203)。具体的には、固有番号と固有情報が同じである場合について上記テーブルを例として説明する。
例えば、固有番号として、1375が入力されると。上記のように、上記式(1)を逆に算出することにより、各文書要素に対応した各類似文書要素番号が算出される。そして、各類似文書要素番号から、各類似文書要素が特定されることにより、テーブル中1番目の文書要素から順に、類似文書要素「ドキュメント」「単語」「同義語」「ワード」「プリント」「類義語」「ユニーク」「類語」が選出されることとなる。
次に、上記選出に応じて、文書データ中の各文書要素を選出された類似文書要素と置換する(S204)。具体的には、上記の文書データの例の場合、「印刷される(1)[ドキュメント]中の文章の中からいくつかの(2)[単語]を抽出し、辞書から(3)[同義語]を探し出し、別の(4)[ワード]に置き換えて(5)[プリント]する。その際、出力者ごとに選択する(6)[類義語]を変化させ、出力者ごとに(7)[ユニーク]な出力が得られる。出力者と(8)[類語]の組み合わせを紐付けしておき、後から出力物を見てどの出力者が出力したものかどうか特定できるような文書生成システム。」という置換文書データが作成される。
なお、当該置換文書データにおいて()で囲まれた部分はテーブルの「番号」に相当し、[]で囲まれた部分は選出された類似文書要素を示すものであって、()で囲まれた部分や[]は実際の置換文書データに含まれないことはいうまでもない。
次に、上記のようにして作成された置換文書データを、通信部205を用いることにより、通信ネットワーク104を通じて、例えばデータ形成装置102に送付する(S205)。そして、データ形成装置102により、置換文書データを配布用文書として印刷し、所定の配布先に配布してもよいし、当該置換文書データを配布用文書データとして、通信ネットワーク104を通じて所望のコンピュータ103等の所望の配布先に、電子的に配布してもよい。
上記のように配布用文書作成処理が終了する。なお、上記フローチャートは一例であって、上記で示した処理と実質的に同一の処理を行うことができる限り異なる処理であってもよい。
次に、情報漏洩時において、上記のように埋め込んだ固有情報を取り出す構成について説明する。
図7は、本実施の形態における照合装置の構成を機能的に説明するための図である。図7に示す当該照合装置700の機能は、主に制御部201により実行される。なお、当該照合装置700は、本実施の形態においては文書処理装置101と一体的に制御部201に形成されるが、文書処理装置101とは別個に、例えばコンピュータ103等の情報記録媒体に形成されてもよい。
図7に示すように、照合装置700は、配布文書データ取得部701、登録データ取得部702、判断部703、固有情報取得部704を有する。
配布文書データ取得部701は、例えばスキャナ(図示せず)等の読み取り装置で読み込んだ配布された文書の文書データを取得する。なお、当該文書データは、置換文書データに対応する。また、登録データ取得部702は、記憶部202等の情報記録媒体から、上記テーブルを取得する。なお、特許請求の範囲における類似文書要素取得部は、例えば、当該登録データ取得部702に対応する。
判断部703は、上記配布文書データ取得部701から取得された文書データにおける類似文書要素と上記テーブルにおける対応する類似文書要素を比較することにより、各文書要素と置換された類似文書要素が上記テーブルにおける類似文書要素群のうちいずれの類似文書要素であるかを判断する。なお、このとき、当該文書データにおける類似文書要素の位置の特定においては、例えば、前述の文書要素の位置情報を利用する。
固有情報取得部704は、判断部703からの判断結果に基づき、固有番号を算出する。そして、前述のように記憶部202等の情報記録媒体に記憶された固有番号と固有情報との対応関係に基づいて、当該固有番号から、固有情報を取得する。なお、固有番号が固有情報と同一である場合には、固有番号がそのまま固有情報を示すことはいうまでもない。
図8は、当該照合装置の照合処理のフローチャートを示す図である。図8に示すように、照合処理が開始されると、まず登録データとしての上記テーブルを取得するとともに(S301)、置換文書データを取得する(S302)。なお、置換文書データの取得は、例えば上述のように行われる。
次に、登録データと置換文書データを比較することによりいずれの類似文書要素が含まれているかを判断し(S303)、これに応じて固有情報を取得する(S304)。具体的には、例えば、置換文書データにおいて、テーブルに登録された文書要素「文書」の位置に、類似文書要素「ドキュメント」が存在すると判断した場合、当該類似文書要素の類似文書要素番号1を取得する。以下同様にして、置換文書データからテーブルを用いて各文書要素に対応する類似文書要素番号を取得する。そして、得られた各類似文書要素番号に対応する各重みを乗じた数を加算することにより、固有番号を取得する。そして、上述のように、当該固有番号に基づいて、固有情報を取得する。
次に、取得した固有情報から配布先情報を取得する(S305)。最後に、配布先情報を表示画面に表示して(S306)、当該照合フローを終了する。ここで、固有情報と配布先情報は前述のように関連付けて記憶部202等の情報記録媒体に記憶されているため、記憶部202等の情報記録媒体を参照することにより、配布先情報が求められる。
なお、上記照合処理のフローチャートは例示であって、上記実施の形態で示した処理と実質的に同一の処理を行うことができる限り異なる処理であってもよい。
また、上記照合処理は、上記のような照合装置700によらず、ユーザーが例えば上記テーブルと配布された文書データとを比較することにより、固有情報を算出し、また、当該固有情報に基づいてユーザーがその他のデータベースを検索して配布先情報を取得する構成としてもよい。
上記のように構成することで、本実施の形態によれば、上記のような不正使用防止技術が適用された配布用文書または配布用文書データであることを知られることを低くしつつ、不正使用防止技術を適用した配布用文書または配布用文書データが配布される。
また、文章自体に不正使用防止技術が適用されているため、配布用文書または配布用文書データを手入力でテキスト化された場合であっても、不正使用防止情報が残る可能性が高く、また、複写が繰り返されたとしても、不正使用防止情報が劣化しない。
更に、例えばメールマガジンやEメールの複数人への配信機能を用いる場合のように、同じ内容の文書が一斉に配信されるような場合、本実施の形態によれば、配信先毎に固有の文書を生成して配信することで、当該文書の内容が別の場所で引用された場合であっても、引用内容によって一次配信先が特定される。
本発明は、上記実施の形態に限定されるものではなく、種々の変形が可能である。例えば、上記実施の形態で示した構成と実質的に同一の構成、同一の作用効果を奏する構成又は同一の目的を達成することができる構成で置き換えることができる。
例えば、上記実施の形態においては、ユーザーが出力物固有番号を入力する構成としたが、文書処理装置101が固有番号を生成する構成としてもよい。具体的には、例えば、前回の配布時の固有番号を記憶しておき、次回の配布時には次の固有番号を生成するようにしてもよい。または、ユーザーが入力した配布先情報から特有のハッシュ値を計算し、それを固有番号としてもよい。
[変形例]
本変形例では、制御部201が単語抽出部901を有する点、類似文書要素取得部303が辞書検索部902を有する点が、上記実施の形態と異なる。その他の点は、上記実施の形態と同様であり、同様である点については説明を省略する。
図9に示すように、本変形例における制御部201は、単語抽出部901を有する。単語抽出部901は、文書データにおける単語を抽出する。
類似文書要素取得部303は、辞書検索部902を有する。辞書検索部902は、単語抽出部901が抽出した単語または記号の類似文書要素が存在するか否かを、例えば記憶部202に記憶されている類似文書要素辞書に基づいて判断する。
そして、1または複数の類似文書要素が存在する場合には、文書要素指定部302は当該単語または記号を文書要素として指定する。一方、類似文書要素が存在しない場合には、単語抽出部901が抽出した次の単語または記号について、上記と同様の処理を繰り返し行う。
上記のように、本変形例においては、単語抽出部901を用いることにより文書データ中から単語を自動的に抽出し、類似文書要素辞書を検索することにより類似文書要素を有する単語または記号のみを文書要素として指定する。つまり、上記実施の形態と異なり、ユーザーが文書要素を指定したり、類似文書要素を選択して登録しなくてもよい。なお、類似文書要素辞書とは、例えば、類義語や類似の記号を検索できる辞書をいう。
なお、単語または記号の抽出のみをユーザーが行う構成としてもよい。この場合は、類似文書要素の登録のみが自動で行われる。または、類似文書要素の一覧が表示され、ユーザーが類似文書要素群から1または複数の類似文書要素を選択する構成としてもよい。
本変形例においても、上記実施の形態と同様に、上記のような不正使用防止技術が適用された配布用文書または配布用文書データであることを知られることを低くしつつ、不正使用防止技術を適用した配布用文書または配布用文書データが配布される。
また、文章自体に不正使用防止技術が適用されているため、配布用文書または配布用文書データを手入力でテキスト化された場合であっても、不正使用防止情報が残る可能性が高く、また、複写が繰り返されたとしても、不正使用防止情報が劣化しない。
更に、例えばメールマガジンやEメールの複数人への配信機能を用いる場合のように、同じ内容の文書が一斉に配信されるような場合、本実施の形態によれば、配信先毎に固有の文書を生成して配信することで、当該文書の内容が別の場所で引用された場合であっても、引用内容によって一次配信先を特定される。
なお、本発明は、上記実施の形態及び変形例に限定されるものではなく、種々の変形が可能である。例えば、上記実施の形態及び変形例で示した構成と実質的に同一の構成、同一の作用効果を奏する構成又は同一の目的を達成することができる構成で置き換えることができる。
100 文書処理システム、101 文書処理装置、102 データ形成装置、103 コンピュータ、104 通信ネットワーク、201 制御部、202 記憶部、203 操作部、204 表示部、205 通信部、301 文書データ取得部、302 文書要素指定部、303 類似文書要素取得部、304 位置情報取得部、305 登録部、306 登録データ取得部、307 固有情報取得部、308 類似文書要素選出部、309 置換文書データ取得部、310 元文書作成部、311 配布用文書作成部、700 照合装置、701 配布文書データ取得部、702 登録データ取得部、703 判断部、704 固有情報取得部、901 単語抽出部、902 辞書検索部。

Claims (13)

  1. 記録すべき固有情報を取得する固有情報取得部と、
    文書データに含まれる1又は複数のユーザが指定した文書要素にそれぞれ関連する、前記ユーザが選択した複数の、前記文書要素と意味が類似する類似文書要素群から、前記固有情報に応じた1の類似文書要素のそれぞれを選出する類似文書要素選出部と、
    前記各文書要素が前記類似文書要素選出部により選出される前記類似文書要素に置換された置換文書データを取得する置換文書データ取得部と、
    を含み、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理システム。
  2. 前記文書処理システムは、更に、
    前記1又は複数の文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部と、
    前記位置情報取得部により取得される前記各文書要素を、前記位置情報に関連付けて、前記類似文書要素群を記憶部に登録する登録部と、
    を有することを特徴とする請求項1記載の文書処理システム。
  3. 前記文書処理システムは、更に、
    前記置換文書データに含まれる1又は複数の文書要素それぞれに関する類似文書要素群を取得する類似文書要素取得部と、
    前記置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部と、
    前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する前記固有情報を取得する固有情報取得部と、
    を含むことを特徴とする請求項2記載の文書処理システム。
  4. 前記記憶部は、前記置換文書データを配布する配布先に関連する情報を、前記固有情報と関連付けて記憶することを特徴とする請求項2記載の文書処理システム。
  5. 前記文書処理システムは、更に1又は複数の文書要素を指定する文書要素指定部を有することを特徴とする請求項2記載の文書処理システム。
  6. 前記登録部は、前記類似文書要素群を構成する各類似文書要素に、順に0から始まる類似文書要素番号を関連付けて登録することを特徴とする請求項2記載の文書処理システム。
  7. 前記登録部は、
    各文書要素を順にテーブルの形式で登録し、
    前記テーブルの1番目の文書要素については1の値を、該1番目の文書要素に関する重みとして、
    2番目以降の文書要素については、Nを2以上の整数とした場合、N−1番目の重みに該N−1番目の文書要素の類似文書要素群に含まれる類似文書要素の個数を乗じた値を重みとして、各文書要素と関連付けて登録することを特徴とする請求項6記載の文書処理システム。
  8. 前記固有情報は、前記各文書要素に関連づけられた各重みと、各類似文書要素番号に応じた情報であることを特徴とする請求項7記載の文書処理システム。
  9. 文書データに含まれる1又は複数のユーザが指定した文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部と、
    前記位置情報取得部により取得される前記各文書要素の位置情報に関連付けて、前記1または複数のユーザが指定した文書要素にそれぞれ関連する、前記ユーザが選択した、前記文書要素と意味が類似する類似文書要素群を記憶部に登録する登録部と、
    を含み、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理システム。
  10. 文書データに含まれる1又は複数のユーザが指定した文書要素それぞれに関する、前記ユーザが選択した、前記文書要素と意味が類似する類似文書要素群を取得する類似文書要素取得部と、
    置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部と、
    前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する固有情報を取得する固有情報取得部と、
    を含み、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理システム。
  11. 記録すべき固有情報を取得する固有情報取得部、
    文書データに含まれる1又は複数のユーザが指定した文書要素にそれぞれ関連する、前記ユーザが選択した複数の、前記文書要素と意味が類似する類似文書要素群から、前記固有情報に応じた1の類似文書要素のそれぞれを選出する類似文書要素選出部、
    前記各文書要素が前記類似文書要素選出部により選出される前記類似文書要素に置換された置換文書データを取得する置換文書データ取得部、
    としてコンピュータを機能させるための文書処理プログラムであって、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理プログラム
  12. 文書データに含まれる1又は複数の、前記文書要素と意味が類似するユーザが指定した文書要素の前記文書データにおける位置を示す位置情報を取得する位置情報取得部、
    前記位置情報取得部により取得される前記各文書要素の位置情報に関連付けて、前記1または複数の前記ユーザが指定した文書要素にそれぞれ関連する、前記ユーザが選択した類似文書要素群を記憶部に登録する登録部、
    としてコンピュータを機能させるための文書処理プログラムであって、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理プログラム
  13. 文書データに含まれる1又は複数の、前記文書要素と意味が類似するユーザが指定した文書要素それぞれに関する、前記ユーザが選択した類似文書要素群を取得する類似文書要素取得部、
    置換文書データにおいて前記各文書要素に代えて前記類似文書要素群のうちいずれの類似文書要素が含まれているかを判断する判断部、
    前記判断部により判断される類似文書要素に基づき、前記置換文書データに関する固有情報を取得する固有情報取得部、
    としてコンピュータを機能させるための文書処理プログラムであって、
    前記文書要素は、前記文書データに含まれる単語である、
    ことを特徴とする文書処理プログラム
JP2010058533A 2010-03-15 2010-03-15 文書処理システム及び文書処理プログラム Expired - Fee Related JP5428967B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010058533A JP5428967B2 (ja) 2010-03-15 2010-03-15 文書処理システム及び文書処理プログラム
US12/869,350 US8970871B2 (en) 2010-03-15 2010-08-26 Document processing system that embeds unique information in document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010058533A JP5428967B2 (ja) 2010-03-15 2010-03-15 文書処理システム及び文書処理プログラム

Publications (2)

Publication Number Publication Date
JP2011192089A JP2011192089A (ja) 2011-09-29
JP5428967B2 true JP5428967B2 (ja) 2014-02-26

Family

ID=44559719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010058533A Expired - Fee Related JP5428967B2 (ja) 2010-03-15 2010-03-15 文書処理システム及び文書処理プログラム

Country Status (2)

Country Link
US (1) US8970871B2 (ja)
JP (1) JP5428967B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8229509B2 (en) 2009-02-27 2012-07-24 Microsoft Corporation Protective shroud for handheld device
JP5891867B2 (ja) * 2012-03-15 2016-03-23 富士通株式会社 情報処理方法、装置及びプログラム
JP7343311B2 (ja) * 2019-06-11 2023-09-12 ファナック株式会社 文書検索装置及び文書検索方法
CN111461933A (zh) * 2020-04-13 2020-07-28 向英 一种文本数据处理方法、软件、存储介质、设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH063597B2 (ja) * 1985-08-20 1994-01-12 俊明 渡辺 ワ−ドプロセツサ
JP3989577B2 (ja) * 1996-10-22 2007-10-10 株式会社野村総合研究所 デジタル文書のマーキング装置及びマーク認識装置
JP3516609B2 (ja) 1999-06-14 2004-04-05 日本電信電話株式会社 文字情報加工編集装置、および文字情報加工編集プログラムを記録した記録媒体
US7099898B1 (en) * 1999-08-12 2006-08-29 International Business Machines Corporation Data access system
US7536636B2 (en) * 2004-04-26 2009-05-19 Kodak Graphic Communications Canada Company Systems and methods for comparing documents containing graphic elements
US7945525B2 (en) * 2007-11-09 2011-05-17 International Business Machines Corporation Methods for obtaining improved text similarity measures which replace similar characters with a string pattern representation by using a semantic data tree
JP4998220B2 (ja) * 2007-11-09 2012-08-15 富士通株式会社 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
US8073256B2 (en) * 2007-11-15 2011-12-06 Canon Kabushiki Kaisha Image processing apparatus and method therefor
US7925598B2 (en) * 2008-01-24 2011-04-12 Microsoft Corporation Efficient weighted consistent sampling

Also Published As

Publication number Publication date
US20110222109A1 (en) 2011-09-15
US8970871B2 (en) 2015-03-03
JP2011192089A (ja) 2011-09-29

Similar Documents

Publication Publication Date Title
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
CN100581214C (zh) 图像处理装置和图像处理方法
JP2009169536A (ja) 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
US20180160009A1 (en) Image processing apparatus and image forming apparatus
JP2008146605A (ja) 画像処理装置及びその制御方法
JP5428967B2 (ja) 文書処理システム及び文書処理プログラム
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2006202295A (ja) デジタル写真管理装置とデジタル写真管理方法及びコンピュータプログラムを保存するコンピュータで読み取り可能な記録媒体
CN105740317B (zh) 用于将非文本内容对象化以及用于文档发现的方法和***
JP7379987B2 (ja) 情報処理装置及びプログラム
JP2005217805A (ja) 画像処理装置
JP4827519B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2007325196A (ja) 文書管理装置および文書管理方法
US6415039B2 (en) Image data merging system
JP7115162B2 (ja) 電子機器、画像形成装置、電子メール作成支援方法、及び電子メール作成支援プログラム
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体
JP4826378B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2006005670A (ja) ドキュメント処理装置
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
JP5465279B2 (ja) 情報処理装置及びプログラム
JP2013016059A (ja) 画像形成装置
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP2018142093A (ja) 画像形成装置
JP2008118364A (ja) 画像処理装置および画像処理プログラム
JP2008181223A (ja) 電子文書管理システム、電子文書管理方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121206

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20121206

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5428967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees