JP2011008394A - 文書情報生成装置、文書登録システム、及びプログラム - Google Patents

文書情報生成装置、文書登録システム、及びプログラム Download PDF

Info

Publication number
JP2011008394A
JP2011008394A JP2009149733A JP2009149733A JP2011008394A JP 2011008394 A JP2011008394 A JP 2011008394A JP 2009149733 A JP2009149733 A JP 2009149733A JP 2009149733 A JP2009149733 A JP 2009149733A JP 2011008394 A JP2011008394 A JP 2011008394A
Authority
JP
Japan
Prior art keywords
document information
word
replacement
secret
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009149733A
Other languages
English (en)
Other versions
JP5471065B2 (ja
Inventor
Shinichi Saito
信一 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009149733A priority Critical patent/JP5471065B2/ja
Priority to US12/629,560 priority patent/US20100332484A1/en
Priority to CN201010002088.2A priority patent/CN101930524B/zh
Publication of JP2011008394A publication Critical patent/JP2011008394A/ja
Application granted granted Critical
Publication of JP5471065B2 publication Critical patent/JP5471065B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Document Processing Apparatus (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】秘密単語を暗号化した情報と置換する場合と比較して、秘密単語が置換されたことに気づき難い文書情報を生成する。
【解決手段】秘密にすべき秘密単語18bと秘密単語の属性18aとを対応させて記憶すると共に、予め定められた属性を有する秘密単語18bに対応させて、予め定められた属性を有しかつ予め定められた属性を有する秘密単語と置換するための少なくとも1つの置換候補単語20aを記憶したHDD14dと、文書情報中に含まれた予め定められた属性を有する秘密単語をHDD14dに記憶された置換候補単語の何れかに置換する第1置換、及び文書情報中に含まれた予め定められた属性以外の属性を有する秘密単語を予め定められた文字群から無作為に選択された文字によって生成された単語に置換する第2置換の少なくとも一方の置換を、文書情報に対して行うことにより文書情報を生成する。
【選択図】図3

Description

本発明は、文書情報生成装置、文書登録システム、及びプログラムに関する。
従来、機密情報を含む情報を紙面に印刷する機密情報印刷方法において、機密情報を第三者が読み取ることのできない表現である代用表現に変換し、機密情報が代用表現で印刷されていることを示す文字列とともに,機密情報を代用表現で印刷する機密情報印刷方法が知られている(例えば、特許文献1参照)。
また、テキスト文章において、文字コードと文字の配列をシフトすることにより文字、及び文章を暗号化し、シフトした文字の配列を元に戻すことにより復号し、さらに、テキスト文章の文字を数値化し、任意の数値と排他的論理和演算をする技術が知られている(例えば、特許文献2参照)。
また、暗号化文字列データを作成する暗号化方法であって、複数の人名文字データからなる人名文字列データの入力を受け付け、暗号化文字列データのカラム数を設定し、文字配置パターンデータテーブルを参照して人名文字データ及び暗号化文字データの文字配置パターンを定め、設定したカラムに人名文字データ及び暗号化文字データを配置することにより暗号化文字列データを作成する暗号化方法が知られている(例えば、特許文献3参照)。
特開2004−58410号公報 特開2004−157490号公報 特開2007−114506号公報
本発明は、秘密単語を暗号化した情報と置換する場合と比較して、秘密単語が置換されたことに気づき難い文書情報を生成する文書情報生成装置、文書登録システム、及びプログラムを提供することを目的とする。
上記目的を達成するために、請求項1記載の発明の文書情報生成装置は、秘密にすべき秘密単語と該秘密単語の属性とを対応させて記憶すると共に、前記秘密単語のうちの予め定められた属性を有する秘密単語に対応させて、該予め定められた属性を有しかつ該予め定められた属性を有する秘密単語と置換するための少なくとも1つの置換候補単語を記憶した記憶手段と、文書情報中に含まれた前記予め定められた属性を有する秘密単語を前記記憶手段に記憶された置換候補単語の何れかに置換する第1置換、及び前記文書情報中に含まれた前記予め定められた属性以外の属性を有する秘密単語を予め定められた文字群から無作為に選択された文字によって生成された単語に置換する第2置換の少なくとも一方の置換を、文書情報に対して行うことにより文書情報を生成する生成手段とを含んで構成されている。
また、請求項2記載の発明の文書情報生成装置は、請求項1記載の発明の文書情報生成装置において、前記第1置換及び前記第2置換の少なくとも一方の置換が行われた場合に、置換が行われる前の秘密単語と、該秘密単語と置換された置換単語とを対応させて前記記憶手段に記憶するように制御する制御手段と、前記生成手段で生成されて登録された文書情報の中から指定された文書情報を取得し、前記記憶手段に記憶された秘密単語と置換単語とに基づいて、取得された文書情報中の置換単語を対応する秘密単語に変換する変換手段とを含むようにしたものである。
また、請求項3記載の発明の文書情報生成装置は、請求項1または請求項2記載の発明の文書情報生成装置において、前記第1置換及び前記第2置換の少なくとも一方の置換によって、前記秘密単語を置換した後の文書情報が意味を成す内容となるように前記秘密単語と前記置換候補単語とを対応させて記憶すると共に、前記予め定められた属性、及び前記文字群を数字としたものである。
また、請求項4記載の発明の文書情報生成装置は、請求項1から請求項3のいずれか1項記載の文書情報生成装置において、前記第1置換における秘密単語を置換する置換候補単語を、前記文書情報中に含まれない単語としたものである。
また、請求項5記載の発明の文書登録システムは、請求項1から4のいずれか1項記載の文書情報生成装置と、前記文書情報生成装置の前記生成手段で生成された前記文書情報を登録する登録装置とを含んで構成されている。
また、上記目的を達成するために、請求項6記載の発明のプログラムは、コンピュータを、秘密にすべき秘密単語と該秘密単語の属性とを対応させて記憶すると共に、前記秘密単語のうちの予め定められた属性を有する秘密単語に対応させて、該予め定められた属性を有しかつ該予め定められた属性を有する秘密単語と置換するための少なくとも1つの置換候補単語を記憶した記憶手段の記憶内容に基づいて、文書情報中に含まれた前記予め定められた属性を有する秘密単語を前記記憶手段に記憶された置換候補単語の何れかに置換する第1置換、及び前記文書情報中に含まれた前記予め定められた属性以外の属性を有する秘密単語を予め定められた文字群から無作為に選択された文字によって生成された単語に置換する第2置換の少なくとも一方の置換を、文書情報に対して行うことにより文書情報を生成する生成手段として機能させるためのプログラムである。
請求項1、5及び6の各発明によれば、秘密単語を、暗号化した情報と置換する場合と比較して、秘密単語が置換されたことに気づき難い文書情報を生成することができる、という効果が得られる。
請求項2の発明によれば、置換される前の文書情報を得ることができる、という効果が得られる。
請求項3の発明によれば、意味を成す文書情報であって秘密単語が置換されたことに気づき難い文書情報を生成することができる、という効果が得られる。
請求項4の発明によれば、置換された後の文書情報を置換前の文書情報に変換する際に、置換されていない単語を秘密単語に誤って変換することが防止される。
本実施の形態における文書登録システムの概略構成図である。 本実施の形態の秘密単語テーブルの模式図である。 本実施の形態における文書中継サーバの概略構成図である。 本実施の形態の置換候補辞書の模式図である。 本実施の形態の文書中継サーバが実行する文書情報生成処理のフローチャートである。 本実施の形態の置換テーブルの模式図である。 本実施の形態における置換前(変換後)の文書情報の一例である。 本実施の形態における置換前の文書情報の一例及び置換後の文書情報の一例を説明するための図である。 本実施の形態における置換後(変換前)の文書情報の一例である。 本実施の形態の文書中継サーバが実行する文書検索処理のフローチャートである。 本実施の形態における変換後の文書情報の一例及び変換前の文書情報の一例を説明するための図である。
以下、本発明を、クライアントとストレージサーバとの間に設けられた中継サーバに適用した場合の実施の形態について説明する。
図1は、本実施の形態における文書登録システム10の概略構成図である。文書登録システム10は、クライアント12、文書中継サーバ14、及び受信した文書情報を登録するストレージサーバ16を備えている。
クライアント12は、例えば、キーボードやマウスなどのユーザの指示を受け付けるための受付手段(図示せず)、受付手段で受け付けた指示内容に応じた処理を実行するコンピュータ等の処理実行手段(図示せず)、及び処理結果をユーザ(使用者)に報知するための表示装置や音声出力装置などの報知手段(図示せず)を備えている。
クライアント12は、登録対象の文書情報を文書中継サーバ14に送信する。ここで、「登録対象の文書情報」は、ストレージサーバ16へ登録させるための文書情報であって、中継サーバ14で処理される前の文書情報である。また、「文書情報」は、文書の情報(データ)であり、本実施の形態では、文書情報の一例として、テキストデータを用いた場合について説明する。
また、クライアント12は、例えば、受付手段を介して、ユーザを識別するためのユーザID、秘密にすべき秘密単語、及びこの秘密単語の属性が入力されると、これらユーザID、秘密単語、及び属性を対応させて図2に示す秘密単語テーブル18を作成する。また、クライアント12は、受付手段を介して秘密単語テーブル18を文書中継サーバ14に送信する指示を受け付けると、秘密単語テーブル18を文書中継サーバ14に送信する。
ここで秘密単語テーブル18の登録内容について図2を参照して詳細を説明する。秘密単語テーブル18には、秘密にすべき秘密単語18bと、当該秘密単語18bの属性18aとが対応されて登録される。ユーザは、自身のユーザIDと共に、文書情報中の秘密にしようとする単語を「秘密単語」としてクライアント12の受付手段を介して入力し、また、その秘密単語が、数値、人名、地名、会社名等のどのような種類の単語であるのかを示す属性をクライアント12の受付手段を介して入力する。なお、秘密単語の属性はクライアント12で自動的に判別してもよい。ユーザID、秘密単語、及び属性が入力されると、クライアント12の処理実行手段が、入力されたこれらの情報を対応させて秘密単語テーブル18に登録する。これにより、秘密単語テーブル18が生成されて、各レコードに、属性18a及び属性18aに対応する秘密単語18bが登録される。
文書中継サーバ14は、図3に示すように、ROM(Read Only Memory)14a、RAM(Random Access Memory)14b、CPU(Central Processing Unit)14c、HDD(Hard Disk Drive)14d、及びI/O(入出力)ポート14eを備えたコンピュータを含んで構成されている。これら、ROM14a、RAM14b、CPU14c、HDD14d、及びI/Oポート14eは、互いにバス14fを介して接続されている。なお、文書中継サーバ14は、文書情報生成装置としての機能を有する。
記憶媒体としてのROM14aには、OS等の基本プログラムが記憶されている。また、記憶媒体としてのHDD14dには、詳細を以下で説明する文書情報生成処理、及び検索処理の各処理ルーチンを実行するための各プログラムが記憶されている。
更に、HDD14dには、図4に示す置換候補辞書20が記憶されている。ここで、この置換候補辞書20の登録内容について説明する。本実施の形態では、上記で説明した複数の属性のうち予め定められた属性(本実施の形態では、例えば、数値以外の属性(例えば、人名、地名、及び会社名等の固有名詞を示す複数の属性))の各属性毎に、置換候補辞書20がHDD14dに記憶されている。置換候補辞書20には、置換候補辞書20の属性に対応する属性を有する秘密単語と置換するための複数個の置換候補単語20aが登録されている。なお、置換候補辞書20に登録される置換候補単語20aの数は1つでもよい。
また、文書中継サーバ14のCPU14cは、クライアント12から秘密単語テーブル18を受信すると、当該秘密単語テーブル18をHDD14dに記憶する。
以上、説明したように、本実施の形態のHDD14dには、秘密にすべき秘密単語18bと当該秘密単語18bの属性18aとが対応されて記憶されると共に、全ての秘密単語18bのうちの予め定められた属性18aを有する秘密単語18bに対応して、当該予め定められた属性18aを有しかつ当該予め定められた属性18aを有する秘密単語18bと置換するための少なくとも1つの置換候補単語20aが記憶される。なお、秘密単語テーブル18及び置換候補辞書20を記憶したHDD14dは、記憶手段に対応する。
CPU14cは、各プログラムをROM14a及びHDD14dから読み出して処理を実行する。RAM14bには、各種データが一時的に記憶される。
I/Oポート14eにはクライアント12及びストレージサーバ16が接続されている。
次に、文書中継サーバ14のコンピュータのCPU14cが実行する文書情報生成処理の処理ルーチンについて図5を用いて説明する。なお、文書情報生成処理は、クライアント12から、文書情報、文書情報をストレージサーバ16へ登録する指示、ユーザID、及び文書情報を識別するための文書IDを受信した場合に、CPU14cによって実行される。
まず、ステップ100では、HDD14dに記憶された秘密単語テーブル18に登録された秘密単語18bの各々が、受信した文書情報で表された文書中に含まれているか検索することにより、受信した文書情報中に秘密単語18bが含まれているか否かを判断し、含まれている場合は秘密単語18bを抽出する。なお、ステップ100は抽出手段の一例である。また、ステップ100及びステップ100以降の秘密単語テーブル18を用いる各ステップでは、受信したユーザIDが示すユーザに対応する秘密単語テーブル18を用いる。
ステップ100で、受信した文書情報中に秘密単語18bが含まれていないと判定された場合には、次のステップ122へ進む。一方、ステップ100で、受信した文書情報中に秘密単語18bが含まれていると判定された場合には、次のステップ102へ進む。
ステップ102では、秘密単語テーブル18の登録内容に基づいて、受信した文書情報中に含まれている全ての秘密単語18bのうち未選択の1つの秘密単語18bを選択し、選択された秘密単語18bに対応する属性18aが予め定められた属性(本実施の形態では、例えば、数値以外の属性(例えば、人名、地名、及び会社名等の固有名詞を示す複数の属性))であるか否かを判定する。
ステップ102で、選択された秘密単語18bに対応する属性18aが予め定められた属性でないと判定された場合には、次のステップ118へ進む。一方、ステップ102で、選択された秘密単語18bに対応する属性18aが予め定められた属性であると判定された場合には、次のステップ104へ進む。
ステップ104では、選択された秘密単語18bの属性に対応する置換候補辞書20をHDD14dから検索し、検索の結果得られた置換候補辞書20に登録されている複数のレコードの中から1レコードを読み込む。例えば、1番目のレコードを読み込む。
次のステップ106では、受信した文書情報で表される文書中に、読み込んだ1レコードに登録された置換候補単語20aが含まれているか否かを判断する。
ステップ106で、受信した文書情報で表される文書中に、読み込んだ1レコードに登録された置換候補単語20aが含まれていると判断された場合には、次のステップ108に進む。ステップ108では、上記ステップ104での検索の結果得られた置換候補辞書20に登録されているレコードの中から、本文書情報生成処理において未だ読み込まれていないレコードを1レコード読み込む。例えば、読み込まれたレコードの次の1レコードを読み込む。そして、上記ステップ106へ戻る。
なお、上記ステップ108で、上記ステップ104での検索の結果得られた置換候補辞書20に登録されている全てのレコードが読み込まれている場合には、まず、クライアント12へ文書情報中の秘密単語を置換候補単語で置換せずに文書情報をストレージサーバ16へ登録することについての許可または不許可の確認をとるためのメッセージ(例えば、「文書情報を置換せずにストレージサーバへ登録するか、または、文書情報を登録せずに破棄するか、いずれかご指示下さい」のメッセージ)を送信する。これによりクライアント12には当該メッセージが表示されて、ユーザはクライアント12を介して、登録の許可を示す指示または登録を許可しない指示を文書中継サーバ14へ返信する。文書中継サーバ14は、登録の許可を示す指示を受信した場合には、受信した文書情報をストレージサーバ16へ送信する。これにより、ストレージサーバ16で当該文書情報が登録される。一方、文書中継サーバ14は、登録を許可しない指示を受信した場合には、受信した文書情報を破棄し、本文書情報生成処理を終了する。
一方、ステップ106で、受信した文書情報で表される文書中に、読み込んだ1レコードに登録された置換候補単語20aが含まれていないと判断された場合には、次のステップ110に進む。ステップ110では、読み込んだ1レコードに登録された置換候補単語20aを置換単語として、受信したユーザID、受信した文書ID、選択された秘密単語18b、及び置換単語を対応付けて記憶するように制御する。より具体的には、ステップ110では、図6に示すように、ユーザID、文書ID、選択された秘密単語18b、及び置換単語を対応付けて置換テーブル22に登録する。これにより、置換テーブル22に、ユーザID22a、文書ID22b、秘密単語22c、及び置換単語22dの新規レコードが追加される。このように、HDD14dには、秘密単語22cを置換単語22dによって置換した後の文書情報が意味を成す内容となるように、秘密単語18b(22c)と置換候補単語20aとが属性を介して対応付けられて記憶される。
次のステップ112では、秘密単語テーブル18の登録内容に基づいて、受信した文書情報中に含まれている全ての秘密単語18bのうち、上記ステップ102で未選択の秘密単語18bが存在するか否かを判定する。ステップ112において、上記ステップ102で未選択の秘密単語18bが存在すると判定された場合には、上記ステップ102へ戻る。一方、ステップ112において、上記ステップ102で未選択の秘密単語18bが存在しないと判定された場合には、次のステップ114へ進む。
ステップ114では、受信した文書情報中に含まれた秘密単語22cを対応する置換単語22dで置換する置換処理を、受信した文書情報(登録対象の文書情報)に対して行うことにより、「登録すべき文書情報」を生成する。なお、「登録すべき文書情報」は、受信した文書情報に対して上記置換処理が行われた後の文書情報であり、ストレージサーバ16へ登録すべき情報である。また、ステップ114での置換は、上記ステップ110からステップ114へ進んだ場合については第1置換の一例であり、以下で詳細を説明するステップ120からステップ114へ進んだ場合については第2置換の一例である。また、ステップ114は、生成手段の一例である。
次のステップ116では、上記ステップ114で生成された登録すべき文書情報をストレージサーバ16へ送信する。これにより、ストレージサーバ16は、登録すべき文書情報を登録する。そして、本文書情報生成処理を終了する。
一方、ステップ118では、予め定められた乱数生成アルゴリズムを用いて、予め定められた桁数の乱数(ランダムな値)を生成する。なお、この予め定められた桁数は、例えば、選択された秘密単語18bの桁数と同じ桁数となるように生成するとよい、なお、選択された秘密単語18bの桁数以下または桁数以上となるように生成するようにしてもよい。この場合、数字が意味を持つように、最初の桁に0が含まれないように生成すると良い。これにより、予め定められた文字群(0〜9の数字)から無作為に選択された文字によって単語(この場合には予め定められた桁数の数値)が生成される。また、ステップ118では、生成された単語が、選択された秘密単語18bの数値と同一となる場合には、再度単語の生成を行うようにし、生成された単語が、選択された秘密単語18bの数値と異なるまで、単語の生成を行うようにしてもよい。
次のステップ120では、上記ステップ118で生成された単語を置換単語として、受信したユーザID、受信した文書ID、選択された秘密単語18b、及び置換単語を対応付けて記憶するように制御する。より具体的には、ステップ120では、図6に示すように、ユーザID、文書ID、選択された秘密単語18b、及び置換単語を対応付けて置換テーブル22に登録する。これにより、置換テーブル22に、ユーザID22a、文書ID22b、秘密単語22c、及び置換単語22dの新規レコードが追加される。そして、上記ステップ114へ進む。
また、ステップ122では、受信した文書情報を、登録すべき文書情報としてストレージサーバ16へ送信する。これにより、ストレージサーバ16は、登録すべき文書情報を登録する。そして、本文書情報生成処理を終了する。
以上、文書情報生成処理について説明した。文書情報生成処理による置換前の文書情報と置換後の文書情報とを具体例によって説明する。登録対象の文書情報(置換前の文書情報)として、例えば、図7及び図8に示すように、クライアント12から文書中継サーバ14に、「富士太郎の年収は5,000,000円です。」の文章を表す文書情報が送信され、秘密単語テーブル18に、属性18aを「人名」とした秘密単語18b「富士太郎」が登録され、属性18aを「数値」とした秘密単語18b「5,000,000」が登録されると共に、属性「人名」に対応する置換候補辞書20に、置換候補単語18c「横浜一郎」が登録されていた場合には、文書中継サーバ14からストレージサーバへ登録すべき文書情報(置換後の文書情報)として、図8及び図9に示すように、「横浜一郎の年収は9,999,999円です。」の文章を表す文書情報が送信される。
次に、文書中継サーバ14のコンピュータのCPU14cが実行する文書検索処理の処理ルーチンについて図10を用いて説明する。なお、文書検索処理は、クライアント12から、ユーザID、及び検索単語(検索キー)を受信した場合に、CPU14cによって実行される。なお、検索単語とは、例えば、その検索単語を文書情報中に含む文書情報を検索するためのものであり、詳細を以下で説明する文書検索処理により、検索情報を文書情報中に含む文書情報が検索されて、中継サーバ14を介してストレージサーバ16からクライアント12へ送信される。
まず、ステップ200では、受信した検索単語が、置換テーブル22に秘密単語22cとして登録されているか否かを判定する。なお、ステップ200及びステップ200以降の置換テーブル22を用いる各ステップでは、受信したユーザIDが示すユーザに対応する置換テーブル22を用いる。
ステップ200で、受信した検索単語が、置換テーブル22に秘密単語22cとして登録されていないと判定された場合には、次のステップ216へ進む。一方、ステップ200で、受信した検索単語が、置換テーブル22に秘密単語22cとして登録されていると判定された場合には、次のステップ202へ進む。
ステップ202では、受信した検索単語を秘密単語22cとした場合の秘密単語22cに対応する置換単語22dを置換テーブル22から取得する。
次のステップ204では、ストレージサーバ16に、上記ステップ202で取得された置換単語22dを含む文書情報を送信する指示を出力する。これにより、ストレージサーバ16は、指示に基づいて、登録されている文書情報の中から、置換単語22dを含む文書情報を検索して、検索の結果得られた文書情報を文書中継サーバ14へ送信する。従って、ステップ204の処理により、文書中継サーバ14は、ストレージサーバ16に登録された文書情報の中から指定された文書情報を取得する。なお、「指定された文書情報」は、上記の場合では、「上記ステップ202で取得された置換単語22dを含む文書情報」である。
次のステップ206では、ストレージサーバ16から文書情報を受信することにより文書情報を取得したか否かを判定する。ステップ206では、ストレージサーバ16から文書情報を取得したと判定されるまで、繰り返し上記の判定を行う。ステップ206で、ストレージサーバ16から文書情報を取得したと判定された場合には、次のステップ208へ進む。
ステップ208では、取得した文書情報中に含まれる置換単語22dの中から未選択の置換単語22dを1つ選択し、選択された置換単語22dに対応する秘密単語22cを置換テーブル22から1つ取得する。
次のステップ210では、取得された文書情報中の上記ステップ208で選択された置換単語22dを、上記ステップ208で取得された秘密単語22cで変換(置換)する。なお、ステップ210は、変換手段の一例である。
次のステップ212では、取得した文書情報中に含まれる置換単語22dの中に、上記ステップ208で未だ選択されていない置換単語22dが存在するか否かを判定する。ステップ212で、上記ステップ208で未だ選択されていない置換単語22dが存在すると判定された場合には、上記ステップ208へ戻る。一方、ステップ212で、上記ステップ208で未だ選択されていない置換単語22dが存在しないと判定された場合には、次のステップ214へ進む。なお、ステップ212で、上記ステップ208で未だ選択されていない置換単語22dが存在しないと判定された場合には、取得した文書情報中の全ての置換単語22dが対応する秘密単語22cで変換されている。
ステップ214では、全ての置換単語22dが対応する秘密単語22cで変換された文書情報をクライアント12へ送信する。これにより、クライアント12には検索対象の文書情報が送信される。そして、文書検索処理を終了する。
一方、ステップ216では、ストレージサーバ16に、受信した検索単語を含む文書情報を送信する指示を出力する。これにより、ストレージサーバ16は、指示に基づいて、登録されている文書情報の中から、検索単語を含む文書情報を検索して、検索の結果得られた文書情報を文書中継サーバ14へ送信する。従って、ステップ216の処理により、文書中継サーバ14は、ストレージサーバ16に登録された文書情報の中から指定された文書情報を取得する。なお、「指定された文書情報」は、上記の場合では、「受信した検索単語を含む文書情報」である。
次のステップ218では、ストレージサーバ16から文書情報を受信することにより文書情報を取得したか否かを判定する。ステップ218では、ストレージサーバ16から文書情報を取得したと判定されるまで、繰り返し上記の判定を行う。ステップ218で、ストレージサーバ16から文書情報を取得したと判定された場合には、次のステップ220へ進む。
ステップ220では、取得した文書情報をクライアント12へ送信する。これにより、クライアント12には検索対象の文書情報が送信される。そして、文書検索処理を終了する。
以上、文書検索処理について説明した。文書検索処理による変換前の文書情報(登録すべき文書情報)と変換後の文書情報(登録対象の文書情報)とを説明する。変換前の文書情報として、例えば、図9及び図11に示すように、ストレージサーバ16から文書中継サーバ14に、「横浜一郎の年収は9,999,999円です。」の文章を表す文書情報が送信され、置換テーブル22に置換単語22d「9,999,999」及び対応する秘密単語22c「5,000,000」が登録され、また、置換テーブル22に置換単語22d「横浜一郎」及び対応する秘密単語22c「富士太郎」が登録されていた場合には、文書中継サーバ14からクライアント12へ変換後の文書情報として、図7及び図11に示すように、「富士太郎の年収は5,000,000円です。」の文章を表す文書情報が送信される。
以上、本実施の形態の文書登録システム10について説明した。なお、文書IDがクライアント12から送信される例について説明したが、予め定められたハッシュ関数(例えば、SHA−256等)を用いて、置換後の文書情報からハッシュ値を演算し、演算されたハッシュ値を文書IDとしてもよい。
また、上記で説明した文書中継サーバ14の機能をクライアント12またはストレージサーバ16に持たせて、文書中継サーバ14を省略して、クライアント12とストレージサーバ16とを直接接続するような構成としてもよい。
また、予め定められた属性の一例として、数値以外の属性を挙げ、ステップ118で、予め定められた文字群(0〜9の数字)から無作為に選択された文字によって単語(この場合には予め定められた桁数の数値)を生成する場合について説明したが、予め定められた属性として、例えば人名や会社名などの属性以外の属性を挙げ、ステップ118で、予め定められた文字群(ひらがなやカタカナの50音)から無作為に選択された文字によって文字列を生成するようにしてもよい。この場合は、例えば、図示しない日本語辞書の情報を用いて文字列が意味を成すものになるように生成するようにすればよい。
また、クライアント12が、日本語の登録対象の文書情報を文書中継サーバ14へ送信し、文書中継サーバ14によって、登録対象の文書情報中の秘密単語22cを対応する置換単語22dに置換して、登録すべき文書情報を生成する例、及びストレージサーバ16に登録された文書の中から指定された文書情報を取得し、取得した文書情報中の置換単語22dを秘密単語22cに変換する例について説明した。しかしながら、文書中継サーバ14に、予め定められた言語(例えば日本語)から他の言語(例えば英語)に翻訳する機能及び上記他の言語から上記予め定められた言語に翻訳する機能を持たせて、文書中継サーバ14が、予め定められた言語の登録対象の文書情報を他の言語に翻訳し、翻訳後の文書情報中の秘密単語22cを対応する置換単語22dに置換して、登録すべき文書情報を生成するようにしてもよい。また、ストレージサーバ16に登録された上記他の言語の文書情報の中から指定された文書情報を取得し、取得した文書情報中の置換単語22dを秘密単語22cに変換して、変換後の文書情報を上記他の言語から上記予め定められた言語に翻訳し、翻訳後の文書情報をクライアント12へ送信するようにしてもよい。
また、文書検索処理で、ストレージサーバ16に、置換単語22dを含む文書情報を送信する指示を出力して、ストレージサーバ16が、当該指示に基づいて、登録されている文書情報の中から、置換単語22dを含む文書情報を検索して、検索の結果得られた文書情報を文書中継サーバ14へ送信する例について説明した。しかしながら、以下のように処理を行ってもよい。すなわち、文書検索処理は、クライアント12から、ユーザID及び文書IDを受信した場合にCPU14cによって実行されることとし、ストレージサーバ16に文書IDが示す文書情報を送信する指示を出力するようにしてもよい。この場合、ストレージサーバ16は、当該指示に基づいて、登録されている文書情報の中から、文書IDが示す文書情報を検索して、検索の結果得られた文書情報を文書中継サーバ14へ送信する。従って、この処理により、文書中継サーバ14は、ストレージサーバ16に登録された文書情報の中から指定された文書情報を取得する。なお、この場合における「指定された文書情報」は、「文書IDが示す文書情報」である。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
10 文書登録システム
12 クライアント
14 文書中継サーバ
14c CPU
14d HDD
16 ストレージサーバ
18 秘密単語テーブル
20 置換候補辞書
22 置換テーブル

Claims (6)

  1. 秘密にすべき秘密単語と該秘密単語の属性とを対応させて記憶すると共に、前記秘密単語のうちの予め定められた属性を有する秘密単語に対応させて、該予め定められた属性を有しかつ該予め定められた属性を有する秘密単語と置換するための少なくとも1つの置換候補単語を記憶した記憶手段と、
    文書情報中に含まれた前記予め定められた属性を有する秘密単語を前記記憶手段に記憶された置換候補単語の何れかに置換する第1置換、及び前記文書情報中に含まれた前記予め定められた属性以外の属性を有する秘密単語を予め定められた文字群から無作為に選択された文字によって生成された単語に置換する第2置換の少なくとも一方の置換を、文書情報に対して行うことにより文書情報を生成する生成手段と、
    を含む文書情報生成装置。
  2. 前記第1置換及び前記第2置換の少なくとも一方の置換が行われた場合に、置換が行われる前の秘密単語と、該秘密単語と置換された置換単語とを対応させて前記記憶手段に記憶するように制御する制御手段と、
    前記生成手段で生成されて登録された文書情報の中から指定された文書情報を取得し、前記記憶手段に記憶された秘密単語と置換単語とに基づいて、取得された文書情報中の置換単語を対応する秘密単語に変換する変換手段と、
    を含む請求項1記載の文書情報生成装置。
  3. 前記第1置換及び前記第2置換の少なくとも一方の置換によって、前記秘密単語を置換した後の文書情報が意味を成す内容となるように前記秘密単語と前記置換候補単語とを対応させて記憶すると共に、前記予め定められた属性以外の属性及び前記文字群を数字とした請求項1または請求項2記載の文書情報生成装置。
  4. 前記第1置換における秘密単語を置換する置換候補単語を、前記文書情報中に含まれない単語とした請求項1から請求項3のいずれか1項記載の文書情報生成装置。
  5. 請求項1から4の何れか1項記載の文書情報生成装置と、
    前記文書情報生成装置の前記生成手段で生成された前記文書情報を登録する登録装置と、
    を含む文書登録システム。
  6. コンピュータを、
    秘密にすべき秘密単語と該秘密単語の属性とを対応させて記憶すると共に、前記秘密単語のうちの予め定められた属性を有する秘密単語に対応させて、該予め定められた属性を有しかつ該予め定められた属性を有する秘密単語と置換するための少なくとも1つの置換候補単語を記憶した記憶手段の記憶内容に基づいて、文書情報中に含まれた前記予め定められた属性を有する秘密単語を前記記憶手段に記憶された置換候補単語の何れかに置換する第1置換、及び前記文書情報中に含まれた前記予め定められた属性以外の属性を有する秘密単語を予め定められた文字群から無作為に選択された文字によって生成された単語に置換する第2置換の少なくとも一方の置換を、文書情報に対して行うことにより文書情報を生成する生成手段
    として機能させるためのプログラム。
JP2009149733A 2009-06-24 2009-06-24 文書情報生成装置、文書登録システム、及びプログラム Expired - Fee Related JP5471065B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009149733A JP5471065B2 (ja) 2009-06-24 2009-06-24 文書情報生成装置、文書登録システム、及びプログラム
US12/629,560 US20100332484A1 (en) 2009-06-24 2009-12-02 Document information creation device, document registration system, computer-readable storage medium and document information creation method
CN201010002088.2A CN101930524B (zh) 2009-06-24 2010-01-11 文档信息创建装置、文档登记***和文档信息创建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009149733A JP5471065B2 (ja) 2009-06-24 2009-06-24 文書情報生成装置、文書登録システム、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011008394A true JP2011008394A (ja) 2011-01-13
JP5471065B2 JP5471065B2 (ja) 2014-04-16

Family

ID=43369694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009149733A Expired - Fee Related JP5471065B2 (ja) 2009-06-24 2009-06-24 文書情報生成装置、文書登録システム、及びプログラム

Country Status (3)

Country Link
US (1) US20100332484A1 (ja)
JP (1) JP5471065B2 (ja)
CN (1) CN101930524B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017219997A (ja) * 2016-06-07 2017-12-14 富士ゼロックス株式会社 情報処理システム、情報処理装置及びプログラム
CN109766703A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 信息处理***、方法和装置
JP2020021505A (ja) * 2019-10-09 2020-02-06 株式会社ニコン 情報処理装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185689A (zh) * 2011-03-25 2011-09-14 桂林电子科技大学 一种具有误导功能的低冗余加密***
CN102169535A (zh) * 2011-04-11 2011-08-31 桂林电子科技大学 一种基于关键词替换的文本密写方法
WO2013011730A1 (ja) * 2011-07-21 2013-01-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 文書を処理する装置及び方法
US9940393B2 (en) * 2015-06-03 2018-04-10 International Business Machines Corporation Electronic personal assistant privacy
JP6544205B2 (ja) * 2015-11-04 2019-07-17 株式会社リコー 情報処理装置、プログラム、情報処理システムおよび情報処理方法
CN107037990B (zh) * 2016-02-03 2020-04-07 株式会社理光 图像处理装置以及图像处理***
JP6677887B2 (ja) * 2016-03-28 2020-04-08 富士通クライアントコンピューティング株式会社 メール配信プログラム、メールサーバ及びメール配信方法
KR102558139B1 (ko) * 2016-04-28 2023-07-21 에스케이플래닛 주식회사 개인화 템플릿을 이용한 보안 메시지 전송 방법 및 이를 이용한 장치
GB2551754B (en) * 2016-06-29 2021-03-10 Sophos Ltd Content leakage protection
CN107783947A (zh) * 2016-08-25 2018-03-09 Ib研究株式会社 支援装置、支援方法及支援***
CN107515939A (zh) * 2017-08-30 2017-12-26 安徽天达网络科技有限公司 一种信息断点分存***
US20230195932A1 (en) * 2021-12-16 2023-06-22 RevSpring, Inc. Sensitive data attribute tokenization system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259368A (ja) * 2001-03-01 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書伏字加工方法、文書伏字加工装置、文書伏字加工処理プログラム及びその記録媒体
JP2002358305A (ja) * 2001-05-31 2002-12-13 Casio Comput Co Ltd データ処理装置及びデータ処理プログラム
JP2005215717A (ja) * 2004-01-27 2005-08-11 Hitachi Ltd セキュリティ機能付き文書処理装置
JP2006331329A (ja) * 2005-05-30 2006-12-07 Oki Electric Ind Co Ltd 言語処理装置、言語処理方法、言語処理プログラム及び記録媒体
JP2007156861A (ja) * 2005-12-06 2007-06-21 Nec Software Chubu Ltd 機密情報保護装置及び機密情報保護方法並びにプログラム
JP2009116555A (ja) * 2007-11-06 2009-05-28 Hitachi Systems & Services Ltd 文書管理方法、文書管理装置、プログラムおよび記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100452071C (zh) * 1995-02-13 2009-01-14 英特特拉斯特技术公司 用于安全交易管理和电子权利保护的***和方法
US20010034845A1 (en) * 2000-02-15 2001-10-25 Brunt George B. Secure web-based document control process and system
AU2003298616A1 (en) * 2002-11-06 2004-06-03 International Business Machines Corporation Confidential data sharing and anonymous entity resolution
JP4346326B2 (ja) * 2003-02-27 2009-10-21 富士通株式会社 セキュリティシステム、情報管理システム、暗号化支援システム、およびコンピュータプログラム
US20040181670A1 (en) * 2003-03-10 2004-09-16 Carl Thune System and method for disguising data
JP2005259015A (ja) * 2004-03-15 2005-09-22 Ricoh Co Ltd 文書開示装置、文書開示システム、プログラム及び記憶媒体
KR20070088687A (ko) * 2004-12-01 2007-08-29 화이트스모크 인코포레이션 문서의 질을 자동으로 향상시키는 시스템 및 방법
JP4419871B2 (ja) * 2005-03-02 2010-02-24 富士ゼロックス株式会社 翻訳依頼装置およびプログラム
US20090055374A1 (en) * 2007-08-20 2009-02-26 Cisco Technology, Inc. Method and apparatus for generating search keys based on profile information
JP4518168B2 (ja) * 2008-03-21 2010-08-04 富士ゼロックス株式会社 関連文書提示システム及びプログラム
US7917438B2 (en) * 2008-09-10 2011-03-29 Expanse Networks, Inc. System for secure mobile healthcare selection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259368A (ja) * 2001-03-01 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書伏字加工方法、文書伏字加工装置、文書伏字加工処理プログラム及びその記録媒体
JP2002358305A (ja) * 2001-05-31 2002-12-13 Casio Comput Co Ltd データ処理装置及びデータ処理プログラム
JP2005215717A (ja) * 2004-01-27 2005-08-11 Hitachi Ltd セキュリティ機能付き文書処理装置
JP2006331329A (ja) * 2005-05-30 2006-12-07 Oki Electric Ind Co Ltd 言語処理装置、言語処理方法、言語処理プログラム及び記録媒体
JP2007156861A (ja) * 2005-12-06 2007-06-21 Nec Software Chubu Ltd 機密情報保護装置及び機密情報保護方法並びにプログラム
JP2009116555A (ja) * 2007-11-06 2009-05-28 Hitachi Systems & Services Ltd 文書管理方法、文書管理装置、プログラムおよび記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017219997A (ja) * 2016-06-07 2017-12-14 富士ゼロックス株式会社 情報処理システム、情報処理装置及びプログラム
CN109766703A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 信息处理***、方法和装置
CN109766703B (zh) * 2017-11-09 2021-01-26 西安京迅递供应链科技有限公司 信息处理***、方法和装置
JP2020021505A (ja) * 2019-10-09 2020-02-06 株式会社ニコン 情報処理装置

Also Published As

Publication number Publication date
CN101930524B (zh) 2015-12-02
US20100332484A1 (en) 2010-12-30
JP5471065B2 (ja) 2014-04-16
CN101930524A (zh) 2010-12-29

Similar Documents

Publication Publication Date Title
JP5471065B2 (ja) 文書情報生成装置、文書登録システム、及びプログラム
US8286171B2 (en) Methods and systems to fingerprint textual information using word runs
JP5011751B2 (ja) 訳語情報出力処理プログラム,処理方法および処理装置
JP2011018330A (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
US20150055155A1 (en) Information processing apparatus, image processing apparatus, and information processing system
CN103140849A (zh) 音译处理装置、程序、记录媒体及方法
JP5204244B2 (ja) 誤訳の検出を支援する装置及び方法
JP6781373B2 (ja) 検索プログラム、検索方法、および検索装置
Megyesi et al. Keys with nomenclatures in the early modern Europe
JP2011065255A (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2019197336A (ja) 学習データ生成装置、方法、およびプログラム
JP2008299675A (ja) かな混在表記抽出装置、方法及びプログラム
JP2018067264A (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2019057137A (ja) 情報処理装置及び情報処理プログラム
CN1627289B (zh) 用于分析汉语的装置和方法
JP2009059300A (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
JP4734400B2 (ja) 文書検索装置およびプログラム
JP2007200252A (ja) 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体
JP6554841B2 (ja) 情報処理装置及び情報処理プログラム
JP4294386B2 (ja) 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体
JP2018147205A (ja) 情報処理装置及び情報処理プログラム
JP6554804B2 (ja) 情報処理装置及び情報処理プログラム
JP5968186B2 (ja) プログラム作成支援装置及びプログラム
JP6651183B2 (ja) 正式名称・省略表現リスト生成装置、正式名称・省略表現リスト生成方法、プログラム
JP6476988B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140120

R150 Certificate of patent or registration of utility model

Ref document number: 5471065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees