JP2018159986A - 情報管理装置、情報管理方法、及びプログラム - Google Patents

情報管理装置、情報管理方法、及びプログラム Download PDF

Info

Publication number
JP2018159986A
JP2018159986A JP2017055491A JP2017055491A JP2018159986A JP 2018159986 A JP2018159986 A JP 2018159986A JP 2017055491 A JP2017055491 A JP 2017055491A JP 2017055491 A JP2017055491 A JP 2017055491A JP 2018159986 A JP2018159986 A JP 2018159986A
Authority
JP
Japan
Prior art keywords
information
feature amount
unit
dividing
managed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017055491A
Other languages
English (en)
Other versions
JP6984147B2 (ja
Inventor
晃滝 上野
Akiro Ueno
晃滝 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017055491A priority Critical patent/JP6984147B2/ja
Publication of JP2018159986A publication Critical patent/JP2018159986A/ja
Application granted granted Critical
Publication of JP6984147B2 publication Critical patent/JP6984147B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

【課題】システムにかかる負担を増加させることなく、元のファイルが改変された場合でも、情報の流出元を特定できるようにし得る、情報管理装置、情報管理方法、及びプログラム提供する。【解決手段】情報管理装置1は、予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録している、特徴量登録部2と、外部から入力された情報を、ルールに基づいて、複数の領域に分割する、領域分割部3と、分割によって得られた領域毎に、特徴量を抽出する、特徴量抽出部4と、抽出した特徴量と、登録されている特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、判定部5とを備えている。【選択図】図1

Description

本発明は、情報、特には個人情報を管理するための、情報管理装置及び情報管理方法に関し、更には、これらを実現するためのプログラムに関する。
近年、個人情報の流出が社会的に問題となっている。特に、個人を対象にして商品又はサービスを提供する企業の場合、ファイルサーバには、大量の個人情報が保有されており、個人情報が流出する可能性がある。また、一旦流出してしまった個人情報を元に戻すことは不可能であるため、個人情報が流出してしまった場合は、流出元を特定し、情報の変更等の対策をとることが必要となる。
このため、例えば、特許文献1は、実在しない人物のダミーの個人情報を一定期間毎に生成し、生成したダミーの個人情報を、データベースに登録することで、個人情報の流出と流出元とを特定する技術を開示している。特許文献2は、機密文書のイメージ画像から抽出された特徴量を登録しておき、流出した機密文書のイメージ画像の特徴量と、登録されている特徴量とを比較することで、流出元を特定する技術を開示している。
特開2006−79233号公報 特開2008−42636号公報
しかしながら、特許文献1に開示された技術では、定期的にダミー情報を生成し、更に生成したダミー情報を管理する必要があり、システムに負担が掛かってしまう。また、特許文献2に開示された技術では、元のファイルに対して、分割、列の入れ替え等の改変が行なわれた場合に、特徴量が維持されず、流出元を特定することが困難となる。
本発明の目的の一例は、上記問題を解消し、システムにかかる負担を増加させることなく、元のファイルが改変された場合でも、情報の流出元を特定できるようにし得る、情報管理装置、情報管理方法、及びプログラム提供することにある。
上記目的を達成するため、本発明の一側面における情報管理装置は、
予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録している、特徴量登録部と、
外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、領域分割部と、
分割によって得られた領域毎に、特徴量を抽出する、特徴量抽出部と、
抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、判定部と、
を備えていることを特徴とする。
また、上記目的を達成するため、本発明の一側面における情報管理方法は、
(a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
(b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
(c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
(d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
を有することを特徴とする。
更に、上記目的を達成するため、本発明の一側面におけるプログラムは、
コンピュータに、
(a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
(b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
(c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
(d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
を実行させることを特徴とする。
以上のように、本発明によれば、システムにかかる負担を増加させることなく、元のファイルが改変された場合でも、情報の流出元を特定できるようにすることができる。
図1は、本発明の実施の形態における情報管理装置の構成を概略的に示すブロック図である。 図2は、本発明の実施の形態における情報管理装置の具体的構成を示すブロック図である。 図3は、本発明の実施の形態で用いられる分割ルールの一例を示す図である。 図4は、本発明の実施の形態で用いられるデータベースに登録されている情報の一例を示す図である。 図5は、本発明の実施の形態における情報管理装置がファイルから管理対象となる個人情報を抽出する際の動作を示すフロー図である。 図6は、本発明の実施の形態における情報管理装置が管理対象となる個人情報を分割する際の動作を示すフロー図である。 図7は、本発明の実施の形態における情報管理装置が分割された領域から特徴量を抽出する際の動作を示すフロー図である。 図8は、本発明の実施の形態における情報管理装置が流出したファイルから判定対象となる個人情報を抽出する際の動作を示すフロー図である。 図9は、本発明の実施の形態における情報管理装置が流出したファイルの判定対象となる個人情報を分割する際の動作を示すフロー図である。 図10は、本発明の実施の形態における情報管理装置が流出したファイルから得られた領域から特徴量を抽出する際の動作を示すフロー図である。 図11は、本発明の実施の形態における情報管理装置が特徴量の比較による判定処理を実行する際の動作を示すフロー図である。 図12は、本発明の実施の形態における情報管理装置の変形例1での具体的構成を示すブロック図である。 図13は、本発明の実施の形態における情報管理装置を実現するコンピュータの一例を示すブロック図である。
(発明の概要)
本発明では、管理装置を必要とし、管理装置はファイルサーバのファイルに対して個人情報を含むファイルを検出することができる。個人情報を含むファイルの検出は、例えば、特許第5013081号等に開示された技術を用いて行なうことができる。
管理装置は、ファイルサーバに格納されているファイルに対して、個人情報を含むファイルの検出を実行する。検出された個人情報には、例えば、姓、名、性別、都道府県等の項目が含まれる。管理装置は、それらの項目に対して、姓属性、名属性、性別属性、都道府県属性等の属性のタグ付けを実施する。
次に、管理装置は、検出された個人情報が持っている属性と属性の値とを利用して、ファイルが持っている個人情報を複数の領域に分割する。具体的には、分割は、例えば、属性ごとに、又は特定の属性の値ごとに行なわれる。また、分割された領域が増えるほど、より多くのファイルの改変に対応することができる。
但し、分割される領域が増えると、計算量も増加するため、対象となるファイルの重要性に応じて、分割される領域の数を増減させても良い。例えば、文書中に「機密情報」というキーワードが含まれている場合は、より重要なファイルと判定して、個人情報の持っている属性と属性値とにより領域を分割するが、「機密情報」というキーワードを持っていない場合は属性のみによって領域を分割するというような手法が考えられる。
また、個人情報が複数の領域に分割された後、分割された領域ごとに、属性の値が用いられて特徴量が抽出される。特徴量を抽出するためのアルゴリズムとしては、既存のアルゴリズム、例えば、ハフマン符号のアルゴリズム、相互情報量のアルゴリズム等が挙げられる。このようにして抽出された特徴量は保持され、個人情報が流出した場合は、流出した個人情報の特徴量と、保持されている特徴量とが対比されて、個人情報の流出元が特定される。
(実施の形態)
以下、本発明の実施の形態における情報管理装置、情報管理方法、及びプログラムについて、図1〜図13を参照しながら説明する。
[装置構成]
最初に、図1を用いて、本実施の形態における情報管理装置の概略構成について説明する。図1は、本発明の実施の形態における情報管理装置の構成を概略的に示すブロック図である。
図1に示す、情報管理装置1は、情報、特には個人情報を管理するための装置である。図1に示すように、情報管理装置1は、特徴量登録部2と、領域分割部3と、特徴量抽出部4と、判定部5とを備えている。
特徴量登録部2は、予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録している。領域分割部3は、外部から入力された情報を、ルールに基づいて、複数の領域に分割する。特徴量抽出部4は、分割によって得られた領域毎に、特徴量を抽出する。判定部5は、特徴量抽出部4によって抽出された特徴量と、登録されている特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する。
このように、本実施の形態では、管理対象となる情報において、ダミー情報の作成及び管理を行なう必要がない。また、管理対象となる情報の分割された領域の特徴量は、元のファイルが改変された場合であっても変更されない。このため、本実施の形態によれば、システムにかかる負担を増加させることなく、元のファイルが改変された場合でも、情報の流出元を特定できるようにすることができる。
続いて、図2〜図4を用いて、本実施の形態における情報管理装置の構成についてより具体的に説明する。図2は、本発明の実施の形態における情報管理装置の具体的構成を示すブロック図である。
まず、本実施の形態において、管理対象となる情報は、個人情報であるとする。図2に示すように、本実施の形態では、情報管理装置1は、ネットワーク10を介して、管理者が使用する端末装置20及びファイルサーバ30に接続されている。
ファイルサーバ30は、管理対象となる個人情報を含むファイルを格納している。端末装置20は、管理者の指示により、流出したファイルを情報管理装置1に入力する。また、端末装置20は、情報管理装置1によって判定が行なわれた場合は、判定結果を取得して、取得した判定結果を、その表示画面上に表示する。
また、図2に示すように、本実施の形態では、情報管理装置1は、上述した特徴量登録部2、領域分割部3、特徴量抽出部4、及び判定部5に加えて、ファイル取得部6及び個人情報検出部7を備えている。
ファイル取得部6は、端末装置20を介した管理者の指示に応じて、ファイルサーバ30にアクセスして、指定されたファイルを取得する。個人情報検出部7は、取得されたファイルから個人情報を検出する。
特徴量登録部2は、本実施の形態では、管理対象となる個人情報を分割して得られた、複数の領域それぞれの特徴量を、データベース9に登録している。また、本実施の形態では、特徴量登録部2が登録している特徴量は、領域分割部3と特徴量抽出部4とによって作成されている。つまり、本実施の形態では、領域分割部3が、管理対象となる個人情報を分割し、特徴量抽出部4が、分割によって得られた個人情報の領域毎に、特徴量を抽出する。特徴量登録部2は、個人情報の分割領域から抽出された特徴量を登録する。なお、本実施の形態において、特徴量登録部2が登録している特徴量は、外部の装置によって作成された特徴量であっても良い。
領域分割部3は、予め作成されている分割ルール8を用いて、個人情報を複数の領域に分割する。分割ルール8は、本実施の形態では、個人情報を構成する特定の属性に基づいて情報を分割するルール、及び個人情報に含まれる特定の属性値に基づいて情報を分割するルールのうち、少なくとも1つを含む。また、本実施の形態では、特徴量登録部2に登録されている特徴量を得るために用いられるルールと、領域分割部3が用いるルールとは、同一のルールである。
図3は、本発明の実施の形態で用いられる分割ルールの一例を示す図である。図3の例では、分割ルールとして、(1)属性(姓)で分割するルール、(2)属性(名)で分割するルール、(3)属性(都道府県)の属性値で分割するルールが採用されている。そして、分割ルール(1)により、属性が姓である情報で構成された領域が生成される。分割ルール(2)により、属性が名である情報で構成された領域が生成される。また、分割ルール(3)により、都道府県が神奈川となっている行で構成された領域と、都道府県が東京となっている行で構成された領域とが生成される。
特徴量抽出部4は、本実施の形態では、例えば、分割によって得られた領域毎に、ハフマン符号のアルゴリズムを利用して、当該領域を表す文字列を取り出すことによって、特徴量を抽出する。また、本実施の形態では、特徴量抽出部4は、ハフマン符号のアルゴリズム以外のアルゴリズム、例えば、相互情報量等の特徴量を抽出するアルゴリズムを利用することもできる。特徴量抽出部4による処理の具体例については、図7を用いて後述する。
また、特徴量抽出部4は、図4に示すように、抽出した特徴量をデータベース9に登録する。図4は、本発明の実施の形態で用いられるデータベースに登録されている情報の一例を示す図である。図4に示すように、データタベース9は、個人情報ファイルテーブルと、個人情報特徴テーブルとを格納している。
個人情報ファイルテーブルは、個人情報が検出されたファイルパスを格納しているテーブルである。個人情報特徴テーブルは、個人情報を含むファイルの属性及び属性値毎に、特徴量となる文字列を格納している。なお、個人情報ファイルテーブルは、後述するように、個人情報検出部7によって格納されている。
[装置動作]
次に、本発明の実施の形態における情報管理装置1の動作について図5〜図11を用いて説明する。また、本実施の形態では、情報管理装置1を動作させることによって、情報管理方法が実施される。よって、本実施の形態における情報管理方法の説明は、以下の情報管理装置1の動作説明に代える。
まず、情報管理装置1においては、主に、管理対象となる個人情報の特徴量を抽出して、これを登録する処理と、流出したファイルから抽出した特徴量と登録されている特徴量とから流出元を判定する処理とが行なわれる。以下においては、図5〜図7を用いて、管理対象となる個人情報の特徴量の抽出処理を説明する。また、図8〜図11を用いて、流出元の判定処理を説明する。
特徴量登録処理
管理対象となる個人情報の特徴量を登録するため、ファイルサーバ30に格納されているファイルからの個人情報の抽出処理(図5)、個人情報の分割処理(図6)、分割された領域からの特徴量の抽出処理(図7)が実行される。以下、各処理を順に説明する。
図5は、本発明の実施の形態における情報管理装置がファイルから管理対象となる個人情報を抽出する際の動作を示すフロー図である。
図5に示すように、最初に、ファイル取得部6はファイルサーバ30にアクセスしてファイルを取得する(ステップA1)。次に、ファイル取得部6は、取得したファイルを個人情報検出部7に渡す(ステップA2)。
次に、個人情報検出部7は、ステップA1で取得されているファイルに、氏名、住所、メールアドレス、電話番号、性別、クレジットカード番号等の個人情報が含まれているかどうか確認し、それらの情報が含まれている場合、個人情報を検出する(ステップA3)。なお、個人情報の検出は、上述した特許第5013081号に開示された既存技術を用いて行なうことができる。
その後、個人情報検出部7は、検出した個人情報に対して、文書IDを採番し、検出したファイルのパスと採番した文書IDとを、データベース9に格納されている個人情報ファイルテーブルに登録する(ステップA4)。
図6は、本発明の実施の形態における情報管理装置が管理対象となる個人情報を分割する際の動作を示すフロー図である。
図6に示すように、最初に、領域分割部3は、個人情報検出部7によって検出された個人情報を取得する(ステップB1)。
次に、領域分割部3は、ステップB1で取得した個人情報を用いてテーブルを作成する(ステップB2)。具体的には、領域分割部3は、縦に並ぶ各行(レコード)が1件の個人情報に該当し、各行において横方向に個人情報の各属性の値が並ぶように、テーブルを作成する。また、テーブルの列を構成している属性として、姓(氏名)、名(氏名)、都道府県(住所)、市(住所)、区(住所)、町村(住所)、メールアドレス、性別等が挙げられる。
次に、領域分割部3は、分割ルール8を取得する(ステップB3)。図6の例では、取得される分割ルールは、属性(姓(氏名))で分割するルール、属性(名(氏名))で分割するルール、属性(町村(住所))で分割するルール、属性(都道府県(住所))の属性値で分割するルール、属性(性別)の属性値で分割するルール、属性(メールアドレス)の属性値で分割するルールである。
次に、領域分割部3は、属性で分割するルールに沿って、姓(氏名)、名(氏名)、町村(住所)といった属性毎に、ステップB5〜B7を実行して分割を行なう(ステップB4)。
ステップB5では、領域分割部3は、処理対象となっている属性の値が一定数以上(例えば100件以上)存在しているかどうかを判定する。
ステップB5の判定の結果、値が一定数以上存在してない場合は、処理対象となっている属性についての処理を終了し、次の属性についての処理を開始する。
一方、ステップB5の判定の結果、値が一定数以上存在している場合は、領域分割部3は、処理対象となっている属性全体が1つの領域となるように、テーブルを分割する(ステップB6)。続いて、領域分割部3は、分割のキーとなった属性を、分割によって生成された領域に付加する(ステップB7)。
次に、領域分割部3は、属性値で分割するルールに沿って、都道府県(住所)、性別、メールアドレスといった属性毎に、ステップB9〜B16を実行して分割を行なう(ステップB8)。
ステップB9では、領域分割部3は、処理対象となっている属性に値が存在しているかどうかを判定する。
ステップB9の判定の結果、値が存在していない場合は、領域分割部3は、次の属性を選択して、再度ステップB9を実行する。
一方、ステップB9の判定の結果、値が存在している場合は、領域分割部3は、処理対象となっている属性がメールアドレスかどうかを判定する(ステップB10)。
ステップB10の判定の結果、属性がメールアドレスである場合は、まず、メールアドレスに含まれるアットマークの右側部分をドメイン名として取出し、ドメイン名を属性値として、ドメイン名ごとにグループ化し、グループ化された個人情報を領域とする(ステップB11)。
一方、ステップB10の判定の結果、属性がメールアドレスでない場合は、領域分割部3は、属性の値ごとに個人情報をグループ化して、領域を生成する(ステップB12)。
次に、ステップB11又はB12が実行されると、領域分割部3は、生成されたグループについて、姓(氏名)、名(氏名)、町村(住所)の属性毎に、ステップB14〜B16を実行する(ステップB13)。
ステップB14では、領域分割部3は、グループ内で、処理対象となっている属性の値が一定数以上(例えば100件以上)存在しているかどうかを判定する。
ステップB14の判定の結果、値が一定数以上存在していない場合は、領域分割部3は、次の属性を選択して、再度ステップB14を実行する。
一方、ステップB14の判定の結果、値が一定数以上存在している場合は、領域分割部3は、グループ化した個人情報の中で、処理対象となっている属性全体を1つの領域として分割する(ステップB15)。
続いて、領域分割部3は、グループ化においてキーとなった属性とその属性値とを、分割によって生成された領域に付加する(ステップB16)。
その後、領域分割部3は、分割によって生成した領域を、特徴量抽出部4に渡す(ステップB17)。
図7は、本発明の実施の形態における情報管理装置が分割された領域から特徴量を抽出する際の動作を示すフロー図である。図7の例では、特徴量は、ハフマン符号のアルゴリズムを利用して、文字列として抽出される。
図7に示すように、特徴量抽出部4は、分割によって生成された領域毎に、ステップC2〜C6を実行して特徴量を抽出する(ステップC1)。
ステップC2では、特徴量抽出部4は、処理対象となっている領域における属性の値の出現頻度を計算する。
次に、特徴量抽出部4は、ステップC2で計算した出現頻度をもとに、ハフマン符号のアルゴリズムを利用してハフマン木を生成し、属性の各値に対して2進数による符号化を実施する(ステップC3)。
次に、特徴量抽出部4は、符号化した結果、「最短の符号長/最長の符号長」が一定の値以下(例えば0.2以下)となっているかどうかを判定する(ステップC4)。
ステップC4の判定の結果、「最短の符号長/最長の符号長」が一定の値以下でない場合は、特徴量抽出部4は、次の領域を選択して、再度、ステップC2を実行する。
一方、ステップC4の判定の結果、「最短の符号長/最長の符号長」が一定の値以下である場合は、特徴量抽出部4は、特徴的な文字列が存在していると判断する。そして、特徴量抽出部4は、「符号長/最長の符号長」が一定の値以上(例えば0.8以上)となっている文字列は存在しているかどうかを判定する(ステップC5)。
ステップC5の判定の結果、「符号長/最長の符号長」が一定の値以上となっている文字列が存在していない場合は、特徴量抽出部4は、次の領域を選択して、再度、ステップC2を実行する。
一方、ステップC5の判定の結果、「符号長/最長の符号長」が一定の値以上となっている文字列が存在している場合は、特徴量抽出部4は、該当する文字列を特徴的な文字列と判定する(ステップC6)。
次に、特徴量抽出部4は、文書ID、属性、属性値、特徴量(ステップC6で判定された文字列)を、データベース9における個人情報特徴テーブルに格納する(ステップC7)。
また、ステップC7において、個人情報特徴テーブルにおいて、属性及び属性値としては、領域への分割時にテーブルに格納されていた値が用いられる。また、元のテーブルにおいて属性値が無かった場合は、個人情報特徴テーブルの該当する欄の属性値は空とされる。更に、特徴量抽出部4は、個人情報特徴テーブルにおいて、特徴量として抽出した文字列1つが1レコードとなるように、特徴量を格納する(図4参照)。
流出元判定処理
ファイルの流出元を判定するため、流出したファイルからの個人情報の抽出処理(図8)、個人情報の分割処理(図9)、分割された領域からの特徴量の抽出処理(図10)、特徴量の比較による判定処理(図11)が実行される。以下、各処理を順に説明する。
図8は、本発明の実施の形態における情報管理装置が流出したファイルから判定対象となる個人情報を抽出する際の動作を示すフロー図である。
まず、管理者が端末装置20を介して流出したファイルを情報管理装置1に送信する。これにより、図8に示すように、ファイル取得部6は、送信されたファイルを取得する(ステップD1)。
次に、ファイル取得部6は、取得したファイルを個人情報検出部7に渡す(ステップD2)。
次に、個人情報検出部7は、ステップD1で取得されているファイルに、氏名、住所、メールアドレス、電話番号、性別、クレジットカード番号等の個人情報が含まれているかどうか確認し、それらの情報が含まれている場合、個人情報を検出する(ステップD3)。ステップD3は、図5に示したステップA3と同様に行なわれる。
その後、個人情報検出部7は、ステップD3で検出した個人情報を、領域分割部3に渡す(ステップD4)。
図9は、本発明の実施の形態における情報管理装置が流出したファイルの判定対象となる個人情報を分割する際の動作を示すフロー図である。なお、図9に示す各ステップは、図6に示した各ステップに準じて行なわれる。
図9に示すように、最初に、領域分割部3は、流出したファイルから、個人情報検出部7によって検出された個人情報を取得する(ステップE1)。
次に、領域分割部3は、流出したファイルの個人情報を用いて、テーブルを作成する(ステップE2)。ステップE2においても、領域分割部3は、図6に示したステップB2と同様に、縦に並ぶ各行(レコード)が1件の個人情報に該当し、各行において横方向に個人情報の各属性の値が並ぶように、テーブルを作成する。また、テーブルの列を構成している属性として、姓(氏名)、名(氏名)、都道府県(住所)、市(住所)、区(住所)、町村(住所)、メールアドレス、性別等が挙げられる。
次に、領域分割部3は、分割ルール8を取得する(ステップB3)。図6の例では、取得される分割ルールは、属性(姓(氏名))で分割するルール、属性(名(氏名))で分割するルール、属性(町村(住所))で分割するルール、属性(都道府県(住所))の属性値で分割するルール、属性(性別)の属性値で分割するルール、属性(メールアドレス)の属性値で分割するルールである。
次に、領域分割部3は、属性で分割するルールに沿って、姓(氏名)、名(氏名)、町村(住所)といった属性毎に、ステップE5〜E7を実行して分割を行なう(ステップE4)。
ステップE5では、領域分割部3は、処理対象となっている属性の値が一定数以上(例えば100件以上)存在しているかどうかを判定する。
ステップE5の判定の結果、値が一定数以上存在してない場合は、処理対象となっている属性についての処理を終了し、次の属性についての処理を開始する。
一方、ステップE5の判定の結果、値が一定数以上存在している場合は、領域分割部3は、処理対象となっている属性全体が1つの領域となるように、テーブルを分割する(ステップE6)。続いて、領域分割部3は、分割のキーとなった属性を、分割によって生成された領域に付加する(ステップE7)。
次に、領域分割部3は、属性値で分割するルールに沿って、都道府県(住所)、性別、メールアドレスといった属性毎に、ステップE9〜E16を実行して分割を行なう(ステップE8)。
ステップE9では、領域分割部3は、処理対象となっている属性に値が存在しているかどうかを判定する。
ステップE9の判定の結果、値が存在していない場合は、領域分割部3は、次の属性を選択して、再度ステップE9を実行する。
一方、ステップE9の判定の結果、値が存在している場合は、領域分割部3は、処理対象となっている属性がメールアドレスかどうかを判定する(ステップE10)。
ステップE10の判定の結果、属性がメールアドレスである場合は、まず、メールアドレスに含まれるアットマークの右側部分をドメイン名として取出し、ドメイン名を属性値として、ドメイン名ごとにグループ化し、グループ化された個人情報を領域とする(ステップE11)。
一方、ステップE10の判定の結果、属性がメールアドレスでない場合は、領域分割部3は、属性の値ごとに個人情報をグループ化して、領域を生成する(ステップE12)。
次に、ステップE11又はE12が実行されると、領域分割部3は、生成されたグループについて、姓(氏名)、名(氏名)、町村(住所)の属性毎に、ステップE14〜E16を実行する(ステップE13)。
ステップE14では、領域分割部3は、グループ内で、処理対象となっている属性の値が一定数以上(例えば100件以上)存在しているかどうかを判定する。
ステップE14の判定の結果、値が一定数以上存在していない場合は、領域分割部3は、次の属性を選択して、再度ステップE14を実行する。
一方、ステップE14の判定の結果、値が一定数以上存在している場合は、領域分割部3は、グループ化した個人情報の中で、処理対象となっている属性全体を1つの領域として分割する(ステップE15)。
続いて、領域分割部3は、グループ化においてキーとなった属性とその属性値とを、分割によって生成された領域に付加する(ステップE16)。
その後、領域分割部3は、分割によって生成した領域を、特徴量抽出部4に渡す(ステップE17)。
図10は、本発明の実施の形態における情報管理装置が流出したファイルから得られた領域から特徴量を抽出する際の動作を示すフロー図である。なお、図10に示す各ステップは、図7に示した各ステップに準じて行なわれる。また、図10の例でも、特徴量は、ハフマン符号のアルゴリズムを利用して、文字列として抽出される。
図10に示すように、特徴量抽出部4は、流出したファイルから生成された領域毎に、ステップF2〜F6を実行して特徴量を抽出する(ステップF1)。
ステップF2では、特徴量抽出部4は、処理対象となっている領域における属性の値の出現頻度を計算する。
次に、特徴量抽出部4は、ステップF2で計算した出現頻度をもとに、ハフマン符号のアルゴリズムを利用してハフマン木を生成し、属性の各値に対して2進数による符号化を実施する(ステップF3)。
次に、特徴量抽出部4は、符号化した結果、「最短の符号長/最長の符号長」が一定の値以下(例えば0.2以下)となっているかどうかを判定する(ステップF4)。
ステップF4の判定の結果、「最短の符号長/最長の符号長」が一定の値以下でない場合は、特徴量抽出部4は、次の領域を選択して、再度、ステップF2を実行する。
一方、ステップF4の判定の結果、「最短の符号長/最長の符号長」が一定の値以下である場合は、特徴量抽出部4は、特徴的な文字列が存在していると判断する。そして、特徴量抽出部4は、「符号長/最長の符号長」が一定の値以上(例えば0.8以上)となっている文字列は存在しているかどうかを判定する(ステップF5)。
ステップF5の判定の結果、「符号長/最長の符号長」が一定の値以上となっている文字列が存在していない場合は、特徴量抽出部4は、次の領域を選択して、再度、ステップF2を実行する。
一方、ステップF5の判定の結果、「符号長/最長の符号長」が一定の値以上となっている文字列が存在している場合は、特徴量抽出部4は、該当する文字列を特徴的な文字列と判定する(ステップF6)。また、ステップF6の終了後、特徴量抽出部4は、抽出した領域毎の特徴量を判定部5に渡す。
図11は、本発明の実施の形態における情報管理装置が特徴量の比較による判定処理を実行する際の動作を示すフロー図である。
図11に示すように、判定部5は、特徴量抽出部4から受け取った領域(流出したファイルから得られた領域)毎の特徴量を用いて、この領域毎に、ステップG2〜G10を実行する(ステップG1)。
ステップG2では、判定部5は、処理対象となる領域において、属性値が空の属性が存在しているかどうかを判定する(ステップG2)。
ステップG2の判定の結果、処理対象となる領域において、属性値が空の属性が存在している場合は、判定部5は、属性値が空の属性を検索条件として、個人情報特徴テーブルを検索し、属性値が空のレコードを特定する(ステップG3)。
一方、ステップG2の判定の結果、処理対象となる領域において、属性値が空の属性が存在していない場合は、判定部5は、処理対象となる領域における属性とその属性値とを検索条件として、個人情報特徴テーブルを検索する(ステップG4)。
次に、判定部5は、ステップG3又はG4が実行されると、検索によって抽出されたレコードを、文書ID毎に分ける(ステップG5)。続いて、判定部5は、文書ID毎に、レコードから特徴量(文字列)を抽出する(ステップG6)。
次に、判定部5は、文書ID毎に、ステップG6で取り出した特徴量(文字列)と、特徴量抽出部4から受け取った領域毎の特徴量とを比較し、特徴量が一致した文書IDが存在しているかどうかを判定する(ステップG7)。
ステップG7の判定の結果、特徴量が一致している文書IDが存在していない場合は、判定部5は、次の領域を選択して、再度ステップG2を実行する。一方、ステップG7の判定の結果、特徴量が一致している文書IDが存在している場合は、判定部5は、その文書IDを流出元の候補とする(ステップG8)。ステップG8によって、分割した領域毎に流出元の候補となる文書IDが特定できる。
次に、判定部5は、個人情報ファイルテーブル(図4参照)を検索して、特定された文書IDを持つ文書のファイルを特定し、特定したファイルを流出元の候補とする(ステップG9)。次に、判定部5は、文書ID毎に、候補となった回数を計算する(ステップG10)。
領域毎のステップG2〜G10が終了すると、判定部5は、領域毎に計算された各文書IDの回数を足し合せ、文書ID毎に回数の合計値を算出する(ステップG11)。分割した領域毎に複数の文書IDが候補となり、また、分割した領域毎に、候補となる文書IDが異なる可能性があるが、候補となった回数が多いほど、流出元となっている可能性が高いと判断できる。よって、ステップG11では、合計値が算出される。
次に、判定部5は、合計値が最も高い文書IDを流出元の文書と判定し、判定結果を出力する(ステップG12)。具体的には、判定結果は、ネットワーク10を介して、管理者の端末装置20へと送信される。また、情報管理装置1が表示装置を備えている場合は、判定結果は、この表示装置に出力されても良い。
[実施の形態における効果]
以上の本実施の形態では、個人情報を属性及び属性値を用いて分割することで得られた領域の特徴量と、流出したファイルの同様に分割された領域の特徴量とを比較することで、流出元のファイルが特定される。このため、分割又は順序の入れ替えが行なわれた状態でファイルが流出していても、流出元のファイルを特定することができる
また、本実施の形態では、上述したように、分割された領域の特徴量を手がかりとして流出元のファイルを特定するので、本実施の形態は、テキストファイルのような電子透かしを埋め込むことが困難なファイルが流出した場合であっても対応できる。
[変形例1]
以下に本実施の形態における変形例1について説明する。変形例1では、領域分割部3による分割の回数が、管理対象となる情報(個人情報)の重要度に応じて設定される。図12は、本発明の実施の形態における情報管理装置の変形例1での具体的構成を示すブロック図である。
図12に示すように、本変形例1では、情報管理装置1は、更に、重要度計算部11を備えている。重要度計算部11は、個人情報検出部7によって個人情報が検出されると、検出された個人情報の重要度を計算し、計算された重要度に応じて、領域分割部3による分割に用いられる分割ルール8の数を増減させる。例えば、重要度計算部11は、重要度が高い程、領域分割部3が用いる分割ルール8の数を増加させることで、流出元の特定精度を向上させることができる。
具体的には、重要度計算部11は、例えば、重要度の段階毎に、キーワード(特定の人名、特定の住所等)及びキーワードの出現頻度を設定し、個人情報に含まれているキーワード及びその出現頻度に応じて、管理対象となる個人情報に重要度を設定する。また、分割ルール8それぞれには、重要度に応じて適用されるルールが設定されていても良く、この場合は、領域分割部3は、設定された重要度に適用される分割ルール8を用いて分割を実行する。
[変形例2]
続いて、本実施の形態における変形例2について説明する。上述の実施の形態では、属性の値を利用して個人情報をグループ化する際において、都道府県、性別、メールアドレスといった属性値が同一のレコードがグループ化されている。これに対して、変形例2では、属性値が同一のレコードではなく、例えば、姓を辞書順にソートした結果がグループ化される。この場合であっても、流出元を特定することができる
[プログラム]
本実施の形態におけるプログラムは、コンピュータに、図5に示すステップA1〜A4、図6に示すステップB1〜B17、図7に示すステップC1〜C7、図8に示すステップD1〜D4、図9に示すステップE1〜E17、図10に示すステップF1〜F6、図11に示すステップG1〜G12を実行させるプログラムであれば良い。
また、本実施の形態におけるプログラムをコンピュータにインストールし、実行することによって、本実施の形態における情報管理装置1と情報管理方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、特徴量登録部2、領域分割部3、特徴量抽出部4、判定部5、ファイル取得部6及び個人情報検出部7として機能し、処理を行なう。
また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、特徴量登録部2、領域分割部3、特徴量抽出部4、判定部5、ファイル取得部6及び個人情報検出部7のいずれかとして機能しても良い。
ここで、実施の形態におけるプログラムを実行することによって、情報管理装置1を実現するコンピュータについて図13を用いて説明する。図13は、本発明の実施の形態における情報管理装置を実現するコンピュータの一例を示すブロック図である。
図13に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記録媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記録媒体が挙げられる。
なお、本実施の形態における情報管理装置1は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、情報管理装置1は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記15)によって表現することができるが、以下の記載に限定されるものではない。
(付記1)
予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録している、特徴量登録部と、
外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、領域分割部と、
分割によって得られた領域毎に、特徴量を抽出する、特徴量抽出部と、
抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、判定部と、
を備えていることを特徴とする情報管理装置。
(付記2)
前記ルールが、情報を構成する特定の属性に基づいて情報を分割するルール、及び情報に含まれる特定の属性値に基づいて情報を分割するルールのうち、少なくとも1つを含み、
前記特徴量登録部に登録されている特徴量を得るために用いられるルールと、前記領域分割部が用いるルールとは、同一のルールである、
付記1に記載の情報管理装置。
(付記3)
前記領域分割部が、前記管理対象となる情報を分割し、
前記特徴量抽出部が、前記管理対象となる情報の分割によって得られた領域毎に、特徴量を抽出し、
前記特徴量登録部が、前記特徴量抽出部によって、前記管理対象となる情報の分割によって得られた領域から抽出された特徴量を登録する、
付記1または2に記載の情報管理装置。
(付記4)
前記管理対象となる情報の重要度を計算し、計算した重要度に応じて、前記領域分割部による分割に用いられる前記ルールの数を増減させる、重要度計算部を更に備えている、
付記3に記載の情報管理装置。
(付記5)
管理対象となる情報が、個人情報である、
付記1〜4のいずれかに記載の情報管理装置。
(付記6)
(a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
(b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
(c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
(d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
を有することを特徴とする情報管理方法。
(付記7)
前記ルールが、情報を構成する特定の属性に基づいて情報を分割するルール、及び情報に含まれる特定の属性値に基づいて情報を分割するルールのうち、少なくとも1つを含み、
前記(a)のステップで登録される特徴量を得るために用いられるルールと、前記(b)のステップで用いるルールとは、同一のルールである、
付記6に記載の情報管理方法。
(付記8)
(e)前記ルールに基づいて、前記管理対象となる情報を、複数の領域に分割する、ステップと、
(f)前記管理対象となる情報の分割によって得られた領域毎に、特徴量を抽出する、ステップと、を更に有し、
前記(a)のステップにおいて、前記(f)のステップによって抽出された特徴量を登録する、
付記6または7に記載の情報管理方法。
(付記9)
(g)前記管理対象となる情報の重要度を計算し、計算した重要度に応じて、前記(b)のステップ及び前記(e)のステップによる分割に用いられる前記ルールの数を増減させる、ステップを更に有する、
付記8に記載の情報管理方法。
(付記10)
管理対象となる情報が、個人情報である、
付記6〜9のいずれかに記載の情報管理方法。
(付記11)
コンピュータに、
(a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
(b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
(c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
(d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
を実行させるプログラム。
(付記12)
前記ルールが、情報を構成する特定の属性に基づいて情報を分割するルール、及び情報に含まれる特定の属性値に基づいて情報を分割するルールのうち、少なくとも1つを含み、
前記(a)のステップで登録される特徴量を得るために用いられるルールと、前記(b)のステップで用いるルールとは、同一のルールである、
付記11に記載のプログラム。
(付記13)
前記コンピュータに、
(e)前記ルールに基づいて、前記管理対象となる情報を、複数の領域に分割する、ステップと、
(f)前記管理対象となる情報の分割によって得られた領域毎に、特徴量を抽出する、ステップと、を更に実行させ、
前記(a)のステップにおいて、前記(f)のステップによって抽出された特徴量を登録する、
付記11または12に記載のプログラム。
(付記14)
前記コンピュータに、
(g)前記管理対象となる情報の重要度を計算し、計算した重要度に応じて、前記(b)のステップ及び前記(e)のステップによる分割に用いられる前記ルールの数を増減させる、ステップを更に実行させる、
付記13に記載のプログラム。
(付記15)
管理対象となる情報が、個人情報である、
付記11〜14のいずれかに記載のプログラム。
以上のように、本発明によれば、システムにかかる負担を増加させることなく、元のファイルが改変された場合でも、情報の流出元を特定できるようにすることができる。本発明は、ファイルサーバを利用している企業で、ファイルサーバ上に個人情報を含むファイルを置いている(あるいは誤っておかれている)状況である場合に、個人情報を含むファイルが流出してしまった際に、流出元のファイルを効率的に特定するために用いることが出来る。
1 情報管理措置
2 特徴量登録部
3 領域分割部
4 特徴量抽出部
5 判定部
6 ファイル取得部
7 個人情報検出部
8 分割ルール
9 データベース
10 ネットワーク
11 重要度計算部
20 端末装置
30 ファイルサーバ
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス

Claims (7)

  1. 予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録している、特徴量登録部と、
    外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、領域分割部と、
    分割によって得られた領域毎に、特徴量を抽出する、特徴量抽出部と、
    抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、判定部と、
    を備えていることを特徴とする情報管理装置。
  2. 前記ルールが、情報を構成する特定の属性に基づいて情報を分割するルール、及び情報に含まれる特定の属性値に基づいて情報を分割するルールのうち、少なくとも1つを含み、
    前記特徴量登録部に登録されている特徴量を得るために用いられるルールと、前記領域分割部が用いるルールとは、同一のルールである、
    請求項1に記載の情報管理装置。
  3. 前記領域分割部が、前記管理対象となる情報を分割し、
    前記特徴量抽出部が、前記管理対象となる情報の分割によって得られた領域毎に、特徴量を抽出し、
    前記特徴量登録部が、前記特徴量抽出部によって、前記管理対象となる情報の分割によって得られた領域から抽出された特徴量を登録する、
    請求項1または2に記載の情報管理装置。
  4. 前記管理対象となる情報の重要度を計算し、計算した重要度に応じて、前記領域分割部による分割に用いられる前記ルールの数を増減させる、重要度計算部を更に備えている、
    請求項3に記載の情報管理装置。
  5. 管理対象となる情報が、個人情報である、
    請求項1〜4のいずれかに記載の情報管理装置。
  6. (a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
    (b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
    (c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
    (d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
    を有することを特徴とする情報管理方法。
  7. コンピュータに、
    (a)予め設定されたルールに基づいて、管理対象となる情報を分割して得られた、複数の領域それぞれの特徴量を登録する、ステップと、
    (b)外部から入力された情報を、前記ルールに基づいて、複数の領域に分割する、ステップと、
    (c)分割によって得られた領域毎に、特徴量を抽出する、ステップと、
    (d)抽出した特徴量と、登録されている前記特徴量とを比較して、外部から入力された情報と管理対象となる情報とが、一致しているかどうかを判定する、ステップと、
    を実行させるプログラム。
JP2017055491A 2017-03-22 2017-03-22 情報管理装置、情報管理方法、及びプログラム Active JP6984147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017055491A JP6984147B2 (ja) 2017-03-22 2017-03-22 情報管理装置、情報管理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017055491A JP6984147B2 (ja) 2017-03-22 2017-03-22 情報管理装置、情報管理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018159986A true JP2018159986A (ja) 2018-10-11
JP6984147B2 JP6984147B2 (ja) 2021-12-17

Family

ID=63796664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017055491A Active JP6984147B2 (ja) 2017-03-22 2017-03-22 情報管理装置、情報管理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6984147B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007158413A (ja) * 2005-11-30 2007-06-21 Canon Inc 画像処理方法及び装置
JP2009075868A (ja) * 2007-09-20 2009-04-09 Toshiba Corp 画像から対象を検出する装置、方法およびプログラム
JP2009225084A (ja) * 2008-03-17 2009-10-01 Mitsubishi Electric Corp 情報漏洩検査装置及びコンピュータプログラム及び情報漏洩検査方法
JP2012182737A (ja) * 2011-03-02 2012-09-20 Nec Corp 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム
JP2015530665A (ja) * 2012-09-07 2015-10-15 ティヴァーサ アイピー インコーポレイテッド ファイル共有ネットワークにおけるスニペット照合
JP2016161951A (ja) * 2015-02-26 2016-09-05 富士通株式会社 情報処理システム、情報処理装置、機密情報検査プログラム及び機密情報検査方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007158413A (ja) * 2005-11-30 2007-06-21 Canon Inc 画像処理方法及び装置
JP2009075868A (ja) * 2007-09-20 2009-04-09 Toshiba Corp 画像から対象を検出する装置、方法およびプログラム
JP2009225084A (ja) * 2008-03-17 2009-10-01 Mitsubishi Electric Corp 情報漏洩検査装置及びコンピュータプログラム及び情報漏洩検査方法
JP2012182737A (ja) * 2011-03-02 2012-09-20 Nec Corp 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム
JP2015530665A (ja) * 2012-09-07 2015-10-15 ティヴァーサ アイピー インコーポレイテッド ファイル共有ネットワークにおけるスニペット照合
JP2016161951A (ja) * 2015-02-26 2016-09-05 富士通株式会社 情報処理システム、情報処理装置、機密情報検査プログラム及び機密情報検査方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竹口 誠士: "統計手法を用いた情報漏洩検知の改善に関する検討", 情報処理学会研究報告, vol. 2008, no. 21, JPN6017031103, 6 March 2008 (2008-03-06), JP, pages 103 - 108, ISSN: 0004406403 *

Also Published As

Publication number Publication date
JP6984147B2 (ja) 2021-12-17

Similar Documents

Publication Publication Date Title
US20200356901A1 (en) Target variable distribution-based acceptance of machine learning test data sets
US11704342B2 (en) Similarity sharding
CN107203522B (zh) 一种恶意订单地址的判定方法和装置
US10360405B2 (en) Anonymization apparatus, and program
CN107408115B (zh) web站点过滤器、控制对内容的访问的方法和介质
CN111160021A (zh) 日志模板提取方法及装置
CN108280197B (zh) 一种识别同源二进制文件的方法及***
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
WO2017160340A1 (en) Automatic content-based append detection
CN106933878B (zh) 一种信息处理方法及装置
CN107357794B (zh) 优化键值数据库的数据存储结构的方法和装置
JP6242540B1 (ja) データ変換システム及びデータ変換方法
US11222131B2 (en) Method for a secure storage of data records
CN112749173A (zh) 更新对象的方法和装置
US10698608B2 (en) Method, apparatus and computer storage medium for data input and output
CN109670153A (zh) 一种相似帖子的确定方法、装置、存储介质及终端
JP6984147B2 (ja) 情報管理装置、情報管理方法、及びプログラム
CN111221690A (zh) 针对集成电路设计的模型确定方法、装置及终端
CN112733523B (zh) 文档发送方法、装置、设备及存储介质
CN107562533A (zh) 一种数据加载处理方法及装置
Wang et al. MapReduce based personalized locality sensitive hashing for similarity joins on large scale data
JP6680472B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP6123372B2 (ja) 情報処理システム、名寄せ判定方法及びプログラム
JP2018045476A (ja) 評価値に基づいて推奨するコンテンツを決定するシステム
US11860876B1 (en) Systems and methods for integrating datasets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211108

R150 Certificate of patent or registration of utility model

Ref document number: 6984147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150