JP5720536B2 - 秘匿化データの検索のための情報処理方法及び装置 - Google Patents
秘匿化データの検索のための情報処理方法及び装置 Download PDFInfo
- Publication number
- JP5720536B2 JP5720536B2 JP2011246817A JP2011246817A JP5720536B2 JP 5720536 B2 JP5720536 B2 JP 5720536B2 JP 2011246817 A JP2011246817 A JP 2011246817A JP 2011246817 A JP2011246817 A JP 2011246817A JP 5720536 B2 JP5720536 B2 JP 5720536B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- data
- numerical
- numerical value
- auxiliary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
データ格納部に格納されており且つ第1の数値を含むテキストデータから、第1の数値及び当該第1の数値の周辺に存在する複数個の特徴語を抽出する処理と、
抽出された前記第1の数値から、当該第1の数値と近似するか否かを判断する上で基準となる1又は複数の第2の数値を生成する生成処理と、
前記1又は複数の第2の数値と前記複数個の特徴語との各々について秘匿化処理を行って秘匿化データを生成し、前記データ格納部に格納する処理と、
を含む処理を、コンピュータが実行する情報処理方法。
前記生成処理が、
抽出された前記第1の数値を異なる有効桁数で表した複数の第2の数値を生成する処理
である付記1記載の情報処理方法。
前記生成処理が、
抽出された前記第1の数値を含む所定の数値範囲の上限値及び下限値である複数の第2の数値を特定する処理と、
前記第1の数値と前記下限値との差と、前記第1の数値と前記上限値との差とを算出し、前記データ格納部に格納する処理と、
を含む付記1記載の情報処理方法。
前記生成処理が、
抽出された前記第1の数値と、数値を分類するための数値範囲の設定とから、前記第1の数値を代表する1又は複数の第2の数値を特定する処理と、
前記1又は複数の第2の数値と、前記第1の数値との差を算出し、前記データ格納部に格納する処理と、
を含む付記1記載の情報処理方法。
前記生成処理が、
抽出された前記第1の数値を、指示された有効桁数で表した第2の数値を1つ生成する処理
である付記1記載の情報処理方法。
前記複数個の特徴語の同義語を抽出する処理と、
前記同義語の秘匿化を行って秘匿化データを生成し、前記データ格納部に格納する処理と、
を前記処理がさらに含む付記1乃至5のいずれか1つ記載の情報処理方法。
第1の数値の第1の秘匿化データ値と複数個の第1の特徴語の第2の秘匿化データ値とを含む1又は複数の検索データブロックを含む検索要求を受信する処理と、
複数の第2の数値の第3の秘匿化データ値と複数個の第2の特徴語の第4の秘匿化データ値とを含む1又は複数のデータブロックと識別情報とを含む案件データブロックを複数格納するデータ格納部に格納されている前記案件データブロックの各々について、前記第1の秘匿化データ値と前記第3の秘匿化データ値とから算出される、数値についての第1の類似度と、前記第2の秘匿化データ値と一致する前記第4の秘匿化データ値の個数とから、処理対象の案件データブロックに含まれる前記データブロックと前記検索データブロックとの各組み合わせについての第2の類似度の合計値である第3の類似度を算出する算出処理と、
前記第3の類似度が閾値を超えた案件データブロックの識別情報又は前記第3の類似度が上位所定数の案件データブロックの識別情報を、前記検索要求の送信元に送信する処理と、
を含む処理を、コンピュータが実行する情報処理方法。
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には前記第1の類似度を1に設定し、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在しない場合には前記第1の類似度を0に設定する処理
を含む付記7記載の情報処理方法。
前記第1の秘匿化データ値が、前記第1の数値の元の数値についての代表値の秘匿化データ値であり、
前記検索要求には、前記第1の数値の元の数値についての代表値との差である第1の補助数値と、近似判定のための範囲のデータとをさらに含み、
前記複数の第2の数値が、元の数値が属する値域の下限値及び上限値であり、
前記データブロックには、前記第2の数値の元の数値が属する値域の下限値と当該元の数値との差である第2の補助数値と当該元の数値と前記上限値との差である第3の補助数値とをさらに含み、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には、前記第1の秘匿化データ値についての前記第1の補助数値と、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値についての前記第2の補助数値又は前記第3の補助数値との差を算出する処理と、
前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値との差が、前記近似判定のための範囲内であれば、前記第1の類似度を1に設定し、前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値との差が、前記近似判定のための範囲内でない場合には前記第1の類似度を0に設定する処理と、
を含む付記7記載の情報処理方法。
前記第1の数値の第1の秘匿化データ値が複数前記データブロックに含まれ、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値の個数に応じた類似度を前記第1の類似度に設定する処理
を含む付記7記載の情報処理方法。
前記第1の秘匿化データ値が、前記第1の数値の元の数値についての代表値の秘匿化データ値であり、
前記検索要求には、前記第1の数値の元の数値についての代表値との差である第1の補助数値と、近似判定のための範囲のデータとをさらに含み、
前記複数の第2の数値が、元の数値が属する値域の下限値及び上限値であり、
前記データブロックには、前記第2の数値の元の数値が属する値域の下限値と当該元の数値との差である第2の補助数値と当該元の数値と前記上限値との差である第3の補助数値とをさらに含み、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には、前記第1の秘匿化データ値についての前記第1の補助数値と、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値についての前記第2の補助数値又は前記第3の補助数値との差を算出する処理と、
前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値と、前記近似判定のための範囲を表す数値と、の差に応じた類似度を前記第1の類似度に設定する処理と、
を含む付記7記載の情報処理方法。
データ格納部と、
前記データ格納部に格納されており且つ第1の数値を含むテキストデータから、第1の数値及び当該第1の数値の周辺に存在する複数個の特徴語を抽出し、抽出された前記第1の数値から、当該第1の数値と近似するか否かを判断する上で基準となる1又は複数の第2の数値を生成し、前記1又は複数の第2の数値と前記複数個の特徴語との各々について秘匿化処理を行って秘匿化データを生成し、第2のデータ格納部に格納する生成部と、
を有する情報処理装置。
第1の数値の第1の秘匿化データ値と複数個の第1の特徴語の第2の秘匿化データ値とを含む1又は複数の検索データブロックを含む検索要求を受信する受信部と、
複数の第2の数値の第3の秘匿化データ値と複数個の第2の特徴語の第4の秘匿化データ値とを含む1又は複数のデータブロックと識別情報とを含む案件データブロックを複数格納するデータ格納部に格納されている前記案件データブロックの各々について、前記第1の秘匿化データ値と前記第3の秘匿化データ値とから算出される、数値についての第1の類似度と、前記第2の秘匿化データ値と一致する前記第4の秘匿化データ値の個数とから、処理対象の案件データブロックに含まれる前記データブロックと前記検索データブロックとの各組み合わせについての第2の類似度の合計値である第3の類似度を算出する検索処理部と、
前記第3の類似度が閾値を超えた案件データブロックの識別情報又は前記第3の類似度が上位所定数の案件データブロックの識別情報を、前記検索要求の送信元に送信する送信部と、
を有する情報処理装置。
31 入力部
32 機密データ格納部
33 FP生成部
34 FPルールデータ取得部
35 FPルールデータ格納部
36 PFデータ格納部
37 送信部
5 管理装置
51 FPルールデータ格納部
52 FPルールデータ配布部
53 PF登録部
54 DB
55 検索処理部
56 検索要求受信部
57 検索結果送信部
7 検索装置
71 入力部
72 機密データ格納部
73 FP生成部
74 FPルールデータ取得部
75 FPルールデータ格納部
76 検索条件データ格納部
77 FPデータ格納部
78 検索要求部
79 出力部
Claims (13)
- データ格納部に格納されており且つ第1の数値を含むテキストデータから、第1の数値及び当該第1の数値の周辺に存在する複数個の特徴語を抽出する処理と、
抽出された前記第1の数値から、当該第1の数値と近似するか否かを判断する上で基準となる1又は複数の第2の数値を生成する生成処理と、
前記1又は複数の第2の数値と前記複数個の特徴語との各々について秘匿化処理を行って秘匿化データを生成し、前記データ格納部に格納する処理と、
を含む処理を、コンピュータが実行する情報処理方法。 - 前記生成処理が、
抽出された前記第1の数値を異なる有効桁数で表した複数の第2の数値を生成する処理
である請求項1記載の情報処理方法。 - 前記生成処理が、
抽出された前記第1の数値を含む所定の数値範囲の上限値及び下限値である複数の第2の数値を特定する処理と、
前記第1の数値と前記下限値との差と、前記第1の数値と前記上限値との差とを算出し、前記データ格納部に格納する処理と、
を含む請求項1記載の情報処理方法。 - 前記生成処理が、
抽出された前記第1の数値と、数値を分類するための数値範囲の設定とから、前記第1の数値を代表する1又は複数の第2の数値を特定する処理と、
前記1又は複数の第2の数値と、前記第1の数値との差を算出し、前記データ格納部に格納する処理と、
を含む請求項1記載の情報処理方法。 - 前記生成処理が、
抽出された前記第1の数値を、指示された有効桁数で表した第2の数値を1つ生成する処理
である請求項1記載の情報処理方法。 - 前記複数個の特徴語の同義語を抽出する処理と、
前記同義語の秘匿化を行って秘匿化データを生成し、前記データ格納部に格納する処理と、
を前記処理がさらに含む請求項1乃至5のいずれか1つ記載の情報処理方法。 - 第1の数値の第1の秘匿化データ値と複数個の第1の特徴語の第2の秘匿化データ値とを含む1又は複数の検索データブロックを含む検索要求を受信する処理と、
複数の第2の数値の第3の秘匿化データ値と複数個の第2の特徴語の第4の秘匿化データ値とを含む1又は複数のデータブロックと識別情報とを含む案件データブロックを複数格納するデータ格納部に格納されている前記案件データブロックの各々について、前記第1の秘匿化データ値と前記第3の秘匿化データ値とから算出される、数値についての第1の類似度と、前記第2の秘匿化データ値と一致する前記第4の秘匿化データ値の個数とから、処理対象の案件データブロックに含まれる前記データブロックと前記検索データブロックとの各組み合わせについての第2の類似度の合計値である第3の類似度を算出する算出処理と、
前記第3の類似度が閾値を超えた案件データブロックの識別情報又は前記第3の類似度が上位所定数の案件データブロックの識別情報を、前記検索要求の送信元に送信する処理と、
を含む処理を、コンピュータが実行する情報処理方法。 - 前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には前記第1の類似度を1に設定し、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在しない場合には前記第1の類似度を0に設定する処理
を含む請求項7記載の情報処理方法。 - 前記第1の秘匿化データ値が、前記第1の数値の元の数値についての代表値の秘匿化データ値であり、
前記検索要求には、前記第1の数値の元の数値についての代表値との差である第1の補助数値と、近似判定のための範囲のデータとをさらに含み、
前記複数の第2の数値が、元の数値が属する値域の下限値及び上限値であり、
前記データブロックには、前記第2の数値の元の数値が属する値域の下限値と当該元の数値との差である第2の補助数値と当該元の数値と前記上限値との差である第3の補助数値とをさらに含み、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には、前記第1の秘匿化データ値についての前記第1の補助数値と、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値についての前記第2の補助数値又は前記第3の補助数値との差を算出する処理と、
前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値との差が、前記近似判定のための範囲内であれば、前記第1の類似度を1に設定し、前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値との差が、前記近似判定のための範囲内でない場合には前記第1の類似度を0に設定する処理と、
を含む請求項7記載の情報処理方法。 - 前記第1の数値の第1の秘匿化データ値が複数前記データブロックに含まれ、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値の個数に応じた類似度を前記第1の類似度に設定する処理
を含む請求項7記載の情報処理方法。 - 前記第1の秘匿化データ値が、前記第1の数値の元の数値についての代表値の秘匿化データ値であり、
前記検索要求には、前記第1の数値の元の数値についての代表値との差である第1の補助数値と、近似判定のための範囲のデータとをさらに含み、
前記複数の第2の数値が、元の数値が属する値域の下限値及び上限値であり、
前記データブロックには、前記第2の数値の元の数値が属する値域の下限値と当該元の数値との差である第2の補助数値と当該元の数値と前記上限値との差である第3の補助数値とをさらに含み、
前記算出処理が、
前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値が存在する場合には、前記第1の秘匿化データ値についての前記第1の補助数値と、前記第1の秘匿化データ値に一致する前記第3の秘匿化データ値についての前記第2の補助数値又は前記第3の補助数値との差を算出する処理と、
前記第1の補助数値と前記第2の補助数値又は前記第3の補助数値と、前記近似判定のための範囲を表す数値と、の差に応じた類似度を前記第1の類似度に設定する処理と、
を含む請求項7記載の情報処理方法。 - データ格納部と、
前記データ格納部に格納されており且つ第1の数値を含むテキストデータから、第1の数値及び当該第1の数値の周辺に存在する複数個の特徴語を抽出し、抽出された前記第1の数値から、当該第1の数値と近似するか否かを判断する上で基準となる1又は複数の第2の数値を生成し、前記1又は複数の第2の数値と前記複数個の特徴語との各々について秘匿化処理を行って秘匿化データを生成し、第2のデータ格納部に格納する生成部と、
を有する情報処理装置。 - 第1の数値の第1の秘匿化データ値と複数個の第1の特徴語の第2の秘匿化データ値とを含む1又は複数の検索データブロックを含む検索要求を受信する受信部と、
複数の第2の数値の第3の秘匿化データ値と複数個の第2の特徴語の第4の秘匿化データ値とを含む1又は複数のデータブロックと識別情報とを含む案件データブロックを複数格納するデータ格納部に格納されている前記案件データブロックの各々について、前記第1の秘匿化データ値と前記第3の秘匿化データ値とから算出される、数値についての第1の類似度と、前記第2の秘匿化データ値と一致する前記第4の秘匿化データ値の個数とから、処理対象の案件データブロックに含まれる前記データブロックと前記検索データブロックとの各組み合わせについての第2の類似度の合計値である第3の類似度を算出する検索処理部と、
前記第3の類似度が閾値を超えた案件データブロックの識別情報又は前記第3の類似度が上位所定数の案件データブロックの識別情報を、前記検索要求の送信元に送信する送信部と、
を有する情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011246817A JP5720536B2 (ja) | 2011-11-10 | 2011-11-10 | 秘匿化データの検索のための情報処理方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011246817A JP5720536B2 (ja) | 2011-11-10 | 2011-11-10 | 秘匿化データの検索のための情報処理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013105207A JP2013105207A (ja) | 2013-05-30 |
JP5720536B2 true JP5720536B2 (ja) | 2015-05-20 |
Family
ID=48624723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011246817A Expired - Fee Related JP5720536B2 (ja) | 2011-11-10 | 2011-11-10 | 秘匿化データの検索のための情報処理方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5720536B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6557338B2 (ja) * | 2015-06-16 | 2019-08-07 | 株式会社日立製作所 | 類似性秘匿検索システム、類似性秘匿検索方法 |
EP3361469B8 (en) | 2015-10-09 | 2021-03-10 | Mitsubishi Electric Corporation | Secret search system, management device, secret search method, and secret search program |
JP6659037B2 (ja) * | 2015-11-09 | 2020-03-04 | Necソリューションイノベータ株式会社 | 情報管理装置、情報管理方法、及びプログラム |
JP6430973B2 (ja) * | 2016-01-20 | 2018-11-28 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2018160285A (ja) * | 2018-07-20 | 2018-10-11 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02105974A (ja) * | 1988-10-14 | 1990-04-18 | Hitachi Ltd | 数値比較検索方式 |
JP2005326970A (ja) * | 2004-05-12 | 2005-11-24 | Mitsubishi Electric Corp | 構造化文書曖昧検索装置及びそのプログラム |
JP2007328196A (ja) * | 2006-06-08 | 2007-12-20 | Fuji Xerox Co Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
JP2008276449A (ja) * | 2007-04-27 | 2008-11-13 | Albert:Kk | 希望商品に類似する商品の推薦システム |
JP5429502B2 (ja) * | 2009-07-29 | 2014-02-26 | 日本電気株式会社 | 範囲検索システム、範囲検索方法、及び範囲検索用プログラム |
-
2011
- 2011-11-10 JP JP2011246817A patent/JP5720536B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013105207A (ja) | 2013-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11487902B2 (en) | Systems and methods for computing with private healthcare data | |
US20230044294A1 (en) | Systems and methods for computing with private healthcare data | |
US20200410116A1 (en) | Sensitive Data Classification | |
CA2950676C (en) | Methods and systems for mapping data items to sparse distributed representations | |
US9262584B2 (en) | Systems and methods for managing a master patient index including duplicate record detection | |
US9003529B2 (en) | Apparatus and method for identifying related code variants in binaries | |
US11062035B2 (en) | Secure document management using blockchain | |
US10572461B2 (en) | Systems and methods for managing a master patient index including duplicate record detection | |
CN106844723A (zh) | 基于问答***的医学知识库构建方法 | |
CN104346418A (zh) | 用于数据的关系型上下文敏感匿名化的方法和*** | |
JP5720536B2 (ja) | 秘匿化データの検索のための情報処理方法及び装置 | |
EP3097527A1 (en) | Dynamic document matching and merging | |
CN111695336A (zh) | 疾病名称对码方法、装置、计算机设备及存储介质 | |
US11775665B2 (en) | System and method for executing access transactions of documents related to drug discovery | |
KR101651780B1 (ko) | 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템 | |
WO2021178689A1 (en) | Systems and methods for computing with private healthcare data | |
CN112115697A (zh) | 用于确定目标文本的方法、装置、服务器以及存储介质 | |
JP2018005633A (ja) | 関連コンテンツ抽出装置、関連コンテンツ抽出方法及び関連コンテンツ抽出プログラム | |
CN112685389B (zh) | 数据管理方法、数据管理装置、电子设备及存储介质 | |
CN111986815B (zh) | 基于共现关系的项目组合挖掘方法及相关设备 | |
Lim et al. | ClaimFinder: A Framework for Identifying Claims in Microblogs. | |
Nair et al. | Advancements in Cyber Security and Information Systems in Healthcare from 2004 to 2022: A Bibliometric Analysis | |
CN113688119B (zh) | 基于人工智能的医疗数据库构建方法及相关设备 | |
Dongliang et al. | Digital library resources information integration system of self-help service | |
Ucan et al. | A platform for developing privacy preserving diagnosis mobile applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5720536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |