JP7064682B2 - 準同型暗号に基づくプライバシー保護多機関データ分類方法 - Google Patents

準同型暗号に基づくプライバシー保護多機関データ分類方法 Download PDF

Info

Publication number
JP7064682B2
JP7064682B2 JP2021533328A JP2021533328A JP7064682B2 JP 7064682 B2 JP7064682 B2 JP 7064682B2 JP 2021533328 A JP2021533328 A JP 2021533328A JP 2021533328 A JP2021533328 A JP 2021533328A JP 7064682 B2 JP7064682 B2 JP 7064682B2
Authority
JP
Japan
Prior art keywords
data
polynomial
homomorphic encryption
calculation center
public key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021533328A
Other languages
English (en)
Other versions
JP2022508351A (ja
Inventor
▲勁▼松 李
▲遥▼ ▲陸▼
▲天▼舒 周
▲潤▼▲澤▼ 李
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2022508351A publication Critical patent/JP2022508351A/ja
Application granted granted Critical
Publication of JP7064682B2 publication Critical patent/JP7064682B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は多機関データ分析技術分野に属し、特に準同型暗号に基づくプライバシー保護多機関データ分類方法に関する。
現在、多くのデータ分析研究はいずれも単一機関の限られたデータセットに基づいて行われる。ところが、このような方法は大きく限定されている。一方では、いくつかの特定研究に対して、単一機関は十分な裏付けデータを生成できない可能性があり、例えば、ある希少疾患に対して、単一の医療機関は一般的に十分なデータを提供できず、他方では、様々な観測技術の発展に伴い、ますます多くの異種データが生成され、これもデータマイニングに対して多くのチャレンジを提供し、例えば、ヴァンダービルト大学の科学者Joshua C Dennyによる2013年の研究では、単一の医療機関の電子カルテに基づいて行われるゲノムワイド関連研究がデータ量の欠乏により理想的な研究結果を得られない場合が多いことが明らかになった。従って、多機関の協調研究は必然的な流れである。
現在、多機関のデータ分析を実現するために、多くの多機関データ分析方法例えば世界医療ビッグデータコンソーシアムオデッセイ(OHDSI)が提案され実践されている。多機関データ分析方法は主にトレーニングデータの選別、トレーニングデータのアップロード、分析モデルの構築、モデルの取得・分析の4つのステップを含む。個人のプライバシーを保護するために、それらは一般的にデータをアップロードする前に各機関が提供するデータから機密情報を削除することとなる。
現在提案された多機関データ分析方法は機密情報のみを処理したが、大量の情報が依然として漏洩した。一方では、これらの漏洩した情報を適切に処理することにより、一部の機密情報を導き出すことができ、これにより個人のプライバシーが漏洩してしまう。他方では、データそのものは価値があり、漏洩した大量の情報は許可されずに第三者によって悪用される可能性があり、これによりデータ提供機関の利益の損失を引き起こしてしまう。これは多機関データ分析の開発を大きく妨げてしまう。
本発明の目的は従来技術の欠点に対して、準同型暗号に基づくプライバシー保護多機関データ分類方法を提供することにあり、まず、データ生成及びアップロード段階では、各データ提供機関はデータをアップロードする前に準同型暗号技術を利用してそれぞれのデータを暗号化し、いかなる情報の漏洩を回避する。次に、データ分析段階では、計算センターは各データ提供機関と協力して分析の中間値及び分類モデルの復号化を完了し、演算過程におけるいかなる意味のある情報の漏洩を回避し、第三者がデータを悪用することが効果的に防止される。
本発明の目的は以下の技術案により実現される。
準同型暗号に基づくプライバシー保護多機関データ分類方法であって、
使用者がトレーニングデータの選別条件を生成して、選別条件を計算センターに送信するステップ(1)と、
計算センターが選別条件を受信し、準同型暗号アルゴリズムを利用して暗号化パラメータを生成して、暗号化パラメータをステップ(1)の選別条件とともに各データ提供機関に送信するステップ(2)と、
各データ提供機関が選別条件に基づいて分類タグを付けたローカルデータを選別して、トレーニングデータを取得するステップ(3)と、
各データ提供機関が暗号化パラメータに基づいて、準同型暗号アルゴリズムを利用してそれぞれの公開鍵及び秘密鍵を生成するステップ(4)と、
各データ提供機関が公開鍵によりトレーニングデータを暗号化し、分類変数を暗号化せずに特徴変数を暗号化して、暗号化後のトレーニングデータを対応する公開鍵とともに計算センターに送信するステップ(5)と、
計算センターが各データ提供機関により暗号化された後のトレーニングデータ及び対応する公開鍵を受信した後、各データ提供機関とともに準同型暗号における論理回帰分析を実行して、データ分類モデルを取得するステップ(6)と、
計算センターがデータ分類モデルを使用者に送信するステップ(7)と、
使用者が分類対象データをデータ分類モデルに入力して、分類結果を取得するステップ(8)と、を含む。
更に、前記ステップ(2)において、NTRU準同型暗号アルゴリズムを利用して暗号化パラメータを生成し、前記暗号化パラメータは多項式の次数n、大きな素数q、暗号鍵生成用標準偏差σ、暗号化ノイズ用標準偏差σを含み、暗号化パラメータの設定はa)~e)の条件を満足する必要があり、
a)nが2の正の整数乗であり、
b)
Figure 0007064682000001
且つ
Figure 0007064682000002
であり、
c)σとσがいずれも正数であって、
Figure 0007064682000003
であり、
d)
Figure 0007064682000004
であり、
e)
Figure 0007064682000005
である。
更に、前記ステップ(4)において、公開鍵がデータの暗号化に使用され、秘密鍵がデータの復号に使用され、公開鍵及び秘密鍵を生成する具体的なステップが次のとおりであり、
(1)一元多項式の生成ルール
Figure 0007064682000006
に従って多項式fと多項式gを生成し、
Figure 0007064682000007
は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
fは以下の(a)~(b)を満足し、
(a)多項式環R にfの逆元f-1が存在し、R におけるすべての多項式の係数が(-q/2,q/2)の中の整数であり、すべての多項式の最高次数がn-1であり、環のモジュロが多項式x+1であり、
(b)
Figure 0007064682000008
であり、
(2)公開鍵pk及び秘密鍵skを生成し、
Figure 0007064682000009
であり、
Figure 0007064682000010
である。
更に、前記ステップ(5)において、各データ提供機関が公開鍵によりトレーニングデータを暗号化する過程が次のとおりであり、
(1)平文のビット長
Figure 0007064682000011
にし、
(2)暗号化対象の整数平文μについて、
Figure 0007064682000012
が求められ、
(3)一元多項式の生成ルール
Figure 0007064682000013
に従ってL個の多項式S~S及びL個の多項式E~Eを生成し、
Figure 0007064682000014
は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
(4)暗号文Cを生成し、暗号文CがL個の多項式を含み、i番目の暗号文における多項式Cの式が、
Figure 0007064682000015
である
更に、前記ステップ(6)において、準同型暗号における論理回帰分析の実行過程においてデータ復号を行い、具体的なステップが次のとおりであり、
(1)暗号文Cにおけるすべての多項式をそれぞれ秘密鍵skに乗じて、次の式を取得し、
Figure 0007064682000016
(2)μfを生成し、具体的な式が次のとおりであり、
Figure 0007064682000017
(3)μfの各係数をいずれも2に乗じてから秘密鍵skの対応係数で割って、復号結果μを取得し、その式が次のとおりであり、
Figure 0007064682000018
式中、roundが床関数であり、(μf)がμfのi項目の係数であり、skが秘密鍵のi項目の係数である
更に、前記ステップ(6)において、準同型暗号における論理回帰分析の実行過程において準同型加算及び準同型乗算を行い、具体的には、
暗号文C及び暗号文Dがそれぞれ平文μ及び平文μを暗号化して取得したものであると仮定すれば、暗号文加算及び暗号文乗算がそれぞれ次のとおりであり、
Figure 0007064682000019
Figure 0007064682000020
式中、BD(C)がビット分解方程式であり、入力CがL個の多項式を含む集合であり、該方程式がCにおけるすべての係数をLビットのバイナリーベクトル表現に変換する。
更に、前記ステップ(6)において、計算センターと各データ提供機関が共同で準同型暗号における論理回帰分析を実行し、全部でデータ提供機関がx個あると仮定すれば、それらのトレーニングデータがそれぞれz~z個あり、全部でz個があり、全部でy個の特徴変数があり、具体的なステップが次のとおりであり、
(1)計算センターが論理回帰の最大反復回数iter及び学習率aを設定し、
(2)計算センターが分類モデルパラメータθ0~θyを初期化し、
(3)計算センターが分類モデルパラメータの更新された値Δθ0~Δθy=0を初期化し、
(4)計算センターがそれぞれ各機関の公開鍵により分類モデルパラメータを暗号化し、暗号化後のモデルパラメータをΘ010x、……、Θy1yxと記し、
(5)計算センターが各暗号文におけるトレーニングデータCに対して次の操作を実行し、機関iから提供されたj番目のトレーニングデータ
Figure 0007064682000021
(ここで、
Figure 0007064682000022
がCijのy個の特徴変数であり、labelijがCijの分類変数である。)について、
(a)重み付け予測値
Figure 0007064682000023

(b)暗号文状態における勾配降下値
Figure 0007064682000024
を計算し、準同型暗号におけるsigmoid関数が多項式y=-0.0016x+0.1501x+0.5によりフィッティングを行い、
(c)
Figure 0007064682000025
をデータ提供機関iに送信し、
(6)データ提供機関
Figure 0007064682000026

Figure 0007064682000027
を受信してノイズ合計値
Figure 0007064682000028
を初期化し、その後、各
Figure 0007064682000029
に対して次の操作を実行し、
(a)ワンタイムノイズerrorを生成して公開鍵により暗号文ノイズEij に暗号化し、
(b)暗号化ノイズにより
Figure 0007064682000030
を隠して、
Figure 0007064682000031
を取得し、具体的な式がΔΘ’ij k=ΔΘij k+Eij kであり、
(c)Ei k+=eであり、
(d)
Figure 0007064682000032

Figure 0007064682000033
に復号して
Figure 0007064682000034
を計算センターに送信し、
最後に、
Figure 0007064682000035
を計算センターに送信し、
(7)計算センターが
Figure 0007064682000036
及び
Figure 0007064682000037
を受信し、各
Figure 0007064682000038
に対して次の操作を実行し、
(a)
Figure 0007064682000039
であり、
(b)以下の計算を行うことにより、ノイズの影響を除去し、
Figure 0007064682000040
(c)次のように分類モデルパラメータの更新を行い、
Figure 0007064682000041
(8)反復回数に達していない場合、ステップ(3)に戻り、それ以外の場合、分析を終了する。
本発明の有益な効果は、本発明がデータをアップロードする前に準同型暗号技術を利用してデータを暗号化することにより、いかなる情報の漏洩を回避することである。本発明はデータ分析及び分析結果の取得の段階では、無意味な中間結果のみを公開し、演算過程におけるいかなる意味のある情報の漏洩を回避し、第三者によるデータの悪用を効果的に防止する。本発明は実際の応用では、より一層高い安全性を有し、個人のプライバシーを効果的に保護するだけでなく、データ提供機関に発生する可能性のある利益損失を回避し、多機関データ分析の展開を大幅に促進する。
図1はプライバシー保護多機関データ分類方法の全体ブロック図である。 図2はプライバシー保護多機関データ分類方法の全体フローチャートである。 図3は準同型暗号における論理回帰分析の具体的なフローチャートである。
以下、図面を参照しながら具体的な実施例によって本発明を更に詳しく説明する。
本発明に係る準同型暗号に基づくプライバシー保護多機関データ分類方法は、全体ブロックが図1に示される。方法の参加者は複数のデータ提供機関、計算センター及び使用者を含む。方法の全体プロセスは図2に示され、具体的に、
使用者がトレーニングデータの選別条件を生成して、選別条件を計算センターに送信するステップ(1)と、
計算センターが選別条件を受信し、準同型暗号アルゴリズムを利用して暗号化パラメータを生成して、暗号化パラメータをステップ(1)の選別条件とともに各データ提供機関に送信するステップ(2)と、
各データ提供機関が選別条件に基づいて分類タグを付けたローカルデータを選別して、トレーニングデータを取得するステップ(3)と、
各データ提供機関が暗号化パラメータに基づいて、準同型暗号アルゴリズムを利用してそれぞれの公開鍵及び秘密鍵を生成するステップ(4)と、
各データ提供機関が公開鍵によりトレーニングデータを暗号化し、分類変数を暗号化せずに特徴変数を暗号化して、暗号化後のトレーニングデータを対応する公開鍵とともに計算センターに送信するステップ(5)と、
計算センターが各データ提供機関により暗号化された後のトレーニングデータ及び対応する公開鍵を受信した後、各データ提供機関とともに準同型暗号における論理回帰分析を実行して、データ分類モデルを取得するステップ(6)と、
計算センターがデータ分類モデルを使用者に送信するステップ(7)と、
使用者が分類対象データをデータ分類モデルに入力して、分類結果を取得するステップ(8)と、を含む。
更に、前記ステップ(2)において、NTRU準同型暗号アルゴリズムを利用して暗号化パラメータを生成し、前記暗号化パラメータは多項式の次数n、大きな素数q、暗号鍵生成用標準偏差σ、暗号化ノイズ用標準偏差σを含み、暗号化パラメータの設定はa)~e)の条件を満足する必要があり、
a)nが2の正の整数乗であり、
b)
Figure 0007064682000042
且つ
Figure 0007064682000043
であり、
c)σとσがいずれも正数であって、
Figure 0007064682000044
であり、
d)
Figure 0007064682000045
であり、
e)
Figure 0007064682000046
である。
準同型暗号は特別な暗号化方式であり、準同型暗号後の暗号文を処理して1つの出力を取得し、この出力を復号し、その結果が同じ方法で暗号化されない平文を処理して取得した出力結果と同様であり、準同型暗号技術を利用して、データの具体的な内容を知らずにデータを処理でき、データ安全を確保するとともにデータの利用を実現し、NTRU準同型暗号アルゴリズムが加算準同型及び乗算準同型を同時に満足することを特徴とする。
更に、前記ステップ(4)において、公開鍵はデータの暗号化に使用され、秘密鍵はデータの復号に使用され、公開鍵及び秘密鍵を生成する具体的なステップが以下のとおりであり、
(1)一元多項式の生成ルール
Figure 0007064682000047
に従って多項式fと多項式gを生成し、nが多項式の生成回数を指定し、Zは多項式の各項の係数がいずれも整数であることを意味し、
Figure 0007064682000048
は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
fは(a)~(b)を満足し、
(a)多項式環
Figure 0007064682000049
にfの逆元f-1が存在し、
Figure 0007064682000050
におけるすべての多項式の係数が(-q/2,q/2)の中の整数であり、すべての多項式の最高回数がn-1であり、環のモジュロが多項式x+1であり、
(b)
Figure 0007064682000051
であり、
(2)公開鍵pk及び秘密鍵skを生成し、
Figure 0007064682000052
であり、
Figure 0007064682000053
であり、
更に、前記ステップ(5)において、各データ提供機関が公開鍵によりトレーニングデータを暗号化する過程が次のとおりであり、
(1)平文のビット長
Figure 0007064682000054
にし、
(2)暗号化対象の整数平文μについて、
Figure 0007064682000055
が求められ、
(3)一元多項式の生成ルール
Figure 0007064682000056
に従ってL個の多項式S~S及びL個の多項式E~Eを生成し、
Figure 0007064682000057
は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
(4)暗号文Cを生成し、暗号文CはL個の多項式を含み、i番目の暗号文多項式Cの式が次のとおりであり、
Figure 0007064682000058
更に、前記ステップ(6)において、準同型暗号における論理回帰分析の実行過程においてデータ復号を行い、具体的なステップ次のとおりであり、
(1)暗号文Cにおけるすべての多項式をそれぞれ秘密鍵skに乗じて、次の式を取得し、
Figure 0007064682000059
(2)μfを生成し、具体的な式が次のとおりであり、
Figure 0007064682000060
(3)μfの各係数をいずれも2に乗じてから秘密鍵skの対応係数で割って、復号結果μを取得し、その式が次のとおりであり、
Figure 0007064682000061
式中、roundが床関数であり、(μf)がμfのi項目の係数であり、skが秘密鍵のi項目の係数である。
更に、前記ステップ(6)において、準同型暗号における論理回帰分析の実行過程において準同型加算及び準同型乗算を行い、具体的には、
暗号文C及び暗号文Dがそれぞれ平文μ及び平文μを暗号化して取得したものであると仮定すれば、暗号文加算及び暗号文乗算がそれぞれ次のとおりであり、
Figure 0007064682000062
Figure 0007064682000063
式中、BD(C)がビット分解方程式であり、入力CがL個の多項式を含む集合であり、該方程式がCにおけるすべての係数をLビットのバイナリーベクトル表現に変換する。
暗号文加算の準同型証明が次のとおりである。
Figure 0007064682000064
BDI(I)は1から始まる2の整数パワーベクトルを示し、長さがLであり、即ち{1,2,4,...,2L-1}であり、
暗号文乗算の準同型証明が次のとおりである。
Figure 0007064682000065
更に、前記ステップ(6)において、計算センターと各データ提供機関が共同で準同型暗号における論理回帰分析を実行し、論理回帰は一般化線形回帰分析モデルであり、データマイニング、自動疾患診断、経済予測等の分野によく使用されている。論理回帰の分類変数は二分類であってもよいし、多分類であってもよいが、二分類はよく使用される方であり、より容易に解釈されるため、本発明では二分類の論理回帰を用いる。全部でデータ提供機関がx個あると仮定すれば、それらのトレーニングデータはそれぞれz~z個があり、全部でz個があり、全部でy個の特徴変数があり、準同型暗号における論理回帰分析の具体的なプロセスは図3に示され、具体的なステップが次のとおりであり、
(1)計算センターが論理回帰の最大反復回数iter及び学習率aを設定し、
(2)計算センターが分類モデルパラメータθ~θを初期化し、
(3)計算センターが分類モデルパラメータの更新された値Δθ0~Δθy=0を初期化し、
(4)計算センターがそれぞれ各機関の公開鍵により分類モデルパラメータを暗号化し、暗号化後のモデルパラメータをΘ01~Θ0x、……、Θy1~Θyxと記し、
(5)計算センターが各暗号文におけるトレーニングデータCに対して以下の操作を実行し、機関iから提供されたj番目のトレーニングデータ
Figure 0007064682000066
(ここで、
Figure 0007064682000067
がCijのy個の特徴変数であり、labelijがCijの分類変数である)について、
(a)重み付け予測値
Figure 0007064682000068

(b)暗号文状態における勾配降下値
Figure 0007064682000069
を計算し、準同型暗号におけるsigmoid関数が多項式y=-0.0016x+0.1501x+0.5によりフィッティングを行い、
(c)
Figure 0007064682000070
をデータ提供機関iに送信し、
(6)データ提供機関
Figure 0007064682000071

Figure 0007064682000072
を受信してノイズ合計値
Figure 0007064682000073
を初期化し、その後、各
Figure 0007064682000074
に対して以下の操作を実行し、
(a)ワンタイムノイズerrorを生成して公開鍵により暗号文ノイズEij に暗号化し、
(b)暗号化ノイズによりΔΘij を隠して、ΔΘ’ij を取得し、具体的な公式はΔΘ’ij =ΔΘij +Eij であり、
(c)E +=eであり、
(d)
Figure 0007064682000075

Figure 0007064682000076
に復号して
Figure 0007064682000077
を計算センターに送信し、
最後に、
Figure 0007064682000078
を計算センターに送信し、
(7)計算センターが
Figure 0007064682000079
及び
Figure 0007064682000080
Figure 0007064682000081
を受信し、各
Figure 0007064682000082
に対して以下の操作を実行し、
(a)
Figure 0007064682000083
であり、
(b)以下の計算を行うことにより、ノイズの影響を除去し、
Figure 0007064682000084
(c)分類モデルパラメータの更新を行い、
Figure 0007064682000085
(8)反復回数に達していない場合、ステップ(3)に戻り、それ以外の場合、分析を終了する。
以上は本発明の実施形例に過ぎず、本発明の保護範囲を制限するためのものではない。本発明の趣旨や原則内に創造的な作業なしに行われたいかなる修正、等価置換、改良等は、いずれも本発明の保護範囲内に含まれる。

Claims (4)

  1. 準同型暗号に基づくプライバシー保護多機関データ分類方法であって、
    ユーザー端末がトレーニングデータの選別条件を生成して、選別条件をコンピュータで構成された計算センターに送信するステップ(1)と、
    計算センターが選別条件を受信し、準同型暗号アルゴリズムを利用して暗号化パラメータを生成して、暗号化パラメータをステップ(1)の選別条件とともに各データ提供装置に送信するステップ(2)と、
    各データ提供装置が分類タグを付けたローカルデータを選別条件に基づいて選別して、トレーニングデータを取得するステップ(3)と、
    各データ提供装置が暗号化パラメータに基づいて、準同型暗号アルゴリズムを利用してそれぞれの公開鍵及び秘密鍵を生成するステップ(4)と、
    各データ提供装置が公開鍵によりトレーニングデータを暗号化し、暗号化後のトレーニングデータを対応する公開鍵とともに計算センターに送信するステップ(5)と、
    計算センターが各データ提供装置により暗号化された後のトレーニングデータ及び対応する公開鍵を受信した後、各データ提供装置とともに準同型暗号における論理回帰分析を実行して、データ分類モデルを取得するステップ(6)と、
    計算センターがデータ分類モデルをユーザー端末に送信するステップ(7)と、
    ユーザー端末が分類対象データをデータ分類モデルに入力して、分類結果を取得するステップ(8)と、を含み、
    前記ステップ(6)において、計算センターと各データ提供装置が共同で準同型暗号における論理回帰分析を実行し、データ提供装置が合計x個あり、それらのトレーニングデータがそれぞれz ~z 個あり、合計でz個があり、各トレーニングデータに合計y個の特徴変数がある場合、具体的なステップが次のとおりであり、
    (1)計算センターが論理回帰の最大反復回数iter及び学習率aを設定し、
    (2)計算センターが分類モデルパラメータθ ~θ を初期化し、
    (3)計算センターが分類モデルパラメータの更新された値Δθ ~Δθ =0を初期化し、
    (4)計算センターがそれぞれ各機関の公開鍵により分類モデルパラメータを暗号化し、暗号化後のモデルパラメータをΘ 01 0x 、……、Θ y1 yx と記し、
    (5)計算センターが各暗号文におけるトレーニングデータCに対して次の操作を実行し、機関iから提供されたj番目のトレーニングデータ
    Figure 0007064682000086
    (ここで、
    Figure 0007064682000087
    がC ij のy個の特徴変数であり、label ij がC ij の分類変数である。)について、
    (a)重み付け予測値
    Figure 0007064682000088

    (b)暗号文状態における勾配降下値
    Figure 0007064682000089
    を計算し、準同型暗号におけるsigmoid関数が多項式y=-0.0016x +0.1501x+0.5によりフィッティングを行い、
    (c)
    Figure 0007064682000090
    をデータ提供装置iに送信し、
    (6)データ提供装置
    Figure 0007064682000091

    Figure 0007064682000092
    を受信してノイズ合計値
    Figure 0007064682000093
    を初期化し、その後、各
    Figure 0007064682000094
    に対して次の操作を実行し、
    (a)ワンタイムノイズerrorを生成して公開鍵により暗号文ノイズE ij に暗号化し、
    (b)暗号化ノイズによりΔΘ ij k を隠して、ΔΘ’ ij k を取得し、具体的な式がΔΘ’ ij k =ΔΘ ij k +E ij k であり、
    (c)E i k +=eであり、
    (d)秘密鍵により
    Figure 0007064682000095

    Figure 0007064682000096
    に復号して
    Figure 0007064682000097
    を計算センターに送信し、
    最後に、
    Figure 0007064682000098
    を計算センターに送信し、
    (7)計算センターが
    Figure 0007064682000099
    及び
    Figure 0007064682000100
    を受信し、各
    Figure 0007064682000101
    に対して次の操作を実行し、
    (a)
    Figure 0007064682000102
    であり、
    (b)以下の計算を行うことにより、ノイズの影響を除去し、
    Figure 0007064682000103
    (c)次のように分類モデルパラメータの更新を行い、
    Figure 0007064682000104
    (8)反復回数に達していない場合、ステップ(3)に戻ることを特徴とする準同型暗号に基づくプライバシー保護多機関データ分類方法。
  2. 前記ステップ(4)において、公開鍵がデータの暗号化に使用され、秘密鍵がデータの復号に使用され、公開鍵及び秘密鍵を生成する具体的なステップが次のとおりであり、
    (1)一元多項式の生成ルール
    Figure 0007064682000105
    に従って多項式fと多項式gを生成し、
    Figure 0007064682000106
    は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
    fは以下の(a)~(b)を満足し、
    (a)多項式環R にfの逆元f-1が存在し、R におけるすべての多項式の係数が(-q/2,q/2)の中の整数であり、すべての多項式の最高次数がn-1であり、環のモジュロが多項式x+1であり、
    (b)
    Figure 0007064682000107
    であり、
    (2)公開鍵pk及び秘密鍵skを生成し、
    Figure 0007064682000108
    であり、
    Figure 0007064682000109
    であることを特徴とする請求項に記載の準同型暗号に基づくプライバシー保護多機関データ分類方法。
  3. 前記ステップ(5)において、各データ提供装置が公開鍵によりトレーニングデータを暗号化する過程が次のとおりであり、
    (1)平文のビット長
    Figure 0007064682000110
    にし、
    (2)暗号化対象の整数平文μについて、
    Figure 0007064682000111
    が求められ、
    (3)一元多項式の生成ルール
    Figure 0007064682000112
    に従ってL個の多項式S~S及びL個の多項式E~Eを生成し、
    Figure 0007064682000113
    は、多項式の次数がn-1であることと、多項式のすべての係数がいずれも平均値が0であり、標準偏差がσである離散正規分布のサンプリングにより取得されることとを満足し、
    (4)暗号文Cを生成し、暗号文CがL個の多項式を含み、i番目の暗号文における多項式Cの式が、
    Figure 0007064682000114
    であることを特徴とする請求項に記載の準同型暗号に基づくプライバシー保護多機関データ分類方法。
  4. 前記ステップ(6)において、準同型暗号における論理回帰分析の実行過程において各データ提供装置がデータ復号を行い、具体的なステップが次のとおりであり、
    (1)暗号文Cにおけるすべての多項式をそれぞれ秘密鍵skに乗じて、次の式を取得し、
    Figure 0007064682000115
    (2)μfを生成し、具体的な式が次のとおりであり、
    Figure 0007064682000116
    (3)μfの各係数をいずれも2に乗じてから秘密鍵skの対応係数で割って、復号結果μを取得し、その式が次のとおりであり、
    Figure 0007064682000117
    式中、roundが床関数であり、(μf)がμfのi項目の係数であり、skが秘密鍵のi項目の係数であることを特徴とする請求項に記載の準同型暗号に基づくプライバシー保護多機関データ分類方法。
JP2021533328A 2019-07-12 2020-04-07 準同型暗号に基づくプライバシー保護多機関データ分類方法 Active JP7064682B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910629833.7A CN110190946B (zh) 2019-07-12 2019-07-12 一种基于同态加密的隐私保护多机构数据分类方法
CN201910629833.7 2019-07-12
PCT/CN2020/083590 WO2020233260A1 (zh) 2019-07-12 2020-04-07 一种基于同态加密的隐私保护多机构数据分类方法

Publications (2)

Publication Number Publication Date
JP2022508351A JP2022508351A (ja) 2022-01-19
JP7064682B2 true JP7064682B2 (ja) 2022-05-11

Family

ID=67725575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021533328A Active JP7064682B2 (ja) 2019-07-12 2020-04-07 準同型暗号に基づくプライバシー保護多機関データ分類方法

Country Status (3)

Country Link
JP (1) JP7064682B2 (ja)
CN (1) CN110190946B (ja)
WO (1) WO2020233260A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110190946B (zh) * 2019-07-12 2021-09-03 之江实验室 一种基于同态加密的隐私保护多机构数据分类方法
CN111062487B (zh) * 2019-11-28 2021-04-20 支付宝(杭州)信息技术有限公司 基于数据隐私保护的机器学习模型特征筛选方法及装置
CN111159727B (zh) * 2019-12-11 2022-12-09 西安交通大学医学院第一附属医院 一种面向多方协同的贝叶斯分类器安全生成***及方法
CN111143862B (zh) * 2019-12-13 2021-07-09 支付宝(杭州)信息技术有限公司 数据处理方法、查询方法、装置、电子设备和***
CN111898137A (zh) * 2020-06-30 2020-11-06 深圳致星科技有限公司 一种联邦学习的隐私数据处理方法、设备及***
CN111859440B (zh) * 2020-08-21 2022-12-23 安徽大学 基于混合协议的分布式隐私保护逻辑回归模型的样本分类方法
CN112104446A (zh) * 2020-09-03 2020-12-18 哈尔滨工业大学 一种基于同态加密的多方联合机器学习方法和***
CN112597379B (zh) * 2020-12-04 2023-09-01 光大科技有限公司 数据识别方法、装置和存储介质及电子装置
CN114691167A (zh) * 2020-12-31 2022-07-01 华为技术有限公司 机器学习模型更新的方法和装置
CN112685783B (zh) * 2021-01-05 2024-02-27 西安电子科技大学 金融许可区块链中支持隐私保护的数据共享方法
CN112929151B (zh) * 2021-01-25 2023-06-30 苏宁金融科技(南京)有限公司 基于隐私保护的实体对齐方法及计算机存储介质
CN112818369B (zh) * 2021-02-10 2024-03-29 ***股份有限公司 一种联合建模方法及装置
CN112949741B (zh) * 2021-03-18 2023-04-07 西安电子科技大学 基于同态加密的卷积神经网络图像分类方法
CN112948883B (zh) * 2021-03-25 2023-10-31 支付宝(杭州)信息技术有限公司 保护隐私数据的多方联合建模的方法、装置和***
CN113158232A (zh) * 2021-03-26 2021-07-23 北京融数联智科技有限公司 一种隐私数据的计算方法、装置及计算机设备
CN113282935A (zh) * 2021-05-19 2021-08-20 中原银行股份有限公司 一种基于模型的预测方法、装置和存储介质
CN113434873A (zh) * 2021-06-01 2021-09-24 内蒙古大学 一种基于同态加密的联邦学习隐私保护方法
CN113626858B (zh) * 2021-07-21 2024-07-16 西安电子科技大学 隐私保护k-means聚类方法、设备、介质、终端
CN113554182B (zh) * 2021-07-27 2023-09-19 西安电子科技大学 一种横向联邦学习***中拜占庭节点的检测方法及***
KR102615381B1 (ko) * 2021-08-24 2023-12-19 서울대학교산학협력단 동형 암호를 활용한 사적 변수의 보안 방법 및 장치
CN113821810B (zh) * 2021-08-26 2024-03-08 上海赢科信息技术有限公司 数据处理方法及***、存储介质及电子设备
CN113938266B (zh) * 2021-09-18 2024-03-26 桂林电子科技大学 基于整数向量同态加密的垃圾邮件过滤器训练方法及***
CN113935050A (zh) * 2021-09-26 2022-01-14 平安科技(深圳)有限公司 基于联邦学习的特征提取方法和装置、电子设备、介质
CN114528564B (zh) * 2022-01-25 2024-08-02 河南大学 基于密文特征的通用密码算法识别方法
CN114696991B (zh) * 2022-05-31 2022-09-20 蓝象智联(杭州)科技有限公司 基于同态加密的数据聚类方法及装置
CN115276948B (zh) * 2022-07-20 2023-04-07 京信数据科技有限公司 一种同态加密计算方法及***
CN115442134B (zh) * 2022-09-02 2024-05-07 暨南大学 一种基于同态双向代理重加密的多密钥多方安全计算方法
CN115587139B (zh) * 2022-11-03 2024-03-22 国网江苏省电力有限公司营销服务中心 一种基于同态加密的分布式隐私保护分类方法及***
CN115622685B (zh) * 2022-12-16 2023-04-28 成方金融科技有限公司 隐私数据同态加密方法、装置及***
CN116011552A (zh) * 2023-03-24 2023-04-25 摩尔线程智能科技(北京)有限责任公司 模型训练方法、推理方法、装置、***、设备及存储介质
CN116800906B (zh) * 2023-08-22 2023-11-07 北京电子科技学院 一种基于模分量同态的密文卷积神经网络图像分类方法
CN117411731B (zh) * 2023-12-15 2024-03-01 江西师范大学 一种基于lof算法的加密ddos流量异常检测方法
CN117792637A (zh) * 2024-01-04 2024-03-29 北京睿航至臻科技有限公司 基于深度学习的动态数据加密方法
CN118152898B (zh) * 2024-05-11 2024-07-26 山东大学 一种基于深度学习的数据隐私保护的心电分类方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712260A (zh) 2018-05-09 2018-10-26 曲阜师范大学 云环境下保护隐私的多方深度学习计算代理方法
JP2018207222A (ja) 2017-05-31 2018-12-27 パナソニックIpマネジメント株式会社 カメラ及びパラメータ登録方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249250B2 (en) * 2009-03-30 2012-08-21 Mitsubishi Electric Research Laboratories, Inc. Secure similarity verification between homomorphically encrypted signals
US9325671B2 (en) * 2014-02-19 2016-04-26 Raytheon Bbn Technologies Corp. System and method for merging encryption data using circular encryption key switching
KR101726619B1 (ko) * 2015-04-14 2017-04-26 삼성에스디에스 주식회사 암호화 데이터 관리 방법 및 장치
US20170293913A1 (en) * 2016-04-12 2017-10-12 The Governing Council Of The University Of Toronto System and methods for validating and performing operations on homomorphically encrypted data
US20190007212A1 (en) * 2017-06-30 2019-01-03 Intel Corporation Secure unlock systems for locked devices
CN108521326B (zh) * 2018-04-10 2021-02-19 电子科技大学 一种基于向量同态加密的隐私保护的线性svm模型训练方法
CN109033854B (zh) * 2018-07-17 2020-06-09 阿里巴巴集团控股有限公司 基于模型的预测方法和装置
CN109359588B (zh) * 2018-10-15 2021-02-09 电子科技大学 一种新的隐私保护下非交互式的k近邻分类方法
CN109858269B (zh) * 2019-02-20 2022-11-01 安徽师范大学 一种基于同态加密的隐私保护密度峰聚类方法
CN110190946B (zh) * 2019-07-12 2021-09-03 之江实验室 一种基于同态加密的隐私保护多机构数据分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018207222A (ja) 2017-05-31 2018-12-27 パナソニックIpマネジメント株式会社 カメラ及びパラメータ登録方法
CN108712260A (zh) 2018-05-09 2018-10-26 曲阜师范大学 云环境下保护隐私的多方深度学习计算代理方法

Also Published As

Publication number Publication date
WO2020233260A1 (zh) 2020-11-26
JP2022508351A (ja) 2022-01-19
CN110190946B (zh) 2021-09-03
CN110190946A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
JP7064682B2 (ja) 準同型暗号に基づくプライバシー保護多機関データ分類方法
Chinnasamy et al. HCAC-EHR: hybrid cryptographic access control for secure EHR retrieval in healthcare cloud
JP5911654B2 (ja) 乱数生成器及びストリーム暗号
Andrushkevych et al. A prospective lightweight block cipher for green IT engineering
Chinnasamy et al. Design of secure storage for health-care cloud using hybrid cryptography
CN110235409A (zh) 使用同态加密被保护的rsa签名或解密的方法
US20140208101A1 (en) Confidential computation system, confidential computation method, and confidential computation program
US8976960B2 (en) Methods and apparatus for correlation protected processing of cryptographic operations
Kh-Madhloom et al. ECG Encryption Enhancement Technique with Multiple Layers of AES and DNA Computing.
Paje et al. Multidimensional key RC6 algorithm
Priya et al. FPGA implementation of efficient AES encryption
Dawood et al. Design large symmetric algorithm for securing big data
Riddhi et al. An efficient algorithm for dynamic key generation for image encryption
Buell Modern symmetric ciphers—Des and Aes
Dadhich et al. Security of healthcare systems with smart health records using cloud technology
JP7383985B2 (ja) 情報処理装置、情報処理方法及びプログラム
Quinga-Socasi et al. A deep learning approach for symmetric-key cryptography system
Zakaria et al. Modifications of key schedule algorithm on RECTANGLE block cipher
Moon et al. A cryptographic algorithm based on ASCII and number system conversions along with a cyclic mathematical function
Buja et al. The direction of lightweight ciphers in mobile big data computing
Shah et al. Encrypting grayscale images using S-boxes chosen by logistic map
Shi et al. Obfuscatable multi-recipient re-encryption for secure privacy-preserving personal health record services
Al-Attab et al. Lightweight effective encryption algorithm for securing data in cloud computing
Abdulhamid et al. Development of blowfish encryption scheme for secure data storage in public and commercial cloud computing environment
Al-Kareem et al. A review of the most effective cryptography techniques based on conventional block cipher and lightweight

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210610

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220330

R150 Certificate of patent or registration of utility model

Ref document number: 7064682

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150