JP7075362B2 - 判定装置、判定方法及び判定プログラム - Google Patents
判定装置、判定方法及び判定プログラム Download PDFInfo
- Publication number
- JP7075362B2 JP7075362B2 JP2019009273A JP2019009273A JP7075362B2 JP 7075362 B2 JP7075362 B2 JP 7075362B2 JP 2019009273 A JP2019009273 A JP 2019009273A JP 2019009273 A JP2019009273 A JP 2019009273A JP 7075362 B2 JP7075362 B2 JP 7075362B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- sample
- matrices
- determination
- cumulative probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本実施形態に係る悪性データの判定方法では、強調フィルタリングに用いられる正規の評価行列に対して、追加で与えられた評価行列が悪性データであることを、コルモゴロフ・スミルノフ検定を用いて判定する。
コルモゴロフ・スミルノフ検定は、正規分布を仮定するt検定と異なり、分布によらないノンパラメトリックな検定手法の一つであり、これにより、評価値に関する分布の形状を仮定せずに、正規ユーザによる評価行列と悪性ユーザによる評価行列とが区別される。
協調フィルタリングでは、評価行列Mを分析することで、Mにおける未観測な要素の値を推定する。
本実施形態の判定装置1は、正規ユーザの評価行列Mに対して、評価行列M’が追加で与えられたときに、この評価行列M’が正規ユーザによるものか、悪性ユーザにより混入されたものかを判定する。
判定装置1は、サーバ装置又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10及び記憶部20の他、各種データの入出力デバイス及び通信デバイス等を備える。
算出部11は、例えば、評価行列M及びM’に格納された観測された評価値の集合を標本とし、評価値のヒストグラムを表す累積確率分布を算出する。
また、算出部11は、例えば、二つの評価行列M及びM’における互いに対応する部分を標本とし、これらの標本における評価値の有無のヒストグラムを表す累積確率分布を算出する。具体的には、算出部11は、評価行列M及びM’におけるアイテムの単位の部分行列を標本としてよい。
また、判定部12は、二つの評価行列M及びM’において、条件を満たす部分集合の数(アイテムの個数)が所定以上の場合に、二つの評価行列M及びM’の母集団が同一でないと判定してもよい。
判定装置1は、例えば、以下に示す第1の判定方法又は第2の判定方法を採用する。また、判定装置1は、第1の判定方法及び第2の判定方法を共に実行し、いずれの方法においても母集団が同一でないと判定される場合に、評価行列M’が悪性な評価データであると判定してもよい。
第1の判定方法では、判定装置1は、コルモゴロフ・スミルノフ検定を用いて、評価行列M及びM’のそれぞれに含まれる観測された評価値の累積確率分布の差に基づいて、M’が悪性ユーザの評価行列であるかどうかを判定する。
なお、コルモゴロフ・スミルノフ検定を用いるにあたって、Xを正規ユーザの評価値の標本とし、X’を悪性ユーザの評価値の標本とする。また、帰無仮説を「XとX’の母集団が同一である」とする。
ここで、xは、評価行列M及びM’に含まれる観測された評価値である。例えば、評価行列M及びM’の要素として、各アイテムに対する実際の評価値1~5と、無評価を示す0とが混在する場合、算出部11は、無評価の0を除く評価値x(=1~5)のヒストグラムから、累積確率分布を算出する。
D=maxx|P(x)-Q(x)|
第2の判定方法では、判定装置1は、コルモゴロフ・スミルノフ検定を用いて、評価行列M及びM’のそれぞれにおける各アイテムに対する評価の付け方の違いに基づいて、M’が悪性ユーザの評価行列であるかどうかを判定する。
なお、コルモゴロフ・スミルノフ検定を用いるにあたって、Xjを正規ユーザによるj番目のアイテムに対する評価値の標本とし、Xj’を悪性ユーザによるj番目のアイテムに対する評価値の標本とする。ただし、評価値は、0又は1の2値、すなわち、ユーザがj番目のアイテムを評価していれば評価の高低に関わらず1、評価していなければ0とする。また、帰無仮説を「XjとXj’の母集団が同一である」とする。
ここで、xは、前述の0又は1の評価値である。例えば、評価行列M及びM’の要素として、各アイテムに対する実際の評価値1~5と、無評価を示す0とが混在する場合、算出部11は、評価なし(x=0)と評価あり(x=1)のヒストグラムから、累積確率分布を求める。
D=maxx|P(x)-Q(x)|
したがって、判定装置1は、正規分布等の特定の分布形状に従わない評価データを扱う協調フィルタリングシステムにおいても、データポイゾニング攻撃の影響を抑えられる。
このとき、判定装置1は、母集団が同一でないと判定されたアイテムの個数が所定以上の場合に、二つの評価行列の母集団も同一でなく、悪性ユーザの評価データが追加されたと判定してもよい。これにより、判定装置1は、特定のアイテムのみで判定することによる誤検出を抑制し、悪性データを適切に判定できる。
10 制御部
11 算出部
12 判定部
20 記憶部
Claims (5)
- ユーザ毎の複数のアイテムに対する評価値が格納される評価行列において、前記評価値の標本に関する累積確率分布を算出する算出部と、
互いに異なる二つの評価行列それぞれの前記累積確率分布の差、及び前記二つの評価行列それぞれにおけるユーザ数に基づく指標が所定の有意水準に基づく条件を満たす場合に、前記二つの評価行列の母集団が同一でないと判定する判定部と、を備え、
前記算出部は、前記評価行列における一つ以上の特定のアイテム群に対応する部分行列を前記標本とし、当該標本における前記評価値の有無を変数としたヒストグラムから前記累積確率分布を算出する判定装置。 - 前記算出部は、前記評価行列における前記アイテムの単位の部分行列を前記標本とする請求項1に記載の判定装置。
- 前記判定部は、前記二つの評価行列において、前記条件を満たす前記アイテムの個数が所定以上の場合に、前記二つの評価行列の母集団が同一でないと判定する請求項2に記載の判定装置。
- ユーザ毎の複数のアイテムに対する評価値が格納される評価行列において、前記評価値の標本に関する累積確率分布を算出する算出ステップと、
互いに異なる二つの評価行列それぞれの前記累積確率分布の差、及び前記二つの評価行列それぞれにおけるユーザ数に基づく指標が所定の有意水準に基づく条件を満たす場合に、前記二つの評価行列の母集団が同一でないと判定する判定ステップと、をコンピュータが実行し、
前記算出ステップにおいて、前記評価行列における一つ以上の特定のアイテム群に対応する部分行列を前記標本とし、当該標本における前記評価値の有無を変数としたヒストグラムから前記累積確率分布を算出する判定方法。 - ユーザ毎の複数のアイテムに対する評価値が格納される評価行列において、前記評価値の標本に関する累積確率分布を算出する算出ステップと、
互いに異なる二つの評価行列それぞれの前記累積確率分布の差、及び前記二つの評価行列それぞれにおけるユーザ数に基づく指標が所定の有意水準に基づく条件を満たす場合に、前記二つの評価行列の母集団が同一でないと判定する判定ステップと、をコンピュータに実行させ、
前記算出ステップにおいて、前記評価行列における一つ以上の特定のアイテム群に対応する部分行列を前記標本とし、当該標本における前記評価値の有無を変数としたヒストグラムから前記累積確率分布を算出させるための判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009273A JP7075362B2 (ja) | 2019-01-23 | 2019-01-23 | 判定装置、判定方法及び判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009273A JP7075362B2 (ja) | 2019-01-23 | 2019-01-23 | 判定装置、判定方法及び判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020119201A JP2020119201A (ja) | 2020-08-06 |
JP7075362B2 true JP7075362B2 (ja) | 2022-05-25 |
Family
ID=71890833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019009273A Active JP7075362B2 (ja) | 2019-01-23 | 2019-01-23 | 判定装置、判定方法及び判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7075362B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7169663B2 (ja) * | 2019-06-13 | 2022-11-11 | 株式会社大一商会 | 遊技機 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012150561A (ja) | 2011-01-17 | 2012-08-09 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦装置及び方法及びプログラム |
JP2018197662A (ja) | 2017-05-23 | 2018-12-13 | 株式会社島津製作所 | 質量分析データ解析装置及び質量分析データ解析用プログラム |
-
2019
- 2019-01-23 JP JP2019009273A patent/JP7075362B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012150561A (ja) | 2011-01-17 | 2012-08-09 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦装置及び方法及びプログラム |
JP2018197662A (ja) | 2017-05-23 | 2018-12-13 | 株式会社島津製作所 | 質量分析データ解析装置及び質量分析データ解析用プログラム |
Non-Patent Citations (2)
Title |
---|
LI,Bo et al.,Data Poisoning Attacks on Factorization-Based Collaborative Filtering,[online],v2,米国,arXiv,2016年10月05日,pages:1-13,[令和3年10月26日検索],インターネット<URL:https://arxiv.org/pdf/1608.08182.pdf> |
William H Press 著、丹慶勝市 他訳,NUMERICAL RECIPES in C(ニューメリカルレシピ・イン・シー C言語による数値計算のレシピ) ,第1版,株式会社技術評論社,1994年08月25日,第457頁-第463頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2020119201A (ja) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11689549B2 (en) | Continuous learning for intrusion detection | |
Baldwin et al. | Leveraging support vector machine for opcode density based detection of crypto-ransomware | |
US8479296B2 (en) | System and method for detecting unknown malware | |
WO2019128529A1 (zh) | Url攻击检测方法、装置以及电子设备 | |
CN106713324B (zh) | 一种流量检测方法及装置 | |
US20060206935A1 (en) | Apparatus and method for adaptively preventing attacks | |
US8997256B1 (en) | Systems and methods for detecting copied computer code using fingerprints | |
CN106803039B (zh) | 一种恶意文件的同源判定方法及装置 | |
CN111914257A (zh) | 文档检测的方法、装置、设备、及计算机存储介质 | |
CN112632609A (zh) | 异常检测方法、装置、电子设备及存储介质 | |
JP7075362B2 (ja) | 判定装置、判定方法及び判定プログラム | |
CN105224954B (zh) | 一种基于Single-pass去除小话题影响的话题发现方法 | |
CN113793076A (zh) | 一种风险池动态监测方法、***、设备和可读存储介质 | |
CN112464297A (zh) | 硬件木马检测方法、装置及存储介质 | |
CN116662954A (zh) | 统一安全管理平台的异常用户的检测方法和计算机设备 | |
CN115758336A (zh) | 一种资产识别方法及装置 | |
CN110197066B (zh) | 一种云计算环境下的虚拟机监控方法及监控*** | |
CN114510720A (zh) | 一种基于特征融合和NLP技术的Android恶意软件分类方法 | |
CN113806737A (zh) | 一种恶意进程风险等级评估方法、终端设备及存储介质 | |
KR101872406B1 (ko) | 악성코드들의 위험도를 정량적으로 결정하는 장치 및 방법 | |
CN110689074A (zh) | 一种基于模糊集特征熵值计算的特征选择方法 | |
CN115329316B (zh) | 权限处理方法、装置、存储介质和电子设备 | |
Rueda et al. | A hybrid intrusion detection approach based on deep learning techniques | |
CN113704761B (zh) | 恶意文件的检测方法、装置、计算机设备及存储介质 | |
CN115086022B (zh) | 一种调整安全评估指标体系的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7075362 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |