JP6649875B2 - Information processing apparatus, information processing method, program, and information processing system - Google Patents

Information processing apparatus, information processing method, program, and information processing system Download PDF

Info

Publication number
JP6649875B2
JP6649875B2 JP2016252628A JP2016252628A JP6649875B2 JP 6649875 B2 JP6649875 B2 JP 6649875B2 JP 2016252628 A JP2016252628 A JP 2016252628A JP 2016252628 A JP2016252628 A JP 2016252628A JP 6649875 B2 JP6649875 B2 JP 6649875B2
Authority
JP
Japan
Prior art keywords
feature
matrix
test
factor matrix
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016252628A
Other languages
Japanese (ja)
Other versions
JP2018106453A (en
Inventor
慧 米川
慧 米川
塁 木村
塁 木村
村松 茂樹
茂樹 村松
亜令 小林
亜令 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2016252628A priority Critical patent/JP6649875B2/en
Publication of JP2018106453A publication Critical patent/JP2018106453A/en
Application granted granted Critical
Publication of JP6649875B2 publication Critical patent/JP6649875B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Description

本発明は、情報処理装置、情報処理方法、プログラム、情報処理システム、及び通信端末に関する。   The present invention relates to an information processing device, an information processing method, a program, an information processing system, and a communication terminal.

近年、機械学習による認識・推定技術が急激に発展してきている。例えば特許文献1には、大規模データセットを利用して画像内に含まれる複数の物体(又は対象)について、各物体が何であるかを自動的に認識する技術が開示されている。   In recent years, recognition / estimation techniques using machine learning have been rapidly developed. For example, Patent Literature 1 discloses a technique for automatically recognizing what each object is about a plurality of objects (or objects) included in an image using a large-scale data set.

特許第5823270号公報Japanese Patent No. 5823270

上記のような技術では、認識対象を認識するための何らかの特徴量に基づいて認識・推定処理が実行される。したがって、認識・推定処理を実行する装置がネットワーク上にあるような場合には、通信ネットワークを介してその装置に特徴量を送信しなければならない。   In the above technique, recognition / estimation processing is executed based on some feature amount for recognizing a recognition target. Therefore, when a device that executes the recognition / estimation processing is on a network, the feature amount must be transmitted to the device via a communication network.

しかしながら、通信ネットワークを介して送信される情報が、例えば企業が保有する個人情報等を用いた特徴量となれば、その特徴量をそのまま外部に送信することは個人情報流出のリスクを高めるため許容しがたい。したがって、そのような特徴量を除いた他の特徴量から、認識・推定処理を実行することができることが求められている。   However, if the information transmitted via the communication network is, for example, a feature using personal information or the like owned by a company, transmitting the feature as it is to the outside as it is allowed to increase the risk of leaking personal information. It is difficult. Therefore, it is required that the recognition / estimation process can be executed from other feature amounts excluding such a feature amount.

そこで、本発明はこれらの点に鑑みてなされたものであり、複数の特徴量のうちの一部の特徴量を用いて、他の特徴量を補完する技術を提供することを目的とする。   Therefore, the present invention has been made in view of these points, and an object of the present invention is to provide a technique of using a part of a plurality of feature amounts to complement another feature amount.

本発明の第1の態様は、情報処理装置である。この装置は、N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを格納する特徴因子行列格納部と、P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得する試験行列取得部と、前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する特徴因子抽出部と、前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するユーザ因子抽出部と、前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する欠損情報推定部と、を備える。   A first aspect of the present invention is an information processing device. This apparatus generates feature vectors each having M elements (M is an integer of 2 or more), each of which includes a numerical value indicating a feature amount associated with each of N users (N is an integer of 2 or more). Feature matrix storage unit that stores a feature factor matrix F when a matrix configured by arranging a plurality of feature vectors obtained by performing the above is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F And a feature vector having a numerical value indicating a feature amount associated with each of P users (P is an integer of 2 or more) as elements, and Q types (Q is 1 or more and less than M) of the M types of feature amounts A test matrix acquisition unit configured to acquire a test matrix T formed by arranging a plurality of feature vectors generated and obtained for each of the feature amounts of (i) and the test matrix T of the feature factor matrix F. Characteristic A feature factor extraction unit that generates a test feature factor matrix Ft obtained by extracting a component corresponding to a vector and a missing feature factor matrix Fl composed of other components; A user factor extraction unit that calculates a test user factor matrix Ut that is approximated by a product of a matrix Ut and the test feature factor matrix Ft, and a product of the test user factor matrix Ut and the missing feature factor matrix Fl. A missing information estimating unit that acquires an estimated value of a missing feature vector that is not included in the feature vectors that constitute T.

前記特徴因子抽出部は、前記試験行列Tを構成する特徴ベクトルに含まれない特徴量である欠損特徴量を特定するための情報をさらに取得してもよい。   The feature factor extraction unit may further acquire information for specifying a missing feature amount that is a feature amount not included in a feature vector included in the test matrix T.

前記情報処理装置は、N人のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を取得する教師行列取得部と、前記教師行列取得部が取得した行列を、交互最小二乗法(Alternative Least Squares)を用いてユーザ因子行列Uと特徴因子行列Fとの2つの行列の積に分解する行列分解部と、をさらに備えてもよく、前記特徴因子行列格納部は、前記行列分解部が分解した前記特徴因子行列Fを格納してもよい。   The information processing device is configured by arranging a plurality of feature vectors obtained by generating a feature vector having a numerical value indicating a feature amount associated with each of N users as an element for each of M types of feature amounts. A teacher matrix acquisition unit that acquires a matrix, and a matrix acquired by the teacher matrix acquisition unit are converted into a product of two matrices of a user factor matrix U and a feature factor matrix F using an alternate least squares method (Alternative Least Squares). A matrix factorization unit for decomposing, and the feature factor matrix storage unit may store the feature factor matrix F decomposed by the matrix factorization unit.

前記ユーザ因子抽出部は、最小二乗法を用いて、前記試験行列Tと前記試験特徴因子行列Ftとから前記試験ユーザ因子行列Utを算出してもよい。   The user factor extraction unit may calculate the test user factor matrix Ut from the test matrix T and the test feature factor matrix Ft using a least squares method.

前記特徴量は、前記ユーザの個人情報に関する特徴量であってもよい。   The characteristic amount may be a characteristic amount relating to the personal information of the user.

前記情報処理装置は、前記M種類の特徴ベクトルに対応する特徴量に基づいてあらかじめ機械学習によって得られた識別器を格納する識別器格納部と、前記試験行列Tと前記欠損特徴ベクトルとを用いて、前記P人のユーザそれぞれに関するM種類の特徴ベクトルから構成される推定行列Meを生成する推定行列生成部と、前記推定行列Meを構成する特徴ベクトルと前記識別器とに基づいて、前記P人のユーザそれぞれに関する識別処理を実行する識別部と、前記識別処理の結果を、前記試験行列Tを送信した通信端末に送信する送信部と、をさらに備えてもよい。   The information processing device uses a classifier storage unit that stores a classifier obtained in advance by machine learning based on feature amounts corresponding to the M types of feature vectors, and uses the test matrix T and the missing feature vector. An estimation matrix generation unit configured to generate an estimation matrix Me including M types of feature vectors for each of the P users; and the P vector based on the feature vectors configuring the estimation matrix Me and the discriminator. The apparatus may further include an identification unit that executes an identification process for each of the human users, and a transmission unit that transmits a result of the identification process to the communication terminal that has transmitted the test matrix T.

本発明の第2の態様は、情報処理方法である。この方法において、プロセッサが、N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを取得するステップと、P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得するステップと、前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成するステップと、前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するステップと、前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得するステップと、を実行する。   A second aspect of the present invention is an information processing method. In this method, the processor generates M types (M is an integer of 2 or more) of feature vectors, each of which includes a numerical value indicating a feature amount associated with each of N users (N is an integer of 2 or more). Obtaining a feature factor matrix F in a case where a matrix configured by arranging a plurality of feature vectors generated and obtained for each is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F; , And P (where P is an integer of 2 or more) the feature vectors each having a numerical value indicating the feature amount associated with each of the users, and Q types (Q is 1 or more and less than M) of the M types of feature amounts Obtaining a test matrix T configured by arranging a plurality of feature vectors generated and obtained for each of the (integer) feature amounts, and configuring the test matrix T among the feature factor matrices F. Generating a test feature factor matrix Ft obtained by extracting a component corresponding to the feature vector and a missing feature factor matrix Fl composed of other components; and converting the test matrix T into a test user factor matrix Ut Calculating a test user factor matrix Ut that is approximated by the product of the test feature factor matrix Ft and the product of the test user factor matrix Ut and the missing feature factor matrix Fl. Obtaining an estimated value of the missing feature vector not included in the vector.

本発明の第3の態様は、プログラムである。このプログラムは、コンピュータに、N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを取得する機能と、P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得する機能と、前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する機能と、前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出する機能と、前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する機能と、を実現させる。   A third aspect of the present invention is a program. This program stores in a computer a feature vector having M elements (N is an integer of 2 or more) indicating numerical values indicating feature amounts associated with N users (N is an integer of 2 or more). A function of obtaining a feature factor matrix F in a case where a matrix configured by arranging a plurality of feature vectors generated and obtained for each is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F; , And P (where P is an integer of 2 or more) the feature vectors each having a numerical value indicating the feature amount associated with each of the users, and Q types (Q is 1 or more and less than M) of the M types of feature amounts (Integer), a function of acquiring a test matrix T formed by arranging a plurality of feature vectors obtained and obtained for each of the feature amounts, and a feature matrix constituting the test matrix T among the feature factor matrices F. A function for generating a test feature factor matrix Ft obtained by extracting a component corresponding to a tor and a missing feature factor matrix Fl composed of other components, and a test user factor matrix Ut A function of calculating a test user factor matrix Ut approximated by a product of the test feature factor matrix Ft, and a feature vector constituting the test matrix T from a product of the test user factor matrix Ut and the missing feature factor matrix Fl And a function of obtaining an estimated value of the missing feature vector not included in the above.

本発明の第4の態様は、通信端末と、ネットワークを介して前記通信端末と通信する情報処理装置と、を備える情報処理システムである。このシステムにおいて、前記情報処理装置は、N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを格納する特徴因子行列格納部と、P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを、前記ネットワークを介して前記通信端末から取得する試験行列取得部と、前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する特徴因子抽出部と、前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するユーザ因子抽出部と、前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する欠損情報推定部と、を備える。前記通信端末は、P人のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列から、所定の特徴量に対応する特徴ベクトルを除いたQ種類の特徴ベクトルから構成される試験行列Tを生成する試験行列生成部と、前記ネットワークを介して前記試験行列Tを前記情報処理装置に送信する試験行列送信部と、を備える。   A fourth aspect of the present invention is an information processing system including a communication terminal and an information processing device that communicates with the communication terminal via a network. In this system, the information processing apparatus may include M types (M is an integer of 2 or more) of feature vectors each having a value indicating a feature amount associated with each of N users (N is an integer of 2 or more). A feature factor matrix F is stored when a matrix formed by arranging a plurality of feature vectors generated and obtained for each of the feature amounts is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F. A feature vector matrix storage unit and a feature vector having elements representing numerical values indicating feature amounts associated with P users (P is an integer of 2 or more) as Q elements (Q types) of the M types of feature amounts (Q is an integer of 1 or more and less than M). A test matrix T configured by arranging a plurality of feature vectors generated and obtained for each of the feature amounts is obtained from the communication terminal via the network. Test matrix acquisition unit, a test feature factor matrix Ft obtained by extracting a component corresponding to the feature vector constituting the test matrix T from the feature factor matrix F, and a missing feature composed of other components. A feature factor extraction unit that generates a factor matrix Fl, and a user factor extraction unit that calculates a test user factor matrix Ut that approximates the test matrix T by a product of a test user factor matrix Ut and the test feature factor matrix Ft. A loss information estimating unit that obtains, from a product of the test user factor matrix Ut and the missing feature factor matrix Fl, an estimated value of a missing feature vector not included in the feature vectors forming the test matrix T. The communication terminal is configured by arranging a plurality of feature vectors obtained by generating, for each of the M types of feature amounts, a feature vector including a numerical value indicating a feature amount associated with each of the P users. A test matrix generation unit configured to generate a test matrix T composed of Q types of feature vectors excluding a feature vector corresponding to a predetermined feature amount from a matrix, and the test matrix T via the network. And a test matrix transmission unit for transmitting the test matrix.

本発明の第5の態様は、通信端末と、ネットワークを介して前記通信端末と通信する情報処理装置と、を備える情報処理システムにおける前記通信端末である。この通信端末は、P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列から、所定の特徴量に対応する特徴ベクトルを除いたQ種類の特徴ベクトルから構成される試験行列Tを生成する試験行列生成部と、前記ネットワークを介して前記試験行列Tを前記情報処理装置に送信する試験行列送信部と、前記情報処理装置において、前記試験行列生成部が除いた欠損特徴ベクトルを推定するためにあらかじめ定められた特徴因子行列Fに基づいて推定された欠損特徴ベクトルと、前記試験行列Tとから、前記P人のユーザそれぞれに関する識別処理を実行された結果を受信する識別結果受信部と、を備える。   A fifth aspect of the present invention is the communication terminal in the information processing system that includes a communication terminal and an information processing device that communicates with the communication terminal via a network. This communication terminal generates a plurality of feature vectors obtained by generating, for each of the M types of feature values, feature vectors each having a value indicating a feature value associated with each of P users (P is an integer of 2 or more). A test matrix generation unit configured to generate a test matrix T composed of Q types of feature vectors excluding a feature vector corresponding to a predetermined feature amount from a matrix configured by arranging feature vectors; A test matrix transmission unit that transmits a matrix T to the information processing device; and an estimation unit that estimates a missing feature vector removed by the test matrix generation unit in the information processing device based on a predetermined feature factor matrix F. Identification result receiving unit that receives the result of executing the identification process for each of the P users from the obtained missing feature vector and the test matrix T , Comprising a.

本発明によれば、複数の特徴量のうちの一部の特徴量を用いて、他の特徴量を補完することができる。   According to the present invention, a part of a plurality of feature amounts can be used to complement another feature amount.

実施の形態に係る情報処理システムの構成を模式的に示す図である。FIG. 1 is a diagram schematically illustrating a configuration of an information processing system according to an embodiment. 実施の形態に係る情報処理装置の機能構成を模式的に示す図である。FIG. 2 is a diagram schematically illustrating a functional configuration of the information processing apparatus according to the embodiment. 特徴行列のデータ構造を模式的に示す図である。It is a figure which shows the data structure of a characteristic matrix typically. 実施の形態に係る特徴行列生成部の機能構成を模式的に示す図である。FIG. 4 is a diagram schematically illustrating a functional configuration of a feature matrix generation unit according to the embodiment. 特徴行列と特徴因子行列との関係を説明するための図である。FIG. 4 is a diagram for explaining a relationship between a feature matrix and a feature factor matrix. 実施の形態に係る情報推定部の機能構成を模式的に示す図である。FIG. 4 is a diagram schematically illustrating a functional configuration of an information estimating unit according to the embodiment. 実施の形態に係る情報推定部が実行する推定処理を説明するための模式図である。FIG. 9 is a schematic diagram for describing an estimation process performed by an information estimation unit according to the embodiment. 実施の形態に係る識別実行部の機能構成を模式的に示す図である。It is a figure which shows typically the functional structure of the identification execution part which concerns on embodiment. 通信端末の機能構成を模式的に示す図である。It is a figure which shows the functional structure of a communication terminal typically. 実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。5 is a flowchart for explaining a flow of information processing executed by the information processing apparatus according to the embodiment.

<実施の形態の概要>
図1を参照して、実施の形態の概要を述べる。
図1は、実施の形態に係る情報処理システムSの構成を模式的に示す図である。実施の形態に係る情報処理システムSは、情報処理装置1と、ネットワークNを介して情報処理装置1と通信する通信端末2とを備える。情報処理装置1は、例えばブレードサーバやクラウドサーバ等の既知の計算機、及び大容量記憶装置から構成される。情報処理装置1は、複数の特徴量に基づいてあらかじめ機械学習によって得られた識別器を保持しており、ネットワークNを介して通信端末2から取得した特徴量に基づいて、識別処理を実行することができる。
<Overview of Embodiment>
An outline of the embodiment will be described with reference to FIG.
FIG. 1 is a diagram schematically illustrating a configuration of an information processing system S according to an embodiment. The information processing system S according to the embodiment includes an information processing device 1 and a communication terminal 2 that communicates with the information processing device 1 via a network N. The information processing device 1 includes a known computer such as a blade server and a cloud server, for example, and a mass storage device. The information processing apparatus 1 holds a classifier obtained in advance by machine learning based on a plurality of feature amounts, and executes an identification process based on the feature amount obtained from the communication terminal 2 via the network N. be able to.

通信端末2は、利用者が管理しているPC(Personal Computer)やワークステーション等の計算機である。通信端末2の利用者は、情報処理装置1に識別処理を実行させるために、ネットワークNを介して識別処理に必要な特徴量を情報処理装置1に送信する。   The communication terminal 2 is a computer such as a PC (Personal Computer) or a workstation managed by the user. The user of the communication terminal 2 transmits a feature amount required for the identification processing to the information processing apparatus 1 via the network N in order to cause the information processing apparatus 1 to execute the identification processing.

図1においては一つの通信端末2のみを図示しているが、情報処理装置1は複数の異なる利用者がそれぞれ管理する複数の異なる通信端末2とも通信可能である。情報処理装置1を維持管理する管理者は、例えば特定の個人情報等、個々の利用者では取得することが難しい情報を取得することができる。このため情報処理装置1は、個々の利用者では取得することが難しい情報から抽出された特徴量を用いる識別器を保持することができる。これにより、利用者は、自身では保持することができない識別器を用いた識別処理を、情報処理装置1に実行させることが可能となる。   Although only one communication terminal 2 is shown in FIG. 1, the information processing device 1 can communicate with a plurality of different communication terminals 2 managed by a plurality of different users. The administrator who maintains and manages the information processing apparatus 1 can acquire information, such as specific personal information, which is difficult for individual users to acquire. For this reason, the information processing device 1 can hold a classifier that uses a feature amount extracted from information that is difficult for individual users to acquire. This allows the user to cause the information processing apparatus 1 to execute an identification process using an identifier that cannot be held by the user.

ここで、一般にある装置が識別器を用いた識別処理を実行する際には、学習時に用いた特徴量と同じ種類の特徴量が必要となる。これはすなわち、情報処理装置1が保持する識別器が、個人情報に関する特徴量等のように一般に秘匿することが望まれている特徴量を用いる場合、通信端末2の利用者が情報処理装置1に識別処理を実行させるためにはそのような特徴量を情報処理装置1に提供する必要があることを意味する。通信端末2の利用者はそのような特徴量を郵送等のオフラインで情報処理装置1に提供することも考えられるが、利便性や速度、紛失の懸念等を考慮すると、必ずしも最適な解決策とは言えない。   Here, in general, when a certain device executes a classification process using a classifier, the same type of feature amount as that used at the time of learning is required. That is, when the discriminator held by the information processing device 1 uses a feature amount that is generally desired to be concealed, such as a feature amount related to personal information, the user of the communication terminal 2 can use the information processing device 1 Means that it is necessary to provide such information to the information processing apparatus 1 in order to cause the information processing apparatus 1 to execute the identification processing. It is conceivable that the user of the communication terminal 2 provides such a feature amount to the information processing apparatus 1 off-line by mail or the like. However, considering the convenience, speed, concern about loss, and the like, it is not necessarily the best solution. I can't say.

そこで実施の形態に係る情報処理装置1は、識別器を実行するために必要な特徴量のうち、秘匿することが望まれている特徴量を除いた特徴量を通信端末2から取得する。情報処理装置1は、通信端末2から取得した特徴量に基づいて、除かれている特徴量を推定して補完する。情報処理装置1は、通信端末2から取得した特徴量と補完した特徴量とに基づいて、識別器を用いた識別処理を実行して結果を通信端末2に送信する。これにより、利用者は、秘匿することが望まれている特徴量を情報処理装置1に送信することなく、そのような特徴量を用いた識別器による識別処理の結果を得ることができる。
以下、実施の形態に係る情報処理装置1についてより詳細に説明する。
Therefore, the information processing apparatus 1 according to the embodiment acquires, from the communication terminal 2, a feature amount excluding a feature amount desired to be concealed among feature amounts required to execute the classifier. The information processing apparatus 1 estimates and complements the removed feature based on the feature acquired from the communication terminal 2. The information processing device 1 executes an identification process using an identifier based on the feature amount acquired from the communication terminal 2 and the complemented feature amount, and transmits the result to the communication terminal 2. Accordingly, the user can obtain the result of the identification processing by the classifier using such a feature amount without transmitting the feature amount desired to be kept secret to the information processing apparatus 1.
Hereinafter, the information processing apparatus 1 according to the embodiment will be described in more detail.

<情報処理装置1の機能構成>
図2は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。実施の形態に係る情報処理装置1は、通信部10、記憶部20、及び制御部30を備える。
<Functional Configuration of Information Processing Apparatus 1>
FIG. 2 is a diagram schematically illustrating a functional configuration of the information processing apparatus 1 according to the embodiment. The information processing device 1 according to the embodiment includes a communication unit 10, a storage unit 20, and a control unit 30.

通信部10は、情報処理装置1が通信端末2との間で情報を送受信するための通信インタフェースである。記憶部20は、OS(Operating System)やアプリケーションプログラム等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、その他、識別器等の各種情報を格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。記憶部20の大容量記憶装置には、特徴因子行列格納部21及び識別器格納部22が格納されている。   The communication unit 10 is a communication interface through which the information processing device 1 transmits and receives information to and from the communication terminal 2. The storage unit 20 stores various information such as a ROM (Read Only Memory) for storing an OS (Operating System), an application program, and the like, a RAM (Random Access Memory) as a work area of the information processing apparatus 1, and other identifiers. It is a large-capacity storage device such as a hard disk drive (HDD) or a solid state drive (SSD). In the mass storage device of the storage unit 20, a feature factor matrix storage unit 21 and a discriminator storage unit 22 are stored.

制御部30は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部20に記憶されたプログラムを実行することによって特徴行列生成部31、情報推定部32、及び識別実行部33として機能する。   The control unit 30 is a processor such as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit) of the information processing device 1, and executes a program stored in the storage unit 20 to execute the feature matrix generation unit 31 and the information estimation. It functions as the unit 32 and the identification execution unit 33.

特徴因子行列格納部21は、N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルであって、各特徴ベクトルはM種類(Mは2以上の整数)の特徴量それぞれについて生成して得られたN個の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを格納する。   The feature factor matrix storage unit 21 is a feature vector having, as elements, numerical values indicating feature amounts associated with N users (N is an integer of 2 or more), and each feature vector has M types (M is 2 A matrix formed by arranging N feature vectors generated and obtained for each of the above-described feature amounts (the above integers) by a product of two matrices of a user factor matrix U and a feature factor matrix F The factor matrix F is stored.

[特徴行列Ms]
以下、特徴因子行列格納部21が格納する特徴因子行列Fについて説明するが、その前提となる特徴行列Msについてまず説明する。特徴行列Msは、特徴行列生成部31によって生成される。
[Feature matrix Ms]
Hereinafter, the feature factor matrix F stored in the feature factor matrix storage unit 21 will be described. First, the feature matrix Ms as a premise thereof will be described. The feature matrix Ms is generated by the feature matrix generation unit 31.

図3は、特徴行列Msのデータ構造を模式的に示す図である。また図4は、実施の形態に係る特徴行列生成部31の機能構成を模式的に示す図である。特徴行列生成部31は、教師行列取得部311と行列分解部312とを含む。   FIG. 3 is a diagram schematically illustrating the data structure of the feature matrix Ms. FIG. 4 is a diagram schematically illustrating a functional configuration of the feature matrix generation unit 31 according to the embodiment. The feature matrix generation unit 31 includes a teacher matrix acquisition unit 311 and a matrix decomposition unit 312.

上述したように、特徴行列Msは、N人の個人それぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数個の特徴ベクトルを並べて構成される行列であり、図3では太線の矩形で示されている。図3に示す例において、ユーザIDはN人の個人それぞれを一意に特定するための識別子を表し、特徴量IDはM種類の特徴量それぞれを一意に特定するための識別子を表す。   As described above, the feature matrix Ms includes a plurality of feature vectors obtained by generating feature vectors each having a numerical value indicating a feature amount associated with each of N individuals for each of M types of feature amounts. Are arranged in a matrix, and are shown by thick rectangles in FIG. In the example shown in FIG. 3, the user ID represents an identifier for uniquely identifying each of the N individuals, and the feature amount ID represents an identifier for uniquely identifying each of the M types of feature amounts.

図3において、特徴量IDがF00001で特定される特徴量は、各個人の年齢を示す数値である。また、特徴量IDがF00002で特定される特徴量は、各個人の性別を0(男性)又は1(女性)で数値化したものである。例えば図3に示す例は、ユーザIDがU00001で特定される個人の年齢は23歳、U00002で特定される個人の年齢は34歳、U0XXXXで特定される個人の年齢は18歳であることを示している。   In FIG. 3, the feature amount specified by the feature amount ID F00001 is a numerical value indicating the age of each individual. The feature amount specified by the feature amount ID F00002 is obtained by quantifying the gender of each individual by 0 (male) or 1 (female). For example, the example shown in FIG. 3 indicates that the age of the individual identified by the user ID U00001 is 23, the age of the individual identified by U00002 is 34, and the age of the individual identified by U0XXXX is 18 years. Is shown.

このように、特徴行列Msの各列は、特定の特徴量に対応する数値を要素とする縦ベクトルとなっている。特徴行列Msは、各特徴量に対応するM個の縦ベクトルを並べて構成されるN行M列の行列である。特徴行列Msは各人の個人情報が含まれるデータであり、実施の形態に係る情報処理システムSにおいては情報処理装置1を維持管理する管理者でなければ入手が困難な情報を含んでいる。   As described above, each column of the feature matrix Ms is a vertical vector having elements corresponding to numerical values corresponding to specific feature amounts. The feature matrix Ms is a matrix of N rows and M columns configured by arranging M vertical vectors corresponding to each feature amount. The feature matrix Ms is data including personal information of each person, and in the information processing system S according to the embodiment, includes information that is difficult to obtain unless a manager who maintains and manages the information processing apparatus 1.

教師行列取得部311は、N人の個人それぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べることにより、特徴行列Msを生成する。一例として、Nの値は数万であり、Mの値は数千である。   The teacher matrix acquisition unit 311 arranges a plurality of feature vectors obtained by generating, for each of the M types of feature amounts, a feature vector having a numerical value indicating a feature amount associated with each of the N individuals as an element. , A feature matrix Ms. As an example, the value of N is tens of thousands and the value of M is thousands.

[特徴行列Msと特徴因子行列Fとの関係]
行列分解部312は、教師行列取得部311が取得した特徴行列Msを、例えば交互最小二乗法(Alternative Least Squares)等の既知の行列分解手法を用いてユーザ因子行列Uと特徴因子行列Fとの2つの行列の積に分解する。行列分解部312は、特徴行列Msを分解することで得られた特徴因子行列Fを特徴因子行列格納部21に格納する。
[Relationship between feature matrix Ms and feature factor matrix F]
The matrix factorization unit 312 converts the feature matrix Ms acquired by the teacher matrix acquisition unit 311 into a user factor matrix U and a feature factor matrix F using a known matrix factorization method such as, for example, an alternate least squares method (Alternative Least Squares). Decompose into the product of two matrices. The matrix factorization unit 312 stores the feature factor matrix F obtained by decomposing the feature matrix Ms in the feature factor matrix storage unit 21.

図5は、特徴行列Ms、ユーザ因子行列U、及び特徴因子行列Fの関係を説明するための図である。図5に示すように、行列分解部312は、特徴行列Msをユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似する。ここでユーザ因子行列UはN行K列の行列であり、特徴因子行列FはK行M列の行列である。   FIG. 5 is a diagram for explaining the relationship among the feature matrix Ms, the user factor matrix U, and the feature factor matrix F. As shown in FIG. 5, the matrix decomposition unit 312 approximates the feature matrix Ms by a product of two matrices of a user factor matrix U and a feature factor matrix F. Here, the user factor matrix U is a matrix with N rows and K columns, and the feature factor matrix F is a matrix with K rows and M columns.

ここでKは、行列分解部312が特徴行列Msを分解するときに設定する因子パラメータであり、任意の正の整数を設定することができる。Kの具体的な値は特徴行列Msのランク等を考慮して実験により定めればよい。一例としては、誤差行列Eの二乗誤差esqrを最小化するKを以下のように設定してもよい。 Here, K is a factor parameter set when the matrix decomposition section 312 decomposes the feature matrix Ms, and can be set to any positive integer. The specific value of K may be determined by experiment in consideration of the rank of the feature matrix Ms and the like. As an example, K that minimizes the square error e sqr of the error matrix E may be set as follows.

誤差行列Eを以下の式(1)で定義する。
E=Ms−U×F (1)
The error matrix E is defined by the following equation (1).
E = Ms−U × F (1)

誤差行列Eのi行j列の成分をeijとしたとき、Kの値は以下の式(2)で与えられる。

Figure 0006649875
ここでargmin(x)は、xが最小となるパラメータを意味する。 Assuming that the component at the i-th row and the j-th column of the error matrix E is e ij , the value of K is given by the following equation (2).
Figure 0006649875
Here, argmin (x) means a parameter that minimizes x.

図5に示すように、ユーザ因子行列Uは行の長さがNであり、個人の数と一致する。一方特徴因子行列Fは列の長さがMであり、特徴量の数と一致する。特徴行列Ms≒ユーザ因子行列U×特徴因子行列Fの定義から、ユーザ因子行列Uの各行はそれぞれ各個人を表現する情報を保持し、特徴因子行列Fの各列はそれぞれ各特徴量を表現するとみることもできる。例えばユーザIDがU00001で特定される個人の、特徴量IDがF00001で特定される特徴量の値は、ユーザ因子行列Uの第1行と特徴因子行列Fの第1列との内積をとることで得られる。教師行列取得部311及び行列分解部312は、情報処理装置1を維持管理する管理者が特徴行列Msを更新する度に特徴因子行列Fを生成し、特徴因子行列格納部21に格納させる特徴因子行列Fを更新する。   As shown in FIG. 5, the user factor matrix U has a row length of N, which is equal to the number of individuals. On the other hand, the feature factor matrix F has a column length M, which is equal to the number of feature values. From the definition of the feature matrix Ms ≒ user factor matrix U × feature factor matrix F, each row of the user factor matrix U holds information expressing each individual, and each column of the feature factor matrix F expresses each feature amount. You can also see. For example, the value of the feature amount of the individual whose user ID is specified by U00001 and whose feature amount ID is specified by F00001 is the inner product of the first row of the user factor matrix U and the first column of the feature factor matrix F. Is obtained. The teacher matrix acquisition unit 311 and the matrix decomposition unit 312 generate a feature factor matrix F each time the administrator who maintains the information processing apparatus 1 updates the feature matrix Ms, and stores the feature factor matrix F in the feature factor matrix storage unit 21. Update the matrix F.

[特徴因子行列Fを用いた欠損データの推定]
特徴因子行列格納部21が特徴因子行列Fを格納していることを前提として、特徴因子行列Fを用いることによる欠損データの推定処理について説明する。
[Estimation of Missing Data Using Feature Factor Matrix F]
Assuming that the feature factor matrix storage unit 21 stores the feature factor matrix F, a process of estimating missing data using the feature factor matrix F will be described.

図6は、実施の形態に係る情報推定部32の機能構成を模式的に示す図である。実施の形態に係る情報推定部32は、試験行列取得部321、特徴因子抽出部322、ユーザ因子抽出部323、及び欠損情報推定部324を含む。
試験行列取得部321は、ネットワークNを介して通信端末2から試験行列Tを取得する。試験行列Tは、P人(Pは2以上の整数)の個人それぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列である。
FIG. 6 is a diagram schematically illustrating a functional configuration of the information estimating unit 32 according to the embodiment. The information estimation unit 32 according to the embodiment includes a test matrix acquisition unit 321, a feature factor extraction unit 322, a user factor extraction unit 323, and a missing information estimation unit 324.
The test matrix acquisition unit 321 acquires a test matrix T from the communication terminal 2 via the network N. The test matrix T includes a feature vector having a numerical value indicating a feature amount associated with each of P individuals (P is an integer of 2 or more) as an element, and Q types (Q is 1 or more) of M types of feature amounts. This is a matrix formed by arranging a plurality of feature vectors generated for each of the feature amounts (an integer less than M).

ここで通信端末2の利用者は、P人の個人それぞれに関連付けられたM種類の特徴量のうち、情報処理装置1に提供することを望まない(M−Q)種類の特徴量を除くことにより、通信端末2に試験行列Tを生成させる。なお、P人の個人は特徴行列Msを構成する特徴ベクトルに対応付けられた個人でなくてもよいが、Q種類の特徴量は特徴行列Msの特徴量に含まれる特徴量と同種の特徴量である。   Here, the user of the communication terminal 2 removes (MQ) types of feature amounts that the user does not want to provide to the information processing apparatus 1 among the M types of feature amounts associated with each of the P individuals. As a result, the communication terminal 2 generates the test matrix T. The P individuals need not be the individuals associated with the feature vectors constituting the feature matrix Ms, but the Q types of feature amounts are the same type of feature amounts as the feature amounts included in the feature amount of the feature matrix Ms. It is.

特徴因子抽出部322は、特徴因子行列Fを特徴因子行列格納部21から読み出す。特徴因子抽出部322は、読み出した特徴因子行列Fのうち、試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flと、を生成する。このため、特徴因子抽出部322は、試験行列Tを構成する特徴ベクトルに含まれない特徴量である欠損特徴量を特定するための情報も、通信端末2から取得する。   The feature factor extraction unit 322 reads the feature factor matrix F from the feature factor matrix storage unit 21. The feature factor extracting unit 322 extracts a test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector forming the test matrix T from the read feature factor matrix F, and a defect configured by other components. And a feature factor matrix Fl. For this reason, the feature factor extraction unit 322 also acquires from the communication terminal 2 information for specifying a missing feature amount, which is a feature amount not included in the feature vector forming the test matrix T.

特徴因子抽出部322が取得する欠損特徴量を特定するための情報は、例えば試験行列Tを構成する特徴ベクトルに含まれない特徴量IDであってもよいし、試験行列Tを構成する特徴ベクトルに含まれる特徴量IDであってもよい。後者の場合、特徴因子抽出部322は、試験行列Tを構成する特徴ベクトルに含まれる特徴量ID以外の特徴量IDで特定される特徴量を、欠損特徴量として特定すればよい。   The information for specifying the missing feature amount acquired by the feature factor extracting unit 322 may be, for example, a feature amount ID not included in a feature vector forming the test matrix T, or a feature vector forming the test matrix T. May be the feature amount ID included in. In the latter case, the feature factor extraction unit 322 may specify a feature value specified by a feature value ID other than the feature value ID included in the feature vector forming the test matrix T as a missing feature value.

ユーザ因子抽出部323は、試験行列Tを、試験ユーザ因子行列Utと試験特徴因子行列Ftとの積で近似するための試験ユーザ因子行列Utを算出する。より具体的には、ユーザ因子抽出部323は、最小二乗法を用いて、試験行列Tと試験特徴因子行列Ftとから試験ユーザ因子行列Utを算出する。欠損情報推定部324は、試験ユーザ因子行列Utと欠損特徴因子行列Flとの積から、試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値から構成される欠損行列Mlを取得する。欠損行列Mlの各列が、欠損特徴ベクトルの推定値である。これにより、欠損情報推定部324は、通信端末2から取得した試験行列Tには含まれない(M−Q)種類の特徴量の推定値を取得することができる。   The user factor extraction unit 323 calculates a test user factor matrix Ut for approximating the test matrix T with a product of the test user factor matrix Ut and the test feature factor matrix Ft. More specifically, the user factor extraction unit 323 calculates the test user factor matrix Ut from the test matrix T and the test feature factor matrix Ft using the least squares method. The missing information estimating unit 324 acquires a missing matrix Ml composed of estimated values of missing feature vectors not included in the feature vectors constituting the test matrix T from a product of the test user factor matrix Ut and the missing feature factor matrix Fl. I do. Each column of the missing matrix Ml is an estimated value of the missing feature vector. Thereby, the loss information estimating unit 324 can obtain the estimated values of the (MQ) types of feature amounts that are not included in the test matrix T obtained from the communication terminal 2.

図7は、実施の形態に係る情報推定部32が実行する推定処理を説明するための模式図である。なお、以下に記載する(1)から(6)までの流れは、図7中の(1)から(6)に対応する。なお、図7において破線の矩形は、図5に示す特徴行列Ms、ユーザ因子行列U、及び特徴因子行列Fの関係を説明するための図と同一である。また図7において斜線で示す行列は、各推定処理によって得られる行列である。   FIG. 7 is a schematic diagram illustrating an estimation process performed by the information estimation unit 32 according to the embodiment. Note that the flow from (1) to (6) described below corresponds to (1) to (6) in FIG. Note that the dashed rectangle in FIG. 7 is the same as the diagram for explaining the relationship between the feature matrix Ms, the user factor matrix U, and the feature factor matrix F shown in FIG. In FIG. 7, the matrices indicated by oblique lines are matrices obtained by the respective estimation processes.

(1)教師行列取得部311は、N人の個人それぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べることにより、特徴行列Msを生成する。(2)行列分解部312は、教師行列取得部311が取得した特徴行列Msを、交互最小二乗法を用いてユーザ因子行列Uと特徴因子行列Fとの2つの行列の積に分解する。特徴因子行列格納部21は、行列分解部312が特徴行列Msを分解して生成した特徴因子行列Fを格納する。以上が、情報処理装置1があらかじめ実行するいわば前処理である。   (1) The teacher matrix acquiring unit 311 generates a plurality of feature vectors obtained by generating, for each of the M types of feature values, a feature vector having a numerical value indicating a feature value associated with each of the N individuals as an element. By arranging, the feature matrix Ms is generated. (2) The matrix decomposing unit 312 decomposes the feature matrix Ms acquired by the teacher matrix acquiring unit 311 into a product of two matrices of a user factor matrix U and a feature factor matrix F using an alternating least squares method. The feature factor matrix storage unit 21 stores a feature factor matrix F generated by decomposing the feature matrix Ms by the matrix decomposition unit 312. The above is the so-called pre-processing executed by the information processing apparatus 1 in advance.

(3)試験行列取得部321は、ネットワークNを介して通信端末2から試験行列Tを取得する。(4)特徴因子抽出部322は、特徴因子行列格納部21から読み出した特徴因子行列Fのうち、試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flと、を生成する。(5)ユーザ因子抽出部323は、試験ユーザ因子行列Utと試験特徴因子行列Ftとの積で試験行列Tを近似するための試験ユーザ因子行列Utを、最小二乗法を用いて算出する。   (3) The test matrix acquisition unit 321 acquires the test matrix T from the communication terminal 2 via the network N. (4) The feature factor extraction unit 322 extracts a test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector forming the test matrix T from the feature factor matrix F read from the feature factor matrix storage unit 21. , And a missing feature factor matrix Fl composed of other components. (5) The user factor extraction unit 323 calculates a test user factor matrix Ut for approximating the test matrix T with a product of the test user factor matrix Ut and the test feature factor matrix Ft using the least square method.

(6)欠損情報推定部324は、試験ユーザ因子行列Utと欠損特徴因子行列Flとの積から、試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値から構成される欠損行列Mlを取得する。欠損行列Mlの各列は、通信端末2から取得した試験行列Tには含まれない(M−Q)種類の特徴量の推定値を要素とするベクトルとなっている。   (6) The missing information estimating unit 324 is based on the product of the test user factor matrix Ut and the missing feature factor matrix Fl, and is a missing matrix composed of estimated values of missing feature vectors not included in the feature vectors constituting the test matrix T. Obtain Ml. Each column of the missing matrix Ml is a vector whose elements are estimated values of (MQ) types of feature amounts that are not included in the test matrix T acquired from the communication terminal 2.

[推定した特徴量を用いた識別処理]
上述したように、実施の形態に係る情報処理装置1は、個々の利用者では取得することが難しい情報から抽出された特徴量を用いる識別器を保持している。具体的には、情報処理装置1における識別器格納部22は、M種類の特徴ベクトルに対応する特徴量に基づいてあらかじめ機械学習によって得られた識別器を格納している。情報処理装置1は、試験行列取得部321がネットワークNを介して通信端末2から取得した試験行列Tと、欠損情報推定部324が推定した欠損行列Mlとから、M種類の特徴量をすべて含むP行M列の行列を取得することができる。情報処理装置1における識別実行部33は、この行列と識別器とに基づいて識別処理を実行する。
[Identification Processing Using Estimated Features]
As described above, the information processing apparatus 1 according to the embodiment holds the discriminator that uses a feature amount extracted from information that is difficult to obtain for each user. Specifically, the discriminator storage unit 22 in the information processing device 1 stores discriminators obtained in advance by machine learning based on feature amounts corresponding to M types of feature vectors. The information processing device 1 includes all M types of feature amounts from the test matrix T acquired by the test matrix acquisition unit 321 from the communication terminal 2 via the network N and the missing matrix Ml estimated by the missing information estimation unit 324. A matrix with P rows and M columns can be obtained. The identification execution unit 33 in the information processing device 1 executes an identification process based on the matrix and the identifier.

図8は、実施の形態に係る識別実行部33の機能構成を模式的に示す図である。実施の形態に係る識別実行部33は、推定行列生成部331、識別部332、及び送信部333を含む。推定行列生成部331は、試験行列Tと欠損行列Mlとを用いて、P人の個人それぞれに関するM種類の特徴ベクトルから構成される推定行列Meを生成する。   FIG. 8 is a diagram schematically illustrating a functional configuration of the identification execution unit 33 according to the embodiment. The identification execution unit 33 according to the embodiment includes an estimation matrix generation unit 331, an identification unit 332, and a transmission unit 333. The estimation matrix generation unit 331 uses the test matrix T and the missing matrix Ml to generate an estimation matrix Me including M types of feature vectors for each of the P individuals.

識別部332は、推定行列Meを構成する特徴ベクトルと識別器とに基づいて、P人の個人それぞれに関する識別処理を実行する。送信部333は、識別処理の結果を、試験行列Tを送信した通信端末2に送信する。   The identification unit 332 performs an identification process for each of the P individuals based on the feature vectors and the classifiers forming the estimation matrix Me. The transmitting unit 333 transmits the result of the identification processing to the communication terminal 2 that has transmitted the test matrix T.

[通信端末2の機能構成]
図9は、通信端末2の機能構成を模式的に示す図である。通信端末2は、試験行列生成部201、試験行列送信部202、及び識別結果受信部203を含む。
試験行列生成部201は、P人の個人それぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列から、所定の特徴量に対応する特徴ベクトルを除いたQ種類の特徴ベクトルから構成される試験行列Tを生成する。ここで「所定の特徴量」とは、通信端末2から情報処理装置1に対して秘匿する特徴量であり、上述したM−Q種類の特徴量である。
[Functional Configuration of Communication Terminal 2]
FIG. 9 is a diagram schematically illustrating a functional configuration of the communication terminal 2. The communication terminal 2 includes a test matrix generation unit 201, a test matrix transmission unit 202, and an identification result reception unit 203.
The test matrix generation unit 201 is configured by arranging a plurality of feature vectors obtained by generating, for each of M types of feature amounts, a feature vector having a numerical value indicating a feature amount associated with each of the P individuals. A test matrix T composed of Q kinds of feature vectors excluding a feature vector corresponding to a predetermined feature amount is generated from the matrix. Here, the “predetermined feature amount” is a feature amount that is concealed from the communication terminal 2 to the information processing device 1, and is the above-described MQ type feature amount.

試験行列送信部202は、ネットワークNを介して試験行列Tを情報処理装置1に送信する。識別結果受信部203は、情報処理装置1において、特徴因子行列Fに基づいて推定された欠損特徴ベクトルと、試験行列Tとから、P人のユーザそれぞれに関する識別処理を実行された結果を受信する。これにより、通信端末2の利用者は、情報処理装置1に提供することを望まない(M−Q)種類の特徴量を除いた情報のみを情報処理装置1に送信するだけで、それらの情報の利用を前提とする識別器による識別処理の結果を得ることができる。   The test matrix transmission unit 202 transmits the test matrix T to the information processing device 1 via the network N. The identification result receiving unit 203 receives, from the information processing apparatus 1, a result of executing the identification processing for each of the P users from the missing feature vector estimated based on the feature factor matrix F and the test matrix T. . As a result, the user of the communication terminal 2 transmits only information excluding (M−Q) types of feature amounts that the user does not want to provide to the information processing device 1 to the information processing device 1. Can be obtained as a result of the classification processing by the classifier on the premise of the use of.

<情報処理装置1が実行する情報処理方法の処理フロー>
図10は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1の電源が投入されたときに開始する。
<Processing flow of information processing method executed by information processing apparatus 1>
FIG. 10 is a flowchart illustrating a flow of information processing executed by information processing apparatus 1 according to the embodiment. The processing in this flowchart is started, for example, when the information processing apparatus 1 is turned on.

試験行列取得部321は、ネットワークNを介して通信端末2から試験行列Tを取得する(S2)。特徴因子抽出部322は、特徴因子行列Fを特徴因子行列格納部21から読み出す(S4)。特徴因子抽出部322は、読み出した特徴因子行列Fのうち、試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftを取得する(S6)。   The test matrix acquisition unit 321 acquires the test matrix T from the communication terminal 2 via the network N (S2). The feature factor extraction unit 322 reads the feature factor matrix F from the feature factor matrix storage unit 21 (S4). The feature factor extraction unit 322 acquires a test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector forming the test matrix T from the read feature factor matrix F (S6).

特徴因子抽出部322はまた、読み出した特徴因子行列Fのうち、試験行列Tを構成する特徴ベクトルに対応する成分以外の成分で構成される欠損特徴因子行列Flを抽出する(S8)。ユーザ因子抽出部323は、試験ユーザ因子行列Utと試験特徴因子行列Ftとの積で試験行列Tを近似するための試験ユーザ因子行列Utを算出する(S10)。欠損情報推定部324は、試験ユーザ因子行列Utと欠損特徴因子行列Flとの積から、試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する(S12)。欠損情報推定部324が欠損特徴ベクトルの推定値を取得すると、本フローチャートにおける処理は終了する。   The feature factor extraction unit 322 also extracts a missing feature factor matrix Fl composed of components other than the components corresponding to the feature vectors forming the test matrix T from the read feature factor matrix F (S8). The user factor extraction unit 323 calculates a test user factor matrix Ut for approximating the test matrix T by a product of the test user factor matrix Ut and the test feature factor matrix Ft (S10). The missing information estimating unit 324 acquires an estimated value of a missing feature vector not included in the feature vectors forming the test matrix T from the product of the test user factor matrix Ut and the missing feature factor matrix Fl (S12). When the missing information estimating unit 324 acquires the estimated value of the missing feature vector, the processing in this flowchart ends.

<情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、識別器が利用する複数の特徴量のうちの一部の特徴量を用いて、他の特徴量を補完することができる。これにより、識別器を利用しようとする者は、例えばその識別器が個人情報等の秘匿されるべき情報を用いるものであっても、そのような情報を提供することなく識別結果を得ることができる。
<Effects of Information Processing Apparatus 1>
As described above, according to the information processing apparatus 1 according to the embodiment, it is possible to use a part of the plurality of feature amounts used by the classifier to complement other feature amounts. . This allows a person who intends to use the classifier to obtain a classification result without providing such information, for example, even if the classifier uses confidential information such as personal information. it can.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。特に、装置の分散・統合の具体的な実施形態は以上に図示するものに限られず、その全部又は一部について、種々の付加等に応じて、又は、機能負荷に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。   As described above, the present invention has been described using the embodiments, but the technical scope of the present invention is not limited to the scope described in the above embodiments. It is apparent to those skilled in the art that various changes or improvements can be made to the above embodiment. In particular, the specific embodiment of the distribution / integration of the apparatus is not limited to the above-described one, and all or a part of the apparatus is arbitrarily added according to various additions or the like, or according to a functional load. It can be configured to be distributed or integrated functionally or physically.

上記では、特徴行列Msの各列が個人毎のある特徴量を並べて構成されるベクトルである場合について説明した。ここで特徴行列生成部31は、特徴行列Msの各列が所定の規格化条件を満たすように特徴行列Msを生成してもよい。ここで「所定の規格化条件」とは、特徴行列Msの各列又は行に共通に備えさせる条件である。具体的には、特徴行列生成部31は、特徴行列Msの各列又は行の総和が一定となるように特徴行列Msを生成する。あるいは特徴行列生成部31は、特徴行列Msの各列又は行の分散が一定となるように特徴行列Msを生成してもよい。これにより、行列分解部312が交互最小二乗法を用いる際やユーザ因子抽出部323が最小二乗法を用いる際に、処理対象の行列の各列又は行に係る重みを平準化することができる。   The case where each column of the feature matrix Ms is a vector configured by arranging certain feature amounts for each individual has been described above. Here, the feature matrix generation unit 31 may generate the feature matrix Ms such that each column of the feature matrix Ms satisfies a predetermined normalization condition. Here, the “predetermined normalization condition” is a condition commonly provided for each column or row of the feature matrix Ms. Specifically, the feature matrix generation unit 31 generates the feature matrix Ms such that the sum of each column or row of the feature matrix Ms is constant. Alternatively, the feature matrix generation unit 31 may generate the feature matrix Ms such that the variance of each column or row of the feature matrix Ms is constant. Thus, when the matrix decomposition section 312 uses the alternating least squares method or when the user factor extraction section 323 uses the least squares method, it is possible to level the weights of each column or row of the processing target matrix.

1・・・情報処理装置
2・・・通信端末
10・・・通信部
20・・・記憶部
21・・・特徴因子行列格納部
22・・・識別器格納部
30・・・制御部
31・・・特徴行列生成部
32・・・情報推定部
33・・・識別実行部
201・・・試験行列生成部
202・・・試験行列送信部
203・・・識別結果受信部
311・・・教師行列取得部
312・・・行列分解部
321・・・試験行列取得部
322・・・特徴因子抽出部
323・・・ユーザ因子抽出部
324・・・欠損情報推定部
331・・・推定行列生成部
332・・・識別部
333・・・送信部
N・・・ネットワーク
S・・・情報処理システム

DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus 2 ... Communication terminal 10 ... Communication part 20 ... Storage part 21 ... Feature factor matrix storage part 22 ... Classifier storage part 30 ... Control part 31 ··· Feature matrix generation unit 32 ··· Information estimation unit 33 ··· Identification execution unit 201 ··· Test matrix generation unit 202 ··· Test matrix transmission unit 203 ··· Identification result reception unit 311 ··· Teacher matrix Acquisition unit 312 Matrix decomposition unit 321 Test matrix acquisition unit 322 Feature factor extraction unit 323 User factor extraction unit 324 Loss information estimation unit 331 Estimation matrix generation unit 332 ... Identifying unit 333 ... Transmitting unit N ... Network S ... Information processing system

Claims (9)

N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを格納する特徴因子行列格納部と、
P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得する試験行列取得部と、
前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する特徴因子抽出部と、
前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するユーザ因子抽出部と、
前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する欠損情報推定部と、
を備える情報処理装置。
A feature vector is generated by generating, for each of M types (M is an integer of 2 or more) of feature amounts, feature vectors each having a numerical value indicating a feature amount associated with each of N users (N is an integer of 2 or more). A feature factor matrix storage unit that stores a feature factor matrix F when a matrix configured by arranging the plurality of feature vectors is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F;
A feature vector having a numerical value indicating a feature amount associated with each of P users (P is an integer of 2 or more) as elements is used for Q types (Q is an integer of 1 or more and less than M) of the M types of feature amounts. A) a test matrix obtaining unit configured to obtain a test matrix T configured by arranging a plurality of feature vectors obtained and generated for each of the feature amounts;
A test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector constituting the test matrix T from the feature factor matrix F and a missing feature factor matrix Fl composed of other components are generated. A feature factor extraction unit that performs
A user factor extraction unit that calculates a test user factor matrix Ut that approximates the test matrix T by a product of a test user factor matrix Ut and the test feature factor matrix Ft;
A missing information estimating unit that obtains an estimated value of a missing feature vector not included in a feature vector forming the test matrix T from a product of the test user factor matrix Ut and the missing feature factor matrix Fl;
An information processing apparatus comprising:
前記特徴因子抽出部は、前記試験行列Tを構成する特徴ベクトルに含まれない特徴量である欠損特徴量を特定するための情報をさらに取得する、
請求項1に記載の情報処理装置。
The feature factor extraction unit further obtains information for specifying a missing feature amount that is a feature amount not included in a feature vector included in the test matrix T.
The information processing device according to claim 1.
N人のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を取得する教師行列取得部と、
前記教師行列取得部が取得した行列を、交互最小二乗法(Alternative Least Squares)を用いてユーザ因子行列Uと特徴因子行列Fとの2つの行列の積に分解する行列分解部と、をさらに備え、
前記特徴因子行列格納部は、前記行列分解部が分解した前記特徴因子行列Fを格納する、
請求項1又は2に記載の情報処理装置。
A teacher matrix for obtaining a matrix formed by arranging a plurality of feature vectors obtained by generating feature vectors each having a value indicating a feature amount associated with each of N users for each of M types of feature amounts An acquisition unit;
A matrix decomposing unit that decomposes the matrix acquired by the teacher matrix acquiring unit into a product of two matrices of a user factor matrix U and a feature factor matrix F using an alternative least squares method (Alternative Least Squares). ,
The feature factor matrix storage unit stores the feature factor matrix F decomposed by the matrix factorization unit.
The information processing device according to claim 1.
前記ユーザ因子抽出部は、最小二乗法を用いて、前記試験行列Tと前記試験特徴因子行列Ftとから前記試験ユーザ因子行列Utを算出する、
請求項1から3のいずれか一項に記載の情報処理装置。
The user factor extraction unit calculates the test user factor matrix Ut from the test matrix T and the test feature factor matrix Ft using a least square method.
The information processing device according to claim 1.
前記特徴量は、前記ユーザの個人情報に関する特徴量である、
請求項1から4のいずれか一項に記載の情報処理装置。
The feature amount is a feature amount related to the personal information of the user.
The information processing apparatus according to claim 1.
前記M種類の特徴ベクトルに対応する特徴量に基づいてあらかじめ機械学習によって得られた識別器を格納する識別器格納部と、
前記試験行列Tと前記欠損特徴ベクトルとを用いて、前記P人のユーザそれぞれに関するM種類の特徴ベクトルから構成される推定行列Meを生成する推定行列生成部と、
前記推定行列Meを構成する特徴ベクトルと前記識別器とに基づいて、前記P人のユーザそれぞれに関する識別処理を実行する識別部と、
前記識別処理の結果を、前記試験行列Tを送信した通信端末に送信する送信部と、
をさらに備える請求項1から5のいずれか一項に記載の情報処理装置。
A classifier storage unit that stores a classifier obtained in advance by machine learning based on feature amounts corresponding to the M types of feature vectors,
An estimation matrix generation unit configured to generate an estimation matrix Me including M types of feature vectors for each of the P users using the test matrix T and the missing feature vector;
An identification unit configured to execute an identification process for each of the P users based on the feature vectors that form the estimation matrix Me and the identifier.
A transmitting unit that transmits a result of the identification processing to the communication terminal that has transmitted the test matrix T;
The information processing apparatus according to any one of claims 1 to 5, further comprising:
プロセッサが、
N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを取得するステップと、
P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得するステップと、
前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成するステップと、
前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するステップと、
前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得するステップと、
を実行する情報処理方法。
The processor
A feature vector is generated by generating, for each of M types (M is an integer of 2 or more) of feature amounts, feature vectors each having a value indicating a feature amount associated with each of N users (N is an integer of 2 or more). Obtaining a feature factor matrix F when a matrix configured by arranging the plurality of feature vectors is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F;
A feature vector having a numerical value indicating a feature amount associated with each of P users (P is an integer of 2 or more) as elements is used for Q types (Q is an integer of 1 or more and less than M) of the M types of feature amounts. A) obtaining a test matrix T configured by arranging a plurality of feature vectors obtained and generated for each of the feature amounts;
A test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector constituting the test matrix T from the feature factor matrix F and a missing feature factor matrix Fl composed of other components are generated. Steps to
Calculating a test user factor matrix Ut that approximates the test matrix T with a product of a test user factor matrix Ut and the test feature factor matrix Ft;
Obtaining an estimated value of a missing feature vector not included in the feature vectors forming the test matrix T from a product of the test user factor matrix Ut and the missing feature factor matrix Fl;
Information processing method for executing.
コンピュータに、
N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを取得する機能と、
P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを取得する機能と、
前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する機能と、
前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出する機能と、
前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する機能と、
を実現させるプログラム。
On the computer,
A feature vector is generated by generating, for each of M types (M is an integer of 2 or more) of feature amounts, feature vectors each having a value indicating a feature amount associated with each of N users (N is an integer of 2 or more). A function of obtaining a feature factor matrix F when a matrix configured by arranging the plurality of feature vectors is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F;
A feature vector having a numerical value indicating a feature amount associated with each of P users (P is an integer of 2 or more) as elements is used for Q types (Q is an integer of 1 or more and less than M) of the M types of feature amounts. A) a function of acquiring a test matrix T configured by arranging a plurality of feature vectors obtained and generated for each of the feature amounts;
A test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector constituting the test matrix T from the feature factor matrix F and a missing feature factor matrix Fl composed of other components are generated. Function and
A function of calculating a test user factor matrix Ut that approximates the test matrix T by a product of a test user factor matrix Ut and the test feature factor matrix Ft;
A function of obtaining an estimated value of a missing feature vector not included in the feature vectors constituting the test matrix T from a product of the test user factor matrix Ut and the missing feature factor matrix Fl;
The program that realizes.
通信端末と、
ネットワークを介して前記通信端末と通信する情報処理装置と、
を備える情報処理システムであって、
前記情報処理装置は、
N人(Nは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、M種類(Mは2以上の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列を、ユーザ因子行列Uと特徴因子行列Fとの2つの行列の積で近似した場合における特徴因子行列Fを格納する特徴因子行列格納部と、
P人(Pは2以上の整数)のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量のうちのQ種類(Qは1以上M未満の整数)の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される試験行列Tを、前記ネットワークを介して前記通信端末から取得する試験行列取得部と、
前記特徴因子行列Fのうち、前記試験行列Tを構成する特徴ベクトルに対応する成分を抽出して得られる試験特徴因子行列Ftと、それ以外の成分で構成される欠損特徴因子行列Flとを生成する特徴因子抽出部と、
前記試験行列Tを、試験ユーザ因子行列Utと前記試験特徴因子行列Ftとの積で近似する試験ユーザ因子行列Utを算出するユーザ因子抽出部と、
前記試験ユーザ因子行列Utと前記欠損特徴因子行列Flとの積から、前記試験行列Tを構成する特徴ベクトルに含まれない欠損特徴ベクトルの推定値を取得する欠損情報推定部と、を備え、
前記通信端末は、
P人のユーザそれぞれに関連付けられた特徴量を示す数値を要素とする特徴ベクトルを、前記M種類の特徴量それぞれについて生成して得られた複数の特徴ベクトルを並べて構成される行列から、所定の特徴量に対応する特徴ベクトルを除いたQ種類の特徴ベクトルから構成される試験行列Tを生成する試験行列生成部と、
前記ネットワークを介して前記試験行列Tを前記情報処理装置に送信する試験行列送信部と、を備える、
情報処理システム。
A communication terminal;
An information processing device that communicates with the communication terminal via a network,
An information processing system comprising:
The information processing device,
A feature vector is generated by generating, for each of M types (M is an integer of 2 or more) of feature amounts, feature vectors each having a value indicating a feature amount associated with each of N users (N is an integer of 2 or more). A feature factor matrix storage unit that stores a feature factor matrix F when a matrix configured by arranging the plurality of feature vectors is approximated by a product of two matrices of a user factor matrix U and a feature factor matrix F;
A feature vector having a numerical value indicating a feature amount associated with each of P users (P is an integer of 2 or more) as elements is used for Q types (Q is an integer of 1 or more and less than M) of the M types of feature amounts. A) a test matrix acquisition unit that acquires a test matrix T configured by arranging a plurality of feature vectors obtained and generated for each of the feature amounts from the communication terminal via the network;
A test feature factor matrix Ft obtained by extracting a component corresponding to a feature vector constituting the test matrix T from the feature factor matrix F and a missing feature factor matrix Fl composed of other components are generated. A feature factor extraction unit that performs
A user factor extraction unit that calculates a test user factor matrix Ut that approximates the test matrix T by a product of a test user factor matrix Ut and the test feature factor matrix Ft;
A loss information estimating unit that obtains, from a product of the test user factor matrix Ut and the missing feature factor matrix Fl, an estimated value of a missing feature vector not included in the feature vectors forming the test matrix T,
The communication terminal,
A feature vector having a numerical value indicating a feature amount associated with each of the P users as an element is obtained from a matrix configured by arranging a plurality of feature vectors obtained for each of the M types of feature amounts. A test matrix generation unit configured to generate a test matrix T including Q types of feature vectors excluding a feature vector corresponding to a feature amount;
A test matrix transmission unit that transmits the test matrix T to the information processing device via the network.
Information processing system.
JP2016252628A 2016-12-27 2016-12-27 Information processing apparatus, information processing method, program, and information processing system Active JP6649875B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016252628A JP6649875B2 (en) 2016-12-27 2016-12-27 Information processing apparatus, information processing method, program, and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016252628A JP6649875B2 (en) 2016-12-27 2016-12-27 Information processing apparatus, information processing method, program, and information processing system

Publications (2)

Publication Number Publication Date
JP2018106453A JP2018106453A (en) 2018-07-05
JP6649875B2 true JP6649875B2 (en) 2020-02-19

Family

ID=62787968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016252628A Active JP6649875B2 (en) 2016-12-27 2016-12-27 Information processing apparatus, information processing method, program, and information processing system

Country Status (1)

Country Link
JP (1) JP6649875B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177228B2 (en) * 2003-10-24 2008-11-05 三菱電機株式会社 Prediction device
JP2012058972A (en) * 2010-09-08 2012-03-22 Sony Corp Evaluation prediction device, evaluation prediction method, and program
JP2012194741A (en) * 2011-03-16 2012-10-11 Nec Corp Prediction device of missing value in matrix data, method for calculating missing value prediction, and missing value prediction program
CN104995631A (en) * 2013-02-06 2015-10-21 汤姆逊许可公司 Privacy protection against curious recommenders
JP6383688B2 (en) * 2015-03-23 2018-08-29 日本電信電話株式会社 Data analysis apparatus, method, and program

Also Published As

Publication number Publication date
JP2018106453A (en) 2018-07-05

Similar Documents

Publication Publication Date Title
CN109241903B (en) Sample data cleaning method, device, computer equipment and storage medium
US9721221B2 (en) Skill estimation method in machine-human hybrid crowdsourcing
EP3779774A1 (en) Training method for image semantic segmentation model and server
US9576248B2 (en) Record linkage sharing using labeled comparison vectors and a machine learning domain classification trainer
US9454641B2 (en) Systems and methods for modeling and processing functional magnetic resonance image data using full-brain vector auto-regressive model
US10878281B2 (en) Video face clustering detection with inherent and weak supervision
WO2015180397A1 (en) Method and device for recognizing data category based on deep neural network
US10909871B2 (en) Method, apparatus, and computer program for operating machine-learning framework
CN110431560A (en) The searching method and device of target person, equipment, program product and medium
US11809972B2 (en) Distributed machine learning for improved privacy
US20220198266A1 (en) Using disentangled learning to train an interpretable deep learning model
Monajemi et al. Making massive computational experiments painless
WO2020007989A1 (en) Method for co-clustering senders and receivers based on text or image data files
EP3239897A1 (en) Method and apparatus for determining the similarity between multivariate data sets
CN110249312A (en) Data integration operation changing
EP3627404B1 (en) Chemical compound activity predicting device, predicting method and program
JP2018032340A (en) Attribute estimation device, attribute estimation method and attribute estimation program
CN110276243A (en) Score mapping method, face comparison method, device, equipment and storage medium
WO2017188048A1 (en) Preparation apparatus, preparation program, and preparation method
Gerogiannis et al. Covid-19 computer-aided diagnosis through ai-assisted ct imaging analysis: Deploying a medical ai system
JP6649875B2 (en) Information processing apparatus, information processing method, program, and information processing system
US20220139069A1 (en) Information processing system, information processing method, and recording medium
CN112445846A (en) Medical item identification method, device, equipment and computer readable storage medium
CN112836767B (en) Federal modeling method, apparatus, device, storage medium, and program product
JP2019159918A (en) Clustering program, clustering method, and clustering apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200117

R150 Certificate of patent or registration of utility model

Ref document number: 6649875

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150