JP5948171B2 - Database complementing system, database complementing method, data complementing server and program - Google Patents

Database complementing system, database complementing method, data complementing server and program Download PDF

Info

Publication number
JP5948171B2
JP5948171B2 JP2012154606A JP2012154606A JP5948171B2 JP 5948171 B2 JP5948171 B2 JP 5948171B2 JP 2012154606 A JP2012154606 A JP 2012154606A JP 2012154606 A JP2012154606 A JP 2012154606A JP 5948171 B2 JP5948171 B2 JP 5948171B2
Authority
JP
Japan
Prior art keywords
axis
database
item
value
sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012154606A
Other languages
Japanese (ja)
Other versions
JP2014016872A (en
Inventor
中村 徹
徹 中村
清本 晋作
晋作 清本
渡辺 龍
龍 渡辺
三宅 優
優 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012154606A priority Critical patent/JP5948171B2/en
Publication of JP2014016872A publication Critical patent/JP2014016872A/en
Application granted granted Critical
Publication of JP5948171B2 publication Critical patent/JP5948171B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、互いが所有する情報を秘匿しつつ利用することで、保有するデータベース内の欠損値を精度よく補完するデータベース補完システム、データベース補完方法、データ補完サーバおよびプログラムに関する。   The present invention relates to a database complementing system, a database complementing method, a data complementing server, and a program for accurately complementing missing values in a database owned by using information owned by each other in a secret manner.

近年の情報化技術の発展により、人々は大量の情報を容易に得ることが可能になった。一方で、その大量の情報から自分にとって有用な情報を得ることは困難になった。この状況を解決するために、例えば、大量の情報から利用者にとって有用な情報のみを抽出して提示する推薦システムが考案された。推薦システムは、電子商取引やインターネット広告の分野で既に広く普及している。 With the development of information technology in recent years, people can easily obtain a large amount of information. On the other hand, it became difficult to obtain useful information for me from the large amount of information. In order to solve this situation, for example, a recommendation system that extracts and presents only useful information for a user from a large amount of information has been devised. Recommendation systems are already widespread in the fields of electronic commerce and Internet advertising.

推薦システムにおいて、利用者にとって有用な情報(アイテム)を判別する代表的な手法に、協調フィルタリングがある。協調フィルタリングとは、利用者と嗜好の類似する他の利用者情報を利用して、利用者が未評価なアイテムについての嗜好情報を補完することで推薦を行う手法である。協調フィルタリングを用いて、利用者にとってより有用な情報(アイテム)を推薦するためには、大量の利用者情報(個人情報や履歴情報などのプライバシ情報を含む)を用いて推薦情報(アイテム)を選択することが有効である。そのため、複数の事業者が互いの利用者情報を提供することで利用者にとって満足度の高い推薦情報(アイテム)を提供可能になることが期待できる。 Collaborative filtering is a representative technique for discriminating information (items) useful for users in a recommendation system. Collaborative filtering is a method of making a recommendation by complementing preference information about an item that has not been evaluated by the user by using other user information having similar preferences to the user. In order to recommend information (items) more useful to users using collaborative filtering, recommend information (items) using a large amount of user information (including privacy information such as personal information and history information). It is effective to select. Therefore, it can be expected that recommendation information (items) with a high degree of satisfaction for users can be provided by providing each other's user information by a plurality of business operators.

しかしながら、利用者情報を提供する際には、利用者のプライバシの問題が生じる。個人情報の提供は個人情報保護法により制限されており、また個人情報保護法で定められた個人情報に該当しない利用者情報の利用・提供であっても、消費者団体等からプライバシの侵害として訴訟を起こされる事例は国内外で頻繁に生じている。 However, when providing user information, there is a problem of user privacy. The provision of personal information is restricted by the Personal Information Protection Law, and even the use and provision of user information that does not correspond to the personal information specified by the Personal Information Protection Law is a violation of privacy from consumer groups, etc. Cases where lawsuits are filed frequently occur in Japan and overseas.

そこで、複数データベース連携プライバシ保護協調フィルタリング手法が提案されている。この手法は、各データベースサーバが所有する、利用者の各アイテムに対する評価値をその他のデータベースに開示することなく、各データベースサーバが所有する評価値すべてを考慮して欠損値の補完を行い、推薦を行うことを可能にする。   Therefore, a multi-database cooperative privacy protection collaborative filtering technique has been proposed. This method does not disclose the evaluation value for each item of the user owned by each database server to other databases, and complements the missing values by considering all the evaluation values owned by each database server. Makes it possible to do.

既存の手法は大きく分けて、暗号化技術に基づく手法と摂動化に基づく手法に分類される。暗号化技術に基づく手法では、暗号化したままある種の演算が可能な性質を持つ特殊な暗号を利用して、利用者の各アイテムに対する評価値を秘匿する(例えば、非特許文献1参照)。また、摂動化に基づく手法では、提供する利用者の各アイテムに対する評価値に、ある分布に従って生成した乱数を付与することで、元の評価値を求めることを困難にする(例えば、非特許文献2参照)。   Existing methods can be broadly classified into methods based on encryption technology and methods based on perturbation. In the technique based on the encryption technology, the evaluation value for each item of the user is concealed by using a special encryption having a property that allows certain operations to be performed with encryption (for example, see Non-Patent Document 1). . In addition, in the method based on perturbation, it is difficult to obtain the original evaluation value by adding a random number generated according to a certain distribution to the evaluation value for each item of the providing user (for example, non-patent literature) 2).

A. Basu, H. Kikuchi, and J. Vaidya, “Privacy and J. Vaidya, ”Privacy−One predictor for Item−based Collaborative Filtering“, Proceedings of the International Workshop on Trust and Privacy in Distributed Information Processing (workshop at the IFIPTM 2011), 2011.A. Basu, H .; Kikuchi, and J.K. Vaidya, "Privacy and J. Vaidya," Privacy-One predictor for Item-based Collaborative Filtering ", Proceedings of the International Workshop on Trust and Privacy in Distributed Information Processing (workshop at the IFIPTM 2011), 2011. H. Polat and W. Du, “Privacy−Preserving Collaborative Filtering on Vertically Partitioned Data”, Knowledge Discovery in Databases: PKDD 2005, 2005.H. Polat and W. Du, “Privacy-Preserving Collaborative Filtering on Vertically Partitioned Data”, Knowledge Discovery in Databases: PKDD 2005, 2005.

しかしながら、暗号化技術に基づく手法は、一般に高い秘匿性を実現することが可能であるが、処理時間が長く実用的ではない。摂動化に基づく手法は、暗号化技術に基づく手法に比べ、短い処理時間で実行できるが、必要のない統計情報が明らかになる場合がある。   However, although the technique based on the encryption technique can generally achieve high confidentiality, the processing time is long and not practical. Although the method based on perturbation can be executed in a shorter processing time than the method based on encryption technology, unnecessary statistical information may be revealed.

そこで、本発明は、上述の課題に鑑みてなされたものであり、互いが所有する情報を秘匿しつつ利用することで、保有するデータベース内の欠損値を精度よく補完するデータベース補完システム、データベース補完方法、データ補完サーバおよびプログラムを提供することを目的とする。   Therefore, the present invention has been made in view of the above-described problems, and a database complementation system and a database complementation that accurately complement missing values in a database owned by using the information owned by each other in a concealed manner. It is an object to provide a method, a data supplement server, and a program.

本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。   The present invention proposes the following matters in order to solve the above problems. In addition, in order to make an understanding easy, although the code | symbol corresponding to embodiment of this invention is attached | subjected and demonstrated, it is not limited to this.

(1)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムであって、前記情報提供サーバが、保有する前記データベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する統計情報生成手段と、該生成した統計情報を前記データベース補完サーバに送信する統計情報送信手段と、を備え、前記データベース補完サーバが、前記統計情報を受信する統計情報受信手段と、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他のすべての前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目とその他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する補完手段と、を備えたことを特徴とするデータベース補完システムを提案している。   (1) The present invention includes a two-dimensional tabular database that includes a first axis and a second axis, and in which the items of the first axis are common, and supplements missing values in the held database. A database complementing system comprising a database complementing server and one or more information providing servers for providing information for supplementing missing values to the database complementing server, wherein the information providing server includes Statistical information generating means for generating, as statistical information, the sum of the differences between the values of each pair and the number of samples when the total is calculated for all pairs of items on one axis, and the generated statistical information Statistical information transmitting means for transmitting to the database complementing server, the database supplementing server receiving statistical information receiving means for receiving the statistical information, and retained data The average value of the evaluation values of all other items of the first axis corresponding to the missing value to be complemented, and the statistical information received from each information providing server The sum of the difference of the evaluation values of the pairs of the first axis item corresponding to the missing value and all the other first axis items, and the pair of the first axis item in the held database The sum of the differences between the evaluation values of the pair of items of the first axis corresponding to the total of the number of samples received from each information providing server and the corresponding pair of items in the first axis is obtained by adding all the sums of the differences between the evaluation values. The sum of the number of samples at the time of calculation divided by the added value is calculated for the pair of the corresponding first axis item and all the other first axis items, and The corresponding said number Complementing means for supplementing the missing value by adding the item of the axis of the item and the number of pairs of the other items of the first axis divided by the number of pairs. A system is proposed.

この発明によれば、情報提供サーバの統計情報生成手段は、保有するデータベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と総和を算出したときの各サンプル数とを統計情報として生成する。統計情報送信手段は、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバの統計情報受信手段は、統計情報を受信する。補完手段は、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他のすべての第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する第1の軸の項目とその他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目とその他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、第1の軸のすべての項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the statistical information generating means of the information providing server, for each pair of all items of the first axis in the database held, each sample when calculating the sum and difference of the values of each pair Numbers are generated as statistical information. The statistical information transmission means transmits the generated statistical information to the database supplement server. The statistical information receiving means of the database supplement server receives statistical information. The complementing means includes an average value of evaluation values of all other first axis items of the second axis item corresponding to the missing value to be complemented in the database held, and the statistics received from each information providing server. The sum of the differences of the evaluation values of the pairs of the first axis item corresponding to the missing value in the information and all the other first axis items, and the pair of the first axis item in the held database When the sum of the difference of evaluation values is added to the sum of the number of samples received from each information providing server, the sum of differences of evaluation values of the corresponding pair of first axis items in the database is calculated. The sum of the number of samples divided by the added value is calculated for the pair of the corresponding first axis item and all the other first axis items, and the sum is calculated. Axis items and other By adding the divided by number of pairs of the item of the first axis of Te, which complements a defect value. Accordingly, the information providing server uses, as statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for each pair of items on the first axis so as not to be restored. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(2)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムであって、前記情報提供サーバが、すべての前記第2の軸の項目のペアについて、各ペアの評価値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する統計情報生成手段と、該生成した統計情報を前記データベース補完サーバに送信する統計情報送信手段と、を備え、前記データベース補完サーバが、前記統計情報を受信する統計情報受信手段と、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他の前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目と他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目と他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する補完手段と、を備えたことを特徴とするデータベース補完システムを提案している。   (2) The present invention comprises a two-dimensional tabular database composed of a first axis and a second axis, and the items of the first axis are common, and supplements missing values in the database held. A database complementing system comprising a database complementing server and one or more information providing servers for providing information for complementing missing values to the database complementing server, wherein the information providing server is configured to include all the second axes Statistical information generating means for generating, as statistical information obtained by processing the total sum of differences of evaluation values of each pair and the number of samples when the total is calculated as unrecoverable, and the generated statistical information Statistical information transmitting means for transmitting to the database complementing server, the database supplementing server receiving statistical information receiving means for receiving the statistical information; The average value of the evaluation values of the other items of the first axis corresponding to the missing values to be complemented and the missing values in the statistical information received from each information providing server The sum of the difference of the evaluation values of the pair of the corresponding item of the first axis and all the other items of the first axis, and the evaluation value of the pair of the item of the first axis in the database held When the total sum of the differences is calculated, and the sum of the differences between the evaluation values of the pair of items in the first axis corresponding to the sum of the number of samples received from each information providing server in the database held is calculated The sum of the number of samples divided by the added value is calculated for the pair of the corresponding first axis item and all the other first axis items, and this is further calculated as the corresponding The first axis item to And a supplementing means for supplementing the missing value by adding all of the first axis items divided by the number of pairs and proposing the database complementing system .

この発明によれば、情報提供サーバの統計情報生成手段は、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する。統計情報送信手段は、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバの統計情報受信手段は、統計情報を受信する。補完手段は、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他の第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目と他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目と他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the statistical information generating means of the information providing server restores the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for all pairs of items of the second axis. Generated as statistical information processed to impossible. The statistical information transmission means transmits the generated statistical information to the database supplement server. The statistical information receiving means of the database supplement server receives statistical information. In the database held, the complement means includes an average value of the evaluation values of the other first axis items of the second axis item corresponding to the missing value to be complemented, and the statistical information received from each information providing server. The sum of the difference of the evaluation values of the pair of the first axis item corresponding to the missing value and all the other first axis items, and the evaluation value of the pair of the first axis item in the held database The number of samples when the sum of the differences of the evaluation values of the corresponding first axis item pairs is calculated in the database that holds the sum of all the differences in the total number of samples received from each information providing server Is divided by the sum of the values, and a sum is calculated for each pair of the corresponding first axis item and all other first axis items, and this is further calculated for the corresponding first axis item. Item and all other first axis terms By adding the divided by number of pairs of the complement missing values. Therefore, for the pairs of items of all the second axes, the information providing server uses, as statistical information, which processed the sum of the difference between the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(3)本発明は、(1)または(2)のデータベース補完システムについて、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とするデータベース補完システムを提案している。   (3) According to the present invention, in the database complementing system of (1) or (2), a user or a user group is assigned to one of the first axis and the second axis, and an item is assigned to the other. A database complementing system is proposed in which one of the first axis and the second axis corresponds to a row of the tabular database, and the other corresponds to a column of the tabular database. doing.

この発明によれば、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が表形式のデータベースの行に相当し、他方が表形式のデータベースの列に相当する。したがって、上記のように、補完されたデータベースを用いて、利用者のプライバシを保護しつつ、適切なアイテムを利用者に推薦することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to the present invention, the user or the user group is assigned to one of the first axis and the second axis, the item is assigned to the other, and the first axis and the second axis. One corresponds to a row of a tabular database, and the other corresponds to a column of the tabular database. Therefore, as described above, it is possible to recommend appropriate items to the user while protecting the privacy of the user using the complemented database. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(4)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、1つ以上の情報提供サーバから、各情報提供サーバが保有する前記データベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として受信し、保有するデータベース内の欠損値を補完するデータベース補完サーバであって、前記保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他のすべての前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目とその他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する補完手段を備えたことを特徴とするデータベース補完サーバを提案している。   (4) The present invention comprises a two-dimensional tabular database consisting of a first axis and a second axis, the items of the first axis being common to each of one or more information providing servers, Statistical information obtained by processing the sum of the differences of the values of each pair and the number of samples when the sum is calculated for each pair of items of the first axis in the database held by the information providing server so that it cannot be restored. A database complementing server that compensates for missing values in the database that it receives and holds, in the database that it possesses, all the other first of the items of the second axis that correspond to the missing values that it complements Pairs of the average value of the evaluation values of the items of the axis and the items of the first axis corresponding to the missing values in the statistical information received from each information providing server and all the other items of the first axis Of the difference of the evaluation value of The sum and the sum total of the difference of the evaluation values of the pair of items in the first axis in the retained database correspond to the sum of the number of samples received from each information providing server in the retained database. A value obtained by dividing the sum of the differences of evaluation values of the pair of evaluation values of the first axis item by the value obtained by adding all the samples is the corresponding first axis item and all the other items. Calculating a sum for a pair of items on one axis, and dividing this by the number of pairs of the corresponding item on the first axis and all other items on the first axis; In addition, a database complementing server is proposed that includes a complementing means for complementing the missing values by addition.

この発明によれば、補完手段は、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他のすべての第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する第1の軸の項目とその他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目とその他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、第1の軸のすべての項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。   According to the present invention, the complementing means provides the average value of the evaluation values of all the other first axis items of the second axis item corresponding to the missing value to be complemented and each information provision in the database held. The sum of the differences of the evaluation values of the pairs of the first axis item corresponding to the missing value in the statistical information received from the server and all the other first axis items, and the first The difference between the evaluation values of the corresponding first axis item pair in the database held in the sum total of the differences in the evaluation values of the axis item pairs in the total number of samples received from each information providing server The sum of the number of samples when the sum of the values is calculated divided by the sum of the values is calculated for the pair of the corresponding first axis item and all other first axis items, The corresponding first By adding the divided by number of pairs of the item for all of the first shaft of the items and other complements the missing values. Accordingly, the information providing server uses, as statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for each pair of items on the first axis so as not to be restored. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes.

(5)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、1つ以上の情報提供サーバから、各情報提供サーバが保有する前記データベース内の第1の軸のすべての前記第2の軸の項目のペアについて、各ペアの評価値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として受信し、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他の前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目と他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目と他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する補完手段を備えたことを特徴とするデータベース補完サーバを提案している。   (5) The present invention comprises a two-dimensional tabular database consisting of a first axis and a second axis, the items of the first axis being common, and one or more information providing servers, For all pairs of items of the second axis of the first axis in the database held by the information providing server, the sum of the differences of the evaluation values of each pair and the number of samples when the sum is calculated In the database received and stored as statistical information processed so as not to be restored, the average value of the evaluation values of the other items of the first axis corresponding to the missing value to be complemented, and each information A sum of differences of evaluation values of pairs of items of the first axis corresponding to missing values in the statistical information received from the providing server and all other items of the first axis, and Of the evaluation value of the pair of items of the first axis When the sum of the sums of the minutes is calculated, the sum of the differences between the evaluation values of the pair of items of the first axis corresponding to the sum of the number of samples received from each information providing server in the database held is calculated The sum of the number of samples divided by the added value is calculated for the pair of the corresponding first axis item and all the other first axis items, and this is further calculated as the corresponding A complement means for complementing the missing value is provided by adding the first axis item divided by the number of pairs of all the other first axis items. A database completion server is proposed.

この発明によれば、補完手段は、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他の第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目と他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目と他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。   According to the present invention, the complementing means includes an average evaluation value of the other first axis items of the second axis item corresponding to the missing value to be complemented, and each information providing server in the held database. The sum of the difference of the evaluation values of the pairs of the first axis item corresponding to the missing value in the received statistical information and all the other first axis items, and the first axis item in the held database The sum of the differences of the evaluation values of the pairs of the first axis is added to the sum of the differences of the evaluation values of the first axis items corresponding to the total number of samples received from each information providing server. Calculate the total sum for the pair of the corresponding first axis item and all other first axis items after dividing the total number of samples by the added value. To the first axis item and other By adding the divided by number of pairs of the item of the first axis of Te, which complements a defect value. Therefore, for the pairs of items of all the second axes, the information providing server uses, as statistical information, which processed the sum of the difference between the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes.

(6)本発明は、(4)または(5)のデータベース補完サーバについて、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とするデータベース補完サーバを提案している。   (6) According to the present invention, in the database complementing server of (4) or (5), a user or a user group is assigned to one of the first axis and the second axis, and an item is assigned to the other. A database complementing server is proposed, wherein one of the first axis and the second axis corresponds to a row of the tabular database, and the other corresponds to a column of the tabular database. doing.

この発明によれば、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が表形式のデータベースの行に相当し、他方が表形式のデータベースの列に相当する。したがって、上記のように、補完されたデータベースを用いて、利用者のプライバシを保護しつつ、適切なアイテムを利用者に推薦することができる。   According to the present invention, the user or the user group is assigned to one of the first axis and the second axis, the item is assigned to the other, and the first axis and the second axis. One corresponds to a row of a tabular database, and the other corresponds to a column of the tabular database. Therefore, as described above, it is possible to recommend appropriate items to the user while protecting the privacy of the user using the complemented database.

(7)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法であって、前記情報提供サーバが、保有する前記データベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する第1のステップと、前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、前記データベース補完サーバが、前記統計情報を受信する第3のステップと、前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他のすべての前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目とその他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する第4のステップと、を備えたことを特徴とするデータベース補完方法を提案している。   (7) The present invention comprises a two-dimensional tabular database composed of a first axis and a second axis, the items of the first axis being common, and supplements missing values in the database held. A database complementing method in a database complementing system comprising a database complementing server and one or more information providing servers for providing information for complementing missing values to the database complementing server, wherein the information providing server holds the database supplementing method A first step of generating, as statistical information, a sum of differences of values of each pair and a number of samples when the sum is calculated for all pairs of items on the first axis in the database; A second step in which the server transmits the generated statistical information to the database supplement server; and the database supplement server receives the statistical information. And the average value of the evaluation values of all the other items of the first axis corresponding to the missing value to be complemented in the database held by the database complementing server. And the sum of the differences of the evaluation values of the pairs of the first axis item corresponding to the missing value in the statistical information received from each information providing server and all the other first axis items, The first database corresponding to the total of the number of samples received from each information providing server, which is obtained by adding all the sums of the differences of the evaluation values of the first axis item pairs in the stored database. The sum of the difference of the evaluation values of the pair of items of the axis item divided by the value obtained by adding all the samples is the corresponding item of the first axis and all the other first axes. of Calculating the sum for the eye pair, and adding this to the corresponding first axis item divided by the number of pairs of all other first axis items, And a fourth step of complementing the missing value. A database complementing method is proposed.

この発明によれば、情報提供サーバは、保有するデータベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と総和を算出したときの各サンプル数とを統計情報として生成し、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバは、統計情報を受信し、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他のすべての第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目とその他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目とその他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、第1の軸のすべての項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the information providing server provides statistical information on the sum of the difference between the values of each pair and the number of samples when the sum is calculated for all pairs of items in the first axis in the database held. And send the generated statistical information to the database complementing server. The database complementing server receives statistical information, and in the database it holds, the average value of the evaluation values of all the other first axis items of the second axis item corresponding to the missing value to be complemented, and each information The sum of the differences of the evaluation values of the pairs of the items of the first axis corresponding to the missing values in the statistical information received from the providing server and all the other items of the first axis, The difference between the evaluation values of the corresponding first axis item pair in the database held in the sum total of the differences in the evaluation values of the axis item pairs in the total number of samples received from each information providing server The sum of the number of samples when the sum of the values is calculated divided by the sum of the values is calculated for the pair of the corresponding first axis item and all other first axis items, Vs this The by adding the value obtained by dividing 1 by the number of pairs of the axis of items and all other first axis items of that complements the missing values. Accordingly, the information providing server uses, as statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for each pair of items on the first axis so as not to be restored. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(8)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法であって、前記情報提供サーバが、すべての前記第2の軸の項目のペアについて、各ペアの評価値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する第1のステップと、前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、前記データベース補完サーバが、前記統計情報を受信する第3のステップと、前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他の前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目と他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目と他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する第4のステップと、を備えたことを特徴とするデータベース補完方法を提案している。   (8) The present invention comprises a two-dimensional tabular database composed of a first axis and a second axis, with the items of the first axis being common, and supplements missing values in the database held. A database complementing method in a database complementing system comprising a database complementing server and one or more information providing servers for providing information for complementing missing values to the database complementing server, wherein the information providing server includes all of the information providing servers A first step of generating, as the statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated, as non-recoverable statistical information for the pair of items on the second axis; A second step in which the providing server transmits the generated statistical information to the database complementing server; and the database supplementing server receives the statistical information. A third step, an average value of evaluation values of the other items of the first axis of the items of the second axis corresponding to missing values to be complemented in the database held by the database complementing server; Sum of differences of evaluation values of pairs of items of the first axis corresponding to missing values in the statistical information received from the information providing server and all other items of the first axis, and held database In the first axis corresponding to the sum total of the number of samples received from each information providing server in the held database. What is obtained by dividing the sum of the differences of the evaluation values of the pair of items by the value obtained by adding all the samples is the corresponding item on the first axis and all the other items on the first axis. In a pair And summing the corresponding sum of the first axis item and the number of pairs of all the other first axis items to calculate the missing value. A database complementing method characterized by comprising a fourth step of complementing is proposed.

この発明によれば、情報提供サーバは、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成し、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバは、統計情報を受信し、保有するデータベースにおいて、補完する欠損値に対応する第1の軸の項目のその他の第2の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する第2の軸の項目と他のすべての第2の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他の第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目と他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目と他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the information providing server, for all pairs of items of the second axis, the statistics obtained by processing the sum of the differences of the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable It is generated as information and the generated statistical information is transmitted to the database supplement server. The database complementing server receives statistical information, and in the database it holds, the average value of the evaluation values of the other second axis items of the first axis item corresponding to the missing value to be complemented, and each information providing server The sum of the differences of the evaluation values of the pairs of the items of the second axis corresponding to the missing values in the statistical information received from all the other second axis items, and the missing data to be complemented in the held database The average value of the evaluation values of the other first axis items of the second axis item corresponding to the value, and the first axis item corresponding to the missing value in the statistical information received from each information providing server; Each information is obtained by adding all the sums of differences in evaluation values of pairs with all other first axis items and sums of differences in evaluation values of pairs of first axis items in the database held. To the total number of samples received from the providing server The sum of the difference of the evaluation values of the pair of evaluation values of the corresponding first axis item in the database is divided by the value obtained by adding all the samples, and the corresponding first axis item and all the others. The sum is calculated for the pair of items of the first axis, and the sum is divided by the number of pairs of the corresponding first axis item and all other first axis items. To compensate for missing values. Therefore, for the pairs of items of all the second axes, the information providing server uses, as statistical information, which processed the sum of the difference between the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(9)本発明は、(7)または(8)のデータベース補完方法について、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とするデータベース補完方法を提案している。   (9) In the present invention, in the database complementing method of (7) or (8), a user or a user group is assigned to one of the first axis and the second axis, and an item is assigned to the other. A database complementing method is proposed, wherein one of the first axis and the second axis corresponds to a row of the tabular database, and the other corresponds to a column of the tabular database. doing.

この発明によれば、第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が表形式のデータベースの行に相当し、他方が表形式のデータベースの列に相当する。したがって、上記のように、補完されたデータベースを用いて、利用者のプライバシを保護しつつ、適切なアイテムを利用者に推薦することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to the present invention, the user or the user group is assigned to one of the first axis and the second axis, the item is assigned to the other, and the first axis and the second axis. One corresponds to a row of a tabular database, and the other corresponds to a column of the tabular database. Therefore, as described above, it is possible to recommend appropriate items to the user while protecting the privacy of the user using the complemented database. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(10)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法をコンピュータに実行させるためのプログラムであって、前記情報提供サーバが、保有する前記データベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する第1のステップと、前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、前記データベース補完サーバが、前記統計情報を受信する第3のステップと、前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他のすべての前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目とその他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する第4のステップと、をコンピュータに実行させるためのプログラムを提案している。   (10) The present invention comprises a two-dimensional tabular database composed of a first axis and a second axis, and having the items of the first axis in common, and supplements missing values in the held database. A program for causing a computer to execute a database complementing method in a database complementing system comprising a database complementing server and one or more information providing servers providing information for complementing missing values to the database complementing server, The information providing server generates, as statistical information, the sum of the differences between the values of each pair and the number of samples when the sum is calculated for all pairs of items of the first axis in the database held by the information providing server. The second step in which the information providing server transmits the generated statistical information to the database complementing server; and A database complementing server receiving the statistical information; and a database complemented by the database complementing server in all other first items of the second axis item corresponding to the missing value to be complemented. The average value of the evaluation values of the items of the axis, the items of the first axis corresponding to the missing value in the statistical information received from each information providing server, and the items of the first axis of all other The sum of the difference between the evaluation values of the pair and the sum of the differences between the evaluation values of the pair of items in the first axis in the database held is added to the sum of the number of samples received from each information providing server. What is obtained by dividing the sum of the differences of the evaluation values of the pair of items of the first axis item corresponding to the database owned by the value obtained by adding all the samples is the corresponding A sum is calculated for pairs of one axis item and all other first axis items, and is further calculated as the corresponding first axis item and all other first axis items. A program for causing a computer to execute a fourth step of adding the item divided by the number of pairs to the item and complementing the missing value is proposed.

この発明によれば、情報提供サーバは、保有するデータベース内の第1の軸のすべての項目のペアについて、各ペアの値の差分の総和と総和を算出したときの各サンプル数とを統計情報として生成し、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバは、統計情報を受信し、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他のすべての第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目とその他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目とその他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、第1の軸のすべての項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the information providing server provides statistical information on the sum of the difference between the values of each pair and the number of samples when the sum is calculated for all pairs of items in the first axis in the database held. And send the generated statistical information to the database complementing server. The database complementing server receives statistical information, and in the database it holds, the average value of the evaluation values of all the other first axis items of the second axis item corresponding to the missing value to be complemented, and each information The sum of the differences of the evaluation values of the pairs of the items of the first axis corresponding to the missing values in the statistical information received from the providing server and all the other items of the first axis, The difference between the evaluation values of the corresponding first axis item pair in the database held in the sum total of the differences in the evaluation values of the axis item pairs in the total number of samples received from each information providing server The sum of the number of samples when the sum of the values is calculated divided by the sum of the values is calculated for the pair of the corresponding first axis item and all other first axis items, Vs this The by adding the value obtained by dividing 1 by the number of pairs of the axis of items and all other first axis items of that complements the missing values. Accordingly, the information providing server uses, as statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for each pair of items on the first axis so as not to be restored. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

(11)本発明は、第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法をコンピュータに実行させるためのプログラムであって、前記情報提供サーバが、すべての前記第2の軸の項目のペアについて、各ペアの評価値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する第1のステップと、前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、前記データベース補完サーバが、前記統計情報を受信する第3のステップと、前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目のその他の前記第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する前記第1の軸の項目と他のすべての前記第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて前記第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信した前記サンプル数の総和に前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する前記第1の軸の項目とその他の全ての前記第1の軸の項目とのペアについて総和を計算し、さらに、これを前記対応する前記第1の軸の項目と他の全ての前記第1の軸の項目とのペア数で除したものとを加算して、前記欠損値を補完する第4のステップと、をコンピュータに実行させるためのプログラムを提案している。   (11) The present invention includes a two-dimensional tabular database that includes a first axis and a second axis, and in which the items of the first axis are common, and supplements missing values in the held database. A program for causing a computer to execute a database complementing method in a database complementing system comprising a database complementing server and one or more information providing servers providing information for complementing missing values to the database complementing server, The information providing server generates, for all the pairs of items of the second axis, statistical information obtained by processing the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated so as not to be restored. A first step; a second step in which the information providing server transmits the generated statistical information to the database supplement server; and A third step in which the database complement server receives the statistical information, and the other first axis of the second axis item corresponding to the missing value to be complemented in the database held by the database complement server The average value of the evaluation values of the items and the pairs of the first axis item corresponding to the missing value in the statistical information received from each information providing server and all the other first axis items The sum of the difference between the evaluation values and the sum of the differences between the evaluation values of the pair of items in the first axis in the possessed database are added to the sum of the number of samples received from each information providing server. In the database, the corresponding first axis item is obtained by dividing the sum of the difference of the evaluation values of the corresponding first axis item pairs by the value obtained by adding all the samples. The sum is calculated for all the other pairs of the first axis items, and this is further calculated as the number of pairs of the corresponding first axis item and all the other first axis items. A program for causing a computer to execute a fourth step of complementing the missing value by adding the value divided by 1 is proposed.

この発明によれば、情報提供サーバは、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成し、生成した統計情報をデータベース補完サーバに送信する。データベース補完サーバは、統計情報を受信し、保有するデータベースにおいて、補完する欠損値に対応する第1の軸の項目のその他の第2の軸の項目の評価値の平均値と、各情報提供サーバから受信した該統計情報内の欠損値に対応する第2の軸の項目と他のすべての第2の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて、補完する欠損値に対応する第2の軸の項目のその他の第1の軸の項目の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する第1の軸の項目と他のすべての第1の軸の項目とのペアの評価値の差分の総和と、保有するデータベースにおいて第1の軸の項目のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する第1の軸の項目のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する第1の軸の項目とその他の全ての第1の軸の項目とのペアについて総和を計算し、さらに、これを対応する第1の軸の項目と他の全ての第1の軸の項目とのペア数で除したものとを加算して、欠損値を補完する。したがって、情報提供サーバが、すべての第2の軸の項目のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完手段が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   According to this invention, the information providing server, for all pairs of items of the second axis, the statistics obtained by processing the sum of the differences of the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable It is generated as information and the generated statistical information is transmitted to the database supplement server. The database complementing server receives statistical information, and in the database it holds, the average value of the evaluation values of the other second axis items of the first axis item corresponding to the missing value to be complemented, and each information providing server The sum of the differences of the evaluation values of the pairs of the items of the second axis corresponding to the missing values in the statistical information received from all the other second axis items, and the missing data to be complemented in the held database The average value of the evaluation values of the other first axis items of the second axis item corresponding to the value, and the first axis item corresponding to the missing value in the statistical information received from each information providing server; Each information is obtained by adding all the sums of differences in evaluation values of pairs with all other first axis items and sums of differences in evaluation values of pairs of first axis items in the database held. To the total number of samples received from the providing server The sum of the difference of the evaluation values of the pair of evaluation values of the corresponding first axis item in the database is divided by the value obtained by adding all the samples, and the corresponding first axis item and all the others. The sum is calculated for the pair of items of the first axis, and the sum is divided by the number of pairs of the corresponding first axis item and all other first axis items. To compensate for missing values. Therefore, for the pairs of items of all the second axes, the information providing server uses, as statistical information, which processed the sum of the difference between the evaluation values of each pair and the number of samples when the sum is calculated to be unrecoverable. Since this information is transmitted to the complement server and the complement means can complement the missing values in the database held by the database complement server, the database after complement can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

本発明によれば、プライバシ情報となりえる互いが所有する利用者の情報を秘匿しつつ、保有するデータベース内の欠損値を補完することができるという効果がある。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができるという効果がある。   Advantageous Effects of Invention According to the present invention, there is an effect that it is possible to supplement missing values in a database that is held while concealing user information that can be privacy information. Also, unlike the conventional technique, since the encryption process is not performed, there is an effect that the processing speed can be improved.

本発明の第1の実施形態に係るデータベース補完システムの構成を示す図である。It is a figure which shows the structure of the database complementation system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る情報提供サーバの構成を示す図である。It is a figure which shows the structure of the information provision server which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るデータベース補完サーバの構成を示す図である。It is a figure which shows the structure of the database complementation server which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る情報提供サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the information provision server which concerns on the 1st Embodiment of this invention hold | maintains. 本発明の第1の実施形態に係るデータベース補完サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the database supplementary server which concerns on the 1st Embodiment of this invention holds. 本発明の第1の実施形態に係るデータベース補完システムの処理を示す図である。It is a figure which shows the process of the database complementation system which concerns on the 1st Embodiment of this invention. 本発明の第2の実施形態に係る情報提供サーバの構成を示す図である。It is a figure which shows the structure of the information provision server which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係るデータベース補完サーバの構成を示す図である。It is a figure which shows the structure of the database complementation server which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る情報提供サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the information provision server which concerns on the 2nd Embodiment of this invention holds. 本発明の第2の実施形態に係るデータベース補完サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the database supplementary server which concerns on the 2nd Embodiment of this invention holds. 本発明の第2の実施形態に係るデータベース補完システムの処理を示す図である。It is a figure which shows the process of the database complementation system which concerns on the 2nd Embodiment of this invention. 本発明の第3の実施形態に係る情報提供サーバの構成を示す図である。It is a figure which shows the structure of the information provision server which concerns on the 3rd Embodiment of this invention. 本発明の第3の実施形態に係るデータベース補完サーバの構成を示す図である。It is a figure which shows the structure of the database complementation server which concerns on the 3rd Embodiment of this invention. 本発明の第3の実施形態に係る情報提供サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the information provision server which concerns on the 3rd Embodiment of this invention holds. 本発明の第3の実施形態に係るデータベース補完サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the database supplementary server which concerns on the 3rd Embodiment of this invention holds. 本発明の第3の実施形態に係るデータベース補完システムの処理を示す図である。It is a figure which shows the process of the database complementation system which concerns on the 3rd Embodiment of this invention. 本発明の第4の実施形態に係る情報提供サーバの構成を示す図である。It is a figure which shows the structure of the information provision server which concerns on the 4th Embodiment of this invention. 本発明の第4の実施形態に係るデータベース補完サーバの構成を示す図である。It is a figure which shows the structure of the database complementation server which concerns on the 4th Embodiment of this invention. 本発明の第4の実施形態に係る情報提供サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the information provision server which concerns on the 4th Embodiment of this invention holds. 本発明の第4の実施形態に係るデータベース補完サーバが保有するデータベースを例示した図である。It is the figure which illustrated the database which the database supplementary server which concerns on the 4th Embodiment of this invention holds. 本発明の第4の実施形態に係るデータベース補完システムの処理を示す図である。It is a figure which shows the process of the database complementation system which concerns on the 4th Embodiment of this invention.

以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
Note that the constituent elements in the present embodiment can be appropriately replaced with existing constituent elements and the like, and various variations including combinations with other existing constituent elements are possible. Therefore, the description of the present embodiment does not limit the contents of the invention described in the claims.

以下、図1から図21を用いて、本発明の実施形態について説明する。なお、本発明は、情報提供サーバが、単数であるか複数であるかは限定しないが、説明をわかりやすくするために、一部、情報提供サーバが単数として説明を行う。   Hereinafter, embodiments of the present invention will be described with reference to FIGS. In the present invention, whether the information providing server is singular or plural is not limited, but in order to make the explanation easy to understand, the information providing server is partially explained as singular.

<第1の実施形態>
図1から図6を用いて、本発明の第1の実施形態に係るデータベース補完システムについて説明する。
<First Embodiment>
A database complementing system according to the first embodiment of the present invention will be described with reference to FIGS.

<データベース補完システムの構成>
本発明に係るデータベース補完システムは、図1に示すように、情報提供サーバ100と、データベース補完サーバ200とから構成され、これらは、ネットワークを介して接続されている。ここで、情報提供サーバ100とデータベース補完サーバ200とは、ともに、第1の軸と第2の軸とからなり、第1の軸の項目が共通する2次元の表形式のデータベースを備えている。情報提供サーバ100は、データベース補完サーバ200が保有するデータベース内の欠損値を補完するための情報をデータベース補完サーバ200に提供する。一方、データベース補完サーバ200は、情報提供サーバ100から受信した情報を用いて、保有するデータベース内の欠損値を補完する。なお、以下では、わかりやすく説明するために、第1の軸の項目を「アイテム」とし、第2の軸の項目を「利用者」として説明する。
<Configuration of database supplement system>
As shown in FIG. 1, the database complementation system according to the present invention includes an information providing server 100 and a database complementation server 200, which are connected via a network. Here, both the information providing server 100 and the database complementing server 200 include a two-dimensional tabular database that includes the first axis and the second axis, and the items of the first axis are common. . The information providing server 100 provides the database complementing server 200 with information for complementing missing values in the database held by the database complementing server 200. On the other hand, the database complementing server 200 supplements the missing value in the held database using the information received from the information providing server 100. In the following description, for the sake of easy understanding, the item of the first axis will be described as “item”, and the item of the second axis will be described as “user”.

<情報提供サーバの構成>
図2を用いて、本実施形態に係る情報提供サーバの構成について説明する。なお、本実施形態においては、情報提供サーバ100およびデータベース補完サーバ200がともに、図4および図5に示すような少なくともアイテムが共通するデータベース、いわゆる水平分割モデルのデータベースを保有している。
<Configuration of information providing server>
The configuration of the information providing server according to the present embodiment will be described with reference to FIG. In the present embodiment, both the information providing server 100 and the database complementing server 200 have a database having at least items in common, as shown in FIGS. 4 and 5, that is, a so-called horizontal division model database.

図2に示すように、情報提供サーバ100は、統計情報生成部110と、統計情報送信部120とから構成されている。ここで、統計情報生成部110は、すべてのアイテムのペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する。統計情報送信部120は、統計情報生成部110が生成した統計情報をデータベース補完サーバ200に送信する。   As illustrated in FIG. 2, the information providing server 100 includes a statistical information generation unit 110 and a statistical information transmission unit 120. Here, the statistical information generation unit 110 generates, for all item pairs, the total sum of the difference between the evaluation values of each pair and the number of samples when the total is calculated as statistical information processed to be unrecoverable. The statistical information transmission unit 120 transmits the statistical information generated by the statistical information generation unit 110 to the database supplement server 200.

<データベース補完サーバの構成>
図3を用いて、本実施形態に係るデータベース補完サーバの構成について説明する。
<Configuration of database supplement server>
The configuration of the database supplement server according to this embodiment will be described with reference to FIG.

図3に示すように、データベース補完サーバ200は、統計情報受信部210と、補完部220とから構成されている。   As shown in FIG. 3, the database complementing server 200 includes a statistical information receiving unit 210 and a complementing unit 220.

統計情報受信部210は、統計情報を受信する。   The statistical information receiving unit 210 receives statistical information.

補完部220は、保有するデータベースにおいて、補完する欠損値に対応する利用者の他のすべてのアイテムの評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応するアイテムと他のすべてのアイテムとのペアの評価値の差分の総和と、保有するデータベースにおいてアイテムのペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応するアイテムのペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応するアイテムと他の全てのアイテムとのペアについて総和を計算し、さらに、これを対応するアイテムと他の全てのアイテムとのペア数で除したものとを加算して、欠損値を補完する。   The complementing unit 220 has an average value of evaluation values of all other items of the user corresponding to the missing value to be complemented and an item corresponding to the missing value in the statistical information received from each information providing server in the held database. The sum of the difference between the evaluation values of the pair of items and all other items and the sum of the differences of the evaluation values of the item pairs in the database held in the total number of samples received from each information providing server The total of the pair of the corresponding item and all other items is obtained by dividing the sum of the difference between the evaluation values of the corresponding item pairs in the database held by Further, the missing value is complemented by adding the value obtained by dividing the corresponding item by the number of pairs of all other items.

図4および図5のデータベースを用いて、補完について、具体的に説明する。
いま、データベース補完サーバ200のデータベースにおける「Us4」、「It3」に対応する欠損値Val(4、3)のみを補完する場合について説明する。なお、図中、「*」は、欠損値を示す。
Complementation will be specifically described using the databases shown in FIGS. 4 and 5.
Now, a case where only the missing value Val (4, 3) corresponding to “Us4” and “It3” in the database of the database complementing server 200 is complemented will be described. In the figure, “*” indicates a missing value.

まず、情報提供サーバ100は、図4において、各アイテムについて、「It3」との評価値の差分の総和を計算する。ただし、いずれかの評価値が欠損値である場合には、計算には含まない。例えば、情報提供サーバ100の持つデータベースの「It3」と「It1」の評価値の差分の総和Sum(3,1,100)は、数1のようになる。
このときのサンプル数Num(3,1,100)=2と表す。
First, in FIG. 4, the information providing server 100 calculates the total sum of evaluation value differences from “It3” for each item. However, when any evaluation value is a missing value, it is not included in the calculation. For example, the sum Sum (3, 1, 100) of the difference between the evaluation values of “It3” and “It1” in the database of the information providing server 100 is as shown in Equation 1.
The number of samples at this time is expressed as Num (3, 1, 100) = 2.

Figure 0005948171
Figure 0005948171

情報提供サーバ100は、各アイテムについての、「It3」との評価値の差分の総和と、総和の算出に用いた利用者数(サンプル数)の対を、データベース補完サーバ200に通知する。すなわち、((Sum(3,1,100)、Num(3,1,100))、(Sum(3,2,100)、Num(3,2,100))、(Sum(3,4,100)、Num(3,4,100))を統計情報として、データベース補完サーバ200に送る。ただし、全ての欠損値を補完する場合には、全てのアイテムについて、評価値の差分の総和と、総和の算出に用いたサンプル数を通知する必要がある。   The information providing server 100 notifies the database complementing server 200 of the pair of the sum of the differences between the evaluation values of “It3” and the number of users (number of samples) used to calculate the sum for each item. That is, ((Sum (3,1,100), Num (3,1,100)), (Sum (3,2,100), Num (3,2,100)), (Sum (3,4, 100), Num (3,4,100)) as statistical information is sent to the database complementing server 200. However, when all missing values are to be complemented, the sum of the differences in evaluation values for all items, It is necessary to notify the number of samples used to calculate the sum.

ここで、
Sum(3,2,100)=0
Num(3,2,100)=0
Sum(3,4,100)=(P3−P2)+(P6−P5)
Num(3,4,100)=2
である。
here,
Sum (3, 2, 100) = 0
Num (3,2,100) = 0
Sum (3,4,100) = (P3-P2) + (P6-P5)
Num (3,4,100) = 2
It is.

データベース補完サーバ200の補完部220は、保有するデータベース(図5)において、補完する欠損値に対応する利用者「Us4」の他のアイテムの評価値の平均値を数2のように、求める。   The complementing unit 220 of the database complementing server 200 obtains the average value of the evaluation values of other items of the user “Us4” corresponding to the missing value to be complemented as shown in Equation 2 in the database (FIG. 5) possessed.

Figure 0005948171
Figure 0005948171

次に、受信した統計情報内の欠損値に対応するアイテムと他のすべてのアイテムとのペアの評価値の差分の総和と、保有するデータベースにおいてアイテムのペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応するアイテムのペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応するアイテムと他の全てのアイテムとのペアについて総和を計算し、さらに、これを対応するアイテムと他の全てのアイテムとのペア数で除したものとを加算して、欠損値を補完する。具体的には、数3のようになる。ここで、本実施形態の場合、対応するアイテムと他の全てのアイテムとのペア数は、(It3、It1)、(It3、It2)、(It3、It4)の3通りとなるため、数3における分数の分母は、「3」となる。なお、他の補完値についても同様の手順で演算を行う。   Next, add the sum of the differences between the evaluation values of the pair of items corresponding to the missing value in the received statistical information and all other items, and the sum of the differences between the evaluation values of the item pairs in the database Is obtained by dividing the sum of the number of samples when the sum of the differences between the evaluation values of the corresponding item pairs in the database held in the sum of the number of samples received from each information providing server is added, Calculate the sum of the pair of the corresponding item and all the other items, and then add this divided by the number of pairs of the corresponding item and all the other items to supplement the missing value . Specifically, this is as shown in Equation 3. Here, in the case of the present embodiment, the number of pairs of the corresponding item and all other items is three (It3, It1), (It3, It2), and (It3, It4). The denominator of the fraction at is “3”. The calculation is performed in the same procedure for other complementary values.

Figure 0005948171
Figure 0005948171

情報提供サーバが複数存在する場合には、各情報提供サーバから受信した統計情報内の欠損値に対応するアイテムのペアの評価値の差分の総和を全て、保有するデータベースにおいてペアの評価値の差分の総和を全て加算したものに加算し、各情報提供サーバから受信した統計情報内のサンプル数を全て保有するデータベースにおいて対応するアイテムのペアの評価値の差分の総和を算出したときのサンプル数に加算し、以下同様に欠損値を補完する。すなわち、新たに情報提供サーバ101が存在するとき、数4のようになる。ここで、本実施形態の場合、対応するアイテムと他の全てのアイテムとのペア数は、(It3、It1)、(It3、It2)、(It3、It4)の3通りとなるため、数4における分数の分母は、「3」となる。   When there are a plurality of information providing servers, all the sums of the differences between the evaluation values of the pairs of items corresponding to the missing values in the statistical information received from each information providing server are all differences in the evaluation values of the pairs in the database Is added to the sum of all the sums, and the total number of samples in the statistical information received from each information providing server is added to the number of samples when the sum of the differences between the evaluation values of the corresponding item pairs is calculated in the database. Then, the missing values are complemented in the same manner. That is, when the information providing server 101 newly exists, the following equation 4 is obtained. Here, in the case of the present embodiment, the number of pairs of the corresponding item and all the other items is (It3, It1), (It3, It2), and (It3, It4). The denominator of the fraction at is “3”.

Figure 0005948171
Figure 0005948171

<データベース補完システムの処理>
図6を用いて、本実施形態に係るデータベース補完システムの処理について説明する。
<Processing of database complementation system>
The process of the database complementation system according to this embodiment will be described with reference to FIG.

まず、各情報提供サーバは、保有するデータベース内のすべてのアイテムのペアについて、各ペアの評価値の差分の総和と、総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成し(ステップS101)、生成した統計情報をデータベース補完サーバに送信する(ステップS102)。データベース補完サーバは、統計情報を受信し(ステップS103)、保有するデータベースにおいて、補完する欠損値に対応する利用者の他のすべてのアイテムの評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応するアイテムと他のすべてのアイテムとのペアの評価値の差分の総和と、保有するデータベースにおいてアイテムのペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応するアイテムのペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応するアイテムと他の全てのアイテムとのペアについて総和を計算し、さらに、これを対応するアイテムと他の全てのアイテムとのペア数で除したものとを加算して、欠損値を補完する(ステップS104)。   First, each information providing server, for all item pairs in the database it holds, as statistical information that processed the sum of the difference between the evaluation values of each pair and the number of samples when the sum was calculated to be unrecoverable Generate (step S101), and transmit the generated statistical information to the database complementing server (step S102). The database complementing server receives the statistical information (step S103), and receives the average value of the evaluation values of all other items of the user corresponding to the missing value to be complemented and the information providing server in the retained database. The sum of the differences between the evaluation values of the pairs corresponding to the missing values in the statistical information and all other items and the sum of the differences between the evaluation values of the item pairs in the database held The total of the number of samples received when calculating the sum of the differences in the evaluation values of the corresponding item pair in the database held in the total number of samples received from the information providing server, divided by the value obtained by adding all the corresponding items, etc. The sum is calculated for all pairs of items, and the corresponding item is paired with all other items. In by adding the value obtained by dividing, to complement the missing values (step S104).

以上、説明したように、本実施形態によれば、各情報提供サーバが、すべてのアイテムのペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完部が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   As described above, according to the present embodiment, each information providing server cannot restore the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for all item pairs. As statistical information processed into a database supplement server, this information can be used to supplement the missing values in the database held by the database supplement server. It can be used for applications. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

<第2の実施形態>
図7から図11を用いて、本発明の第2の実施形態に係るデータベース補完システムについて説明する。本実施形態は、第1の実施形態とデータベースの構成が異なり、利用者が共通のデータベースを適用する場合について、説明する。なお、システム構成は、第1の実施形と同様であるため、ここでの詳細な説明は、省略する。
<Second Embodiment>
A database complementing system according to the second embodiment of the present invention will be described with reference to FIGS. In the present embodiment, the case where the database configuration is different from that of the first embodiment and the user applies a common database will be described. Since the system configuration is the same as that of the first embodiment, a detailed description thereof is omitted here.

<情報提供サーバの構成>
図7を用いて、本実施形態に係る情報提供サーバの構成について説明する。なお、本実施形態においては、情報提供サーバ100およびデータベース補完サーバ200がともに、少なくとも、利用者が共通するデータベース、いわゆる垂直分割モデルのデータベースを保有している。
<Configuration of information providing server>
The configuration of the information providing server according to the present embodiment will be described with reference to FIG. In the present embodiment, both the information providing server 100 and the database complementing server 200 have at least a database common to users, that is, a so-called vertical division model database.

図7に示すように、情報提供サーバ100は、統計情報生成部111と、統計情報送信部121とから構成されている。ここで、統計情報生成部111は、すべての利用者のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成する。統計情報送信部121は、統計情報生成部111が生成した統計情報をデータベース補完サーバ200に送信する。   As illustrated in FIG. 7, the information providing server 100 includes a statistical information generation unit 111 and a statistical information transmission unit 121. Here, the statistical information generation unit 111 generates, for all pairs of users, the total sum of the difference between the evaluation values of each pair and the number of samples when the total is calculated as statistical information processed to be unrecoverable. The statistical information transmission unit 121 transmits the statistical information generated by the statistical information generation unit 111 to the database supplement server 200.

<データベース補完サーバの構成>
図8を用いて、本実施形態に係るデータベース補完サーバの構成について説明する。
<Configuration of database supplement server>
The configuration of the database supplement server according to this embodiment will be described with reference to FIG.

図8に示すように、データベース補完サーバ200は、統計情報受信部210と、補完部221とから構成されている。なお、第1の実施形態と同様の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。   As shown in FIG. 8, the database complementing server 200 includes a statistical information receiving unit 210 and a complementing unit 221. In addition, about the component which attaches | subjects the code | symbol similar to 1st Embodiment, since it has the same function, the detailed description is abbreviate | omitted.

補完部221は、保有するデータベースにおいて、補完する欠損値に対応するアイテムの他のすべての利用者の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する利用者と他のすべての利用者とのペアの評価値の差分の総和と、保有するデータベースにおいて利用者のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する利用者のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する利用者と他の全ての利用者とのペアについて総和を計算し、さらに、これを対応する利用者と他の全ての利用者とのペア数で除したものとを加算して、欠損値を補完する。   The complement unit 221 uses an average value of evaluation values of all other users of the item corresponding to the missing value to be complemented and a usage corresponding to the missing value in the statistical information received from each information providing server in the held database. Sample received from each information provider server, which is the sum of the difference of the evaluation values of the pair of the user and all other users and the sum of the differences of the evaluation values of the pair of the user in the database The sum of the difference between the evaluation values of the pair of corresponding users in the database held in the sum of the numbers divided by the total number of samples is divided by the corresponding user and all other users. The sum is calculated for the pair and the value obtained by dividing the sum by the number of pairs of the corresponding user and all other users is added to supplement the missing value.

図9および図10のデータベースを用いて、補完について、具体的に説明する。なお、本実施形態においては、図9(A)および図10(A)のデータベースのアイテムと利用者とを入れ替えた図9(B)および図10(B)を用いて、補完処理を行う。
いま、データベース補完サーバ200のデータベースにおける「Us2」、「It4」に対応する欠損値Val(2、4)を補完する場合について説明する。なお、図中、「*」は、欠損値を示す。
Complementation will be specifically described using the databases in FIGS. 9 and 10. In the present embodiment, complementing processing is performed using FIGS. 9B and 10B in which the items in the database shown in FIGS. 9A and 10A are replaced with the users.
Now, a case where the missing value Val (2, 4) corresponding to “Us2” and “It4” in the database of the database complementing server 200 is complemented will be described. In the figure, “*” indicates a missing value.

まず、情報提供サーバ100は、図9(B)において、各ユーザについて、「Us2」との評価値の差分の総和を計算する。ただし、いずれかの評価値が欠損値である場合には、計算には含まない。例えば、情報提供サーバ100の持つデータベースの「Us2」と「Us1」の評価値の差分の総和Sum(2,1)は、数5のようになる。   First, in FIG. 9B, the information providing server 100 calculates the total sum of evaluation value differences from “Us2” for each user. However, when any evaluation value is a missing value, it is not included in the calculation. For example, the sum Sum (2, 1) of the difference between the evaluation values of “Us2” and “Us1” in the database of the information providing server 100 is as shown in Equation 5.

Figure 0005948171
Figure 0005948171

このときのサンプル数Num(2,1,100)=2となる。   The number of samples at this time is Num (2,1,100) = 2.

情報提供サーバ100は、各アイテムについての、「Us2」との評価値の差分の総和と、総和の算出に用いたアイテム数(サンプル数)の対を、データベース補完サーバ200に通知する。すなわち、((Sum(2,1,100)、Num(2,1,100))、(Sum(2,3,100)、Num(2,3,100))を統計情報として、データベース補完サーバ200に送る。ただし、全ての欠損値を補完する場合には、全てのアイテムについて、評価値の差分の総和と、総和の算出に用いたサンプル数を通知する必要がある。   The information providing server 100 notifies the database complementing server 200 of a pair of the sum of the difference between the evaluation values of “Us2” and the number of items (number of samples) used for calculating the sum for each item. That is, ((Sum (2,1,100), Num (2,1,100)), (Sum (2,3,100), Num (2,3,100))) as statistical information is used as a database complementing server. However, when all missing values are to be complemented, it is necessary to notify the total sum of differences in evaluation values and the number of samples used to calculate the sum for all items.

ここで、
Sum(2,3,100)=(P24−P22)
Num(2,3,100)=1
である。
here,
Sum (2, 3, 100) = (P24-P22)
Num (2,3,100) = 1
It is.

データベース補完サーバ200の補完部221は、保有するデータベース(図10(B))において、補完する欠損値に対応するアイテム「It4」の他の利用者の評価値の平均値を数6のように、求める。   The complementing unit 221 of the database complementing server 200 calculates the average value of the evaluation values of other users of the item “It4” corresponding to the missing value to be complemented as shown in Equation 6 in the database (FIG. 10 (B)). ,Ask.

Figure 0005948171
Figure 0005948171

次に、各情報提供サーバから受信した統計情報内の欠損値に対応する利用者と他のすべての利用者とのペアの評価値の差分の総和と、保有するデータベースにおいて利用者のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する利用者のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する利用者と他の全ての利用者とのペアについて総和を計算し、さらに、これを対応する利用者と他の全ての利用者とのペア数で除したものとを加算して、欠損値を補完する。具体的には、数7のようになる。ここで、本実施形態の場合、対応する利用者と他の全ての利用者とのペア数は、(Us2、Us1)、(Us2、Us3)の2通りとなるため、数7における分数の分母は、「2」となる。なお、他の補完値についても同様の手順で演算を行う。   Next, the sum of the differences of the evaluation values of the pairs corresponding to the missing values in the statistical information received from each information providing server and all other users, and the evaluation of the user pairs in the database held All the number of samples when the sum of the difference of the evaluation value of the corresponding user pair is calculated in the database that holds the sum of all the difference of values in the total number of samples received from each information providing server The sum divided by the added value is calculated for the pair of the corresponding user and all other users, and further divided by the number of pairs of the corresponding user and all other users. The missing value is complemented by adding the above. Specifically, this is as shown in Equation 7. Here, in the case of the present embodiment, the number of pairs of the corresponding user and all other users is two (Us2, Us1) and (Us2, Us3). Becomes “2”. The calculation is performed in the same procedure for other complementary values.

Figure 0005948171
Figure 0005948171

情報提供サーバが複数存在する場合には、各情報提供サーバから受信した統計情報内の欠損値に対応する利用者のペアの評価値の差分の総和を全て、保有するデータベースにおいてペアの評価値の差分の総和を全て加算したものに加算し、各情報提供サーバから受信した統計情報内のサンプル数を全て保有するデータベースにおいて対応する利用者のペアの評価値の差分の総和を算出したときのサンプル数に加算し、以下同様に欠損値を補完する。すなわち、新たに情報提供サーバ101が存在するとき、数8のようになる。ここで、本実施形態の場合、対応する利用者と他の全ての利用者とのペア数は、(Us2、Us1)、(Us2、Us3)の2通りとなるため、数8における分数の分母は、「2」となる。   When there are multiple information providing servers, all the sums of the differences in the evaluation values of the pair of users corresponding to the missing values in the statistical information received from each information providing server Sample when adding the sum of all differences and calculating the sum of the differences of the evaluation values of the corresponding user pair in the database that holds all the number of samples in the statistical information received from each information providing server It is added to the number, and the missing value is complemented in the same manner. That is, when the information providing server 101 newly exists, the following equation 8 is obtained. Here, in the case of this embodiment, the number of pairs of the corresponding user and all other users is (Us2, Us1), (Us2, Us3), so the denominator of the fraction in equation 8 Becomes “2”.

Figure 0005948171
Figure 0005948171

<データベース補完システムの処理>
図11を用いて、本実施形態に係るデータベース補完システムの処理について説明する。
<Processing of database complementation system>
Processing of the database complementation system according to the present embodiment will be described using FIG.

まず、情報提供サーバは、すべての利用者のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として生成し(ステップS201)、生成した統計情報をデータベース補完サーバに送信する(ステップS202)。データベース補完サーバは、統計情報を受信し(ステップS203)、保有するデータベースにおいて、補完する欠損値に対応するアイテムの他のすべての利用者の評価値の平均値と、各情報提供サーバから受信した統計情報内の欠損値に対応する利用者と他のすべての利用者とのペアの評価値の差分の総和と、保有するデータベースにおいて利用者のペアの評価値の差分の総和を全て加算したものを、各情報提供サーバから受信したサンプル数の総和に保有するデータベースにおいて対応する利用者のペアの評価値の差分の総和を算出したときのサンプル数を全て加算した値で除したものを、対応する利用者と他の全ての利用者とのペアについて総和を計算し、さらに、これを対応する利用者と他の全ての利用者とのペア数で除したものとを加算して、欠損値を補完する(ステップS204)。   First, the information providing server generates, for all user pairs, the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated as statistical information processed to be unrecoverable (step S201). The generated statistical information is transmitted to the database supplement server (step S202). The database complementing server receives the statistical information (step S203), and receives the average value of the evaluation values of all other users of the item corresponding to the missing value to be complemented and the information providing server in the retained database. The sum of the difference of the evaluation values of the pair corresponding to the missing value in the statistical information and all other users and the sum of the differences of the evaluation values of the pair of users in the database held Is obtained by dividing the total number of samples when the sum of the differences of the evaluation values of the corresponding user pair in the database held in the total number of samples received from each information providing server is added. The sum is calculated for the pair of the user and all other users, and this is divided by the number of pairs of the corresponding user and all other users. Adding to complement the missing values (step S204).

以上、説明したように、本実施形態によれば、各情報提供サーバが、すべての利用者のペアについて、各ペアの評価値の差分の総和と総和を算出したときの各サンプル数とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完部が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   As described above, according to the present embodiment, each information providing server restores the sum of the differences between the evaluation values of each pair and the number of samples when the sum is calculated for all user pairs. As statistical information processed to impossible, it is sent to the database complement server, and using this information, the complement unit can complement missing values in the database held by the database complement server. It can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

<第3の実施形態>
図12から図16を用いて、本発明の第3の実施形態に係るデータベース補完システムについて説明する。
<Third Embodiment>
A database complementing system according to the third embodiment of the present invention will be described with reference to FIGS.

<情報提供サーバの構成>
図12を用いて、本実施形態に係る情報提供サーバの構成について説明する。なお、本実施形態においては、情報提供サーバ100およびデータベース補完サーバ200がともに、少なくともアイテムが共通するデータベース、いわゆる水平分割モデルのデータベースを保有している。
<Configuration of information providing server>
The configuration of the information providing server according to this embodiment will be described with reference to FIG. In the present embodiment, both the information providing server 100 and the database complementing server 200 have at least a database with common items, that is, a so-called horizontal division model database.

図12に示すように、情報提供サーバ100は、統計情報生成部112と、統計情報送信部122とから構成されている。ここで、統計情報生成部112は、各アイテムについて、他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全てのアイテムとのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として生成する。統計情報送信部122は、統計情報生成部112が生成した統計情報をデータベース補完サーバ200に送信する。   As illustrated in FIG. 12, the information providing server 100 includes a statistical information generation unit 112 and a statistical information transmission unit 122. Here, for each item, the statistical information generation unit 112 obtains the sum of the differences between the evaluation values of the pairs with all the other items, and adds the values of all of these and the pairs of all the other items. The total sum of the difference between the evaluation values is generated as statistical information that is processed so as not to be restored. The statistical information transmission unit 122 transmits the statistical information generated by the statistical information generation unit 112 to the database supplement server 200.

<データベース補完サーバの構成>
図13を用いて、本実施形態に係るデータベース補完サーバの構成について説明する。
<Configuration of database supplement server>
The configuration of the database complementing server according to this embodiment will be described with reference to FIG.

図13に示すように、データベース補完サーバ200は、統計情報受信部210と、補完部222とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。   As shown in FIG. 13, the database complementing server 200 includes a statistical information receiving unit 210 and a complementing unit 222. In addition, about the component which attaches | subjects the same code | symbol as 1st Embodiment, since it has the same function, the detailed description is abbreviate | omitted.

補完部222は、保有するデータベースにおいて、補完する欠損値に対応する利用者の他のすべてのアイテムの評価値の平均値と、保有するデータベースにおいて対応する特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、各情報提供サーバから受信した特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値とを加算したものを分子に、特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求めたときのサンプル数の総和と、各情報提供サーバから受信したサンプル数の総和とを加算したものを分母としたときの値を用いて、欠損値を補完する。   The complementing unit 222 includes an average value of evaluation values of all other items of the user corresponding to the missing value to be complemented in the possessed database, a specific item corresponding to the possessed database, and all other items. Find the sum of the difference of the evaluation values of the pair, add all of them, and find the sum of the difference of the evaluation values of the pair of the specific item received from each information providing server and all other items, From the sum of the number of samples when the sum of the differences between the evaluation values of a pair of a specific item and all other items is calculated, The missing value is supplemented by using the value obtained by adding the total number of received samples to the denominator.

図14および図15のデータベースを用いて、補完について、具体的に説明する。
いま、データベース補完サーバ200のデータベースにおける「Us4」、「It3」に対応する欠損値Val(4、3)を補完する場合について説明する。なお、図中、「*」は、欠損値を示す。
Complementation will be specifically described using the databases in FIGS. 14 and 15.
Now, a case where the missing value Val (4, 3) corresponding to “Us4” and “It3” in the database of the database complementing server 200 is complemented will be described. In the figure, “*” indicates a missing value.

まず、情報提供サーバ100は、図14において、各アイテムについて、他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値を計算する。例えば、情報提供サーバ100の持つデータベースについて、「It1」と他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値Sum(1,100)は、数9のようになる。   First, in FIG. 14, the information providing server 100 obtains the sum of the differences of evaluation values of pairs with all other items for each item, and calculates a value obtained by adding all of them. For example, for the database of the information providing server 100, the sum of the differences between the evaluation values of the pair “It1” and all other items is calculated, and the sum Sum (1, 100) of all of these values is become that way.

Figure 0005948171
Figure 0005948171

このときのサンプル数Num(1,100)=6と表す。   The number of samples at this time is expressed as Num (1,100) = 6.

情報提供サーバ100は、各アイテムについて、他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、このときのサンプル数を復元不能に加工した統計情報として通知する。すなわち、((Sum(1,100)、Num(1,100)、(Sum(2,100)、Num(2,100)、(Sum(3,100)、Num(3,100)、(Sum(4,100)、Num(4,100))を統計情報として、データベース補完サーバ200に送る。ここで、上記、それぞれの情報は、数10のようになる。   The information providing server 100 calculates, for each item, the sum of the differences between the evaluation values of the pairs with all other items, and adds the values together and the statistical information obtained by processing the number of samples at this time in an unrecoverable manner Notify as. That is, ((Sum (1,100), Num (1,100), (Sum (2,100), Num (2,100), (Sum (3,100), Num (3,100), (Sum (4,100), Num (4,100)) are sent as statistical information to the database complementing server 200. Here, each of the above information is as shown in Equation 10.

Figure 0005948171
Figure 0005948171

データベース補完サーバ200の補完部222は、保有するデータベース(図15)において、補完する欠損値に対応する利用者「Us4」の他のアイテムの評価値の平均値を数11のように、求める。   The complementing unit 222 of the database complementing server 200 obtains the average value of the evaluation values of other items of the user “Us4” corresponding to the missing value to be complemented, as shown in Equation 11, in the database held (FIG. 15).

Figure 0005948171
Figure 0005948171

次に、データベース補完サーバ200の保有するデータベース(図15)において、「It3」と他のアイテムとの差分の総和Sum(3、200)を数12のように求める。   Next, in the database held by the database complementing server 200 (FIG. 15), the sum Sum (3, 200) of differences between “It3” and other items is obtained as shown in Equation 12.

Figure 0005948171
Figure 0005948171

このとき、Num(3,100)=4である。                     At this time, Num (3,100) = 4.

そして、数11の演算結果、数12から得られるSum(3、200)、Num(3,100)、受信したSum(3,100)およびNum(3,100)を用いて、数13から補完値を求める。なお、他の補完値についても同様の手順で演算を行う。   Then, using the calculation result of Equation 11, Sum (3, 200), Num (3, 100) obtained from Equation 12, and the received Sum (3, 100) and Num (3, 100), interpolation is performed from Equation 13. Find the value. The calculation is performed in the same procedure for other complementary values.

Figure 0005948171
Figure 0005948171

情報提供サーバが複数存在する場合には、各情報提供サーバから受信した統計情報内の欠損値に対応するアイテムについて、他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値を加算し、各情報提供サーバから受信したサンプル数を全て加算し、以下同様に欠損値を補完する。すなわち、新たに情報提供サーバ101が存在するとき、数14のようになる。   When there are multiple information providing servers, for the items corresponding to the missing values in the statistical information received from each information providing server, find the sum of the differences in the evaluation values of the pairs with all other items, and The sum of all values is added, the number of samples received from each information providing server is added, and the missing values are complemented in the same manner. That is, when the information providing server 101 newly exists, the following formula 14 is obtained.

Figure 0005948171
Figure 0005948171

<データベース補完システムの処理>
図16を用いて、本実施形態に係るデータベース補完システムの処理について説明する。
<Processing of database complementation system>
The process of the database complementation system according to this embodiment will be described using FIG.

まず、情報提供サーバは、各アイテムについて、他の全てのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全てのアイテムとのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として生成し(ステップS301)、生成した統計情報をデータベース補完サーバに送信する(ステップS302)。データベース補完サーバは、統計情報を受信し(ステップS303)、保有するデータベースにおいて、補完する欠損値に対応する利用者の他のすべてのアイテムの評価値の平均値と、保有するデータベースにおいて対応する特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、各情報提供サーバから受信した特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値とを加算したものを分子に、特定のアイテムと他のすべてのアイテムとのペアの評価値の差分の総和を求めたときのサンプル数の総和と、各情報提供サーバから受信したサンプル数の総和とを加算したものを分母としたときの値を用いて、欠損値を補完する(ステップS304)。   First, for each item, the information providing server obtains the sum of the differences between the evaluation values of the pairs with all the other items, and adds the sum of all the values to the evaluation values of the pairs with all the other items. The total of the number of samples when the sum of the differences is obtained is generated as statistical information processed so as not to be restored (step S301), and the generated statistical information is transmitted to the database complementing server (step S302). The database supplement server receives the statistical information (step S303), and in the retained database, the average value of the evaluation values of all other items of the user corresponding to the missing value to be complemented and the identification corresponding to the retained database The sum of the differences in the evaluation values of the pair of the item and all the other items is calculated, and the sum of all the values is added to the pair of the specific item received from each information providing server and all the other items. A sample when the sum of the differences of evaluation values is calculated, and the sum of all of these values is added to the numerator, and the sum of the differences of evaluation values of a pair of a specific item and all other items is calculated. The missing value is supplemented using the value when the sum of the numbers and the sum of the numbers of samples received from each information providing server are used as the denominator ( Step S304).

以上、説明したように、本実施形態によれば、各情報提供サーバが、各利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全ての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完部が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   As described above, according to the present embodiment, each information providing server calculates, for each user, the sum of differences in evaluation values of pairs with all other users, and adds them together. This value is sent to the database supplement server as statistical information that has been processed to be unrecoverable, and the sum of the difference between the evaluation value of the pair and the evaluation value of all other users. In addition, since the complementing unit can supplement missing values in the database held by the database complementing server, the database after complementing can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

<第4の実施形態>
図17から図21を用いて、本発明の第4の実施形態に係るデータベース補完システムについて説明する。本実施形態は、第3の実施形態とデータベースの構成が異なり、少なくとも利用者が共通するデータベースを適用する場合について、説明する。なお、システム構成は、第1の実施形と同様であるため、ここでの詳細な説明は、省略する。
<Fourth Embodiment>
A database complementing system according to the fourth embodiment of the present invention will be described with reference to FIGS. The present embodiment will be described with respect to a case where the database configuration is different from that of the third embodiment, and at least a user common database is applied. Since the system configuration is the same as that of the first embodiment, a detailed description thereof is omitted here.

<情報提供サーバの構成>
図17を用いて、本実施形態に係る情報提供サーバの構成について説明する。なお、本実施形態においては、情報提供サーバ100およびデータベース補完サーバ200がともに、少なくとも利用者が共通するデータベース、いわゆる垂直分割モデルのデータベースを保有している。
<Configuration of information providing server>
The configuration of the information providing server according to the present embodiment will be described with reference to FIG. In the present embodiment, both the information providing server 100 and the database supplementing server 200 have at least a database common to users, that is, a so-called vertical division model database.

図17に示すように、情報提供サーバ100は、統計情報生成部113と、統計情報送信部123とから構成されている。ここで、統計情報生成部113は、各利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全ての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として生成する。統計情報送信部123は、統計情報生成部113が生成した統計情報をデータベース補完サーバ200に送信する。   As illustrated in FIG. 17, the information providing server 100 includes a statistical information generation unit 113 and a statistical information transmission unit 123. Here, for each user, the statistical information generation unit 113 obtains the sum of the differences of the evaluation values of the pairs with all other users, and adds all these values together with all other users. The total sum of the difference of the evaluation values of the pair is generated as statistical information processed so as not to be restored. The statistical information transmission unit 123 transmits the statistical information generated by the statistical information generation unit 113 to the database supplement server 200.

<データベース補完サーバの構成>
図18を用いて、本実施形態に係るデータベース補完サーバの構成について説明する。
<Configuration of database supplement server>
The configuration of the database supplement server according to this embodiment will be described with reference to FIG.

図18に示すように、データベース補完サーバ200は、統計情報受信部210と、補完部223とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。   As shown in FIG. 18, the database complementing server 200 includes a statistical information receiving unit 210 and a complementing unit 223. In addition, about the component which attaches | subjects the same code | symbol as 1st Embodiment, since it has the same function, the detailed description is abbreviate | omitted.

補完部223は、保有するデータベースにおいて、補完する欠損値に対応するアイテムの他のすべての利用者の評価値の平均値と、保有するデータベースにおいて対応する特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、各情報提供サーバから受信した特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値とを加算したものを分子に、特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和と、各情報提供サーバから受信したサンプル数の総和とを加算したものを分母としたときの値を用いて、欠損値を補完する。   The complement unit 223 has an average value of evaluation values of all other users of the item corresponding to the missing value to be complemented in the possessed database, a specific user corresponding to the possessed database, and all other users. The sum of the differences between the evaluation values of the pair and the sum of all these values and the sum of the differences between the evaluation values of the pair of the specific user and all other users received from each information providing server The sum of the difference between the evaluation values of a pair of a specific user and all other users is used as the numerator, and the sum of all these values is added to the sum of the number of samples. The missing value is supplemented using a value obtained by adding the sum of the number of samples received from each information providing server as a denominator.

図19および図20のデータベースを用いて、補完について、具体的に説明する。なお、本実施形態においては、図19(A)および図20(A)のデータベースのアイテムと利用者とを入れ替えた図19(B)および図20(B)を用いて、補完処理を行う。
いま、データベース補完サーバ200のデータベースにおける「Us2」、「It4」に対応する欠損値Val(2,4)を補完する場合について説明する。なお、図中、「*」は、欠損値を示す。
Complementation will be specifically described using the databases shown in FIGS. 19 and 20. In the present embodiment, the complementing process is performed using FIG. 19B and FIG. 20B in which the items in the database in FIG. 19A and FIG.
Now, a case where the missing value Val (2, 4) corresponding to “Us2” and “It4” in the database of the database complementing server 200 is complemented will be described. In the figure, “*” indicates a missing value.

まず、情報提供サーバ100は、図19(B)において、各利用者について、他の全ての利用者と他の利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値を計算する。例えば、情報提供サーバ100の持つデータベースについて、「Us1」と他の全ての利用者とのペアの評価値の差分の総和を求め、これらを全て足し合わせた値Sum(1、100)は、数15のようになる。   First, in FIG. 19B, the information providing server 100 obtains, for each user, the sum of differences in evaluation values of pairs of all other users and other users, and adds them together. Calculate the value. For example, for the database possessed by the information providing server 100, the sum Sum of the difference between the evaluation values of the pairs “Us1” and all other users is calculated, and the sum Sum (1, 100) of all of these is the number It will be like 15.

Figure 0005948171
Figure 0005948171

このときのサンプル数Num(1,100)=4と表す。   The number of samples at this time is expressed as Num (1,100) = 4.

情報提供サーバ100は、各利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、このときのサンプル数を復元不能に加工した統計情報として通知する。すなわち、((Sum(1,100)、Num(1,100)、(Sum(2,100)、Num(2,100)、(Sum(3,100)、Num(3,100))を統計情報として、データベース補完サーバ200に送る。これらの情報は、数16のようになる。   For each user, the information providing server 100 calculates the sum of the differences between the evaluation values of the pairs with all other users, and processes the sum of all of these values and the number of samples at this time so that they cannot be restored. Notify as statistical information. That is, ((Sum (1,100), Num (1,100), (Sum (2,100), Num (2,100), (Sum (3,100), Num (3,100))) Information is sent to the database supplement server 200. These pieces of information are as shown in Expression 16.

Sum(2,100)=(P50−P53))+(P52−P54)+(P56−P54)
Num(2,100)=3
Sum(3,100)=Sum3=(P51−P55)+(P52−P56)+(P54−P56)
Num(3,100)=3
Sum (2,100) = (P50−P53)) + (P52−P54) + (P56−P54)
Num (2,100) = 3
Sum (3,100) = Sum3 = (P51−P55) + (P52−P56) + (P54−P56)
Num (3,100) = 3

データベース補完サーバ200の補完部223は、保有するデータベース(図19(B))において、補完する欠損値に対応するアイテム「It4」の他の利用者の評価値の平均値を数16のように、求める。   The complementing unit 223 of the database complementing server 200 calculates the average value of the evaluation values of other users of the item “It4” corresponding to the missing value to be complemented in the database (FIG. 19 (B)) as shown in Equation 16. ,Ask.

Figure 0005948171
Figure 0005948171

次に、データベース補完サーバ200の保有するデータベース(図20(B))において、「Us2」と他の利用者との差分の総和Sum(2、200)を数17のように求める。   Next, in the database held by the database complementing server 200 (FIG. 20B), the sum Sum (2, 200) of differences between “Us2” and other users is obtained as shown in Equation 17.

Figure 0005948171
Figure 0005948171

このとき、Num(2,200)=3である。   At this time, Num (2,200) = 3.

そして、数16の演算結果、数17から得られるSum(2、200)、Num(2,100)、受信したSum(2、100)およびNum(2,100)を用いて、数18から補完値を求める。なお、他の補完値についても同様の手順で演算を行う。   Then, using the calculation result of Expression 16, Sum (2, 200), Num (2, 100) obtained from Expression 17, and the received Sum (2, 100) and Num (2, 100), complementing from Expression 18 Find the value. The calculation is performed in the same procedure for other complementary values.

Figure 0005948171
Figure 0005948171

情報提供サーバが複数存在する場合には、各情報提供サーバから受信した統計情報内の欠損値に対応する利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値を加算し、各情報提供サーバから受信したサンプル数を全て加算し、以下同様に欠損値を補完する。すなわち、新たに情報提供サーバ101が存在するとき、数19のようになる。   When there are multiple information providing servers, for the users corresponding to the missing values in the statistical information received from each information providing server, find the sum of the differences in the evaluation values of the pairs with all other users, The sum of these values is added, the number of samples received from each information providing server is added, and the missing values are complemented in the same manner. That is, when the information providing server 101 newly exists, the following equation 19 is obtained.

Figure 0005948171
Figure 0005948171

<データベース補完システムの処理>
図21を用いて、本実施形態に係るデータベース補完システムの処理について説明する。
<Processing of database complementation system>
The process of the database complementation system according to this embodiment will be described with reference to FIG.

まず、各情報提供サーバは、保有するデータベースにおいて、各利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全ての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として生成し(ステップS401)、生成した統計情報をデータベース補完サーバに送信する(ステップS402)。データベース補完サーバは、統計情報を受信し(ステップS403)、保有するデータベースにおいて、補完する欠損値に対応するアイテムの他のすべての利用者の評価値の平均値と、保有するデータベースにおいて対応する特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、各情報提供サーバから受信した特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値とを加算したものを分子に、特定の利用者と他のすべての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和と、各情報提供サーバから受信したサンプル数の総和とを加算したものを分母としたときの値を用いて、欠損値を補完する(ステップS404)。   First, each information providing server obtains the sum of the differences of the evaluation values of pairs with all other users for each user in the database that it holds, and adds all these values together with all other values. The total sum of the difference of the evaluation values of the pair with the user is generated as statistical information processed to be unrecoverable (step S401), and the generated statistical information is transmitted to the database complementing server ( Step S402). The database complementing server receives the statistical information (step S403), and in the retained database, the average value of the evaluation values of all other users of the item corresponding to the missing value to be complemented and the identification corresponding to the retained database The sum of the differences in the evaluation values of the pair of the user and all other users is calculated, and the sum of all the values is added to the specific user received from each information providing server and all other users. The sum of the differences of the evaluation values of a pair of a specific user and all other users is calculated using the sum of the sum of the differences of the evaluation values of the pair and the sum of all of these values as the numerator. The missing value is supplemented using a value obtained by adding the sum of the number of samples at the time of obtaining the sum of the number of samples received from each information providing server as the denominator (step S4). 4).

以上、説明したように、本実施形態によれば、各情報提供サーバが、各利用者について、他の全ての利用者とのペアの評価値の差分の総和を求め、これらをすべて足し合わせた値と、他の全ての利用者とのペアの評価値の差分の総和を求めたときのサンプル数の総和とを復元不能に加工した統計情報として、データベース補完サーバに送信し、この情報を用いて、補完部が、データベース補完サーバが保有するデータベース内の欠損値を補完することができるため、補完後のデータベースを様々な用途に利用することができる。また、従来の技術のように、暗号化処理を行わないため、処理速度を向上させることができる。   As described above, according to the present embodiment, each information providing server calculates, for each user, the sum of differences in evaluation values of pairs with all other users, and adds them together. This value is sent to the database supplement server as statistical information that has been processed to be unrecoverable, and the sum of the difference between the evaluation value of the pair and the evaluation value of all other users. In addition, since the complementing unit can supplement missing values in the database held by the database complementing server, the database after complementing can be used for various purposes. Further, since the encryption process is not performed as in the conventional technique, the processing speed can be improved.

なお、データベース補完システムの処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを情報提供サーバ、データベース補完サーバに読み込ませ、実行することによって本発明のデータベース補完システムを実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。   The database complementing system of the present invention is recorded by recording the processing of the database complementing system on a recording medium that can be read by a computer system, causing the information providing server and the database complementing server to read and execute the program recorded on the recording medium. Can be realized. The computer system here includes an OS and hardware such as peripheral devices.

また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。   Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW (World Wide Web) system is used. The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.

また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。   The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、本実施形態においては、情報提供サーバの数を限定しなかったが、複数であることが好ましい。   The embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to the embodiments, and includes designs and the like that do not depart from the gist of the present invention. For example, in the present embodiment, the number of information providing servers is not limited, but a plurality of information providing servers is preferable.

100;情報提供サーバ
200;データベース補完サーバ
110;統計情報生成部
111;統計情報生成部
112;統計情報生成部
113;統計情報生成部
120;統計情報送信部
121;統計情報送信部
122;統計情報送信部
123;統計情報送信部
210;統計情報受信部
220;補完部
221;補完部
222;補完部
223;補完部
100; information providing server 200; database complementing server 110; statistical information generating unit 111; statistical information generating unit 112; statistical information generating unit 113; statistical information generating unit 120; statistical information transmitting unit 121; statistical information transmitting unit 122; Transmission unit 123; Statistical information transmission unit 210; Statistical information reception unit 220; Complement unit 221; Complement unit 222; Complement unit 223; Complement unit

Claims (7)

第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、
保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムであって、
前記情報提供サーバが、
情報提供サーバが保有する前記データベースにおいて、すべての前記第1の軸の項目のペアに、前記第2の軸の項目毎の各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する統計情報生成手段と、
該生成した統計情報を前記データベース補完サーバに送信する統計情報送信手段と、
を備え、
前記データベース補完サーバが、
前記統計情報を受信する統計情報受信手段と、
保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目について、補完する欠損値に対応する前記第1の軸の項目以外のすべての前記第1の軸の項目の評価値の平均値を算出し
各情報提供サーバから受信した前記統計情報内の補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第1の総和値と、保有するデータベースにおいて、前記補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第2の総和値とを加算した第1の加算値を算出し、
前記情報提供サーバから受信した前記サンプル数前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出をしたときのサンプル数とを加算した第2の加算値を算出し、
前記第1の加算値を前記第2の加算値で除したものを、前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペアについて算出した上で加算した第3の加算値を算出し、
さらに、前記第3の加算値を前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペア数で除した値と前記平均値とを加算して、前記欠損値を補完する補完手段と、
を備えたことを特徴とするデータベース補完システム。
Comprising a two-dimensional tabular database consisting of a first axis and a second axis, the items of the first axis being common,
A database complementing system comprising a database complementing server that complements missing values in a database that it holds, and one or more information providing servers that provide information for complementing missing values to the database complementing server,
The information providing server is
In the database the information providing server's item of each pair of all the first axis, each of the time of calculation of difference sum and said total sum of the values of each pair of each item of said second shaft Statistical information generating means for generating the number of samples as statistical information;
Statistical information transmitting means for transmitting the generated statistical information to the database supplement server;
With
The database supplement server is
Statistical information receiving means for receiving the statistical information;
In the database held, for the items of the second axis corresponding to the missing value to be complemented, the evaluation values of all the items of the first axis other than the item of the first axis corresponding to the missing value to be complemented Calculate the average value,
A pair of an item on the first axis corresponding to a missing value to be complemented in the statistical information received from each information providing server and an item on the first axis different from the corresponding item on the first axis The first sum value, which is the sum of the differences of the evaluation values for each item of the second axis calculated in step 2, and the correspondence between the first axis item corresponding to the missing value to be complemented in the database held The second sum value, which is the sum of the differences of the evaluation values for each item of the second axis, calculated in a pair with the item of the first axis different from the item of the first axis to be added Calculating a first addition value;
Second addition obtained by adding the number of samples when the calculated difference sum of the evaluation value of the first axis item pairs which corresponds in the database to the held and the number of samples received from the information providing server Calculate the value,
Wherein the first thing that the added value is divided by the second sum value, the corresponding first axis items and all the first axis different from the corresponding item in the first axis Calculate the third added value after calculating the pair with the item of
Further, the value obtained by dividing the third addition value by the number of pairs of the corresponding first axis item and all the first axis items different from the corresponding first axis item. And a means for complementing the missing value by adding the average value and
A database complementing system characterized by comprising:
第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とする請求項に記載のデータベース補完システム。 A user or user group is assigned to one of the first axis and the second axis, an item is assigned to the other, and one of the first axis and the second axis is the tabular form The database complementing system according to claim 1 , wherein the database corresponds to a row of the database and the other corresponds to a column of the tabular database. 第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、1つ以上の情報提供サーバから、各情報提供サーバが保有する前記データベースにおいて、すべての前記第1の軸の項目のペア毎に、前記第2の軸の項目毎の各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを復元不能に加工した統計情報として受信し、保有するデータベース内の欠損値を補完するデータベース補完サーバであって、
前記保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目について、補完する欠損値に対応する前記第1の軸の項目以外のすべての前記第1の軸の項目の評価値の平均値を算出し
各情報提供サーバから受信した前記統計情報内の補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第1の総和値と、保有するデータベースにおいて、前記補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第2の総和値とを加算した第1の加算値を算出し、
前記情報提供サーバから受信した前記サンプル数前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出をしたときのサンプル数とを加算した第2の加算値を算出し、
前記第1の加算値を前記第2の加算値で除したものを、前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペアについて算出した上で加算した第3の加算値を算出し、
さらに、前記第3の加算値を前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペア数で除した値と前記平均値とを加算して、前記欠損値を補完する補完手段を備えたことを特徴とするデータベース補完サーバ。
The first axis and the second axis, each of which includes a two-dimensional tabular database in which the items of the first axis are common, and each information providing server holds from one or more information providing servers In the database, for each pair of all items on the first axis, the sum of the difference of the values of each pair for each item on the second axis and the number of samples when the sum is calculated cannot be restored. It is a database complement server that receives as processed statistical information and complements missing values in the database it owns,
Evaluation values of all items of the first axis other than the items of the first axis corresponding to the missing value to be complemented for the items of the second axis corresponding to the missing value to be complemented in the database held. The average value of
A pair of an item on the first axis corresponding to a missing value to be complemented in the statistical information received from each information providing server and an item on the first axis different from the corresponding item on the first axis The first sum value, which is the sum of the differences of the evaluation values for each item of the second axis calculated in step 2, and the correspondence between the first axis item corresponding to the missing value to be complemented in the database held The second sum value, which is the sum of the differences of the evaluation values for each item of the second axis, calculated in a pair with the item of the first axis different from the item of the first axis to be added Calculating a first addition value;
Second addition obtained by adding the number of samples when the calculated difference sum of the evaluation value of the first axis item pairs which corresponds in the database to the held and the number of samples received from the information providing server Calculate the value,
Wherein the first thing that the added value is divided by the second sum value, the corresponding first axis items and all the first axis different from the corresponding item in the first axis Calculate the third added value after calculating the pair with the item of
Further, the value obtained by dividing the third addition value by the number of pairs of the corresponding first axis item and all the first axis items different from the corresponding first axis item. A database complementing server comprising a complementing unit that supplements the missing value by adding the average value and the average value .
第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とする請求項に記載のデータベース補完サーバ。 A user or user group is assigned to one of the first axis and the second axis, an item is assigned to the other, and one of the first axis and the second axis is the tabular form 4. The database complementing server according to claim 3 , wherein the database corresponds to a row of the database and the other corresponds to a column of the tabular database. 第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、
保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法であって、
前記情報提供サーバが、情報提供サーバが保有する前記データベースにおいて、すべての前記第1の軸の項目のペアに、前記第2の軸の項目毎の各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する第1のステップと、
前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、
前記データベース補完サーバが、前記統計情報を受信する第3のステップと、
前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目について、補完する欠損値に対応する前記第1の軸の項目以外のすべての前記第1の軸の項目の評価値の平均値を算出し、各情報提供サーバから受信した前記統計情報内の補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第1の総和値と、保有するデータベースにおいて、前記補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第2の総和値とを加算した第1の加算値を算出し、前記情報提供サーバから受信した前記サンプル数前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出をしたときのサンプル数とを加算した第2の加算値を算出し、前記第1の加算値を前記第2の加算値で除したものを、前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペアについて算出した上で加算した第3の加算値を算出し、さらに、前記第3の加算値を前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペア数で除した値と前記平均値とを加算して、前記欠損値を補完する第4のステップと、
を備えたことを特徴とするデータベース補完方法。
Comprising a two-dimensional tabular database consisting of a first axis and a second axis, the items of the first axis being common,
A database complementing method in a database complementing system comprising a database complementing server that complements a missing value in a held database and one or more information providing servers that provide information for complementing the missing value to the database complementing server. ,
The information providing server, in the database information providing server's, for each pair of fields of all the first axis, the differential sum and said total sum of the values of each pair of each item of said second shaft A first step of generating, as statistical information, the number of each sample when calculating
A second step in which the information providing server transmits the generated statistical information to the database complementing server;
A third step in which the database supplement server receives the statistical information;
In the database held by the database complementing server, for the items of the second axis corresponding to the missing value to be complemented , all the first axes other than the item of the first axis corresponding to the missing value to be complemented calculates an average value of the evaluation value of the item, the items of the first axis of items and the corresponding said first axis corresponding to the missing value complementary to in the statistical information received from the information providing server Is a first sum value that is the sum of differences of evaluation values for each item of the second axis calculated in a pair with a different item of the first axis, and the missing value to be complemented in the database held of the difference between the evaluation value of each item of the second axis calculated in pair with the corresponding said first axis of items and different the first axis with the corresponding entry in the said first axis summing the second sum value is the sum Was first calculates a sum value, when the calculated difference sum of the evaluation value of the first axis of item pairs corresponding in a database that the held and the number of samples received from the information providing server the number of samples to calculate a second sum value obtained by adding, said divided by the second sum value of the first sum value, the first item and the corresponding said first axis the corresponding A third addition value calculated after all the pairs of the first axis items that are different from the one axis item are calculated, and further, the third addition value is calculated as the corresponding first value. The value obtained by dividing the number of pairs of the item of one axis and the number of pairs of all the items of the first axis different from the corresponding item of the first axis and the average value are added , and the missing value is calculated. A fourth step to complement,
A database complementing method characterized by comprising:
第1の軸と第2の軸のうち、一方に利用者又は利用者集団が割り当てられ、他方にアイテムが割り当てられ、かつ、第1の軸と第2の軸のうち、一方が前記表形式のデータベースの行に相当し、他方が前記表形式のデータベースの列に相当することを特徴とする請求項に記載のデータベース補完方法。 A user or user group is assigned to one of the first axis and the second axis, an item is assigned to the other, and one of the first axis and the second axis is the tabular form 6. The database complementing method according to claim 5 , wherein the database corresponds to a row of the database and the other corresponds to a column of the tabular database. 第1の軸と第2の軸とからなり、前記第1の軸の項目が共通する2次元の表形式のデータベースを備え、
保有するデータベース内の欠損値を補完するデータベース補完サーバと、該データベース補完サーバに欠損値を補完するための情報を提供する1つ以上の情報提供サーバからなるデータベース補完システムにおけるデータベース補完方法をコンピュータに実行させるためのプログラムであって、
前記情報提供サーバが、情報提供サーバが保有する前記データベースにおいて、すべての前記第1の軸の項目のペアに、前記第2の軸の項目毎の各ペアの値の差分の総和と該総和を算出したときの各サンプル数とを統計情報として生成する第1のステップと、
前記情報提供サーバが、該生成した統計情報を前記データベース補完サーバに送信する第2のステップと、
前記データベース補完サーバが、前記統計情報を受信する第3のステップと、
前記データベース補完サーバが、保有するデータベースにおいて、補完する欠損値に対応する前記第2の軸の項目について、補完する欠損値に対応する前記第1の軸の項目以外のすべての前記第1の軸の項目の評価値の平均値を算出し、各情報提供サーバから受信した前記統計情報内の補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第1の総和値と、保有するデータベースにおいて、前記補完する欠損値に対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なる前記第1の軸の項目とのペアにおいて算出した前記第2の軸の項目毎の評価値の差分の総和である第2の総和値とを加算した第1の加算値を算出し、前記情報提供サーバから受信した前記サンプル数前記保有するデータベースにおいて対応する前記第1の軸の項目のペアの評価値の差分の総和を算出をしたときのサンプル数とを加算した第2の加算値を算出し、前記第1の加算値を前記第2の加算値で除したものを、前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペアについて算出した上で加算した第3の加算値を算出し、さらに、前記第3の加算値を前記対応する前記第1の軸の項目と該対応する前記第1の軸の項目とは異なるすべての前記第1の軸の項目とのペア数で除した値と前記平均値とを加算して、前記欠損値を補完する第4のステップと、
をコンピュータに実行させるためのプログラム。
Comprising a two-dimensional tabular database consisting of a first axis and a second axis, the items of the first axis being common,
A database complementing method in a database complementing system comprising a database complementing server that complements a missing value in a held database and one or more information providing servers that provide information for complementing the missing value to the database complementing server. A program for executing the program,
The information providing server, in the database information providing server's, for each pair of fields of all the first axis, the differential sum and said total sum of the values of each pair of each item of said second shaft A first step of generating, as statistical information, the number of each sample when calculating
A second step in which the information providing server transmits the generated statistical information to the database complementing server;
A third step in which the database supplement server receives the statistical information;
In the database held by the database complementing server, for the items of the second axis corresponding to the missing value to be complemented , all the first axes other than the item of the first axis corresponding to the missing value to be complemented calculates an average value of the evaluation value of the item, the items of the first axis of items and the corresponding said first axis corresponding to the missing value complementary to in the statistical information received from the information providing server Is a first sum value that is the sum of differences of evaluation values for each item of the second axis calculated in a pair with a different item of the first axis, and the missing value to be complemented in the database held of the difference between the evaluation value of each item of the second axis calculated in pair with the corresponding said first axis of items and different the first axis with the corresponding entry in the said first axis summing the second sum value is the sum Was first calculates a sum value, when the calculated difference sum of the evaluation value of the first axis of item pairs corresponding in a database that the held and the number of samples received from the information providing server the number of samples to calculate a second sum value obtained by adding, said divided by the second sum value of the first sum value, the first item and the corresponding said first axis the corresponding A third addition value calculated after all the pairs of the first axis items that are different from the one axis item are calculated, and further, the third addition value is calculated as the corresponding first value. The value obtained by dividing the number of pairs of the item of one axis and the number of pairs of all the items of the first axis different from the corresponding item of the first axis and the average value are added , and the missing value is calculated. A fourth step to complement,
A program that causes a computer to execute.
JP2012154606A 2012-07-10 2012-07-10 Database complementing system, database complementing method, data complementing server and program Expired - Fee Related JP5948171B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012154606A JP5948171B2 (en) 2012-07-10 2012-07-10 Database complementing system, database complementing method, data complementing server and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012154606A JP5948171B2 (en) 2012-07-10 2012-07-10 Database complementing system, database complementing method, data complementing server and program

Publications (2)

Publication Number Publication Date
JP2014016872A JP2014016872A (en) 2014-01-30
JP5948171B2 true JP5948171B2 (en) 2016-07-06

Family

ID=50111475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012154606A Expired - Fee Related JP5948171B2 (en) 2012-07-10 2012-07-10 Database complementing system, database complementing method, data complementing server and program

Country Status (1)

Country Link
JP (1) JP5948171B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4812031B2 (en) * 2007-03-28 2011-11-09 Kddi株式会社 Recommender system
JP2012058972A (en) * 2010-09-08 2012-03-22 Sony Corp Evaluation prediction device, evaluation prediction method, and program

Also Published As

Publication number Publication date
JP2014016872A (en) 2014-01-30

Similar Documents

Publication Publication Date Title
CN109862018B (en) Anti-crawler method and system based on user access behavior
McGinn et al. Visualizing dynamic bitcoin transaction patterns
Sharma Evolution of as-a-Service Era in Cloud
JP2007501975A (en) Data processing system and method
Duriakova et al. PDMFRec: a decentralised matrix factorisation with tunable user-centric privacy
JP2019502957A (en) System and method for detecting leakage of confidential information while maintaining confidentiality
CN113179158B (en) Multi-party combined data processing method and device for controlling bandwidth
CN112100679A (en) Data processing method and device based on privacy protection and server
Reznichenko et al. Private-by-design advertising meets the real world
Raghavendra et al. [Retracted] Critical Retrospection of Security Implication in Cloud Computing and Its Forensic Applications
Dhasade et al. TEE-based decentralized recommender systems: The raw data sharing redemption
CN103049486B (en) A kind of disposal route of collaborative filtering distance and system
CN112800479A (en) Multi-party combined data processing method and device by using trusted third party
WO2015186574A1 (en) Information system, integrating device, first device, information processing method, and recording medium
JP5944251B2 (en) Item recommendation system, item recommendation method and program
JP5948171B2 (en) Database complementing system, database complementing method, data complementing server and program
CN113254989B (en) Fusion method and device of target data and server
Russo et al. Dare‐to‐Share: Collaborative privacy‐preserving recommendations with (almost) no crypto
CN115118520A (en) Data processing method and device and server
CN113810558A (en) Image encryption method and system based on big data
Ting et al. Personalized recommendation system based on web log mining and weighted bipartite graph
Eftekhar et al. Towards the development of a widely accepted cloud trust model
Kumar et al. Secure provenance-based communication using visual encryption
Priyadarshini et al. A Systematic Review of Cloud Storage Services-A Case Study on Amazon Web Services
CA3025825C (en) Data interaction processing method, device and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160606

R150 Certificate of patent or registration of utility model

Ref document number: 5948171

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees