JP2016139229A - Device and program for generating personal profile, and content recommendation device - Google Patents
Device and program for generating personal profile, and content recommendation device Download PDFInfo
- Publication number
- JP2016139229A JP2016139229A JP2015013057A JP2015013057A JP2016139229A JP 2016139229 A JP2016139229 A JP 2016139229A JP 2015013057 A JP2015013057 A JP 2015013057A JP 2015013057 A JP2015013057 A JP 2015013057A JP 2016139229 A JP2016139229 A JP 2016139229A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- tree structure
- node
- personal profile
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願発明は、キーワード同士がリンクされたリンク付きコーパスから、個人の嗜好に適応した個人プロファイルを生成する個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置に関する。 The present invention relates to a personal profile generation device that generates a personal profile adapted to individual preferences from a linked corpus in which keywords are linked to each other, a program thereof, and a content recommendation device.
従来より、番組やWebページなどのコンテンツへのアクセス履歴から、個人の嗜好をモデル化した個人プロファイルを生成し、個人の嗜好に応じたコンテンツを推薦する技術が提案されている。 2. Description of the Related Art Conventionally, a technique has been proposed in which a personal profile that models personal preferences is generated from access histories to content such as programs and Web pages, and content according to personal preferences is recommended.
例えば、特許文献1に記載の発明は、コンテンツに関するキーワードについての嗜好度を個別に計算し、視聴中に特化した番組推薦を行うものである。このとき、特許文献1に記載の発明では、視聴中のコンテンツだけではなく、視聴していない裏番組から抽出したキーワードとの相対関係から、キーワードについての嗜好度の精度を向上させている。 For example, the invention described in Patent Document 1 individually calculates a degree of preference for a keyword related to content, and performs program recommendation specialized during viewing. At this time, in the invention described in Patent Document 1, the accuracy of the preference degree of the keyword is improved not only from the content being viewed but also from the relative relationship with the keyword extracted from the back program that is not viewed.
また、特許文献2に記載の発明は、視聴者のニッチな嗜好を反映したコンテンツを推薦するため、番組の出演者情報を解析して出演者間の関係度合いを算出し、登場が少ない出演者にも視聴者の嗜好を反映させている。
In addition, the invention described in
また、特許文献3に記載の発明は、視聴者の嗜好を反映したコンテンツ推薦を行うため、アクセスしたコンテンツから抽出したキーワード毎にヒストグラムを算出し、そのヒストグラムに基づいてコンテンツを推薦するものである。 The invention described in Patent Document 3 calculates a histogram for each keyword extracted from accessed content and recommends the content based on the histogram in order to recommend content reflecting the viewer's preference. .
前記した従来技術は、視聴者がアクセスしたコンテンツに関するキーワードを抽出して、それらキーワードに基づいて推薦を行っている。つまり、従来技術では、抽出したキーワードの意味を解釈せずに単なるシンボルとして処理するため、概念空間へのマッピングが伴っていない。
なお、概念空間とは、物事や事象の概念が付与された疑似的な空間である。
In the above-described conventional technology, keywords related to content accessed by the viewer are extracted, and recommendation is performed based on the keywords. That is, in the prior art, since the meaning of the extracted keyword is not interpreted, it is processed as a mere symbol, and therefore, mapping to the concept space is not accompanied.
The concept space is a pseudo space to which the concept of things and events is given.
このため、従来技術では、抽出されたキーワードと概念的に同一であるが、抽出されなかった未知のキーワードを扱うことができない。その結果、従来技術では、広範な視聴者の嗜好が反映された個人プロファイルを生成できず、視聴者の嗜好に適したコンテンツを推薦できていないという問題がある。 For this reason, in the prior art, unknown keywords that are conceptually identical to the extracted keywords but not extracted cannot be handled. As a result, the conventional technology has a problem that a personal profile reflecting a wide range of viewer preferences cannot be generated, and content suitable for the viewer's preferences cannot be recommended.
そこで、本願発明は、広範な個人の嗜好が反映された個人プロファイルを生成できる個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置を提供することを課題とする。 SUMMARY OF THE INVENTION An object of the present invention is to provide a personal profile generation device capable of generating a personal profile reflecting a wide range of personal preferences, a program thereof, and a content recommendation device.
前記した課題に鑑みて、本願発明に係る個人プロファイル生成装置は、第1キーワード同士がリンクされたリンク付きコーパスから、個人の嗜好に適応した個人プロファイルを生成する個人プロファイル生成装置であって、初期グラフ生成手段と、グループ化手段と、グループ木構造グラフ生成手段と、プロファイル生成手段と、を備える構成とした。 In view of the above-described problems, the personal profile generation device according to the present invention is a personal profile generation device that generates a personal profile adapted to personal preference from a linked corpus in which first keywords are linked to each other. The configuration includes a graph generation unit, a grouping unit, a group tree structure graph generation unit, and a profile generation unit.
かかる構成によれば、個人プロファイル生成装置は、初期グラフ生成手段によって、リンク付きコーパスの第1キーワードをノードとして、リンクされた第1キーワード同士をエッジとして接続した第1初期グラフを生成する。
個人プロファイル生成装置は、グループ化手段によって、予め設定された終了条件を満たすまで第1初期グラフを再帰的にグループ化することで、木構造におけるノードの位置を表した位置情報が付加された第1グループ化グラフを生成する。
個人プロファイル生成装置は、グループ木構造グラフ生成手段によって、位置情報に基づいて第1グループ化グラフの各ノードを配置することで、第1グループ化グラフから、上位概念及び下位概念となるノード同士が木構造で階層化された第1グループ木構造グラフを生成する。
According to this configuration, the personal profile generation apparatus generates a first initial graph in which the first keyword of the linked corpus is connected as a node and the linked first keywords are connected as an edge by the initial graph generation unit.
The personal profile generation device regroups the first initial graph recursively until a predetermined termination condition is satisfied by the grouping means, so that the position information representing the position of the node in the tree structure is added. One grouped graph is generated.
The personal profile generation device arranges each node of the first grouping graph based on the position information by the group tree structure graph generation unit, so that the nodes that are the higher concept and the lower concept are found from the first grouping graph. A first group tree structure graph hierarchized by a tree structure is generated.
このように、個人プロファイル生成装置は、リンク付きコーパスの第1キーワードが表す概念を階層的にグループ化することで、第1グループ木構造グラフを生成する。言い換えるなら、個人プロファイル生成装置は、キーワードの意味するところをシンボル化して、擬似的な概念空間にキーワードをマッピングする。このようにして、個人プロファイル生成装置は、従来技術で困難であった概念空間までの拡張を実現している。 In this way, the personal profile generation device generates the first group tree structure graph by hierarchically grouping the concepts represented by the first keywords of the linked corpus. In other words, the personal profile generation apparatus symbolizes the meaning of the keyword and maps the keyword to the pseudo concept space. In this way, the personal profile generation device realizes expansion to a concept space that has been difficult in the prior art.
個人プロファイル生成装置は、プロファイル生成手段によって、個人が興味を持つコンテンツの内容を表した個人興味情報に基づいて、個人の嗜好を表す重みを第1グループ木構造グラフのノードに伝搬させることで、個人プロファイルを生成する。 The personal profile generation device propagates the weight representing the personal preference to the nodes of the first group tree structure graph based on the personal interest information representing the content of the content that the individual is interested in by the profile generation unit. Generate a personal profile.
また、本願発明に係るコンテンツ推薦装置は、本願発明の個人プロファイル生成装置と、個人プロファイルと推薦対象プロファイルとの一致度を算出し、算出した一致度の閾値判定によって、推薦対象のコンテンツを個人に推薦するか否かを判定するコンテンツ推薦手段と、を備える構成とした。 The content recommendation device according to the present invention calculates the degree of coincidence between the personal profile generation device according to the present invention and the personal profile and the recommendation target profile, and determines the recommended content to the individual by determining the threshold value of the calculated degree of coincidence. And a content recommendation means for determining whether or not to recommend.
本願発明によれば、以下のような優れた効果を奏する。
本願発明に係る個人プロファイル生成装置は、擬似的な概念空間にキーワードをマッピングし、概念空間まで個人プロファイルを拡張できるので、広範な個人の嗜好が反映された個人プロファイルを生成することができる。
本願発明に係るコンテンツ推薦装置は、個人プロファイル生成装置が生成した個人プロファイルを用いて、視聴者の嗜好に適したコンテンツを推薦することができる。
According to the present invention, the following excellent effects can be obtained.
The personal profile generation apparatus according to the present invention can map a keyword to a pseudo concept space and expand the personal profile to the concept space, so that a personal profile reflecting a wide range of individual preferences can be generated.
The content recommendation device according to the present invention can recommend content suitable for the viewer's preference using the personal profile generated by the personal profile generation device.
以下、本願発明の実施形態について、適宜図面を参照しながら詳細に説明する。
まず、本願発明の実施形態に係るコンテンツ推薦装置2で利用されるリンク付きコーパスを説明した後、コンテンツ推薦装置2の構成を説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings as appropriate.
First, after explaining the corpus with a link used in the
[リンク付きコーパス]
リンク付きコーパスとは、キーワード同士がリンク付けられた辞書コーパスのことである。リンク付きコーパスの代表例としては、ウィキペディアがあげられる。ウィキペディアは、キーワード間のリンク、及び、カテゴリに属する上位概念や下位概念のキーワードが管理されているので、リンク付きコーパスとして簡単に利用できる。
[Corpus with link]
A linked corpus is a dictionary corpus in which keywords are linked to each other. A typical example of a corpus with links is Wikipedia. Since Wikipedia manages links between keywords and keywords of higher concepts and lower concepts belonging to a category, it can be easily used as a corpus with links.
例えば、ウィキペディアには、俳優“○○○○”に関するページがある。図1のように、俳優“○○○○”のページの下部には、この俳優が属するカテゴリのキーワードとして、“日本の俳優”、“日本の歌手”、“△△市出身の人物”などが表示されている。 For example, Wikipedia has a page related to the actor “XXX”. As shown in Fig. 1, at the bottom of the page for the actor “XXX”, keywords of the category to which the actor belongs include “Japanese actor”, “Japanese singer”, “Person from △△ city”, etc. Is displayed.
ここで、各カテゴリでは、そのカテゴリに含まれる、上位概念又は下位概念となるキーワード同士がリンクされている。例えば、カテゴリのキーワード“日本の俳優”をクリックすると、“主要カテゴリ>…>俳優>各国の俳優>日本の俳優”と、“主要カテゴリ>…>日本の人物>日本の芸能人>日本の俳優”とが表示される。 Here, in each category, keywords that are included in the category and that are higher concepts or lower concepts are linked. For example, if you click on the keyword “Japanese actors” in the category, “Main categories>…> Actors> International actors> Japanese actors” and “Main categories>…> Japanese characters> Japanese entertainers> Japanese actors” Is displayed.
主要カテゴリの不等号“>”は、左側のキーワードが右側のキーワードの上位概念であることを表す。1つ目のカテゴリでは、キーワード“俳優”及び“各国の俳優”が上位概念及び下位概念の関係でリンクされ、キーワード“各国の俳優”及び“日本の俳優”も上位概念及び下位概念の関係でリンクされている。また、2つ目のカテゴリでは、キーワード“日本の人物”及び“日本の芸能人”が上位概念及び下位概念の関係でリンクされ、キーワード“日本の芸能人”及び“日本の俳優”も上位概念及び下位概念の関係でリンクされている。 The inequality sign “>” in the main category indicates that the left keyword is a superordinate concept of the right keyword. In the first category, the keywords “actors” and “actors of each country” are linked in relation to the superordinate concepts and subordinate concepts, and the keywords “actors in each country” and “Japanese actors” are also related to the superordinate concepts and subordinate concepts. Linked. Also, in the second category, the keywords “Japanese characters” and “Japanese entertainers” are linked in the relationship between the superordinate concepts and subordinate concepts, and the keywords “Japanese entertainers” and “Japanese actors” are also superordinate concepts and subordinates. Linked in a conceptual relationship.
また、例えば、カテゴリのキーワード“△△市出身の人物”をクリックすると、“主要カテゴリ>…>△△県出身の人物>△△市出身の人物>△△市出身の力士”が表示される。つまり、キーワード“△△市出身の人物”は、“△△県出身の人物”という上位概念のキーワードにリンクされている。さらに、キーワード“△△市出身の人物”は、“△△市出身の力士”という下位概念のキーワードにリンクされている。 Further, for example, when the category keyword “a person from a city” is clicked, “main category>... . That is, the keyword “person from △△ city” is linked to the keyword of the superordinate concept “person from △△ prefecture”. Furthermore, the keyword “a person from ΔΔ city” is linked to a subordinate concept keyword “ΔΔ city-born wrestler”.
なお、ある主要カテゴリでは、上位概念及び下位概念となるキーワード同士が、別の主要カテゴリでは反対にリンクされることもある。このように、ウィキペディアでは、上位概念及び下位概念の関係に曖昧さが残り、擬似的な概念空間にキーワードをマッピングする際の妨げとなる。 In some main categories, keywords that are a superordinate concept and a subordinate concept may be linked oppositely in another main category. Thus, in Wikipedia, ambiguity remains in the relationship between the superordinate concept and the subordinate concept, which hinders the mapping of keywords to the pseudo concept space.
[コンテンツ推薦装置の概略]
図2を参照し、コンテンツ推薦装置2の概略について説明する。
コンテンツ推薦装置2は、個人プロファイル生成装置1がリンク付きコーパスから個人プロファイルを生成し、生成した個人プロファイルに基づいて、コンテンツの推薦を行うものである。
[Outline of content recommendation device]
The outline of the
The
コンテンツ推薦装置2では、大きく分けて、3つの処理が行われる。まず、個人プロファイル生成装置1は、リンク付きコーパスをグラフ化し、それを木構造グラフに変換する(グループ木構造グラフ生成処理)。このとき、個人プロファイル生成装置1は、グラフ解析における連結程度の粗密具合を判定するグループ化処理(コミュニティ検出)を再帰的に施す。
In the
次に、個人プロファイル生成装置1は、各視聴者の嗜好を木構造グラフに反映した個人プロファイルを生成する(プロファイル生成処理)。このとき、コンテンツ推薦装置2は、木構造グラフを構成するノードに一致するキーワードを抽出し、そのノードに重みを加算すると同時に、木構造に沿ってその重みを伝搬する。これによって、各視聴者に適応した重み付き木構造グラフが生成され、個人プロファイルとして扱うことができる。
Next, the personal profile generation device 1 generates a personal profile that reflects each viewer's preference in the tree structure graph (profile generation processing). At this time, the
最後に、コンテンツ推薦装置2は、個人プロファイル生成装置1が生成した個人プロファイルを用いて、コンテンツの推薦を行う(コンテンツ推薦処理)。このとき、コンテンツ推薦装置2は、新たに生成した推薦対象プロファイルがどの程度個人プロファイルに一致しているかどうかで、推薦の可否を判定する。
Finally, the
[コンテンツ推薦装置の構成]
続いて、コンテンツ推薦装置2の構成について説明する。
図2のように、コンテンツ推薦装置2は、個人プロファイル生成装置1と、コンテンツ推薦手段70とを備える。
個人プロファイル生成装置1は、初期グラフ生成手段10と、グループ化手段20と、グループ木構造グラフ生成手段30と、グループ木構造グラフDB40と、プロファイル生成手段50と、プロファイルDB60とを備える。
[Configuration of content recommendation device]
Next, the configuration of the
As shown in FIG. 2, the
The personal profile generation device 1 includes an initial
初期グラフ生成手段10は、リンク付きコーパスが入力され、入力されたリンク付きコーパスのキーワード(第1キーワード)をノードとし、リンクされたキーワード同士をエッジとして接続した初期グラフ(第1初期グラフ、g_cat)を生成するものである。 The initial graph generation means 10 receives a linked corpus, an initial graph (first initial graph, g_cat) in which the keyword (first keyword) of the input linked corpus is used as a node and the linked keywords are connected as edges. ).
<初期グラフの生成>
図1,図3を参照し、初期グラフの生成について、詳細に説明する(適宜図2参照)。
この例では、ウィキペディアにおける俳優“○○○○”のページから、初期グラフAを生成することとする。例えば、初期グラフ生成手段10は、俳優“○○○○”のページのHTML(Hyper Text Markup Language)を解析し、このページの下部に表示されているカテゴリのキーワードを取得する。ここでは、初期グラフ生成手段10は、カテゴリのキーワードとして、“日本の俳優”、“△△市出身の人物”を取得したこととし、“日本の歌手”については説明を省略する。
<Generation of initial graph>
The initial graph generation will be described in detail with reference to FIGS. 1 and 3 (see FIG. 2 as appropriate).
In this example, the initial graph A is generated from the page of the actor “XXX” on Wikipedia. For example, the initial graph generation means 10 analyzes HTML (Hyper Text Markup Language) of the page of the actor “XXX”, and acquires the keyword of the category displayed at the bottom of this page. Here, it is assumed that the initial graph generation means 10 has acquired “Japanese actors” and “persons from ΔΔ city” as category keywords, and the description of “Japanese singers” is omitted.
図1のように、初期グラフ生成手段10は、カテゴリのキーワード“日本の俳優”のリンクを辿り、2つのカテゴリから、キーワード“俳優”、“各国の俳優”、“日本の人物”、“日本の芸能人”を取得する。さらに、初期グラフ生成手段10は、カテゴリのキーワード“△△市出身の人物”のリンクを辿り、キーワード“△△県出身の人物”、“△△市出身の力士”を取得する。 As shown in FIG. 1, the initial graph generation means 10 follows the link of the keyword “Japanese actor” in the category, and from the two categories, the keywords “actor”, “actors in various countries”, “Japanese characters”, “Japan” The “celebrity”. Further, the initial graph generation means 10 follows the link of the keyword “Δ △ from the city” of the category, and acquires the keywords “person from Δ △ prefecture” and “wrestler from ΔΔ city”.
この場合、図3のように、キーワード“俳優”、“各国の俳優”、“日本の人物”、“日本の芸能人”、“日本の俳優”、“△△県出身の人物”、“△△市出身の人物”、“△△市出身の力士”のそれぞれがノードとなる。 In this case, as shown in FIG. 3, the keywords “actors”, “actors from various countries”, “Japanese characters”, “Japanese entertainers”, “Japanese actors”, “△△ characters from prefectures”, “△△ Each of “a person from the city” and “△△ a wrestler from the city” is a node.
また、キーワード“俳優”と“各国の俳優”とのリンク、及び、キーワード“各国の俳優”と“日本の俳優”とのリンクがエッジとなる。また、キーワード“日本の人物”と“日本の芸能人”とのリンク、及び、キーワード“日本の芸能人”と“日本の俳優”とのリンクがエッジとなる。さらに、キーワード“△△県出身の人物”と“△△市出身の人物” とのリンク、及び、キーワード“△△市出身の人物”と“△△市出身の力士”とのリンクがエッジとなる。 Also, the link between the keyword “actor” and “actor of each country” and the link between the keyword “actor of each country” and “Japanese actor” are the edges. In addition, the links between the keywords “Japanese characters” and “Japanese entertainers” and the links between the keywords “Japanese entertainers” and “Japanese actors” are the edges. Furthermore, the links between the keywords “△△ person from prefecture” and “△△ person from city” and the link between keyword “△△ person from city” and “△△ city-born wrestler” Become.
この他、別の主要カテゴリにおいて、キーワード“各国の俳優”と“日本の人物”とのリンク、キーワード“日本の人物”と“△△県出身の人物”のリンクが存在していたので、これらリンクもエッジとなる。
従って、初期グラフ生成手段10は、前記したノードのそれぞれをエッジで接続し、図3のような初期グラフAを生成する。
In addition, in another major category, there was a link between the keyword “actors from each country” and “Japanese people”, and a keyword “Japanese people” and “△ △ Prefecture-born people”. Links are also edges.
Therefore, the initial graph generation means 10 connects each of the nodes described above with an edge, and generates an initial graph A as shown in FIG.
図2に戻り、初期グラフ生成手段10について、説明を続ける。
また、初期グラフ生成手段10は、推薦対象情報が入力され、入力された推薦対象情報にキーワード抽出処理(例えば、形態素解析処理)を施し、推薦対象情報からキーワード(第3キーワード)を抽出する。そして、初期グラフ生成手段10は、推薦対象情報の第3キーワードのうち、リンク付きコーパスのキーワードに一致するものを抽出する(名寄せ処理)。
Returning to FIG. 2, the description of the initial graph generation means 10 will be continued.
Further, the initial graph generation means 10 receives recommendation target information, performs keyword extraction processing (for example, morpheme analysis processing) on the input recommendation target information, and extracts a keyword (third keyword) from the recommendation target information. Then, the initial graph generation means 10 extracts the third keyword of the recommendation target information that matches the keyword of the linked corpus (name identification process).
なお、推薦対象情報とは、推薦対象となるコンテンツの内容を表す情報である。例えば、推薦対象情報としては、推薦対象となる放送番組について、EPGの番組内容情報又は字幕情報があげられる。 Note that the recommendation target information is information representing the content of the content to be recommended. For example, the recommendation target information includes EPG program content information or caption information for a broadcast program to be recommended.
さらに、初期グラフ生成手段10は、抽出された第3キーワードをノードとして、リンク付きコーパスにおけるキーワード同士のリンクにより、第3キーワード同士をエッジとして接続した第2初期グラフを生成する。このとき、初期グラフ生成手段10は、リンク付きコーパスのキーワードに一致する第3キーワードのみを抽出したため、リンク付きコーパスにおけるキーワード同士のリンクを利用して、第3キーワード同士を接続できる。
その後、初期グラフ生成手段10は、生成した初期グラフA及び第2初期グラフをグループ化手段20に出力する。
Furthermore, the initial graph generation means 10 generates a second initial graph in which the third keywords are connected as edges by using the extracted third keywords as nodes and by linking the keywords in the linked corpus. At this time, since the initial graph generation means 10 extracts only the third keyword that matches the keyword of the linked corpus, the third keyword can be connected using the links of the keywords in the linked corpus.
Thereafter, the initial
グループ化手段20は、初期グラフ生成手段10から入力された初期グラフAを再帰的にグループ化することで、位置情報が付加されたグループ化グラフ(第1グループ化グラフ、g_cat_tree)を生成するものである。
The
具体的には、グループ化手段20は、ノード間の連結粗密情報による再帰的グループ化処理を初期グラフAに施す。このとき、グループ化手段20は、再帰的グループ化処理によって、後記する位置情報を各ノードに付加する。この再帰的グループ化処理は、下記の参考文献に記載されている。
参考文献:Vincent D Blondel et.al,“Fast unfolding of communities in large networks”,“Journal of Statistical Mechanics:Theory and Experiment 2008(10),P10008(12pp)”
Specifically, the grouping means 20 performs a recursive grouping process on the initial graph A based on connection density information between nodes. At this time, the grouping means 20 adds position information described later to each node by recursive grouping processing. This recursive grouping process is described in the following references.
References: Vincent D Blondel et.al, “Fast unfolding of communities in large networks”, “Journal of Statistical Mechanics: Theory and Experiment 2008 (10), P10008 (12pp)”
なお、連結粗密情報とは、対象となるノードが属するグループを表す指標であり、ノード同士の類似度と言うこともできる。前記参考文献に記載の手法では、連結粗密情報として、モジュラリティ(modularity)と呼ばれる指標を用いて、コミュニティ検出を行っている。 Note that the connection density information is an index representing a group to which the target node belongs, and can also be referred to as the similarity between nodes. In the method described in the above-mentioned reference, community detection is performed using an index called modularity as the connection density information.
<再帰的グループ化処理>
図4〜図6を参照し、再帰的グループ化処理について、詳細に説明する(適宜図2参照)。
図4のように、グループ化手段20は、図3の初期グラフAのグループを初期化する。初期化された初期グラフAでは、全てのノードが同一のグループG1に属する。
<Recursive grouping>
The recursive grouping process will be described in detail with reference to FIGS. 4 to 6 (see FIG. 2 as appropriate).
As shown in FIG. 4, the grouping means 20 initializes the group of the initial graph A of FIG. In initialized initial graph A, all nodes belong to the same group G 1.
次に、グループ化手段20は、図4の初期グラフAに対し、グループG1を親グループとして、1回目のグループ化処理を施す。このとき、グループ化手段20は、各グループの親子関係(従属関係)を抽出し、連結部分が密なノード同士を子グループとして纏める。
Then, the
図5のように、グループ化手段20は、親グループG1を、ノード“俳優”、“各国の俳優”、“日本の人物”、“日本の芸能人”、“日本の俳優”が纏まった子グループG2と、ノード“△△県出身の人物”、“△△市出身の人物”、“△△市出身の力士”が纏まった子グループG3とに分割する。 As shown in FIG. 5, the grouping means 20 is a child in which the parent group G 1 is composed of nodes “actors”, “actors from various countries”, “Japanese characters”, “Japanese entertainers”, and “Japanese actors”. The group G 2 is divided into the child group G 3 in which the nodes “a person from ΔΔ prefecture”, “a person from ΔΔ city”, and “wrestlers from ΔΔ city” are gathered.
次に、グループ化手段20は、図5の初期グラフAに対し、子グループであったグループG2,G3をそれぞれ親グループとして更新し、2回目のグループ化処理を施す。図6のように、グループ化手段20は、親グループG2を、ノード“俳優”、“各国の俳優”が纏まった子グループG21と、ノード“日本の人物”、“日本の芸能人”、“日本の俳優”が纏まった子グループG22とに分割する。
なお、グループG3は、分割されなかったこととする。
Next, the grouping means 20 updates the groups G 2 and G 3 that are child groups as parent groups to the initial graph A in FIG. 5 and performs the second grouping process. As shown in FIG. 6, the grouping means 20 divides the parent group G 2 into a node “actor”, a child group G 21 in which “actors of each country” are grouped, nodes “Japanese characters”, “Japanese entertainers”, "Japan of the actor" is divided into a child group G 22, which collectively.
The group G 3 are, and that has not been divided.
このように、グループ化手段20は、予め設定された終了条件を満たすまでグループ化処理を再帰的に施し、グループ化グラフBを生成する。このとき、グループ化手段20は、グループ化グラフBのグループ数を、後記するグループ木構造グラフの階層数以下にしたい。そこで、終了条件は、グループ化処理の実行回数が予め設定された回数(例えば、グループ木構造グラフの最大階層数)を超えた場合、グループ化処理を終了するという条件で設定される。 In this way, the grouping means 20 recursively performs the grouping process until a preset end condition is satisfied, thereby generating a grouped graph B. At this time, the grouping means 20 wants the number of groups in the grouping graph B to be less than or equal to the number of layers in the group tree structure graph described later. Therefore, the termination condition is set under the condition that the grouping process is terminated when the number of execution times of the grouping process exceeds a preset number of times (for example, the maximum number of hierarchies of the group tree structure graph).
図2に戻り、グループ化手段20について、説明を続ける。
また、グループ化手段20は、初期グラフ生成手段10から入力された第2初期グラフを再帰的にグループ化することで、位置情報が付加された第2グループ化グラフを生成する。ここで、グループ化手段20は、グループ化グラフBと同様の手順で、第2グループ化グラフを生成できるため、説明を省略する。
その後、グループ化手段20は、生成したグループ化グラフB及び第2グループ化グラフをグループ木構造グラフ生成手段30に出力する。
Returning to FIG. 2, the description of the grouping means 20 will be continued.
The
Thereafter, the
グループ木構造グラフ生成手段30は、グループ化手段20から入力されたグループ化グラフBの各ノードに付加された位置情報に基づいて、各視聴者(各個人)に共通するグループ木構造グラフ(第1グループ木構造グラフ)を1つ生成するものである。
なお、グループ木構造グラフは、上位概念及び下位概念となるノード同士が木構造で階層化されたグラフである。
The group tree structure graph generation means 30 is based on the position information added to each node of the grouping graph B input from the grouping means 20 and the group tree structure graph (first) common to each viewer (each individual). One group tree structure graph) is generated.
Note that the group tree structure graph is a graph in which the nodes that are the upper concept and the lower concept are hierarchized in a tree structure.
<グループ木構造グラフの生成>
以下、図7を参照し、グループ木構造グラフの生成について、説明する(適宜図2参照)。
<Generation of group tree structure graph>
Hereinafter, generation of a group tree structure graph will be described with reference to FIG. 7 (see FIG. 2 as appropriate).
前記したように、グループ化グラフBの各ノードには、再帰的グループ化処理により、位置情報が付加されている。この位置情報は、グループ木構造グラフにおけるノードの位置を表す情報であり、例えば、タプル形式で表される。タプル形式の位置情報は、左から順にカッコ内の各数値が、グループ木構造グラフの階層毎に辿るノードの位置を表している。 As described above, position information is added to each node of the grouping graph B by recursive grouping processing. This position information is information indicating the position of the node in the group tree structure graph, and is expressed in a tuple format, for example. The position information in the tuple format represents the position of the node in which each numerical value in parentheses traces for each hierarchy of the group tree structure graph in order from the left.
例えば、あるノードの位置情報が(0,2,25,11,2)であることとする。この場合、位置情報の先頭は、常にグループ木構造グラフのルートノードを表すため、‘0’になる。また、位置情報は、2番目の数値が‘2’であることから、グループ木構造グラフでルートノードから1つ下となる第1階層において、左から‘2’個目のノードを表す。また、位置情報は、3番目の数値が‘25’であることから、グループ木構造グラフの第2階層において、左から‘25’個目のノードを表す。また、位置情報は、4番目の数値が‘11’であることから、グループ木構造グラフの第3階層において、左から‘11’個目のノードを表す。また、位置情報は、5番目の数値が‘2’であることから、グループ木構造グラフの第4階層において、左から‘2’個目のノードを表す。 For example, assume that the position information of a certain node is (0, 2, 25, 11, 2). In this case, since the head of the position information always represents the root node of the group tree structure graph, it becomes “0”. Further, since the second numerical value is “2”, the position information represents the “2” -th node from the left in the first hierarchy that is one level lower than the root node in the group tree structure graph. Further, since the third numerical value is “25”, the position information represents the “25th” node from the left in the second layer of the group tree structure graph. In addition, since the fourth numerical value is “11”, the position information represents the “11” -th node from the left in the third layer of the group tree structure graph. Further, since the fifth numerical value is “2”, the position information represents the “2” -th node from the left in the fourth layer of the group tree structure graph.
以上より、位置情報は、このノードが、第4階層に位置することを表す。そして、位置情報は、このノードが、ルートノード、第1階層で左から‘2’個目のノード、第2階層で左から‘25’個目のノード、第3階層で左から‘11’個目のノードを順に経由して、第4階層で左から‘2’個目のノードであることを表す。
なお、各ノードの位置情報は、グループ木構造グラフ内で異なる位置を表し、重複しない。
As described above, the position information indicates that this node is located in the fourth hierarchy. The position information includes the root node, the '2' node from the left in the first layer, the '25' node from the left in the second layer, and the '11' from the left in the third layer. This indicates that the node is the '2' node from the left in the fourth layer through the nodes in order.
Note that the position information of each node represents a different position in the group tree structure graph and does not overlap.
そこで、グループ木構造グラフ生成手段30は、グループ化グラフBの各ノードに付加された位置情報が示す位置にそのノードを配置する。このようにして、グループ木構造グラフ生成手段30は、図6のグループ化グラフBを、図7のようなグループ木構造グラフCに変換できる。
Therefore, the group tree structure
前記したように、ウィキペディアでは、上位概念及び下位概念の関係に曖昧さが残る。そこで、個人プロファイル生成装置1は、ウィキペディアの各キーワードを概念的に類似するキーワード同士でグループ化し、グループ木構造グラフCを生成する。このグループ木構造グラフCは、全ノードで木構造が保たれているため、上位概念及び下位概念の関係に曖昧さが残っていない。 As described above, in Wikipedia, ambiguity remains in the relationship between the superordinate concept and the subordinate concept. Therefore, the personal profile generation device 1 groups the keywords of Wikipedia with keywords that are conceptually similar to each other, and generates a group tree structure graph C. In this group tree structure graph C, the tree structure is maintained at all nodes, so that there is no ambiguity in the relationship between the superordinate concept and the subordinate concept.
図2に戻り、グループ木構造グラフ生成手段30について、説明を続ける。
また、グループ木構造グラフ生成手段30は、グループ化手段20から入力された第2グループ化グラフの各ノードに付加された位置情報に基づいて、第2グループ木構造グラフを生成する。ここで、第2グループ木構造グラフは、グループ木構造グラフCと同様の手順で生成できるため、説明を省略する。
その後、グループ木構造グラフ生成手段30は、グループ木構造グラフC及び第2グループ木構造グラフをグループ木構造グラフDB40に書き込む。
Returning to FIG. 2, the description of the group tree structure graph generating means 30 will be continued.
The group tree structure
Thereafter, the group tree structure graph generation means 30 writes the group tree structure graph C and the second group tree structure graph in the group tree
グループ木構造グラフDB40は、グループ木構造グラフC及び第2グループ木構造グラフを記憶するデータベースである。このグループ木構造グラフDB40は、後記するプロファイル生成手段50により、参照される。
The group tree
プロファイル生成手段50は、アクセス履歴情報(個人興味情報)が入力され、入力されたアクセス履歴情報に基づいて、視聴者の嗜好を表した重みをグループ木構造グラフCのノードに伝搬させることで、視聴者毎に個人プロファイル(base_tree)を生成するものである。 The profile generation means 50 receives access history information (individual interest information) and propagates a weight representing the viewer's preference to the nodes of the group tree structure graph C based on the input access history information. A personal profile (base_tree) is generated for each viewer.
ここで、アクセス履歴情報とは、視聴者が興味を持つコンテンツの内容を表す情報であり、各視聴者がコンテンツにアクセスした履歴である。例えば、アクセス履歴情報としては、各視聴者が視聴した放送番組について、EPG(Electronic Program Guide)の番組内容情報又は字幕情報があげられる。
なお、個人プロファイルは、グループ木構造グラフCを各視聴者に適応させたものであるから、個人適応型グループ木構造グラフと呼ぶこともできる。
Here, the access history information is information representing the content of the content that the viewer is interested in, and is a history that each viewer has accessed the content. For example, the access history information includes EPG (Electronic Program Guide) program content information or subtitle information for a broadcast program viewed by each viewer.
Since the personal profile is obtained by adapting the group tree structure graph C to each viewer, it can also be called an individual adaptive group tree structure graph.
<個人プロファイルの生成>
図8を参照し、個人プロファイルの生成について、詳細に説明する(適宜図2参照)。
まず、プロファイル生成手段50は、アクセス履歴情報にキーワード抽出処理(例えば、形態素解析処理)を施し、アクセス履歴情報からキーワード(第2キーワード)を抽出する。次に、プロファイル生成手段50は、抽出した各キーワードに一致するグループ木構造グラフCのノードを探索する。そして、プロファイル生成手段50は、この探索されたノード(基準ノード)に予め設定された重みを加える。
なお、この重みは、任意の値に設定することができる。
<Generate personal profile>
The personal profile generation will be described in detail with reference to FIG. 8 (see FIG. 2 as appropriate).
First, the profile generation means 50 performs keyword extraction processing (for example, morpheme analysis processing) on the access history information, and extracts a keyword (second keyword) from the access history information. Next, the profile generation means 50 searches for a node of the group tree structure graph C that matches each extracted keyword. Then, the profile generation means 50 adds a preset weight to the searched node (reference node).
This weight can be set to an arbitrary value.
続いて、プロファイル生成手段50は、基準ノードから各ノードに到るまで階層が1つ上がる毎に上位係数αと階層が1つ下がる毎に下位係数βとが乗じられた重みを算出する。ここで、上位係数α及び下位係数βは、1以下の値で予め設定される。そして、プロファイル生成手段50は、算出した重みが予め設定された閾値以下になるまで、算出した重みを各ノードに加える。すなわち、プロファイル生成手段50は、上位係数α及び下位係数βが1の場合を除き、基準ノードから階層が離れる程に重みを小さくしながら、重みを伝搬させる。
Subsequently, the profile generation means 50 calculates a weight obtained by multiplying the higher coefficient α every time the hierarchy is increased from the reference node to each node and the lower coefficient β every time the hierarchy is decreased. Here, the higher coefficient α and the lower coefficient β are preset with values of 1 or less. Then, the
例えば、アクセス履歴情報から“日本の俳優”というキーワードが抽出された場合を考える。この場合、プロファイル生成手段50は、図8のように、グループ木構造グラフCのノード“日本の俳優”を基準ノードとして探索する。そして、プロファイル生成手段50は、基準ノード“日本の俳優”に重みを加える。
なお、図8では、accumが重みを表す。
For example, consider a case where the keyword “Japanese actor” is extracted from the access history information. In this case, the profile generation means 50 searches for the node “Japanese actor” of the group tree structure graph C as a reference node, as shown in FIG. Then, the profile generation means 50 adds weight to the reference node “Japanese actor”.
In FIG. 8, accum represents a weight.
次に、プロファイル生成手段50は、基準ノード“日本の俳優”からノード“日本の芸能人”まで階層が1つ上がるので、ノード“日本の芸能人”に重み×上位係数αを加算する。そして、プロファイル生成手段50は、基準ノード“日本の俳優”からノード“日本の人物”まで階層が2つ上がるので、ノード“日本の人物”に重み×上位係数α2を加算する。さらに、プロファイル生成手段50は、基準ノード“日本の俳優”からノード“△△県出身の人物”まで階層が2つ上がった後に1つ下がるので、ノード“△△県出身の人物”に重み×上位係数α2×下位係数βを加算する。
Next, the profile generation means 50 adds a weight × upper coefficient α to the node “Japanese entertainer” because the hierarchy goes up from the reference node “Japanese actor” to the node “Japanese entertainer”. The
ここで、プロファイル生成手段50は、重みが予め設定された閾値以下になるまで、算出した重みを各ノードに加算する。言い換えるなら、プロファイル生成手段50は、重みが閾値を超える範囲のノードには重みを加算し、重みが閾値以下になる範囲のノードには重みを加算しない。例えば、プロファイル生成手段50は、ノード“△△市出身の人物”では、重み×上位係数α2×下位係数β2の値が閾値以下になるので、ノード“△△市出身の人物”に重みを加算しない。 Here, the profile generation means 50 adds the calculated weight to each node until the weight falls below a preset threshold value. In other words, the profile generation means 50 adds weights to nodes in the range where the weight exceeds the threshold, and does not add weights to nodes in the range where the weight is less than or equal to the threshold. For example, since the value of weight × higher coefficient α 2 × lower coefficient β 2 is less than or equal to the threshold value at the node “ΔΔ person from the city”, the profile generation means 50 gives weight to the node “ΔΔ city person”. Is not added.
このようにして、プロファイル生成手段50は、各視聴者に最適化された個人プロファイルを生成する。これにより、個人プロファイル生成装置1は、キーワードの数が少なくても、視聴者の嗜好を表すキーワードの上位概念を見つけることが可能となる。 In this way, the profile generation means 50 generates a personal profile optimized for each viewer. Thereby, even if the number of keywords is small, the personal profile generation device 1 can find a high-level concept of keywords representing the viewer's preference.
なお、プロファイル生成手段50は、ある視聴者がコンテンツを視聴する都度、視聴されたコンテンツのアクセス履歴情報が入力される。従って、プロファイル生成手段50は、アクセス履歴情報が入力される都度、前記手順でプロファイルDB60の個人プロファイルに反映させてもよい。
Note that the profile generation means 50 receives the access history information of the viewed content every time a certain viewer views the content. Accordingly, the profile generation means 50 may reflect the access history information in the personal profile of the
図2に戻り、プロファイル生成手段50について、説明を続ける。
また、プロファイル生成手段50は、第2グループ木構造グラフのノードに重み付けを行うことで、推薦対象プロファイル(target_tree)を生成する。ここで、プロファイル生成手段50は、第2グループ木構造グラフのノードに、任意の手法で重み付けを行うことができる。例えば、プロファイル生成手段50は、tf−idf(Term Frequency-Inverse Document Frequency)法で重み付けを行ってもよい。また、プロファイル生成手段50は、第2グループ木構造グラフのノードが固有名詞のときは一般名詞よりも大きく重み付けを行い、そのノードが一般名詞のときは固有名詞よりも小さく重み付けを行ってもよい。
Returning to FIG. 2, the description of the profile generation means 50 will be continued.
Further, the profile generation means 50 generates a recommendation target profile (target_tree) by weighting the nodes of the second group tree structure graph. Here, the profile generation means 50 can weight the nodes of the second group tree structure graph by any method. For example, the profile generation means 50 may perform weighting by a tf-idf (Term Frequency-Inverse Document Frequency) method. Further, the profile generation means 50 may weight more heavily than a general noun when the node of the second group tree structure graph is a proper noun, and may weight less than the proper noun when the node is a general noun. .
その後、プロファイル生成手段50は、生成した個人プロファイル及び推薦対象プロファイルをプロファイルDB60に書き込む。
なお、推薦対象プロファイルは、個人プロファイルと同一の木構造を有するが、各ノードの重みが個人プロファイルで同一位置のノードと異なる。
Thereafter, the
The recommendation target profile has the same tree structure as the personal profile, but the weight of each node is different from the node at the same position in the personal profile.
プロファイルDB60は、個人プロファイル及び推薦対象プロファイルを記憶するデータベースである。このプロファイルDB60は、後記するコンテンツ推薦手段70により、参照される。
The
コンテンツ推薦手段70は、個人プロファイルと推薦対象プロファイルとの一致度を算出し、算出した一致度の閾値判定によって、推薦対象のコンテンツを視聴者に推薦するか否かを判定するものである。 The content recommendation means 70 calculates the degree of coincidence between the personal profile and the recommendation target profile, and determines whether or not to recommend the content to be recommended to the viewer by determining the threshold value of the calculated degree of coincidence.
<コンテンツの推薦>
以下、コンテンツの推薦について、詳細に説明する(適宜図2参照)。
本実施形態では、コンテンツ推薦手段70は、個人プロファイルと推薦対象プロファイルとの一致度として、推薦対象プロファイルが個人プロファイルにどの程度含まれているかを表す包含係数を算出する。
<Content recommendation>
Hereinafter, the content recommendation will be described in detail (see FIG. 2 as appropriate).
In the present embodiment, the
ここで、コンテンツ推薦手段70は、推薦対象プロファイル(target_tree)において、重みが‘0’を超えるリーフノードを全て抽出する。なお、リーフノードとは、推薦対象プロファイル及び個人プロファイルで最下層に位置するノードのことである。
Here, the
また、コンテンツ推薦手段70は、抽出された各リーフノードを起点として、ルートノードまでの重みを表したベクトルtarget_vec[i]を算出する。ここで、iは、リーフノードの番号を表す1以上の整数である。例えば、i番目のリーフノードの位置情報が(0,1,2,3,4)であることとする。この場合、コンテンツ推薦手段70は、ベクトルtarget_vec[i]として、[(0,1,2,3,4)_accum,(0,1,2,3)_accum,(0,1,2)_accum,(0,1)_accum,(0)_accum]という5次元のベクトルを算出する。
なお、accumの前に各ノードの位置情報を記載した。例えば、(0,1,2,3,4)_accumがi番目のリーフノードの重みを表し、(0)_accumがルートノードの重みを表す。
In addition, the
In addition, the position information of each node was described before accum. For example, (0, 1, 2, 3, 4) _accum represents the weight of the i-th leaf node, and (0) _accum represents the weight of the root node.
続いて、コンテンツ推薦手段70は、個人プロファイル(base_tree)において、重みが‘0’を超えるリーフノードを全て抽出し、抽出した各リーフノードを起点として、ルートノードまでの重みを表したベクトルbase_vec[i]を算出する。ここで、コンテンツ推薦手段70は、ベクトルbase_vec[i]を、ベクトルtarget_vec[i]と同様に算出するため、説明を省略する。
Subsequently, the
そして、コンテンツ推薦手段70は、ベクトルbase_vec[i]の各要素を、個人プロファイルを生成したときの補正係数を用いて平準化する。例えば、コンテンツ推薦手段70は、補正係数が個人プロファイルのキーワード総数の場合、ベクトルbase_vec[i]の各要素をキーワード総数で除算する。
なお、コンテンツ推薦手段70は、ベクトルtarget_vec[i]の各要素を平準化してもよいし、平準化しなくともよい。
Then, the
Note that the
続いて、コンテンツ推薦手段70は、ベクトルtarget_vec[i]とベクトルbase_vec[i]との内積をベクトル類似度として算出する。さらに、コンテンツ推薦手段70は、包含係数として、i個のベクトル類似度の平均値を算出する。つまり、コンテンツ推薦手段70は、同じリーフノードからルートノードまでの経路で生成したベクトルの内積により、各経路の重なり具合を表した指標を算出する。
Subsequently, the
続いて、コンテンツ推薦手段70は、包含係数(一致度)が予め設定された閾値以上であるか否かを判定する。
包含係数が閾値以上の場合、コンテンツ推薦手段70は、推薦対象となるコンテンツを視聴者に推薦するという判定結果を出力する。
包含係数が閾値未満の場合、コンテンツ推薦手段70は、推薦対象となるコンテンツを視聴者に推薦しないという判定結果を出力する。
Subsequently, the
When the inclusion coefficient is equal to or greater than the threshold, the
If the inclusion coefficient is less than the threshold, the
[個人プロファイル生成装置の動作:グループ木構造グラフ生成処理]
図9を参照し、個人プロファイル生成装置1のグループ木構造グラフ生成処理について、詳細に説明する(適宜図2参照)。
[Personal Profile Generation Device Operation: Group Tree Structure Graph Generation Processing]
With reference to FIG. 9, the group tree structure graph generation processing of the personal profile generation device 1 will be described in detail (see FIG. 2 as appropriate).
個人プロファイル生成装置1は、初期グラフ生成手段10によって、リンク付きコーパスのキーワードをノードとし、リンクされたキーワード同士をエッジとして接続した初期グラフAを生成する(ステップS1)。 The personal profile generation device 1 uses the initial graph generation means 10 to generate an initial graph A in which the keywords of the linked corpus are used as nodes and the linked keywords are connected as edges (step S1).
個人プロファイル生成装置1は、グループ化手段20によって、全てのノードが同一の親グループに属するように、初期グラフAのグループを初期化する(ステップS2)。
個人プロファイル生成装置1は、グループ化手段20によって、ノード間の連結粗密情報に基づいて、親グループを2以上の子グループに分割する(ステップS3)。
The personal profile generation device 1 initializes the group of the initial graph A by the grouping means 20 so that all the nodes belong to the same parent group (step S2).
In the personal profile generation device 1, the grouping means 20 divides the parent group into two or more child groups based on the connection density information between nodes (step S3).
個人プロファイル生成装置1は、グループ化手段20によって、各グループの親子関係を抽出する(ステップS4)。
個人プロファイル生成装置1は、グループ化手段20によって、終了条件を満たすか否かを判定する(ステップS5)。
The personal profile generation device 1 extracts the parent-child relationship of each group by the grouping means 20 (step S4).
The personal profile generation device 1 determines whether or not the end condition is satisfied by the grouping unit 20 (step S5).
終了条件を満たさない場合(ステップS5でNo)、個人プロファイル生成装置1は、グループ化手段20によって、ステップS4で抽出した子グループを親グループに更新し(ステップS6)、ステップS3の処理に戻る。 When the end condition is not satisfied (No in step S5), the personal profile generation device 1 updates the child group extracted in step S4 to the parent group by the grouping unit 20 (step S6), and returns to the process of step S3. .
終了条件を満たす場合(ステップS5でYes)、個人プロファイル生成装置1は、グループ木構造グラフ生成手段30によって、ステップS2〜S4の処理で生成されたグループ化グラフBにおいて、位置情報が示す位置に各ノードを配置することで、グループ木構造グラフCを生成する(ステップS7)。
以上の手順により、個人プロファイル生成装置1は、グループ木構造グラフCを生成できる。
If the end condition is satisfied (Yes in step S5), the personal profile generation device 1 uses the group tree structure
Through the above procedure, the personal profile generation device 1 can generate the group tree structure graph C.
なお、個人プロファイル生成装置1は、推薦対象情報にキーワード抽出処理を施し、リンク付きコーパスにおけるキーワード同士のリンクを利用することで、第2初期グラフを生成できる(ステップS1A)。
以後、個人プロファイル生成装置1は、ステップS2〜S4と同様の処理で第2グループ木構造グラフを生成できるため、説明を省略する。
Note that the personal profile generation device 1 can generate a second initial graph by performing keyword extraction processing on the recommendation target information and using links between keywords in the linked corpus (step S1A).
Thereafter, since the personal profile generation device 1 can generate the second group tree structure graph by the same processing as steps S2 to S4, description thereof is omitted.
[個人プロファイル生成装置の動作:プロファイル生成処理]
図10を参照し、個人プロファイル生成装置1のプロファイル生成処理について、詳細に説明する(適宜図2参照)。
個人プロファイル生成装置1は、プロファイル生成手段50によって、アクセス履歴情報からキーワードを抽出する(ステップS11)。
[Personal Profile Generation Device Operation: Profile Generation Processing]
With reference to FIG. 10, the profile generation processing of the personal profile generation device 1 will be described in detail (see FIG. 2 as appropriate).
The personal profile generation device 1 extracts keywords from the access history information by the profile generation means 50 (step S11).
個人プロファイル生成装置1は、プロファイル生成手段50によって、抽出したキーワードに一致するグループ木構造グラフCのノードを探索し、探索された基準ノードに重みを加える。
個人プロファイル生成装置1は、プロファイル生成手段50によって、上位係数αと下位係数βとが乗じられた重みが閾値以下になるまで、その重みをグループ木構造グラフCのノードに加える(ステップS12)。
The personal profile generation device 1 uses the profile generation means 50 to search for a node of the group tree structure graph C that matches the extracted keyword, and adds a weight to the searched reference node.
The personal profile generation device 1 adds the weight to the node of the group tree structure graph C until the weight generated by multiplying the high-order coefficient α and the low-order coefficient β by the profile generation means 50 becomes equal to or less than the threshold (step S12).
ここで、個人プロファイル生成装置1は、アクセス履歴情報から抽出した全てのキーワードについて、ステップS11,S12の処理を行う。
以上の手順により、個人プロファイル生成装置1は、個人プロファイルを生成できる。
Here, the personal profile generation device 1 performs the processing of steps S11 and S12 for all keywords extracted from the access history information.
Through the above procedure, the personal profile generation apparatus 1 can generate a personal profile.
なお、個人プロファイル生成装置1は、ステップS11の処理を行わずに、第2グループ木構造グラフの各ノードに任意の手法で重み付けを行うことで、推薦対象プロファイルを生成できる(ステップS12A)。 The personal profile generation device 1 can generate a recommendation target profile by weighting each node of the second group tree structure graph by an arbitrary method without performing the process of step S11 (step S12A).
[コンテンツ推薦装置の動作:コンテンツ推薦処理]
図11を参照し、コンテンツ推薦装置2のコンテンツ推薦処理について、詳細に説明する(適宜図2参照)。
[Operation of content recommendation device: content recommendation processing]
The content recommendation process of the
コンテンツ推薦装置2は、コンテンツ推薦手段70によって、個人プロファイルと推薦対象プロファイルとをベクトル化する(ステップS21)。
コンテンツ推薦装置2は、コンテンツ推薦手段70によって、ステップS21でベクトル化された個人プロファイルと推薦対象プロファイルとの一致度を算出する(ステップS22)。
コンテンツ推薦装置2は、コンテンツ推薦手段70によって、ステップS22で算出した一致度が閾値以上であるか否かを判定する(ステップS23)。
The
The
The
一致度が閾値以上の場合(ステップS23でYes)、コンテンツ推薦手段70は、推薦対象となるコンテンツを推薦する(ステップS24)。
一致度が閾値未満の場合(ステップS23でNo)、又は、ステップS24の処理後、コンテンツ推薦手段70は、処理を終了する。
以上の手順により、コンテンツ推薦装置2は、コンテンツを推薦できる。
If the degree of coincidence is equal to or greater than the threshold (Yes in step S23), the
If the degree of coincidence is less than the threshold (No in step S23) or after the processing in step S24, the
Through the above procedure, the
本願発明の実施形態に係るコンテンツ推薦装置2は、擬似的な概念空間にキーワードをマッピングするので、概念空間まで個人プロファイルを拡張可能とし、広範な視聴者の嗜好が反映された個人プロファイルを生成することができる。
Since the
すなわち、コンテンツ推薦装置2は、概念的な領域まで踏み込んで、視聴者の嗜好を個人プロファイル化することができる。その結果、コンテンツ推薦装置2は、表層的なキーワードでのマッチング処理で困難であったグループ単位での概念を基にした情報推薦が可能となり、未知のキーワードが出現しても、的確に視聴者の嗜好に応じたコンテンツを推薦できる。
That is, the
以上、本願発明の各実施形態を詳述してきたが、本願発明は前記した実施形態に限られるものではなく、本願発明の要旨を逸脱しない範囲の設計変更なども含まれる。 As mentioned above, although each embodiment of this invention was explained in full detail, this invention is not restricted to above-described embodiment, The design change etc. of the range which does not deviate from the summary of this invention are included.
前記した実施形態では、キーワードを扱って説明したが、本願発明は、キーワードに限られず画像特徴量などの情報リソースにも適用することができる。
また、前記した実施形態では、番組に関するコンテンツを推薦することとして説明したが、本願発明による個人プロファイルを用いて、番組以外のコンテンツ、例えばイベント情報、商品情報などを推薦することもできる。
In the above-described embodiment, the keyword has been described. However, the present invention is not limited to the keyword, and can be applied to information resources such as image feature amounts.
In the above-described embodiment, the content related to the program is recommended. However, content other than the program, such as event information and product information, can be recommended using the personal profile according to the present invention.
前記した実施形態では、リンク付きコーパスがウィキペディアであることとして説明したが、本願発明は、これに限定されない。例えば、本願発明は、リンク付きコーパスとして、リンクが張られたホームページや、学術論文の引用情報も利用することができる。 In the above-described embodiment, the linked corpus is described as being Wikipedia, but the present invention is not limited to this. For example, the present invention can also use a linked home page or academic paper citation information as a linked corpus.
前記した実施形態では、一致度の閾値判定により推薦の可否を判定したが、本願発明は、これに限定されない。例えば、本願発明は、推薦対象となるコンテンツ毎に一致度を算出し、一致度が高い順に視聴者に推薦してもよい。 In the above-described embodiment, whether or not the recommendation is possible is determined by the threshold value determination of the degree of coincidence, but the present invention is not limited to this. For example, the present invention may calculate the degree of coincidence for each content to be recommended and recommend it to the viewer in descending order of the degree of coincidence.
前記した実施形態では、個人プロファイル生成装置1を独立したハードウェアとして説明したが、本願発明は、これに限定されない。例えば、個人プロファイル生成装置1は、コンピュータが備えるCPU、メモリ、ハードディスクなどのハードウェア資源を、前記した各手段として協調動作させる個人プロファイル生成プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリなどの記録媒体に書き込んで配布してもよい。 In the above-described embodiment, the personal profile generation device 1 has been described as independent hardware, but the present invention is not limited to this. For example, the personal profile generation apparatus 1 can also be realized by a personal profile generation program that causes hardware resources such as a CPU, a memory, and a hard disk included in a computer to operate cooperatively as the above-described units. This program may be distributed via a communication line, or may be distributed by writing in a recording medium such as a CD-ROM or a flash memory.
1 個人プロファイル生成装置
2 コンテンツ推薦装置
10 初期グラフ生成手段
20 グループ化手段
30 グループ木構造グラフ生成手段
40 グループ木構造グラフDB
50 プロファイル生成手段
60 プロファイルDB
70 コンテンツ推薦手段
1 Personal
50 Profile generation means 60 Profile DB
70 Content recommendation means
Claims (6)
前記リンク付きコーパスの第1キーワードをノードとして、リンクされた前記第1キーワード同士をエッジとして接続した第1初期グラフを生成する初期グラフ生成手段と、
予め設定された終了条件を満たすまで前記第1初期グラフを再帰的にグループ化することで、木構造における前記ノードの位置を表した位置情報が付加された第1グループ化グラフを生成するグループ化手段と、
前記位置情報に基づいて前記第1グループ化グラフの各ノードを配置することで、前記第1グループ化グラフから、上位概念及び下位概念となる前記ノード同士が木構造で階層化された第1グループ木構造グラフを生成するグループ木構造グラフ生成手段と、
前記個人が興味を持つコンテンツの内容を表す個人興味情報に基づいて、前記個人の嗜好を表した重みを前記第1グループ木構造グラフのノードに伝搬させることで、前記個人プロファイルを生成するプロファイル生成手段と、を備えることを特徴とする個人プロファイル生成装置。 A personal profile generation device that generates a personal profile adapted to personal preferences from a linked corpus in which first keywords are linked,
Initial graph generation means for generating a first initial graph in which the first keywords of the linked corpus are connected as nodes and the linked first keywords are connected as edges;
Grouping to generate a first grouped graph to which position information representing the position of the node in the tree structure is added by recursively grouping the first initial graph until a preset termination condition is satisfied Means,
By arranging each node of the first grouped graph based on the position information, a first group in which the nodes that are the higher and lower concepts are hierarchized in a tree structure from the first grouped graph A group tree structure graph generating means for generating a tree structure graph;
Profile generation for generating the personal profile by propagating a weight representing the personal preference to a node of the first group tree structure graph based on personal interest information representing the content of the content that the individual is interested in Means for generating a personal profile.
前記個人興味情報に含まれる第2キーワードを抽出し、
抽出した前記第2キーワードに一致する前記第1グループ木構造グラフのノードである基準ノードに所定の重みを加え、
前記基準ノードから前記第1グループ木構造グラフの各ノードに到るまで階層が1つ上がる毎に予め設定された1以下の上位係数と前記階層が1つ下がる毎に予め設定された1以下の下位係数とが乗じられた重みを算出し、
算出した当該重みが予め設定された閾値以下になるまで、算出した当該重みを前記第1グループ木構造グラフの各ノードに加えることを特徴とする請求項1又は請求項2に記載の個人プロファイル生成装置。 The profile generation means includes
Extracting a second keyword contained in the personal interest information;
A predetermined weight is added to a reference node that is a node of the first group tree structure graph that matches the extracted second keyword,
Every time the hierarchy goes up from the reference node to each node of the first group tree structure graph, a higher coefficient of 1 or less set in advance and 1 or less set in advance every time the hierarchy goes down Calculate the weight multiplied by the lower coefficient,
3. The personal profile generation according to claim 1 or 2, wherein the calculated weight is added to each node of the first group tree structure graph until the calculated weight is equal to or less than a preset threshold value. apparatus.
前記グループ化手段は、前記終了条件を満たすまで前記第2初期グラフを再帰的にグループ化することで、前記位置情報が付加された第2グループ化グラフを生成し、
前記グループ木構造グラフ生成手段は、前記位置情報に基づいて前記第2グループ化グラフの各ノードを配置することで、前記第2グループ化グラフから、上位概念及び下位概念となる前記ノード同士が木構造で階層化された第2グループ木構造グラフを生成し、
前記プロファイル生成手段は、前記第2グループ木構造グラフのノードに重み付けを行うことで、推薦対象プロファイルを生成することを特徴とする請求項1から請求項3の何れか一項に記載の個人プロファイル生成装置。 The initial graph generation unit extracts a third keyword included in the recommendation target information representing the content of the content to be recommended, and matches the first keyword, and uses the extracted third keyword as a node. , Generating a second initial graph in which the third keywords are connected as edges by links between the first keywords,
The grouping means generates a second grouped graph to which the position information is added by recursively grouping the second initial graph until the termination condition is satisfied,
The group tree structure graph generating means arranges each node of the second grouped graph based on the position information, so that the nodes that are the higher concept and the lower concept are arranged in the tree from the second grouped graph. Generate a second group tree structure graph hierarchized by structure,
4. The personal profile according to claim 1, wherein the profile generation unit generates a recommendation target profile by weighting nodes of the second group tree structure graph. 5. Generator.
前記個人プロファイルと前記推薦対象プロファイルとの一致度を算出し、算出した前記一致度の閾値判定によって、前記推薦対象のコンテンツを前記個人に推薦するか否かを判定するコンテンツ推薦手段と、を備えることを特徴とするコンテンツ推薦装置。 The personal profile generation device according to claim 4,
Content recommendation means for calculating a degree of coincidence between the personal profile and the recommendation target profile, and determining whether or not to recommend the content to be recommended to the individual by determining the threshold value of the calculated degree of coincidence. A content recommendation device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015013057A JP6450203B2 (en) | 2015-01-27 | 2015-01-27 | Personal profile generation device and program thereof, and content recommendation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015013057A JP6450203B2 (en) | 2015-01-27 | 2015-01-27 | Personal profile generation device and program thereof, and content recommendation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016139229A true JP2016139229A (en) | 2016-08-04 |
JP6450203B2 JP6450203B2 (en) | 2019-01-09 |
Family
ID=56560246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015013057A Expired - Fee Related JP6450203B2 (en) | 2015-01-27 | 2015-01-27 | Personal profile generation device and program thereof, and content recommendation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6450203B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018151789A (en) * | 2017-03-10 | 2018-09-27 | ヤフー株式会社 | Information processing apparatus, information processing method, program, and advertisement information processing system |
CN110347926A (en) * | 2019-07-15 | 2019-10-18 | 北京百度网讯科技有限公司 | Method and apparatus for pushed information |
JP2020154991A (en) * | 2019-03-22 | 2020-09-24 | 株式会社日立製作所 | Information management device and information management method |
CN113268629A (en) * | 2021-04-29 | 2021-08-17 | 西安交通大学 | Heterogeneous picture singing list multi-label recommendation method fusing node preference |
WO2022071708A1 (en) * | 2020-09-29 | 2022-04-07 | 삼성전자 주식회사 | Electronic device for providing content recommendation service, and method therefor |
CN118035432A (en) * | 2024-04-12 | 2024-05-14 | 成都航空职业技术学院 | Employment guidance content recommendation method based on semantic recognition |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040073918A1 (en) * | 2002-09-30 | 2004-04-15 | Ferman A. Mufit | Automatic user profiling |
US20080010272A1 (en) * | 2006-07-07 | 2008-01-10 | Ecole Polytechnique Federale De Lausanne | Methods of inferring user preferences using ontologies |
-
2015
- 2015-01-27 JP JP2015013057A patent/JP6450203B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040073918A1 (en) * | 2002-09-30 | 2004-04-15 | Ferman A. Mufit | Automatic user profiling |
US20080010272A1 (en) * | 2006-07-07 | 2008-01-10 | Ecole Polytechnique Federale De Lausanne | Methods of inferring user preferences using ontologies |
Non-Patent Citations (2)
Title |
---|
中山浩太郎、外2名: "Wikipediaマイニングによるシソーラス辞書の構築手法", 情報処理学会論文誌, vol. 第47巻,第10号, JPN6018044062, 15 October 2006 (2006-10-15), pages pp.2917〜2928 * |
榊剛史、外3名: "Web上の情報を用いた関連語のシソーラス構築について", 自然言語処理, vol. 第14巻,第2号, JPN6018044061, 10 April 2007 (2007-04-10), pages pp.3〜31 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018151789A (en) * | 2017-03-10 | 2018-09-27 | ヤフー株式会社 | Information processing apparatus, information processing method, program, and advertisement information processing system |
JP2020154991A (en) * | 2019-03-22 | 2020-09-24 | 株式会社日立製作所 | Information management device and information management method |
WO2020195545A1 (en) * | 2019-03-22 | 2020-10-01 | 株式会社日立製作所 | Information management device and information management method |
JP7099976B2 (en) | 2019-03-22 | 2022-07-12 | 株式会社日立製作所 | Information management device and information management method |
CN110347926A (en) * | 2019-07-15 | 2019-10-18 | 北京百度网讯科技有限公司 | Method and apparatus for pushed information |
WO2022071708A1 (en) * | 2020-09-29 | 2022-04-07 | 삼성전자 주식회사 | Electronic device for providing content recommendation service, and method therefor |
CN113268629A (en) * | 2021-04-29 | 2021-08-17 | 西安交通大学 | Heterogeneous picture singing list multi-label recommendation method fusing node preference |
CN113268629B (en) * | 2021-04-29 | 2023-01-03 | 西安交通大学 | Heterogeneous picture singing list multi-label recommendation method fusing node preference |
CN118035432A (en) * | 2024-04-12 | 2024-05-14 | 成都航空职业技术学院 | Employment guidance content recommendation method based on semantic recognition |
Also Published As
Publication number | Publication date |
---|---|
JP6450203B2 (en) | 2019-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6450203B2 (en) | Personal profile generation device and program thereof, and content recommendation device | |
JP5078173B2 (en) | Ambiguity Resolution Method and System | |
US20180052823A1 (en) | Hybrid Classifier for Assigning Natural Language Processing (NLP) Inputs to Domains in Real-Time | |
US8812504B2 (en) | Keyword presentation apparatus and method | |
JP5710581B2 (en) | Question answering apparatus, method, and program | |
CN108280114A (en) | A kind of user's literature reading interest analysis method based on deep learning | |
JP5477635B2 (en) | Information processing apparatus and method, and program | |
JP6472573B2 (en) | Data analysis method candidate decision device | |
Shah et al. | Sentimental Analysis Using Supervised Learning Algorithms | |
Zhang et al. | STCS lexicon: Spectral-clustering-based topic-specific Chinese sentiment lexicon construction for social networks | |
CN112464100B (en) | Information recommendation model training method, information recommendation method, device and equipment | |
JP2013120534A (en) | Related word classification device, computer program, and method for classifying related word | |
JP2019082931A (en) | Retrieval device, similarity calculation method, and program | |
CN105005616A (en) | Text illustration method and system based on text image characteristics for interaction expansion | |
JP2006318398A (en) | Vector generation method and device, information classifying method and device, and program, and computer readable storage medium with program stored therein | |
JP2019128925A (en) | Event presentation system and event presentation device | |
KR20180113444A (en) | Method, apparauts and system for named entity linking and computer program thereof | |
JP4755834B2 (en) | Attribute evaluation apparatus, attribute evaluation method, and attribute evaluation program | |
JP2012185654A (en) | Translation apparatus, translation program, and translation method | |
Origlia et al. | A multi-source graph representation of the movie domain for recommendation dialogues analysis | |
CN111538898B (en) | Web service package recommendation method and system based on combined feature extraction | |
JP4266584B2 (en) | TEXT DATA GROUP GENERATION DEVICE, TEXT DATA GROUP GENERATION METHOD, PROGRAM, AND RECORDING MEDIUM | |
CN113392245A (en) | Text abstract and image-text retrieval generation method for crowd-sourcing task release | |
JP2010015394A (en) | Link destination presentation device and computer program | |
JP4314271B2 (en) | Inter-word relevance calculation device, inter-word relevance calculation method, inter-word relevance calculation program, and recording medium recording the program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6450203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |