JP2009213067A - 番組推薦装置および番組推薦方法 - Google Patents

番組推薦装置および番組推薦方法 Download PDF

Info

Publication number
JP2009213067A
JP2009213067A JP2008056540A JP2008056540A JP2009213067A JP 2009213067 A JP2009213067 A JP 2009213067A JP 2008056540 A JP2008056540 A JP 2008056540A JP 2008056540 A JP2008056540 A JP 2008056540A JP 2009213067 A JP2009213067 A JP 2009213067A
Authority
JP
Japan
Prior art keywords
program
word
genre
vector
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008056540A
Other languages
English (en)
Inventor
Koichiro Mori
紘一郎 森
Tomoko Murakami
知子 村上
Ryohei Orihara
良平 折原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008056540A priority Critical patent/JP2009213067A/ja
Priority to US12/399,149 priority patent/US20090228424A1/en
Priority to CN200910004535A priority patent/CN101527815A/zh
Publication of JP2009213067A publication Critical patent/JP2009213067A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • H04H60/31Arrangements for monitoring the use made of the broadcast services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/46Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising users' preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/47Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising genres
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/72Systems specially adapted for using specific information, e.g. geographical or meteorological information using electronic programme guides [EPG]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザの嗜好に適合する番組を推薦する。
【解決手段】放送局からの電子番組表を受信する電子番組表受信部11と、電子番組表から番組のジャンル情報と番組内容を抽出し、番組内容の形態素解析によって番組特定単語を抽出し、ジャンル情報と番組特定単語を組合せてジャンル付単語を生成するジャンル付単語生成部12と、ジャンル付単語によってユーザの視聴履歴を解析し、嗜好ベクトルを生成する嗜好ベクトル生成部18と、番組内容をジャンル付単語によって解析し、放送番組ベクトルを生成する放送番組ベクトル生成部20と、ジャンル付単語の関連語モデルを生成する関連語モデル生成部14と、関連語モデルによって嗜好ベクトルと放送番組ベクトルの類似度を計算する番組類似度計算部21と、類似度が所定の条件を満たす推薦番組を出力する番組推薦部22と、を有することを特徴とする番組推薦装置。
【選択図】図1

Description

本発明は、テレビ番組を推薦する番組推薦装置および番組推薦方法に関する。
近年、ユーザが視聴可能な番組数が非常に多くなり、好みの番組を探すのが困難になっている。このような状況を鑑み、ユーザの番組視聴履歴からユーザの嗜好傾向を学習し、ユーザ好みの番組を推薦する番組推薦システムのニーズが高まっている。
番組情報は電子番組表(Electronic Program Guide: EPG)として電子化されており、そこに含まれるジャンル、出演者、番組内容などの文字情報を用いて番組を推薦するシステムが提案されている。ユーザが視聴した番組のEPGに含まれる番組内容を形態素解析と呼ばれる技術を用いて単語単位に分割し、その単語をカウントしてユーザが好む単語を把握する方法が一般的に用いられている(例えば、特許文献1参照)。この際、視聴番組中の出現回数が多い単語ほどユーザの嗜好度が強い単語だと判断する。そして、ユーザの嗜好度が強い単語を多く含む番組を推薦する方法が取られる。
また、ユーザの嗜好と番組データを単語の重みを要素としたベクトルで表現するベクトル空間モデルに基づく方法も一般的に用いられている(例えば、特許文献2参照)。この際、単語の重みには、番組中の単語の出現回数などが用いられる。ベクトル空間モデルでは、ユーザの嗜好ベクトルと番組ベクトル間の類似度を内積やコサイン尺度などで定義し、ユーザの嗜好ベクトルと類似度が高い番組を推薦する方法が取られる。
上記のベクトル空間モデルでは、関連語や類義語を考慮できないという欠点があった。例えば、「手品」という単語が多く含まれる番組を視聴すると「手品」という単語の重みが強くなるが、関連語だと考えられる「マジック」や「マジシャンA(人名)」などの単語の重みは強くならない。
この問題を解決するため潜在的意味解析(Latent Semantic Analysis: LSA)あるいは潜在的意味インデキシング(Latent Semantic Indexing: LSI)と呼ばれる手法が提案されている(例えば、特許文献3、非特許文献1参照)。潜在的意味解析を用いるとEPGデータから作成した索引語-番組行列から関連語を表した行列(以下、「関連語モデル」という。)を作成できる。関連語モデルを用いると同一番組内に頻繁に共起する単語を関連語と見なして同一次元(新しい単語)に縮約できる。関連語モデルを用いてベクトルを縮約することで関連語を考慮した嗜好ベクトルと番組間の類似度が計算できる。
特許第3351058号公報 特開2007−202181号公報 特開2006−48287号公報 S. Deerwester, S. T. Dumais, G.W. Furnas, T. K. Landauer and R. Harshman,Indexing by Latent Semantic Analysis, Journal of the American Society for Information Science,Vol.41, pp.391-407, 1990.
しかしながら、上記の技術においては、以下の問題点があった。
第1の問題点は、ユーザの視聴番組中に出現する単語をカウントして重みとする方法では、多くの番組に出現する一般語の頻度が大きくなりやすいため番組特定力が低い単語の重みが強くなることである。例えば、「ニュース」「情報」といった単語は、多くの番組に含まれているためユーザの視聴番組中に多く含まれている可能性が高い。そのため、「ニュース」「情報」の重みが高くなり、ユーザの嗜好度が強い単語とみなさる。推薦時には、「ニュース」や「情報」を含む番組を推薦することになるが、この単語は多くの番組に含まれているためどの番組を推薦すればよいか判断する手がかりになりにくい。「ニュース」や「情報」を含む番組を全て推薦することも考えられるが、推薦精度が大きく低下する原因になる。
第2の問題点は、従来の方法では単語の出現する文脈がまったく考慮されていないことである。例えば、韓国ドラマをよく視聴するユーザは、番組内容欄に「韓国」が含まれていることが多いため、「韓国」の単語重みが高くなる。そのため、推薦時に韓国ドラマは推薦され易くなるが、同時に韓国大統領選を扱うニュース番組も推薦されてしまうことになる。これは、同じ「韓国」という単語でもドラマなのかニュースなのかで番組内容が大きく異なるために生じる問題である。
別の例として英会話番組を頻繁に視聴するユーザを考えてみる。英会話番組は番組内容欄に「英語」が含まれていることが多いため、「英語」の単語重みが高くなる。そのため、推薦時に「英語」を含む番組が推薦され易くなる。しかし、一口に「英語」といっても、幼児向け、中高生向け、語学バラエティでは番組内容が大きく異なる。すなわち、テレビ番組では、同じ単語でもその使われる文脈によって番組内容は大きく変化し、単語をそのまま用いただけでは文脈を区別できないという問題が発生する。
第3の問題点は、上記の問題と関連するが、文脈を考慮せずに単語をそのまま用いる方法では、潜在的意味解析に用いる正確な関連語モデルが作成できないことである。例えば、次の2つの番組(a)・(b)の内容から関連語モデルを作成することを考えてみる。(a)はアニメ番組、(b)は旅バラエティ番組である。
(a)悪の大王に支配された王国を救うために、7つの宝石を探して旅する冒険ファンタジー。
(b)冬の秋田を旅する。雪見の露天風呂に浸かったり、あったか鍋を満喫。ゆったりとした大人向けの宿もご紹介。
関連語モデルは、番組内容に出現する語の共起に基づいて作成されるので、多くの番組内で共起する単語同士は関連が強いと判断されるが、めったに共起しない単語同士は関連が弱いと判断される。上記の2つの番組から「旅」の関連語と判断される語は、「大王」「支配」「王国」「冒険」「ファンタジー」「冬」「秋田」「露天風呂」「宿」などが挙げられる。明らかにアニメにおける「旅」と旅バラエティにおける「旅」の関連語は異なっているが、単語をそのまま用いる方式ではそれらを区別できない。同様に、アニメにおける「旅」も旅バラエティにおける「旅」も同等に扱い、まとめて関連語を求めてしまうという問題があった。
そこで、本発明は、従来技術の問題に鑑み、ユーザの嗜好に適合する番組を推薦できる番組推薦装置および番組推薦方法を提供することを目的とする。
本発明の番組推薦装置は、放送局から送信される電子番組表を受信する電子番組表受信部と、前記受信された電子番組表から番組のジャンル情報および番組内容を抽出すると共に、前記番組内容の形態素解析によって番組特定単語を抽出し、前記ジャンル情報および前記番組特定単語を組合せてジャンル付単語を生成するジャンル付単語生成部と、前記生成されたジャンル付単語に基づいて予め蓄積されているユーザの視聴履歴を解析し、前記ユーザの番組嗜好を表す嗜好ベクトルを生成する嗜好ベクトル生成部と、前記電子番組表に含まれる各番組の番組内容を前記ジャンル付単語に基づいて解析し、前記番組内容を表す放送番組ベクトルを生成する放送番組ベクトル生成部と、前記ジャンル付単語の関連語モデルを生成する関連語モデル生成部と、前記生成された関連語モデルに基づいて前記嗜好ベクトルと前記放送番組ベクトルの類似度を計算する番組類似度計算部と、前記計算された類似度が予め定められた条件を満たす番組を前記ユーザの嗜好に適合する推薦番組として出力する番組推薦部と、を有することを特徴とする。
本発明の番組推薦方法は、放送局から送信される電子番組表を受信する電子番組表受信ステップと、前記受信された電子番組表から番組のジャンル情報および番組内容を抽出すると共に、前記番組内容の形態素解析によって番組特定単語を抽出し、前記ジャンル情報および前記番組特定単語を組合せてジャンル付単語を生成するジャンル付単語生成ステップと、前記生成されたジャンル付単語に基づいて予め蓄積されているユーザの視聴履歴を解析し、前記ユーザの番組嗜好を表す嗜好ベクトルを生成する嗜好ベクトル生成ステップと、前記電子番組表に含まれる各番組の番組内容を前記ジャンル付単語に基づいて解析し、前記番組内容を表す放送番組ベクトルを生成する放送番組ベクトル生成ステップと、前記ジャンル付単語の関連語モデルを生成する関連語モデル生成ステップと、前記生成された関連語モデルに基づいて前記嗜好ベクトルと前記放送番組ベクトルの類似度を計算する番組類似度計算ステップと、前記計算された類似度が予め定められた条件を満たす番組を前記ユーザの嗜好に適合する推薦番組として出力する番組推薦ステップと、を有することを特徴とする。
本発明によれば、ユーザの嗜好に適合する番組を推薦できる番組推薦装置および番組推薦方法が提供される。
以下、本発明の実施形態について図面を用いて説明する。図1は、本発明の一実施形態に係る番組推薦装置1の全体構成例を示すブロック図である。番組推薦装置1は、大きく4つのブロックに分けられる。第1のブロックは、ジャンル付単語の生成に関連した、電子番組表受信部11、ジャンル付単語生成部12、および電子番組表保存部13である。第2のブロックは、単語間の関連度を表す関連語モデルの生成に関連した、関連語モデル生成部14および関連語モデル保存部15である。第3のブロックは、ユーザの嗜好を表す嗜好ベクトルの生成に関連した、視聴履歴取得部16、視聴履歴保存部17、嗜好ベクトル生成部18、および嗜好ベクトル保存部19である。第4のブロックは、番組の推薦に関連した、放送番組ベクトル生成部20、番組類似度計算部21、および番組推薦部22である。
電子番組表受信部11は、各テレビ局から文字情報として送信される電子番組表(EPG)を受信する。
ジャンル付単語生成部12は、電子番組表の各番組情報からジャンル部分を抽出するジャンル抽出部121、番組内容部分を抽出する番組内容抽出部122、番組内容を形態素解析と呼ばれる技術を用いて単語に分割する形態素解析部123、および形態素解析によって分割された各単語に対してジャンルを付与するジャンル付与部124から成り、番組内容に対してジャンル付単語が関連付けされた電子番組表を電子番組表保存部13に保存する。このジャンル付単語生成部12では、単語の出現する番組のジャンルと単語を組したジャンル付単語を生成し、もとの単語と置き換える。例えば、「韓国」という単語が、海外ドラマジャンルの番組内に出現したときは、「韓国」を「海外ドラマ-韓国」に置き換え、海外・国際ジャンルの番組内に出現したときは、「海外・国際-韓国」に置き換え、両者は異なる単語とみなす。
電子番組表のジャンルは、ARIB規格で定まっており、ニュース、スポーツ、情報/ワイドショー、ドラマ、ドキュメンタリー/教養といったメインジャンルの下に政治・国会、経済・市況、野球、サッカー、芸能・ワイドショー、健康・医療、国内ドラマ、海外ドラマ、歴史・紀行といったサブジャンルがある。本実施形態では、約100種類に分類されたサブジャンルの使用を想定している。サブジャンルは、放送局が内容に基づいて付与したメタデータであり、分類は粗いものの番組内容にマッチしたジャンルが割り当てられている。
関連語モデル生成部14は、ある一定期間の番組に含まれるジャンル付単語を潜在的意味解析おける索引語として用い、作成された索引語-番組行列の特異値分解および次元縮約によって関連語モデルを生成し、関連語モデル保存部15に格納する。
潜在的意味解析は、情報検索の分野でよく用いられる手法であり、高次元の空間にある文書ベクトルを低次元の空間へと射影することにより、検索精度の改善を図る技術である。本発明では、この潜在的意味解析を後述する嗜好ベクトルおよび放送番組ベクトルに適用し、推薦精度の改善に用いる。
視聴履歴取得部16は、視聴者の視聴履歴(ログ)を保存する視聴履歴保存部17から所望の期間の視聴履歴を取得する。
嗜好ベクトル生成部18は、ある一定期間におけるユーザの視聴番組に出現する単語をカウントし、単語の出現頻度を表すVTF(Viewed Term Frequency)を計算するVTF計算部181、各単語の特殊度を表すIDF(Inverse Document Frequency)を計算するIDF計算部182、およびVTFとIDFからVTF_IDFを計算するVTF_IDF計算部183から成る。VTF_IDFは、ユーザが視聴した番組中に多く含まれ、かつ、特定の番組に出現しやすい特殊な単語であるほどユーザの嗜好を表す重要な語と判断して大きな重みを付ける指標になっている。また、VTF_IDF計算部183は、VTF_IDFに基づいてユーザの嗜好を表す嗜好ベクトルを生成し、これを嗜好ベクトル保存部19に格納する。
放送番組ベクトル生成部20は、番組推薦処理において判定対象となる放送予定の番組(以下、「放送番組」という。)の番組情報をそれぞれ読み込み、この番組情報に基づいて番組の内容を表す放送番組ベクトルを生成し、番組類似度計算部21へ出力する。
番組類似度計算部21は、嗜好ベクトル生成部18において生成された嗜好ベクトルと放送番組ベクトル生成部20において生成された放送番組ベクトルの類似度を計算する。
番組推薦部22は、番組類似度計算部21において計算された嗜好ベクトルと放送番組ベクトルの類似度が予めに定められた閾値以上か否かを判定し、類似度が閾値以上の番組を推薦番組として出力する。
図2は、番組推薦装置1全体の処理の具体例を示すフローチャートである。
工程S201において、ジャンル付単語生成部12は、電子番組表の各番組内容を表すジャンル付単語を生成し、ジャンル付単語を含めた電子番組表を電子番組表保存部13に格納する。
工程S202において、関連語モデル生成部14は、電子番組表保存部13のある一定期間の番組を用いて関連語モデルを生成し、関連語モデル保存部15に格納する。
工程S203において、嗜好ベクトル生成部18は、視聴履歴保存部17の視聴履歴と電子番組表保存部13の電子番組表の情報を用いてユーザの嗜好を表す嗜好ベクトルを生成し、嗜好ベクトル保存部19に格納する。
工程S204において、放送番組ベクトル生成部20は、電子番組表から放送番組の番組情報を読み込む。
工程S205において、放送番組ベクトル生成部20は、読込まれた番組情報に基づいて放送番組ベクトルを生成する。具体的には、番組内容欄における各ジャンル付単語の出現回数をカウントして生成する。
工程S206において、番組類似度計算部21は、ユーザの嗜好を表した嗜好ベクトルと判定対象となる放送番組ベクトルの類似度を計算する。
工程S207において、番組推薦部22は、嗜好ベクトルと放送番組ベクトルの類似度が予めに定められた閾値以上か否かを判定する。ここで、閾値以上の場合は、放送番組がユーザの嗜好に適合する番組であると判定し、工程S208へ進む。これに対し、閾値未満の場合は、放送番組がユーザの嗜好に適合しない番組であると判定して、工程S209へ進む。
工程S208において、番組推薦部22は、ユーザの嗜好に適合すると判定された番組を推薦番組リストに追加する。
工程S209において、放送番組ベクトル生成部20は、判定対象となる他の放送番組の有無を判定する。ここで、他に放送番組が有ると判定された場合は、工程S204へ戻る。工程S204からS208の処理は放送番組が無くなるまで繰り返される。これに対し、他に放送番組が無いと判定された場合は、工程S210へ進む。
工程S210において、番組推薦部22は、作成された推薦番組リストを表示装置(図示省略する)へ出力し、処理を終了する。
以下、図2におけるジャンル付単語生成(工程S201)、関連語モデル生成(工程S202)、嗜好ベクトル生成(工程S203)、類似度計算(工程S206)の処理方法を詳細に説明する。
図3は、ジャンル付単語生成部12におけるジャンル付単語生成処理(工程S201)の具体例を示すフローチャートである。図4は、電子番組表に含まれる番組情報の具体例を示す図である。
工程S301においては、電子番組表受信部11から電子番組表(EPG)を取得し、この電子番組表から番組情報を読み込む。図4の番組情報には、放送日、放送局、開始時間、放送時間、ジャンル、タイトル、出演者、番組内容が含まれている。ジャンルは、メインジャンルとこのメインジャンルを更に細かく分類したサブジャンルから成る。本実施形態では、サブジャンルの使用を仮定している。
工程S302においては、読込まれた番組情報から番組のジャンルを抽出する。図4の番組情報では、番組のジャンルは「歴史・紀行」である。尚、番組に複数のジャンルが付与されている場合は、全て抽出してもよいし、第1ジャンルのみ抽出してもよい。
工程S303においては、読込まれた番組情報から番組内容を抽出する。
工程S304においては、抽出された番組内容を形態素解析する。形態素解析によって番組内容は単語に分割され、同時に単語の品詞も明らかになる。
工程S305においては、形態素解析によって分割された単語群の中から名詞のみを抽出する。これは、番組内容を特定する重要な単語(番組特定単語)は名詞であることが多いためである。この処理で抽出した名詞が単語欄の「世界」「遺産」「秘境」「古代」「文明」「歴史」「謎」である。尚、名詞の中でも「これ」「それ」のような指示代名詞や「こと」「もの」のように内容を持たない名詞は不要語リストなどを用いて除去できる。
工程S306においては、抽出した各単語に番組ジャンルを付与してジャンル付単語を作成する。尚、ジャンルは予めコード化しておくと好適である。図4の例では、「歴史・紀行」を「History」にコード化して、各単語に付与している。番組に複数のジャンルが付与されている場合は、全てのジャンルと単語の組合せたジャンル付単語を生成してもよいし、第1ジャンルのみ用いてもよい。以後、このジャンル付単語を単位に全ての処理が行われる。
工程S307においては、電子番組表(EPG)に他の番組情報が含まれているか否かを判定する。ここで、他の番組情報が含まれていると判定された場合には、工程S301へ戻る。工程S301からS307の処理は全ての番組について処理が完了するまで繰り返される。これに対し、他に番組情報が無いと判定された場合は、工程S308へ進む。
工程S308においては、作成されたジャンル付単語を付加した電子番組表を電子番組表保存部13へ保存し、処理を終了する。
上記のように、単なる単語ではなく、ジャンル付単語を用いることには幾つかの利点がある。第1に、単語の番組特定力が向上することで、ユーザの嗜好がより正確に得られ、推薦精度の向上が期待できる。ここで、「番組特定力」とは、その単語がユーザが嗜好する語であると分かったときに、その単語を用いることでどれだけ番組を特定できるかを表す。
例えば、ユーザの視聴番組中に「ニュース」という単語が多く含まれており、ユーザの嗜好を表す単語であると分かったとする。しかし、「ニュース」という単語は非常に多くの番組内に頻繁に現れる語であり、「ニュース」という単語だけではユーザが好む番組を絞り込むことができない。すなわち、番組特定力が低い。絞り切れないまま「ニュース」という単語を含む番組を全て推薦することも考えられるが、大部分はユーザの嗜好に適合しない番組であり、推薦の精度が大きく低下することになる。
一方、ジャンル付単語を用いると、「ニュース」という単語が、「政治・国会-ニュース」「経済・市況-ニュース」「野球-ニュース」「サッカー-ニュース」「競馬-ニュース」のように分割され、「ニュース」だけでは分からなかったユーザの詳細な嗜好を特定でき、番組の絞込みが容易となる。
第2に、上記の番組特定力とも関連するが、ジャンルを文脈情報として利用することで、単語の意味が特定し易くなる。例えば、先に挙げたように、韓国ドラマをよく視聴するユーザは、番組内容欄に「韓国」が含まれていることが多いため、「韓国」の単語重みが高くなる。そのため、推薦時に韓国ドラマは推薦され易くなるが、同時に韓国大統領選を扱うニュース番組も推薦されてしまうことになる。一方、ジャンル付単語を用いると、「韓国」という単語が、「海外・国際-韓国」「海外ドラマ-韓国」のように分割され、韓国のドラマが好きなのか、韓国関連のニュースに興味があるのかを明確に特定できる。
別の例として、英会話番組をよく視聴するユーザを考えてみる。英会話番組の番組内容欄には単語として「英語」が含まれていることが多いため、「英語」の単語重みが高くなる。そのため、推薦時に「英語」を含む番組が推薦され易くなる。しかし、一口に「英語」といっても、幼児向け、中高生向け、語学バラエティでは番組内容が大きく異なる。このような場合にも、ジャンル付単語を用いると、「英語」という単語が、「幼児・小学生-英語」「中学・高校生-英語」「会話・語学-英語」「トークバラエティ-英語」のように分解されるため、どのようなタイプの英語番組に興味があるのか特定し易くなる。
図5は、関連語モデル生成部14における関連語モデル生成処理(工程S202)の具体例を示すフローチャートである。
工程S501においては、電子番組表保存部13から電子番組表(EPG)をを読み込む。
工程S502においては、潜在的意味解析を適用するために電子番組表から索引語-番組行列を生成する。図6は、電子番組表から生成された索引語-番組行列の具体例を示す図である。同図における索引語-番組行列は、行にジャンル付単語、列に番組が並んだ形式になっており、行列の値は番組がジャンル付単語を含む場合を1、含まない場合を0としている。実際は、0か1ではなく、TFIDFなどの単語重みの値を用いてもよい。例えば、番組1は、「History-歴史」、「History-文明」という単語を含む番組である。すなわち、番組1、番組2、番組3は、歴史・紀行(History)の番組であり、内容が類似していることを想定している。また、番組4、番組5、番組6は、バラエティ(Variety)の番組であり、内容が類似していることを想定している。番組7は、ドラマ(Drama)の番組である。ここでは、例題のため非常に小さな行列であるが、実際は、電子番組表に含まれる全番組から生成するので単語数は数万オーダー、番組数は数千オーダーの巨大な行列になる。
工程S503においては、索引語-番組行列の特異値分解を行う。潜在的意味解析においては、特異値分解によって高次元ベクトルの次元縮約を行うためである。m行n列の索引語-番組行列Aは、特異値分解によって下記の数式(1)のように3つの行列U、Σ、VTに分解できる。
行列Σは、rank(A)=rとすると、対角線上にr個の要素σ,…σ(σ≧σ≧…≧σ>0)が並び、他は0であるような行列である。このσi(1≦i≦r)ことを特異値と呼ぶ。
工程S504においては、特異値に基づいて索引語-番組行列を次元縮約する。図7は、索引語-番組行列の特異値分解と次元縮約を具体的に説明する図である。ここでは、行列Σの特異値の大きい方からk個選択し、r×r行列をk×k行列に縮約し、行列Σkとする。また、行列Σに合わせて行列Uと行列VTもm×k行列、k×n行列にそれぞれ縮約し、それぞれ行列Uk、Vk Tとする。そして、縮約行列Akを下記の数式(2)により計算する(AとAkは同じサイズになる)。尚、行列Ukは関連語の情報を格納した行列であるため、ここでは関連語モデルと呼ぶ。
工程S505においては、次元縮約により求められた関連語モデルを関連語モデル保存部15へ保存し、処理を終了する。
図8は、次元縮約後の索引語-番組行列の具体例を示す図である。ここでは、図6の行列をk=3で縮約した行列が示されている。行列を縮約する利点として、番組ベクトル間の類似度の計算において関連語が考慮されることが挙げられる。例えば、元の行列Aにおいて、番組1と番組2の類似度を内積を用いて計算すると両方の番組に共起する単語はないため0になる。一方、縮約行列A3において、番組1と番組2の類似度を内積を用いて計算すると0.63になり、類似番組と判定される。
この違いは、縮約行列A3で関連語が考慮されたことによる。図6から分かるように、番組1から「History-歴史」と「History-文明」が共起し、番組3から「History-歴史」と「History-遺産」が共起することから「History-歴史」、「History-文明」、「History-遺産」は関連性が高い単語だと判定される。そのため、番組2は「History-遺産」しか含んでいないにもかかわらず、縮約行列A3では、「History-遺産」のほかに、「History-歴史」や「History-文明」にも比較的高い重みが与えられ、番組1や番組3との類似度が高くなる原因となっている。このように潜在的意味解析を行うと、番組内で共起する単語から自動的に関連語かどうか判断し、関連語を考慮した番組間類似度が求められるという利点がある。
例えば、次の2つの番組(a)・(b)の内容から関連語モデルを生成することを考えてみる。(a)はアニメ番組、(b)は旅バラエティ番組である。
(a)悪の大王に支配された王国を救うために、7つの宝石を探して旅する冒険ファンタジー。
(b)冬の秋田を旅する。雪見の露天風呂に浸かったり、あったか鍋を満喫。ゆったりとした大人向けの宿もご紹介。
関連語モデルは、番組内容に出現する語の共起に基づいて生成される。多くの番組内で共起する単語同士は関連が強いと判断され、逆にめったに共起しない単語同士は関連が弱いと判断される。上記の2つの番組から「旅」の関連語と判断される語は、「大王」「支配」「王国」「冒険」「ファンタジー」「冬」「秋田」「露天風呂」「宿」などが挙げられる。
この場合、明らかにアニメにおける「旅」と旅バラエティにおける「旅」の関連語は異なっているが、単語をそのまま用いる方式ではそれらを区別できない。すなわち、アニメにおける「旅」も旅バラエティにおける「旅」も同等に扱いまとめて関連語を求めてしまう。
しかし、潜在的意味解析の索引語にジャンル付単語を用いることで正確な関連語モデルを生成できる。上記の場合、アニメ番組では、「Anime-旅」、旅バラエティ番組では、「Tour-旅」のようにジャンル付単語に置き換えられるため、同じ「旅」という単語でも区別できる。また、「Anime-旅」の関連語には、「Anime-冒険」「Anime-ファンタジー」などが挙げられ、「Tour-旅」の関連語には、「Tour-露天風呂」「Tour-宿」などが挙げられ、きちんと区別され、両者の混合は生じない。
図9は、嗜好ベクトル生成部18における嗜好ベクトル生成処理(工程S203)の具体例を示すフローチャートである。図10は、指標値と嗜好ベクトルの具体例を示す図である。
工程S901においては、ユーザの視聴履歴を読み込む。視聴履歴は、視聴した番組のIDや番組タイトルのリストである。
工程S902においては、ユーザが視聴した番組に含まれるジャンル付単語を電子番組表保存部13から取得する。
工程S903においては、過去の一定期間Tにおけるユーザの視聴履歴に基づいてジャンル付単語kの出現回数を表すVTFを計算する。図10に示されるVTFは、ユーザが視聴した番組内に「History-歴史」が3回、「History-文明」が1回出現したことを意味している。この例のユーザは、歴史番組が好みであることが想定される。尚、期間Tは、例えば過去1週間など任意の長さにとってよい。
工程S904においては、ある一定期間Tの電子番組表に基づいてジャンル付単語kの特殊度(番組特定力)を表すIDFを計算する。ここでは、ジャンル付単語kのIDFを下記の数式(3)で計算する。
ここで、n(k)は期間Tにおけるジャンル付単語kを含む番組数、nは期間Tにおける全番組数である。期間Tは、VTFを求めた期間Tと同一期間として計算してもよいし、まったく別の期間のデータ、例えば、現在から1週間分のデータを用いて計算してもよい。また、IDFはユーザの視聴履歴とは関係なく計算されるため予め計算しておくことも可能である。
上記の数式(3)において、IDF(k)は、ジャンル付単語kが多くの番組に出現するとき低い値を取り、少ない番組にのみ出現するとき高い値を取る。すなわち、ジャンル付単語の番組特定力を表している。図10の例では、「History-歴史」のIDFは2.9、「History-文明」のIDFは2.5としている。VTFが0の単語は、VTF_IDFは必ず0となるため、IDFを計算する必要はなく0としている。
工程S905においては、ジャンル付単語kのVTFおよびIDFからVTF_IDFを計算する。ここでは、VTF_IDFを下記の数式(4)で計算する。
尚、VTFの対数を取るのは、VTFの値をそのまま用いるとVTFの影響が強すぎるためである。図10においては、「History-歴史」のVTF_IDFは5.8、「History-文明」のVTF_IDFは2.5となることが示されている。
工程S906においては、嗜好ベクトルをVTF_IDFベクトルのノルムが1になるように正規化して生成する。図10では、番組を特定する複数のジャンル付単語を行、ジャンル付単語に基づいて複数の番組内容を解析して求められた指標値(VTF_IDF)を列とする行列から嗜好ベクトルが求められることが示されている。
工程S907においては、生成した嗜好ベクトルを嗜好ベクトル保存部19に格納し、処理を終了する。
図11は、番組類似度計算部21における類似度計算処理(工程S206)の具体例を示すフローチャートである。
工程S1101においては、嗜好ベクトル保存部16からユーザの嗜好ベクトルを読み込む。
工程S1102においては、放送番組ベクトル生成部20で生成した放送番組ベクトルを読み込む。図12は、嗜好ベクトルと放送番組ベクトルの具体例を示す図である。同図において、放送番組ベクトルは、番組を特定する複数のジャンル付単語を行、電子番組表に含まれる各番組(番組ID)を列として表されている。尚、説明を簡潔にするため電子番組表に含まれる番組として関連語モデルの生成に用いた番組1から番組7を用いたが、実際は関連語モデルを生成した番組とは限らない。
工程S1103においては、関連語モデル保存部15から関連語モデルを読み込む。
工程S1104においては、嗜好ベクトルを正規化したように放送番組ベクトルのノルムが1になるように正規化する。図13は、図12に示される嗜好ベクトルと放送番組ベクトルのノルムが1になるように正規化したベクトルを示す図である。
工程S1105および工程S1106においては、関連語モデルを用いて嗜好ベクトルおよび放送番組ベクトルの次元を下記の数式(5)および数式(6)を用いてそれぞれ縮約する。
ここで、dは嗜好ベクトル、d′は放送番組ベクトル、UkTは関連語モデル、dkは縮約された嗜好ベクトル、dk′は縮約された放送番組ベクトルを表している。
工程S1107においては、嗜好ベクトルと放送番組ベクトル間の類似度を内積やコサイン尺度を用いて計算し、類似度計算処理を終了する。図14は、k=3の関連語モデルU3を用いて縮約した嗜好ベクトルと放送番組ベクトルとの類似度を内積を用いて計算した例である。ここでは、関連性の高い3つのジャンル付単語「History-歴史」、「History-文明」、「History-遺産」に着目した関連語モデルU3を用いて、次元縮約された嗜好ベクトルと各番組の放送番組ベクトルの内積が番組の類似度として求められている。例えば、嗜好ベクトルと番組1の放送番組ベクトルとの内積は、0×0+(−0.81)×(−0.76)+0×0≒0.61と計算されている。このように計算された類似度は、番組推薦部22へ出力され、所定の閾値以上の番組が推薦される。例えば、閾値が0.4の場合には、番組1、番組2、番組3が推薦されることになる。
上記のように処理を行うことにより、図13に示されるベクトルを用いて類似度を計算しても嗜好ベクトルと番組2の類似度は0となってしまうのに対し、関連語モデルを用いて次元を縮約した図14に示されるベクトルを用いて類似度を計算すると嗜好ベクトルと番組2の類似度は0.48となって推薦できるようになる。すなわち、関連語モデルを用いることによって関連語を考慮して類似度を計算できる。
尚、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明の一実施形態に係る番組推薦装置1の全体構成例を示すブロック図。 本発明の一実施形態に係る番組推薦装置1全体の処理の具体例を示すフローチャート。 本発明の一実施形態に係るジャンル付単語生成部12におけるジャンル付単語生成処理の具体例を示すフローチャート。 本発明の一実施形態に係る電子番組表に含まれる番組情報の具体例を示す図。 本発明の一実施形態に係る関連語モデル生成部14における関連語モデル生成処理の具体例を示すフローチャート。 電子番組表から生成された索引語-番組行列の具体例を示す図 索引語-番組行列の特異値分解と次元縮約を具体的に説明する図。 次元縮約後の索引語-番組行列の具体例を示す図。 本発明の一実施形態に係る嗜好ベクトル生成部18における嗜好ベクトル生成処理の具体例を示すフローチャート。 嗜好ベクトルの具体例を示す図。 本発明の一実施形態に係る番組類似度計算部21における類似度計算処理の具体例を示すフローチャート。 嗜好ベクトルと放送番組ベクトルの具体例を示す図。 図12に示される嗜好ベクトルと放送番組ベクトルを正規化したベクトルを示す図。 嗜好ベクトルと放送番組ベクトルとの類似度を内積を用いて計算した例を示す図。
符号の説明
1…番組推薦装置、
11…電子番組表受信部、
12…ジャンル付単語生成部、
13…電子番組表保存部、
14…関連語モデル生成部、
15…関連語モデル保存部、
16…視聴履歴取得部、
17…視聴履歴保存部、
18…嗜好ベクトル生成部、
19…嗜好ベクトル保存部、
20…放送番組ベクトル生成部、
21…番組類似度計算部、
22…番組推薦部、
121…ジャンル抽出部、
122…番組内容抽出部、
123…形態素解析部、
124…ジャンル付与部、
181…VTF計算部、
182…IDF計算部、
183…VTF_IDF計算部。

Claims (6)

  1. 放送局から送信される電子番組表を受信する電子番組表受信部と、
    前記受信された電子番組表に含まれる番組のジャンル情報および番組内容を抽出すると共に、前記番組内容の形態素解析によって番組特定単語を抽出し、前記ジャンル情報および前記番組特定単語を組合せてジャンル付単語を生成するジャンル付単語生成部と、
    前記生成されたジャンル付単語に基づいて予め蓄積されているユーザの視聴履歴を解析し、前記ユーザの番組嗜好を表す嗜好ベクトルを生成する嗜好ベクトル生成部と、
    前記電子番組表に含まれる各番組の前記番組内容を前記ジャンル付単語に基づいて解析し、前記番組内容を表す放送番組ベクトルを生成する放送番組ベクトル生成部と、
    前記ジャンル付単語の関連語モデルを生成する関連語モデル生成部と、
    前記生成された関連語モデルに基づいて前記嗜好ベクトルと前記放送番組ベクトルの類似度を計算する番組類似度計算部と、
    前記計算された類似度が予め定められた条件を満たす番組を前記ユーザの嗜好に適合する推薦番組として出力する番組推薦部と、
    を有することを特徴とする番組推薦装置。
  2. 前記ジャンル付単語生成部は、ある一定期間の視聴番組について前記電子番組表の番組内容に含まれる番組特定単語の出現回数と前記番組特定単語の出現する番組の放送頻度の逆数との積をジャンル付単語の重みとして用い、前記ジャンル付単語を生成することを特徴とする請求項1記載の番組推薦装置。
  3. 前記関連語モデル生成部は、ある一定期間の番組情報に含まれるジャンル付単語を潜在的意味解析における索引語として用いて索引語-番組行列を作成し、この索引語-番組行列を特異値分解および次元縮約して前記関連語モデルを生成することを特徴とする請求項1または請求項2記載の番組推薦装置。
  4. 放送局から送信される電子番組表を受信する電子番組表受信ステップと、
    前記受信された電子番組表に含まれる番組のジャンル情報および番組内容を抽出すると共に、前記番組内容の形態素解析によって番組特定単語を抽出し、前記ジャンル情報および前記番組特定単語を組合せてジャンル付単語を生成するジャンル付単語生成ステップと、
    前記生成されたジャンル付単語に基づいて予め蓄積されているユーザの視聴履歴を解析し、前記ユーザの番組嗜好を表す嗜好ベクトルを生成する嗜好ベクトル生成ステップと、
    前記電子番組表に含まれる各番組の前記番組内容を前記ジャンル付単語に基づいて解析し、前記番組内容を表す放送番組ベクトルを生成する放送番組ベクトル生成ステップと、
    前記ジャンル付単語の関連語モデルを生成する関連語モデル生成ステップと、
    前記生成された関連語モデルに基づいて前記嗜好ベクトルと前記放送番組ベクトルの類似度を計算する番組類似度計算ステップと、
    前記計算された類似度が予め定められた条件を満たす番組を前記ユーザの嗜好に適合する推薦番組として出力する番組推薦ステップと、
    を有することを特徴とする番組推薦方法。
  5. 前記ジャンル付単語生成ステップにおいて、ある一定期間の視聴番組について前記電子番組表の番組内容に含まれる番組特定単語の出現回数と前記番組特定単語の出現する番組の放送頻度の逆数との積をジャンル付単語の重みとして用い、前記ジャンル付単語を生成することを特徴とする請求項4記載の番組推薦方法。
  6. 前記関連語モデル生成ステップにおいて、ある一定期間の番組情報に含まれるジャンル付単語を潜在的意味解析における索引語として用いて索引語-番組行列を作成し、この索引語-番組行列を特異値分解および次元縮約して前記関連語モデルを生成することを特徴とする請求項4または請求項5記載の番組推薦方法。
JP2008056540A 2008-03-06 2008-03-06 番組推薦装置および番組推薦方法 Pending JP2009213067A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008056540A JP2009213067A (ja) 2008-03-06 2008-03-06 番組推薦装置および番組推薦方法
US12/399,149 US20090228424A1 (en) 2008-03-06 2009-03-06 Program recommending apparatus and program recommending method
CN200910004535A CN101527815A (zh) 2008-03-06 2009-03-06 节目推荐装置以及节目推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008056540A JP2009213067A (ja) 2008-03-06 2008-03-06 番組推薦装置および番組推薦方法

Publications (1)

Publication Number Publication Date
JP2009213067A true JP2009213067A (ja) 2009-09-17

Family

ID=41054643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008056540A Pending JP2009213067A (ja) 2008-03-06 2008-03-06 番組推薦装置および番組推薦方法

Country Status (3)

Country Link
US (1) US20090228424A1 (ja)
JP (1) JP2009213067A (ja)
CN (1) CN101527815A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004013A (ja) * 2011-06-21 2013-01-07 Konica Minolta Business Technologies Inc プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム
JP2014045264A (ja) * 2012-08-24 2014-03-13 Nippon Hoso Kyokai <Nhk> 推薦番組提示装置およびそのプログラム
CN103905244A (zh) * 2014-01-28 2014-07-02 北京奇虎科技有限公司 一种统计到访信息的装置和方法
CN105812937A (zh) * 2014-12-30 2016-07-27 Tcl集团股份有限公司 一种电视节目推荐方法和电视节目推荐装置
JP2017004493A (ja) * 2015-06-05 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America データ分析方法、データ分析装置およびプログラム

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5466119B2 (ja) * 2010-09-21 2014-04-09 Kddi株式会社 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
WO2012079254A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 节目推荐装置和节目推荐方法
EP2656523A1 (en) * 2010-12-21 2013-10-30 Telefonaktiebolaget LM Ericsson (PUBL) Method and apparatus for providing temporal context for recommending content for consumption by a user device
US8577876B2 (en) * 2011-06-06 2013-11-05 Met Element, Inc. System and method for determining art preferences of people
EP2620733B1 (de) * 2012-01-27 2014-03-19 Ivoclar Vivadent AG Dentalgerät
CN103368921B (zh) * 2012-04-06 2016-08-10 三星电子(中国)研发中心 用于智能设备的分布式用户建模***和方法
US9460200B2 (en) * 2012-07-02 2016-10-04 International Business Machines Corporation Activity recommendation based on a context-based electronic files search
US20140089136A1 (en) * 2012-09-27 2014-03-27 Intuit Inc. Using financial transactions to generate recommendations
JP2014085780A (ja) 2012-10-23 2014-05-12 Samsung Electronics Co Ltd 番組推薦装置及び番組推薦プログラム
CN103200279B (zh) * 2013-04-28 2017-03-15 百度在线网络技术(北京)有限公司 推荐方法和云端服务器
CN103260061B (zh) * 2013-05-24 2015-11-18 华东师范大学 一种上下文感知的iptv节目推荐方法
CN106708929B (zh) * 2016-11-18 2020-06-26 广州视源电子科技股份有限公司 视频节目的搜索方法和装置
CN106570196B (zh) * 2016-11-18 2020-06-05 广州视源电子科技股份有限公司 视频节目的搜索方法和装置
CN107172495B (zh) * 2017-04-26 2020-01-31 青岛海信电器股份有限公司 针对电子节目指南epg的视图生成方法及智能电视
US10231020B2 (en) * 2017-05-16 2019-03-12 The Directv Group, Inc Sports recommender system utilizing content based filtering
CN108260007B (zh) * 2018-01-22 2020-06-16 北京华录新媒信息技术有限公司 节目推荐方法及节目推荐***
CN108334640A (zh) * 2018-03-21 2018-07-27 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN108763367B (zh) * 2018-05-17 2020-07-10 南京大学 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
CN108965937A (zh) * 2018-06-27 2018-12-07 广东技术师范学院 一种面向网络电视家庭用户的动态兴趣模型构建方法
KR102582046B1 (ko) * 2018-07-19 2023-09-22 삼성전자주식회사 추천 채널 리스트 제공 방법 및 그에 따른 디스플레이 장치
US11317154B1 (en) * 2020-05-29 2022-04-26 Apple Inc. Adaptive content delivery
CN113873333A (zh) * 2021-09-30 2021-12-31 海看网络科技(山东)股份有限公司 一种iptv上节目画像的计算方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004013A (ja) * 2011-06-21 2013-01-07 Konica Minolta Business Technologies Inc プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム
JP2014045264A (ja) * 2012-08-24 2014-03-13 Nippon Hoso Kyokai <Nhk> 推薦番組提示装置およびそのプログラム
CN103905244A (zh) * 2014-01-28 2014-07-02 北京奇虎科技有限公司 一种统计到访信息的装置和方法
CN103905244B (zh) * 2014-01-28 2018-05-11 北京奇虎科技有限公司 一种统计到访信息的装置和方法
CN105812937A (zh) * 2014-12-30 2016-07-27 Tcl集团股份有限公司 一种电视节目推荐方法和电视节目推荐装置
JP2017004493A (ja) * 2015-06-05 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America データ分析方法、データ分析装置およびプログラム

Also Published As

Publication number Publication date
US20090228424A1 (en) 2009-09-10
CN101527815A (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
JP2009213067A (ja) 番組推薦装置および番組推薦方法
US11197036B2 (en) Multimedia stream analysis and retrieval
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
US9654834B2 (en) Computing similarity between media programs
US20050177846A1 (en) Contents extraction method, contents extraction apparatus, contents information display method and apparatus
CN101422041A (zh) 基于因特网搜索的电视
Sardinha et al. American television and off-screen registers: A corpus-based comparison
KR20080080028A (ko) 컨텐트 메터데이터로부터 정보를 추출하기 위한 방법 및장치
JP2005165632A (ja) 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
CN101149747B (zh) 用于处理信息的装置和方法、以及程序
Chiny et al. Netflix recommendation system based on TF-IDF and cosine similarity algorithms
WO2006134682A1 (ja) 固有表現抽出装置、方法、及びプログラム
Berber Sardinha et al. Dimensions of variation<? br?> across American television registers
KR20160062667A (ko) 미디어 리소스를 제공하는 방법 및 장치
JP2016118813A (ja) コンテンツ再生装置
Berber Sardinha et al. A linguistic typology of American television
Souto‐Rico et al. A new system for automatic analysis and quality adjustment in audiovisual subtitled‐based contents by means of genetic algorithms
KR20120071194A (ko) 사용자 리뷰를 이용한 컨텐츠 추천 장치 및 그 방법
CN108140034B (zh) 使用主题模型基于接收的词项选择内容项目
Kim et al. Music playlist title generation using artist information
Xu et al. CS-lol: a Dataset of Viewer Comment with Scene in E-sports Live-streaming
KR101220080B1 (ko) 실시간 인기 키워드에 대한 대표 문구 제공 방법 및 시스템
JP5400819B2 (ja) シーン重要点抽出装置、シーン重要点抽出方法及びシーン重要点抽出プログラム
Ariyasu et al. Message analysis algorithms and their application to social tv
JP2011043908A (ja) 番組検索装置および番組検索プログラム