JP3917648B2 - 連想辞書作成装置 - Google Patents

連想辞書作成装置 Download PDF

Info

Publication number
JP3917648B2
JP3917648B2 JP2006519685A JP2006519685A JP3917648B2 JP 3917648 B2 JP3917648 B2 JP 3917648B2 JP 2006519685 A JP2006519685 A JP 2006519685A JP 2006519685 A JP2006519685 A JP 2006519685A JP 3917648 B2 JP3917648 B2 JP 3917648B2
Authority
JP
Japan
Prior art keywords
word
information
user
search
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006519685A
Other languages
English (en)
Other versions
JPWO2006073095A1 (ja
Inventor
貴史 續木
洋 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Application granted granted Critical
Publication of JP3917648B2 publication Critical patent/JP3917648B2/ja
Publication of JPWO2006073095A1 publication Critical patent/JPWO2006073095A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、データベースに記憶された情報中の単語相互間の関連を格納した連想辞書を作成する連想辞書作成装置に関するものである。
従来、データベースを検索するために用いられる連想辞書を作成する方法として、人手によりデータベースの情報における単語相互間の関係を調べて連想辞書を作成する方法や電子化文書中の全単語に対して出現頻度情報などを用いて連想辞書を自動的に作成する方法等が知られている。このほかに、分野毎の連想辞書を作成するためにユーザが検索条件を入力し、入力された検索条件に適合する文書を対象に連想辞書を作成することで、検索条件が表す分野に適合した連想辞書を作成することができる文書処理装置が開示されている(例えば、特許文献1参照)。また、個人のニーズに対応するため、ユーザが入力した検索キーワードとそれに対応した複数の関連語候補からユーザが選択した関連語との関連度を増加させることにより、ユーザに適応した連想辞書を作成することができる連想辞書作成装置が開示されている(例えば、特許文献2参照)。
特開平10−134075号公報 特開2000−348042号公報
しかしながら、従来の分野毎の連想辞書を作成し利用する文書処理装置は、分野毎の連想辞書を作成するためにユーザは検索条件を入力する必要がある。このため、ユーザが嗜好に合った分野の連想辞書を作成する場合、ユーザは、精度の高い連想辞書を取得するために、分野を表す最適な検索条件を入力しなければならない。このように最適な検索条件を考慮することは、ユーザにとって非常に困難であった。例えば、ニュースや芸能情報、経済市況などを扱う情報番組を頻繁に視聴するユーザは、嗜好に合った精度の高い連想辞書を獲得するために、検索条件として、「ニュース」、「芸能」、「経済」、「情報」のどれを入力してよいのかわからない。
また、ユーザが検索キーワードに対する関連語を選択することで自動的に関連度を変更してユーザに適応した連想辞書を作成する従来の連想辞書作成装置は、ユーザは適応した辞書を取得するまで、嗜好に合った全検索キーワードを入力し、その検索キーワードに対応した関連語を選択しなければならず、精度が向上するまでにユーザの負担が大きかった。例えば、一人の出演者名に対して複数の出演者名が関連付けられて格納される連想辞書の場合、連想辞書の精度を向上させるためにユーザは、連想辞書に格納されている出演者名とその出演者名から連想される出演者を選択することを複数の出演者に対して行わなければならず、ユーザの負担は大きかった。
そこで、本発明は上記の事情に鑑みてなされたものであり、ユーザの嗜好に合った連想辞書を簡単にかつ効率的に作成することができる連想辞書作成装置を提供することを目的とする。
上記目的を達成するため、本発明に係る連想辞書作成装置は、複数の単語間の関係を記憶する連想辞書を作成する連想辞書作成装置であって、番組情報を格納するコンテンツ記憶手段と、前記コンテンツ記憶手段から、ユーザが閲覧した番組に関するテキスト情報を抽出する表示情報抽出手段と、前記表示情報抽出手段により抽出された前記ユーザが閲覧した番組に関するテキスト情報から抽出される単語群であるユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する単語選択手段と、検索対象となる情報が格納されたデータベースに基づいて、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する関連語格納手段とを備えることを特徴とする。これによって、ユーザの嗜好に合った連想辞書を簡単にかつ効率的に作成することができる。
以上の説明から明らかなように、本発明に係る連想辞書作成装置によれば、ユーザの嗜好に合った単語のみを格納した連想辞書を簡単にかつ効率的に作成することができる。
本発明の実施の形態に係る連想辞書作成装置は、複数の単語間の関係を記憶する連想辞書を作成する連想辞書作成装置であって、ユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する単語選択手段と、検索対象となる情報が格納されたデータベースに基づいて、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する関連語格納手段とを備えることを特徴とする。これによって、ユーザの嗜好に合った連想辞書を簡単にかつ効率的に作成することができる。
ここで、前記単語選択手段は、前記ユーザの嗜好を表す情報を、ユーザの嗜好を表す情報を格納したプロファイルより取得してもよい。これによって、ユーザの嗜好を表す情報を簡単に取得することができる。
また、前記関連語格納手段は、前記関連語探索単語と前記関連語候補との関連度を前記データベースにおける出現頻度に基づいてそれぞれ算出し、算出した関連度が閾値以上である前記関連語候補を前記関連語探索単語に関連する関連語として選択してもよい。これによって、関連度の高い関連語を選択するでき、関連度の高い関連語が記憶された連想辞書を作成することができる。
また、前記連想辞書作成装置は、さらに、ユーザが閲覧した表示に関する情報を抽出する表示情報抽出手段を備え、前記単語選択手段は、前記表示情報抽出手段により抽出された前記表示に関する情報を前記ユーザの嗜好を表す情報とし、前記表示に関する情報から任意の単語を選択して関連語探索単語として、前記表示に関する情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択してもよい。これによって、ユーザが閲覧した表示に関する情報からユーザの嗜好を表す情報を取得することができる。
また、前記連想辞書作成装置は、さらに、前記データベースから検索条件に適合する情報を検索する検索手段を備え、前記ユーザが閲覧した表示は、情報検索の結果であり、前記表示情報抽出手段は、前記情報検索の結果に関する情報を前記表示に関する情報として抽出してもよい。これによって、ユーザによって行われた情報検索の結果に関する情報からユーザの嗜好を表す情報を取得することができる。
また、前記表示情報抽出手段は、前記情報検索の結果の中で所定時間以上表示画面上に表示された情報を前記表示に関する情報として抽出してもよい。これによって、例えば少しの時間だけ表示された情報等をユーザによって閲覧されたもの判断せず、除外することができる。
また、前記ユーザが閲覧した表示は、放送番組であり、前記表示情報抽出手段は、前記放送番組に関する情報を前記表示に関する情報として抽出してもよい。これによって、ユーザの視聴行為に適応した連想辞書を作成することができる。
また、前記表示情報抽出手段は、前記放送番組の中で所定時間以上表示画面上に表示された放送番組に関する情報を前記表示に関する情報として抽出してもよい。これによって、例えば少しの時間だけ表示された放送番組等をユーザによって視聴されたもの判断せず、除外することができる。
また、前記連想辞書作成装置は、さらに、ユーザの嗜好を表す情報を格納したプロファイルを用いて、前記データベースからユーザの嗜好に適合する情報を嗜好適合情報として抽出する嗜好適合情報抽出手段を備え、前記関連語格納手段は、前記データベースから抽出された前記嗜好適合情報を参照して、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納してもよい。これによって、単語の関連度合をユーザに適応した連想辞書を作成することができる。
また、前記単語選択手段は、前記嗜好適合情報抽出手段により抽出された前記嗜好適合情報を前記ユーザの嗜好を表す情報とし、前記嗜好適合情報から任意の単語を選択して関連語探索単語として、前記嗜好適合情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択してもよい。これによって、ユーザの好みに合った単語のみを記憶した連想辞書を作成することができる。
また、前記単語選択手段は、前記ユーザの嗜好を表す情報を、ユーザの嗜好を表す情報を格納したプロファイルより取得し、前記ユーザの嗜好を表す情報から任意の単語を選択して関連語探索単語として、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択してもよい。これによって、よりユーザの好みに合った単語のみを記憶した連想辞書を作成することができる。
また、前記連想辞書作成装置は、さらに、ユーザが閲覧した表示に関する情報を抽出する表示情報抽出手段と、ユーザの嗜好を表す情報を格納したプロファイルを用いて、前記データベースからユーザの嗜好に適合する情報を嗜好適合情報として抽出する嗜好適合情報抽出手段とを備え、前記単語選択手段は、前記表示情報抽出手段により抽出された前記表示に関する情報を前記ユーザの嗜好を表す情報とし、前記表示に関する情報から任意の単語を選択して関連語探索単語として、前記表示に関する情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択し、前記関連語格納手段は、前記データベースから抽出された前記嗜好適合情報を参照して、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納してもよい。これによって、ユーザの視聴行為に適応した単語のみを記憶し、かつ単語の関連度合がユーザの嗜好に適応した連想辞書を作成することができる。
なお、本発明は、このような連想辞書作成装置として実現することができるだけでなく、このような連想辞書作成装置が備える特徴的な手段をステップとする連想辞書作成方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以下、本発明の各実施の形態について、それぞれ図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。
この情報検索装置は、単語相互間の関連を格納した連想辞書を作成するとともに、連想辞書を利用して情報検索を行うための装置であり、図1に示すようにコンテンツ記憶部101、連想辞書記憶部102、連想辞書作成部103、入力部107、連想検索部108を含んで構成される。
コンテンツ記憶部101は、テレビ放送番組に関する情報やハードディスクレコーダ等に蓄積されたコンテンツに関する情報などが格納されている。
連想辞書記憶部102は、コンテンツ記憶部101に格納されているコンテンツ内の複数の単語に対して、ユーザの嗜好を反映した単語間の関係を表す連想辞書が格納されている。図2は、連想辞書記憶部102に格納されている連想辞書の一例を示す図である。連想辞書記憶部102には、例えば図2に示すように関連のある単語同士を組とした関連語対(関連語1、関連語2)と関連語対の関連度合を表す関連度とが対応付けて格納されており、(関連語対、関連度)として、((松下太郎、松下次郎)、80)、((松下太郎、松下花子)、70)、((松下次郎、松下花子)、90)、((松下次郎、松下三郎)、80)、…、が格納されている。
連想辞書作成部103は、コンテンツ記憶部101に格納されているコンテンツに対して、ユーザの嗜好に関する情報であるプロファイルから抽出する単語対の関連度を算出し、算出対象となる単語対と算出される関連度を対応付けて連想辞書記憶部102へ格納する連想辞書作成装置であり、プロファイル記憶部104、単語選択部105、および関連度算出部106を備えている。
プロファイル記憶部104は、ユーザの嗜好に関する情報であるプロファイルを格納している。一例として、プロファイルには、ユーザの好みのコンテンツが属するジャンル、好みのタイトルや出演者、視聴時間などを含み、それぞれのデータ(ジャンル、タイトル、出演者、視聴時間など)に対応付けられた好みの度合を示す重み値などが格納されている。図3は、プロファイル記憶部104に格納されているプロファイルの一例を示す図である。プロファイルには、例えば図3に示すようにデータの種類を示すラベルとデータとデータに対するユーザの好みの度合いを示す重み値とが対応付けて格納されており、(ラベル、データ、重み値)として、((<出演者名>、松下太郎、90)、(<出演者名>、松下次郎、85)、(<出演者名>、松下三郎、80)、(<出演者名>、松下花子、80)、(<ジャンル>、ドラマ、90)、(<放送時間>、12:00〜13:00、90)、…)が格納されている。
単語選択部105は、所定の時間毎にプロファイル記憶部104に格納されているプロファイルから単語を選択して関連語探索単語とし、さらにプロファイルに含まれる関連語探索単語以外の単語を関連語候補として選択する。一例として、単語選択部105は、プロファイル記憶部104に格納される図3のプロファイルからデータを選択して関連語探索単語とし、さらにプロファイルに含まれる関連語探索単語以外のデータを関連語候補として選択する。また、重み値が特定の閾値以上のデータのみを対象として関連語探索単語と関連語候補としてもよい。
関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択された関連語探索単語と関連語候補の単語との関連度を算出し、関連度が所定の閾値よりも大きい場合に、関連語探索単語と関連語候補の単語とを関連語対とし、関連語対と関連度を対応付けて連想辞書記憶部102に格納する。ここで、関連度の算出方法としては、例えば相互情報量(MI)を利用する方法がある。具体的には、単語W1と単語W2が含まれるコンテンツ数をa、単語W1が含まれず単語W2が含まれるコンテンツ数をb、単語W1が含まれて単語W2が含まれないコンテンツ数をc、単語W1と単語W2の両方が含まれないコンテンツ数をd、総コンテンツ数をN(=a+b+c+d)とすると、MI=log2(aN/((a+b)(a+c)))で求めることが出来る。この他にも一般的な関連度の算出方法として、Dice−coefficient、重み付きDice−coefficient、t−score、χ二乗値、対数尤度比などを利用する方法もある。また、関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択された関連語探索単語と関連語候補の各単語それぞれに対して、単語の前後のテキストを形態素や単語に分解して、形態素や単語の有無、出現回数、出現頻度(tf値)とidf(inverse document frequency)値を掛け合わせたtf・idf値などを成分としたベクトルを生成しておき、関連語探索単語のベクトルと関連語候補の各単語のベクトル間のコサイン距離やユークリッド距離の逆数などを関連度として算出してもよい。
入力部107は、キーボードやマウス、リモコン等の入力装置で構成され、ユーザが検索キーワードを含む検索条件や入力データを入力する。
連想検索部108は、入力部101から入力される検索条件と検索条件に含まれる検索キーワードに関連する関連語を連想辞書記憶部102から取得して検索拡張条件を生成し、検索拡張条件に合致したコンテンツをコンテンツ記憶部101から取得し、検索結果として出力する処理部であり、検索条件生成部109、および検索部110を備えている。
検索条件生成部109は、入力部101から入力される検索条件に含まれる検索キーワードと所定の閾値以上の関連度で対応づけられる関連語を連想辞書記憶部102から取得し、取得された関連語と検索キーワードから検索拡張条件を生成する。
検索部110は、検索条件生成部109で生成される検索条件に合致したコンテンツをコンテンツ記憶部101から取得し、検索結果とする。
このように構成された本実施の形態による情報検索装置において連想辞書を作成する際の動作例について説明する。図4は連想辞書を作成する際の動作の流れを示すフローチャートである。
単語選択部105は、所定の時間毎にプロファイル記憶部104に格納されているプロファイルから単語を選択して関連語探索単語とし、さらにプロファイルに含まれる関連語探索単語以外の単語を関連語候補として選択する(ステップS101)。具体的な一例として、単語選択部105は、所定の時間として1週間毎にプロファイル記憶部104に格納される図3のプロファイルから単語「松下太郎、松下次郎、…」を関連語探索単語とし、さらに関連語探索単語「松下太郎」に対しては、図3のプロファイルに含まれる関連語探索単語「松下太郎」以外の単語「松下次郎、松下三郎、松下花子、ドラマ、12:00〜13:00、…」を関連語候補とし、同様に、他の関連語探索単語「松下次郎、松下三郎、…」に対しても関連語候補を選択する。
関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択された関連語探索単語と関連語候補の単語との関連度を算出し(ステップS102)、関連度が所定の閾値よりも大きいか否かを判定する(ステップS103)。その結果、関連度が所定の閾値よりも大きい場合(ステップS103でYES)は、関連語探索単語と関連語候補の単語とを関連語対とし、この関連語対と関連度を対応付けて連想辞書記憶部102に格納する(ステップS104)。一方、関連度が所定の閾値以下の場合(ステップS103でNO)は、何も処理を行わない。これらの処理(ステップS102〜ステップS104)を関連語候補に含まれる全単語に対して行い(ステップS105)、さらにこれらの処理(ステップS102〜ステップS105)を全関連語探索単語に対して行う(ステップS106)。上記の例では、関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択されるそれぞれの関連語探索単語「松下太郎、松下次郎、…」に対して、それぞれの関連語候補「松下次郎、松下三郎、松下花子、ドラマ、12:00〜13:00、…」、「松下太郎、松下三郎、松下花子、ドラマ、12:00〜13:00、…」、…、の各単語との関連度を算出する。一例として、(関連語探索単語、関連語候補の単語、関連度)が、(松下太郎、松下次郎、80)、(松下太郎、松下三郎、40)、(松下太郎、松下花子、70)、(松下太郎、ドラマ、20)、(松下太郎、12:00〜13:00、30)、(松下次郎、松下太郎、80)、(松下次郎、松下三郎、80)、(松下次郎、松下花子、90)、(松下次郎、ドラマ、10)、(松下次郎、12:00〜13:00、40)、…、が算出され、関連度が所定の閾値(一例として50とする)よりも大きい(関連語探索単語、関連語候補の単語、関連度)を連想辞書記憶部102に格納する。この場合の連想辞書記憶部102の内容は図2に示すようになる。
次に、本実施の形態による情報検索装置において情報を検索する際の動作例について説明する。図5は情報を検索する際の動作の流れを示すフローチャートである。
検索条件生成部109は、ユーザによって入力部107から入力された検索条件を受け付ける(ステップS201)。上記の例では、一例としてユーザによって入力部107から検索条件「松下太郎の番組」が入力されたとする。
次に、検索条件生成部109は、入力部101から入力された検索条件に含まれる検索キーワードと所定の閾値以上の関連度で対応付けられた関連語を連想辞書記憶部102から取得する(ステップS202)。そして、検索条件生成部109は、取得した関連語と検索キーワードとから検索拡張条件を生成する(ステップS203)。上記の例では、検索条件生成部109は、入力部101から入力された検索条件「松下太郎の番組」に含まれる検索キーワード「松下太郎」と所定の閾値(一例として所定の閾値を75とする)以上の関連度で対応付けられる関連語「松下次郎」を連想辞書記憶部102から取得し、取得された関連語「松下次郎」、または、検索キーワード「松下太郎」のどちらか一方が含まれるということを表す検索拡張条件「松下太郎+松下次郎」を生成する。
検索部110は、検索条件生成部109で生成された検索条件に合致したコンテンツをコンテンツ記憶部101から取得し、検索結果とする(ステップS204)。上記の例では、検索部110は、検索条件生成部109で生成された検索条件「松下太郎+松下次郎」から、「松下太郎」または、「松下次郎」のいずれかのキーワードが含まれるコンテンツをコンテンツ記憶部101から取得し、検索結果とする。
なお、本実施の形態では、単語選択部105は、所定の時間毎にプロファイル記憶部104に格納されているプロファイルから関連語探索単語と関連語候補とを選択しているが、所定の時間毎ではなくプロファイルが更新される度に関連語探索単語と関連語候補とを選択するようにしてもよい。こうすることで、ユーザの嗜好の変化に時間差を生ずることなく関連語対を取得することができる。
また、本実施の形態では、関連度算出部106は、単語選択部105で選択された関連語探索単語と関連語候補の全単語とに対して関連度を算出し、関連度が所定の閾値よりも大きい場合は、関連語探索単語と関連語候補の単語を関連語対とし、関連語対と関連度を対応付けて連想辞書記憶部102に格納しているが、これに限られるものではない。例えば、関連度算出部106は、新たに単語選択部105で選択される関連語対とその関連度を算出する際に、連想辞書記憶部102に記憶されている全関連度を減衰させた後、新たに関連度が算出された関連語対と同じ関連語対が連想辞書記憶部102に既に存在する場合、既に連想辞書記憶部102に記憶されている関連度と関連度算出部106で新たに求められた関連度を加算することで更新するようにしてもよい。この場合、関連度算出部106において、(関連語探索単語、関連語候補の単語、関連度)として新たに(松下太郎、松下次郎、60)が算出された場合、図2に示す連想辞書記憶部102に記憶されている関連度に減衰パラメータ(一例として、0.8)を乗じて減衰させ、既に存在する関連語対(松下太郎、松下次郎)の減衰後の関連度64と新たに求められた関連度60を加えた値124を関連語対(松下太郎、松下次郎)の関連度として、連想辞書記憶部102に格納する。この結果、連想辞書記憶部102の内容は図6に示すように更新される。こうすることで、過去のコンテンツに対する関連度を考慮した関連度を得ることができ、関連度の精度を向上させることができる。
また、例えば、単語選択部105で選択された関連語探索単語と関連語候補の全単語とに対して関連度を算出し、関連度が所定の閾値よりも大きいか否かにかかわらず、関連語探索単語と関連語候補の単語を関連語対とし、関連語対と関連度を対応付けて連想辞書記憶部102に格納しても構わない。なお、本実施の形態のように、関連度が所定の閾値よりも大きい場合に関連語対と関連度を対応付けて連想辞書記憶部102に格納すれば、記憶容量を抑えることができる。
以上のように、本実施の形態によれば、ユーザの嗜好を表す情報であるプロファイルから連想辞書に格納する単語を選択することにより、ユーザの好みに合った単語のみを格納した連想辞書を作成することができる。さらに、ユーザがコンテンツを検索する際に、この作成した連想辞書を利用することで、ユーザの嗜好に合った単語を用いて検索条件の拡張を行うことができる。よって、拡張された検索結果をユーザの嗜好に適応させることができる。
(実施の形態2)
図7は、本発明の実施の形態2に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。ここで、実施の形態1と同一符号の構成要素は同じ動作を行うものとし、それらの詳細な説明は省略する。
本実施の形態の情報検索装置は、単語相互間の関連を格納した連想辞書を作成するとともに、連想辞書を利用して情報検索を行うための装置であり、図7に示すようにコンテンツ記憶部101、連想辞書記憶部102、入力部107、連想検索部108、連想辞書作成部201、表示部204、画面作成部205、および放送波受信部206を含んで構成される。
表示部204は、CRTディスプレイ、液晶ディスプレイ(LCD)、プラズマディスプレイ(PDP)等で構成され、入力される表示画面情報を表示するものである。放送波受信部206は、アンテナ207を介してテレビ放送番組等のコンテンツを受信する。
画面作成部205は、検索部110で検索された検索結果を表示画面情報に変換し、表示部204に表示画面情報を出力するとともに、放送波受信部206で受信されたテレビ放送番組等のコンテンツを表示部204に出力する。さらに、画面作成部205は、表示に関する情報として、検索部110で検索された検索結果に関するテキスト情報や表示部204に表示されたテレビ放送番組等コンテンツに関する情報を抽出し、表示コンテンツ記憶部202に格納する。
連想辞書作成部201は、コンテンツ記憶部101に格納されているコンテンツに対して、表示された検索結果から抽出する単語対の関連度を算出し、算出対象となる単語対と算出される関連度を対応付けて連想辞書記憶部102へ格納する連想辞書作成装置であり、表示コンテンツ記憶部202、単語選択部203、および関連度算出部106を備えている。
表示コンテンツ記憶部202は、表示された検索結果に関するテキスト情報や表示されたコンテンツに関する情報である表示に関する情報を記憶する。単語選択部203は、表示コンテンツ記憶部202に新たなテキスト情報が格納される度に、このテキスト情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する。
関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部203で選択された関連語探索単語と関連語候補の単語との関連度を算出し、関連度が所定の閾値よりも大きい場合に、関連語探索単語と関連語候補の単語とを関連語対とし、関連語対と関連度を対応付けて連想辞書記憶部102に格納する。ここで、関連度の算出方法としては実施の形態1と同様の方法を用いる。
このように構成された本実施の形態による情報検索装置において連想辞書を作成する際の動作例について説明する。図8は連想辞書を作成する際の動作の流れを示すフローチャートである。
ここで、画面作成部205は、検索部110で検索された検索結果を表示画面情報に変換し、表示部204に表示画面情報を出力、または放送波受信部206で受信されたテレビ放送番組等のコンテンツを表示部204に出力しているものとする。一例として、検索結果を表示している場合は、ユーザによって検索条件「松下太郎の番組」が入力され、検索結果が「松下太郎」が出演している動画コンテンツと動画コンテンツの説明であるテキスト「出演:松下太郎、松下花子、松下三郎」とする。一方、テレビ放送番組等のコンテンツを表示している場合は、コンテンツに関するテキスト情報として「出演:松下次郎、松下花代」を有するコンテンツを表示しているとする。
まず、画面作成部205は、検索部110で検索される検索結果を表示している場合には検索結果に関するテキスト情報を、放送波受信部206で受信されたコンテンツを表示している場合には、コンテンツに関するテキスト情報を、表示に関する情報として表示コンテンツ記憶部202へ格納する(ステップS301)。なお、放送波受信部206で受信されたコンテンツを表示している場合には、所定時間(例えば10分等)以上表示されていれば、コンテンツに関するテキスト情報を表示コンテンツ記憶部202へ格納するものとしても構わない。上記の例の検索結果を表示している場合には、画面作成部205は、検索部110で検索された「松下太郎」が出演している動画コンテンツの説明であるテキスト「出演:松下太郎、松下花子、松下三郎」を表示コンテンツ記憶部202へ格納する。また、上記の例の放送波受信部206で受信されたコンテンツを表示している場合には、「出演:松下次郎、松下花代」を表示コンテンツ記憶部202へ格納する。
単語選択部203は、表示コンテンツ記憶部202に画面作成部205からテキスト情報が格納されると、このテキスト情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する(ステップS302)。例えば、テキスト「出演:松下太郎、松下花子、松下三郎」が表示コンテンツ記憶部202へ格納された場合には、単語選択部203は、「出演:松下太郎、松下花子、松下三郎」に対して形態素解析を行うことで、例えば名前を表す単語「松下太郎、松下花子、松下三郎」を抽出し、(関連語探索単語、(関連語候補))として(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))を生成する。
関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択された関連語探索単語と関連語候補の単語との関連度を算出し(ステップS303)、関連度が所定の閾値よりも大きいか否かを判定する(ステップS304)。その結果、関連度が所定の閾値よりも大きい場合(ステップS304でYES)は、関連語探索単語と関連語候補の単語とを関連語対とし、この関連語対と関連度を対応付けて連想辞書記憶部102に格納する(ステップS305)。ここで、新たに関連度が算出された関連語対は、1つの単語が関連語探索単語となる場合と関連語候補の単語となる場合とがあるので重複することになるが、この重複は省いた上で連想辞書記憶部102に格納する。一方、関連度が所定の閾値以下の場合(ステップS304でNO)は、何も処理を行わない。これらの処理(ステップS303〜ステップS305)を関連語候補に含まれる全単語に対して行い(ステップS306)、さらにこれらの処理(ステップS303〜ステップS306)を全関連語探索単語に対して行う(ステップS307)。上記の例では、関連度算出部106は、コンテンツ記憶部101に格納されているコンテンツを参照して、単語選択部105で選択された(関連語探索単語、(関連語候補))の組である(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))に対して、それぞれの関連語探索単語と関連語候補の各単語との関連度を算出する。一例として、(関連語探索単語、関連語候補の単語、関連度)が、(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70)が算出され、関連度が所定の閾値(一例として50とする)よりも大きい(関連語探索単語、関連語候補の単語、関連度)を図2に示す連想辞書記憶部102に記憶されている関連度に減衰パラメータ(一例として、0.8)を乗じて減衰させた後の連想辞書記憶部102に加える。この場合の連想辞書記憶部102の内容は図9に示すようになる。
なお、本実施の形態では、関連度算出部106は、連想辞書記憶部102を更新する際に、連想辞書記憶部102に記憶されている全関連度を減衰させた後、新たに関連度が算出された関連語対と同じ関連語対が連想辞書記憶部102に既に存在する場合、既に連想辞書記憶部102に格納されている関連度と関連度算出部106で新たに求められた関連度とを加算することで更新しているが、これに限られるものではない。例えば、関連度算出部106は、新たに関連度が算出された関連語対をそのまま関連度を対応付けて連想辞書記憶部102に格納するようにしてもよい。
また、本実施の形態では、動画コンテンツを検索したが、これに限定されることはなく、ハイパーテキストやインターネット上のWEBページでもよい。この場合、画面作成部205は、検索部110で検索されるハイパーテキストやWEBページの表示テキストを表示コンテンツ記憶部202に格納し、さらに、検索されたハイパーテキストやWEBページのテキストを表示画面情報に変換し、表示部204に表示画面情報を出力する。具体的な一例として、図10に示すHTML言語で記述されたファイル「name.html」が検索部110で検索された場合、画面作成部205は、ファイル「name.html」より図11(b)に示す表示テキスト「松下太郎、松下花子、松下三郎、松下次郎」を表示コンテンツ記憶部202に格納し、さらに、ファイル「name.html」を表示画面情報に変換し、表示部204に図11(a)に示すように表示画面情報を出力する。さらに、画面作成部205は、表示部204にテキストが全て表示されない場合、表示されたテキストのみを表示コンテンツ記憶部202に格納するようにしてもよい。上記の実施例では、一例として表示部に図10のHTML言語で記述されたファイル「name.html」が図12(a)に示すように表示された場合、画面作成部205は、図12(b)に示すように表示テキスト「松下太郎、松下花子、松下三郎」のみを表示コンテンツ記憶部202に格納する。こうすることで、ユーザが視聴したコンテンツのテキストから抽出される単語のみから連想辞書を作成することができ、ユーザの視聴行為に適応した連想辞書を作成することができる。また、画面作成部205は、表示部204に所定時間以上表示されたテキストを表示されたテキストとして扱っても構わない。これによって、単にスクロール時に表示されただけであってユーザによって閲覧されていないテキストを除くことができる。
また、画面作成部205は、検索部110で検索されるコンテンツに関するテキスト情報を表示コンテンツ記憶部202に格納したが、コンテンツが動画コンテンツで動画コンテンツの各シーンやフレーム毎に対応するテキストが存在する場合、画面作成部205は、ユーザが視聴した動画コンテンツのシーンやフレームに対応するテキストのみを表示コンテンツ記憶部202に格納するようにしてもよい。こうすることで、ユーザが視聴した動画コンテンツのシーンやフレームに対応するテキストのみから連想辞書を作成することができ、動画コンテンツに対してユーザの視聴行為に適応した精度の高い連想辞書を作成することができる。
以上のように、本実施の形態によれば、ユーザが視聴したコンテンツに関するテキストから連想辞書に格納する単語を選択することにより、ユーザの視聴行為に適応した連想辞書を作成することができる。さらに、ユーザがコンテンツを検索する際に、この作成した連想辞書を利用することで、ユーザの視聴行為に合った単語を用いて検索条件の拡張を行うことができる。よって、拡張された検索結果をユーザに視聴行為に適応させることができる。
(実施の形態3)
図13は、本発明の実施の形態3に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。ここで、実施の形態1と同一符号の構成要素は同じ動作を行うものとし、それらの詳細な説明は省略する。
本実施の形態の情報検索装置は、単語相互間の関連を格納した連想辞書を作成するとともに、連想辞書を利用して情報検索を行うための装置であり、図13に示すようにコンテンツ記憶部101、連想辞書記憶部102、入力部107、連想検索部108、および連想辞書作成部301を含んで構成される。
連想辞書作成部301は、コンテンツ記憶部101に格納されているコンテンツからユーザの嗜好に合ったコンテンツに関するテキストとして嗜好適合情報を抽出し、さらに、嗜好適合情報に対して、嗜好適合情報から抽出する単語対の関連度を算出し、算出対象となる単語対と算出される関連度を対応付けて連想辞書記憶部102へ格納する連想辞書作成装置であり、プロファイル記憶部104、嗜好コンテンツ抽出部302、嗜好適合情報記憶部303、単語選択部304、および関連度算出部305を備えている。
嗜好適合情報記憶部303は、ユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を格納する。嗜好コンテンツ抽出部302は、コンテンツ記憶部101に格納されているコンテンツからプロファイル記憶部104に格納されるユーザの嗜好に関する情報であるプロファイルを用いてユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を抽出し、嗜好適合情報記憶部303へ格納する。
単語選択部304は、嗜好適合情報記憶部303に格納される嗜好適合情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する。
関連度算出部305は、嗜好適合情報記憶部303に格納されている嗜好適合情報を参照して、単語選択部304で選択される関連語探索単語と関連語候補の単語との関連度を算出し、関連度が所定の閾値よりも大きい場合に、関連語探索単語と関連語候補の単語とを関連語対とし、関連語対と関連度とを対応付けて連想辞書記憶部102へ格納する。ここで、関連度の算出方法としては実施形態1と同様の方法を用いる。
このように構成された本実施の形態による情報検索装置において連想辞書を作成する際の動作例について説明する。図14は連想辞書を作成する際の動作の流れを示すフローチャートである。
嗜好コンテンツ抽出部302は、コンテンツ記憶部101に格納されているコンテンツからプロファイル記憶部104に格納されている例えば図3に示すようなプロファイルを用いてユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を抽出し、嗜好適合情報記憶部303に格納する(ステップS401)。具体的な一例として、嗜好コンテンツ抽出部302は、プロファイル記憶部104から、(ラベル、データ、重み値)を取得し、コンテンツ記憶部101に格納される各コンテンツに関する各テキストそれぞれに対し、テキストにデータのキーワードが含まれる場合、そのキーワードに対する重みを加算し、その加算した結果が所定の閾値を超えた場合は、その閾値を超えたテキストを嗜好適合情報記憶部303に格納する。一例として、嗜好コンテンツ抽出部302が、テキスト「ジャンル:ドラマ、出演:松下太郎、松下花子、松下三郎」をコンテンツ記憶部101から抽出し、嗜好適合情報として嗜好適合情報記憶部303に格納する。
単語選択部304は、嗜好適合情報記憶部303に格納される嗜好適合情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する(ステップS402)。上記の例では、単語選択部304は、嗜好適合情報記憶部303に格納されたテキスト「ジャンル:ドラマ、出演:松下太郎、松下花子、松下三郎」に対して形態素解析を行うことで、例えば名前を表す単語「松下太郎、松下花子、松下三郎」を抽出し、(関連語探索単語、(関連語候補))として(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))を生成する。
関連度算出部305は、嗜好適合情報記憶部303に格納される嗜好適合情報を参照して、単語選択部304で選択された関連語探索単語と関連語候補の単語との関連度を算出し(ステップS403)、関連度が所定の閾値よりも大きいか否かを判定する(ステップS404)。その結果、関連度が所定の閾値よりも大きい場合(ステップS404でYES)は、関連語探索単語と関連語候補の単語とを関連語対とし、この関連語対と関連度とを対応付けて連想辞書記憶部102に格納する(ステップS405)。ここで、新たに関連度が算出された関連語対は、1つの単語が関連語探索単語となる場合と関連語候補の単語となる場合とがあるので重複することになるが、この重複は省いた上で連想辞書記憶部102に格納する。一方、関連度が所定の閾値以下の場合(ステップS404でNO)は、何も処理を行わない。これらの処理(ステップS403〜ステップS405)を関連語候補に含まれる全単語に対して行い(ステップS406)、さらにこの処理(ステップS403〜ステップS406)を全関連語探索単語に対して行う(ステップS407)。上記の例では、関連度算出部305は、嗜好適合情報記憶部303に格納されている嗜好適合情報を参照して、単語選択部304で選択される(関連語探索単語、(関連語候補))の組である(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))に対して、それぞれの関連語探索単語と関連語候補の各単語との関連度を算出する。一例として、(関連語探索単語、関連語候補の単語、関連度)が、(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70)が算出され、関連度が所定の閾値(一例として50とする)よりも大きい(関連語探索単語、関連語候補の単語、関連度)を連想辞書記憶部102に格納する。この場合の連想辞書記憶部102の内容は図15に示すようになる。
また、情報を検索する際の動作については、実施の形態1と同じであるので、それらの詳細な説明は省略する。
なお、本実施の形態では、関連度算出部305は、単語選択部304で選択される関連語探索単語と関連語候補の全単語とに対して関連度を算出し、関連度が所定の閾値よりも大きい場合は、関連語探索単語と関連語候補の単語を関連語対として、関連語対と関連度を対応付けて連想辞書記憶部102に格納しているが、これに限られるものではない。例えば、関連度算出部305は、新たに単語選択部304で選択される関連語対とその関連度を算出する際に、連想辞書記憶部102に記憶されている全関連度を減衰させた後、新たに関連度が算出された関連語対と同じ関連語対が連想辞書記憶部102に既に存在する場合、既に連想辞書記憶部102に格納されている関連度と関連度算出部305で新たに求められた関連度を加算することで更新するようにしてもよい。この場合、関連度算出部305は、嗜好適合情報記憶部303に格納されている嗜好適合情報を参照して、単語選択部304で選択された(関連語探索単語、(関連語候補))の組である(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))に対して、それぞれの関連語探索単語と関連語候補の各単語との関連度を算出する。一例として、(関連語探索単語、関連語候補の単語、関連度)が、(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70)が算出され、関連度が所定の閾値(一例として50とする)よりも大きい(関連語探索単語、関連語候補の単語、関連度)を図2に示す連想辞書記憶部102に記憶されている関連度を減衰パラメータ(一例として、0.8)を乗じて減衰させた後の連想辞書記憶部102に加える。この場合の連想辞書記憶部102の内容は図9に示すようになる。こうすることで、過去のコンテンツに対する関連度を考慮した関連度を得ることができ、関連度の精度を向上させることができる。
また、本実施の形態では、単語選択部304は、嗜好適合情報記憶部303から関連語探索単語と関連語候補を選択したが、例えば図16に示すように、実施の形態1と同様にプロファイル記憶部104から関連語探索単語と関連語候補を選択するようにしてもよい。さらに重み値が特定の閾値以上のデータのみを対象として関連語探索単語と関連語候補としてもよい。こうすることで、ユーザの嗜好が強く反映されたデータのみを連想辞書記憶部102に格納するので、連想辞書記憶部102に格納される単語にユーザの嗜好をより強く反映することができる。
以上のように、本実施の形態によれば、ユーザの嗜好に合ったコンテンツから連想辞書に格納する単語を選択し、かつ、関連度合も計算することにより、ユーザの好みに合った単語のみを格納し、かつ単語の関連度合もユーザに適応した連想辞書を作成することができる。さらに、ユーザがコンテンツを検索する際に、この作成した連想辞書を利用することで、ユーザの嗜好に合った連想を行いユーザの嗜好に合った単語を用いて検索条件の拡張を行うことできる。よって、拡張された検索結果をユーザの嗜好により一層適応させることができる。
(実施の形態4)
図17は、本発明の実施の形態4に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。ここで、実施の形態1〜3と同一符号の構成要素は同じ動作を行うものとし、それらの詳細な説明は省略する。
本実施の形態の情報検索装置は、単語相互間の関連を格納した連想辞書を作成するとともに、連想辞書を利用して情報検索を行うための装置であり、図17に示すようにコンテンツ記憶部101、連想辞書記憶部102、入力部107、連想検索部108、表示部204、画面作成部205、放送波受信部206、および連想辞書作成部401を含んで構成される。
連想辞書作成部401は、コンテンツ記憶部101に格納されているコンテンツからユーザの嗜好に合ったコンテンツに関するテキストとして嗜好適合情報を抽出し、さらに、嗜好適合情報に対して、表示された検索結果から抽出する単語対の関連度を算出し、算出対象となる単語対と算出される関連度を対応付けて連想辞書記憶部102へ格納する連想辞書作成装置であり、プロファイル記憶部104、嗜好コンテンツ抽出部302、嗜好適合情報記憶部303、表示コンテンツ記憶部202、単語選択部203、および関連度算出部305を備えている。
嗜好適合情報記憶部303は、ユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を格納する。嗜好コンテンツ抽出部302は、コンテンツ記憶部101に格納されているコンテンツからプロファイル記憶部104に格納されるユーザの嗜好に関する情報であるプロファイルを用いてユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を抽出し、嗜好適合情報記憶部303へ格納する。
表示コンテンツ記憶部202は、表示された検索結果に関するテキスト情報や表示されたコンテンツに関する情報である表示に関する情報を記憶する。単語選択部203は、表示コンテンツ記憶部202に新たなテキスト情報が格納される度に、このテキスト情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する。
関連度算出部305は、嗜好適合情報記憶部303に格納されている嗜好適合情報を参照して、単語選択部304で選択される関連語探索単語と関連語候補の単語との関連度を算出し、関連度が所定の閾値よりも大きい場合に、関連語探索単語と関連語候補の単語とを関連語対とし、関連語対と関連度とを対応付けて連想辞書記憶部102へ格納する。ここで、関連度の算出方法としては実施形態1と同様の方法を用いる。
このように構成された本実施の形態による情報検索装置において連想辞書を作成する際の動作例について説明する。図18は連想辞書を作成する際の動作の流れを示すフローチャートである。
ここで、画面作成部205は、実施の形態2と同様に検索部110で検索された検索結果を表示画面情報に変換し、表示部204に表示画面情報を出力、または放送波受信部206で受信されたテレビ放送番組等のコンテンツを表示部204に出力しているものとする。一例として、検索結果を表示している場合は、ユーザによって検索条件「松下太郎の番組」が入力され、検索結果が「松下太郎」が出演している動画コンテンツと動画コンテンツの説明であるテキスト「出演:松下太郎、松下花子、松下三郎」とする。一方、テレビ放送番組等のコンテンツを表示している場合は、コンテンツに関するテキスト情報として「出演:松下次郎、松下花代」を有するコンテンツを表示しているとする。
まず、画面作成部205は、実施の形態2と同様に検索部110で検索される検索結果を表示している場合には検索結果に関するテキスト情報を、放送波受信部206で受信されたコンテンツを表示している場合には、コンテンツに関するテキスト情報を、表示に関する情報として表示コンテンツ記憶部202へ格納する(ステップS501)。なお、放送波受信部206で受信されたコンテンツを表示している場合には、所定時間(例えば10分等)以上表示されていれば、コンテンツに関するテキスト情報を表示コンテンツ記憶部202へ格納するものとしても構わない。上記の例の検索結果を表示している場合には、画面作成部205は、検索部110で検索された「松下太郎」が出演している動画コンテンツの説明であるテキスト「出演:松下太郎、松下花子、松下三郎」を表示コンテンツ記憶部202へ格納する。また、上記の例の放送波受信部206で受信されたコンテンツを表示している場合には、「出演:松下次郎、松下花代」を表示コンテンツ記憶部202へ格納する。
次に、嗜好コンテンツ抽出部302は、実施の形態3と同様にコンテンツ記憶部101に格納されているコンテンツからプロファイル記憶部104に格納されている例えば図3に示すようなプロファイルを用いてユーザの嗜好に合ったコンテンツに関するテキストである嗜好適合情報を抽出し、嗜好適合情報記憶部303に格納する(ステップS502)。具体的な一例として、嗜好コンテンツ抽出部302は、プロファイル記憶部104から、(ラベル、データ、重み値)を取得し、コンテンツ記憶部101に格納される各コンテンツに関する各テキストそれぞれに対し、テキストにデータのキーワードが含まれる場合、そのキーワードに対する重みを加算し、その加算した結果が所定の閾値を超えた場合は、その閾値を超えたテキストを嗜好適合情報記憶部303に格納する。一例として、嗜好コンテンツ抽出部302が、テキスト「ジャンル:ドラマ、出演:松下太郎、松下花子、松下三郎」、…、をコンテンツ記憶部101から抽出し、嗜好適合情報として嗜好適合情報記憶部303に格納する。
単語選択部203は、表示コンテンツ記憶部202に画面作成部205からテキスト情報が格納されると、このテキスト情報に対して形態素解析などを行うことで単語を抽出し、この抽出された単語から単語を選択して関連語探索単語とし、さらに抽出された単語で関連語探索単語以外の単語を関連語候補とした複数の組を生成する(ステップS503)。例えば、テキスト「出演:松下太郎、松下花子、松下三郎」が表示コンテンツ記憶部202へ格納された場合には、単語選択部203は、「出演:松下太郎、松下花子、松下三郎」に対して形態素解析を行うことで、例えば名前を表す単語「松下太郎、松下花子、松下三郎」を抽出し、(関連語探索単語、(関連語候補))として(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))を生成する。
関連度算出部305は、嗜好適合情報記憶部303に格納される嗜好適合情報を参照して、単語選択部203で選択された関連語探索単語と関連語候補の単語との関連度を算出し(ステップS504)、関連度が所定の閾値よりも大きいか否かを判定する(ステップS505)。その結果、関連度が所定の閾値よりも大きい場合(ステップS505でYES)は、関連語探索単語と関連語候補の単語とを関連語対とし、この関連語対と関連度とを対応付けて連想辞書記憶部102に格納する(ステップS506)。ここで、新たに関連度が算出された関連語対は、1つの単語が関連語探索単語となる場合と関連語候補の単語となる場合とがあるので重複することになるが、この重複は省いた上で連想辞書記憶部102に格納する。一方、関連度が所定の閾値以下の場合(ステップS505でNO)は、何も処理を行わない。これらの処理(ステップS504〜ステップS406)を関連語候補に含まれる全単語に対して行い(ステップS507)、さらにこの処理(ステップS504〜ステップS507)を全関連語探索単語に対して行う(ステップS508)。
上記の例では、関連度算出部305は、嗜好適合情報記憶部303に格納されている嗜好適合情報を参照して、単語選択部203で選択される(関連語探索単語、(関連語候補))の組である(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子))に対して、それぞれの関連語探索単語と関連語候補の各単語との関連度を算出する。一例として、(関連語探索単語、関連語候補の単語、関連度)が、(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70)が算出され、関連度が所定の閾値(一例として50とする)よりも大きい(関連語探索単語、関連語候補の単語、関連度)を図2に示す連想辞書記憶部102に記憶されている関連度に減衰パラメータ(一例として、0.8)を乗じて減衰させた後の連想辞書記憶部102に加える。この場合の連想辞書記憶部102の内容は図9に示すようになる。
なお、本実施の形態では、関連度算出部305は、連想辞書記憶部102を更新する際に、連想辞書記憶部102に記憶されている全関連度を減衰させた後、新たに関連度が算出された関連語対と同じ関連語対が連想辞書記憶部102に既に存在する場合、既に連想辞書記憶部102に格納されている関連度と関連度算出部305で新たに求められた関連度とを加算することで更新しているが、これに限られるものではない。例えば、関連度算出部305は、新たに関連度が算出された関連語対をそのまま関連度を対応付けて連想辞書記憶部102に格納するようにしてもよい。
また、本実施の形態では、動画コンテンツを検索したが、これに限定されることはなく、ハイパーテキストやインターネット上のWEBページでもよい。この場合、画面作成部205は、検索部110で検索されるハイパーテキストやWEBページの表示テキストを表示コンテンツ記憶部202に格納し、さらに、検索されたハイパーテキストやWEBページのテキストを表示画面情報に変換し、表示部204に表示画面情報を出力する。具体的な一例として、図10に示すHTML言語で記述されたファイル「name.html」が検索部110で検索された場合、画面作成部205は、ファイル「name.html」より図11(b)に示す表示テキスト「松下太郎、松下花子、松下三郎、松下次郎」を表示コンテンツ記憶部202に格納し、さらに、ファイル「name.html」を表示画面情報に変換し、表示部204に図11(a)に示すように表示画面情報を出力する。さらに、画面作成部205は、表示部204にテキストが全て表示されない場合、表示されたテキストのみを表示コンテンツ記憶部202に格納するようにしてもよい。上記の実施例では、一例として表示部に図10のHTML言語で記述されたファイル「name.html」が図12(a)に示すように表示された場合、画面作成部205は、図12(b)に示すように表示テキスト「松下太郎、松下花子、松下三郎」のみを表示コンテンツ記憶部202に格納する。こうすることで、ユーザが視聴したコンテンツのテキストから抽出される単語のみから連想辞書を作成することができ、ユーザの視聴行為に適応した連想辞書を作成することができる。また、画面作成部205は、表示部204に所定時間以上表示されたテキストを表示されたテキストとして扱っても構わない。これによって、単にスクロール時に表示されただけであってユーザによって閲覧されていないテキストを除くことができる。
また、画面作成部205は、検索部110で検索されるコンテンツに関するテキスト情報を表示コンテンツ記憶部202に格納したが、コンテンツが動画コンテンツで動画コンテンツの各シーンやフレーム毎に対応するテキストが存在する場合、画面作成部205は、ユーザが視聴した動画コンテンツのシーンやフレームに対応したテキストのみを表示コンテンツ記憶部202に格納するようにしてもよい。こうすることで、ユーザが視聴した動画コンテンツのシーンやフレームに対応したテキストのみから連想辞書を作成することができ、動画コンテンツに対してユーザの視聴行為に適応した精度の高い連想辞書を作成することができる。
以上のように、本実施の形態によれば、ユーザが視聴したコンテンツに関するテキストから連想辞書に記憶する単語を選択し、さらに、ユーザの嗜好に合ったコンテンツに対して関連度合を計算することにより、ユーザの視聴行為に適応した単語のみを記憶し、かつ単語の関連度合がユーザの嗜好に適応した連想辞書を作成することができる。さらに、ユーザがコンテンツを検索する際に、この作成した連想辞書を利用することで、ユーザの嗜好に合った連想を行いユーザの視聴行為に適応した単語を用いて検索条件の拡張を行うことできる。よって、拡張された検索結果をユーザの視聴行為に、さらに連想をユーザの嗜好に適応させることができる。
なお、上記実施の形態1において、コンテンツ記憶部101は検索対象となる情報が格納されたデータベースに、単語選択部105は単語選択手段に、関連度算出部106は関連語格納手段に、それぞれ相当する。
また、上記実施の形態2において、単語選択部203は単語選択手段に、画面作成部205は表示情報抽出手段に、関連度算出部106は関連語格納手段に、検索部110は検索手段に、それぞれ相当する。
また、上記実施の形態3において、嗜好コンテンツ抽出部302は嗜好適合情報抽出手段に、単語選択部304は単語選択手段に、関連度算出部305は関連語格納手段に、それぞれ相当する。
また、上記実施の形態4において、嗜好コンテンツ抽出部302は嗜好適合情報抽出手段に、単語選択部203は単語選択手段に、関連度算出部305は関連語格納手段に、画面作成部205は表示情報抽出手段に、検索部110は検索手段に、それぞれ相当する。
本発明に係る連想辞書作成装置は、連想辞書を利用して検索条件の拡張を行う際に拡張のために付加される検索条件をユーザの嗜好や視聴行為に適応させることができる連想辞書を作成でき、例えばハードディスクレコーダやDVDレコーダ、TV、オーディオコンポ、インターネットにアクセスして情報検索を行うことができる端末等として有用である。
図1は、本発明の実施の形態1に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。 図2は、連想辞書記憶部に格納されている連想辞書の一例を示す図である。 図3は、プロファイル記憶部に格納されているプロファイルの一例を示す図である。 図4は、実施の形態1の情報検索装置において連想辞書を作成する際の動作の流れを示すフローチャートである。 図5は、実施の形態1の情報検索装置において情報を検索する際の動作の流れを示すフローチャートである。 図6は、連想辞書記憶部に格納されている連想辞書の一例を示す図である。 図7は、本発明の実施の形態2に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。 図8は、実施の形態2の情報検索装置において連想辞書を作成する際の動作の流れを示すフローチャートである。 図9は、連想辞書記憶部に格納されている連想辞書の一例を示す図である。 図10は、実施の形態2、4の情報検索装置で検索されるコンテンツの内容の一例を示す図である。 図11は、実施の形態2、4の情報検索装置の(a)表示部に表示される内容の一例、(b)表示コンテンツ記憶部に格納される内容の一例、を示す図である。 図12は、実施の形態2、4の情報検索装置の(a)表示部に表示される内容の一例、(b)表示コンテンツ記憶部に格納される内容の一例、を示す図である。 図13は、本発明の実施の形態3に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。 図14は、実施の形態3の情報検索装置において連想辞書を作成する際の動作の流れを示すフローチャートである。 図15は、連想辞書記憶部に格納されている連想辞書の一例を示す図である。 図16は、本発明の実施の形態3に係る連想辞書作成装置を含む情報検索装置の他の構成を示すブロック図である。 図17は、本発明の実施の形態4に係る連想辞書作成装置を含む情報検索装置の構成を示すブロック図である。 図18は、実施の形態4の情報検索装置において連想辞書を作成する際の動作の流れを示すフローチャートである。
符号の説明
101 コンテンツ記憶部
102 連想辞書記憶部
103、201、301、401 連想辞書作成部
104 プロファイル記憶部
105、203、304 単語選択部
106、305 関連度算出部
107 入力部
108 連想検索部
109 検索条件生成部
110 検索部
202 表示コンテンツ記憶部
204 表示部
205 画面作成部
206 放送波受信部
302 嗜好コンテンツ抽出部
303 嗜好適合情報記憶部

Claims (15)

  1. 複数の単語間の関係を記憶する連想辞書を作成する連想辞書作成装置であって、
    番組情報を格納するコンテンツ記憶手段と、
    前記コンテンツ記憶手段から、ユーザが閲覧した番組に関するテキスト情報を抽出する表示情報抽出手段と、
    前記表示情報抽出手段により抽出された前記ユーザが閲覧した番組に関するテキスト情報から抽出される単語群であるユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する単語選択手段と、
    検索対象となる情報が格納されたデータベースに基づいて、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する関連語格納手段と
    を備えることを特徴とする連想辞書作成装置。
  2. 前記テキスト情報は、番組に関するジャンル、タイトル、出演者、視聴時間の少なくとも1つを含む
    ことを特徴とする請求項1記載の連想辞書作成装置。
  3. 前記単語選択手段は、所定の時間毎にユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する
    ことを特徴とする請求項1記載の連想辞書作成装置。
  4. 前記表示情報抽出手段により抽出したテキスト情報を記憶するプロファイル記憶手段と、
    前記単語選択手段は、ユーザの閲覧に基づいて前記プロファイル記憶手段の情報を更新し、前記更新したプロファイル記憶手段から、ユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する
    ことを特徴とする請求項1記載の連想辞書作成装置。
  5. 前記ユーザの嗜好を表す情報は、前記単語と前記単語に対するユーザの好みの度合いを示す重み値とを対応付けて格納し、
    前記単語選択手段は、前記ユーザの嗜好を表す情報から所定の重み値以上の単語のみを関連語探索単語と関連語候補として選択する
    ことを特徴とする請求項記載の連想辞書作成装置。
  6. 前記関連語格納手段は、前記関連語探索単語と前記関連語候補との関連度を前記データベースにおける出現頻度に基づいてそれぞれ算出し、算出した関連度が閾値以上である前記関連語候補を前記関連語探索単語に関連する関連語として選択する
    ことを特徴とする請求項1記載の連想辞書作成装置。
  7. 前記関連語格納手段は、前記連想辞書に既に関連語対と関連度とが対応付けられて記憶されているときには、算出される前記関連語探索単語と当該関連語探索単語に対応する関連語との関連度とを用いて、前記連想辞書に記憶されている関連語対と関連度とを更新する
    ことを特徴とする請求項記載の連想辞書作成装置。
  8. 前記連想辞書作成装置は、さらに、
    前記データベースからユーザが入力する番組を検索するための検索条件に適合する番組に関するテキスト情報を検索する検索手段を備え、
    前記ユーザが閲覧した番組に関するテキスト情報は、前記検索手段で検索される番組に関するテキスト情報であり、
    前記表示情報抽出手段は、前記検索手段で検索される番組に関するテキスト情報を前記ユーザが閲覧した番組に関するテキスト情報として抽出する
    ことを特徴とする請求項記載の連想辞書作成装置。
  9. 前記表示情報抽出手段は、前記検索手段で検索される番組に関するテキスト情報の中で所定時間以上表示画面上に表示された情報を前記ユーザが閲覧した番組に関するテキスト情報として抽出する
    ことを特徴とする請求項記載の連想辞書作成装置。
  10. 前記ユーザが閲覧した番組に関するテキスト情報は、ユーザが視聴した放送番組に関するテキスト情報であり、
    前記表示情報抽出手段は、前記ユーザが視聴した放送番組に関するテキスト情報を前記ユーザが閲覧した番組に関するテキスト情報として抽出する
    ことを特徴とする請求項記載の連想辞書作成装置。
  11. 前記表示情報抽出手段は、前記ユーザが視聴した放送番組の中で所定時間以上表示画面上に表示された放送番組に関するテキスト情報を前記ユーザが閲覧した番組に関するテキスト情報として抽出する
    ことを特徴とする請求項10記載の連想辞書作成装置。
  12. 前記連想辞書作成装置は、さらに、
    前記ユーザの嗜好を表す情報を用いて、前記データベースからユーザの嗜好に適合する番組に関するテキスト情報を嗜好適合情報として抽出する嗜好適合情報抽出手段を備え、
    前記関連語格納手段は、前記データベースから抽出された前記嗜好適合情報を参照して、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する
    ことを特徴とする請求項1記載の連想辞書作成装置。
  13. 前記単語選択手段は、前記嗜好適合情報抽出手段により抽出された前記嗜好適合情報から任意の単語を選択して関連語探索単語として、前記嗜好適合情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する
    ことを特徴とする請求項12記載の連想辞書作成装置。
  14. 複数の単語間の関係を記憶する連想辞書を作成する連想辞書作成方法であって
    コンピュータが、ユーザが閲覧した番組に関するテキスト情報を抽出する表示情報抽出ステップと、
    コンピュータが、前記表示情報抽出ステップで抽出された前記ユーザが閲覧した番組に関するテキスト情報から抽出される単語群であるユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する単語選択ステップと、
    コンピュータが、検索対象となる情報が格納されたデータベースに基づいて、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する関連語格納ステップと
    を含むことを特徴とする連想辞書作成方法。
  15. 複数の単語間の関係を記憶する連想辞書を作成するためのプログラムであって、
    ユーザが閲覧した番組に関するテキスト情報を抽出する表示情報抽出ステップと、
    前記表示情報抽出ステップで抽出された前記ユーザが閲覧した番組に関するテキスト情報から抽出される単語群であるユーザの嗜好を表す情報から任意の単語を関連語探索単語として選択し、前記ユーザの嗜好を表す情報に含まれる前記関連語探索単語以外の単語を関連語候補として選択する単語選択ステップと、
    検索対象となる情報が格納されたデータベースに基づいて、前記関連語候補の中から前記関連語探索単語に関連する関連語を選択し、前記関連語探索単語と前記関連語とを関連付けて連想辞書へ格納する関連語格納ステップとをコンピュータに実行させる
    ことを特徴とするプログラム。
JP2006519685A 2005-01-07 2005-12-27 連想辞書作成装置 Active JP3917648B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005003171 2005-01-07
JP2005003171 2005-01-07
PCT/JP2005/023919 WO2006073095A1 (ja) 2005-01-07 2005-12-27 連想辞書作成装置

Publications (2)

Publication Number Publication Date
JP3917648B2 true JP3917648B2 (ja) 2007-05-23
JPWO2006073095A1 JPWO2006073095A1 (ja) 2008-06-12

Family

ID=36647577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006519685A Active JP3917648B2 (ja) 2005-01-07 2005-12-27 連想辞書作成装置

Country Status (4)

Country Link
US (1) US8280720B2 (ja)
JP (1) JP3917648B2 (ja)
CN (1) CN100454303C (ja)
WO (1) WO2006073095A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504357B2 (en) 2007-08-03 2013-08-06 Panasonic Corporation Related word presentation device

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793569B2 (en) * 2005-04-01 2014-07-29 Sony Corporation Presenting a recommendation based on user preference
JP2007206975A (ja) * 2006-02-01 2007-08-16 Toshiba Corp 言語情報変換装置及びその方法
JP2007241888A (ja) * 2006-03-10 2007-09-20 Sony Corp 情報処理装置および方法、並びにプログラム
WO2008056570A1 (fr) * 2006-11-09 2008-05-15 Panasonic Corporation Dispositif de recherche de contenu
US8037086B1 (en) * 2007-07-10 2011-10-11 Google Inc. Identifying common co-occurring elements in lists
JP2009025968A (ja) * 2007-07-18 2009-02-05 Fujifilm Corp 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置
JP2009069874A (ja) * 2007-09-10 2009-04-02 Sharp Corp コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
JP2009302884A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2012008900A (ja) * 2010-06-28 2012-01-12 Nippon Telegr & Teleph Corp <Ntt> 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム
CN102411563B (zh) * 2010-09-26 2015-06-17 阿里巴巴集团控股有限公司 一种识别目标词的方法、装置及***
CN102479236B (zh) * 2010-11-30 2015-09-23 成都致远诺亚舟教育科技有限公司 一种单词关联库***及其实现方法和电子学习设备
CN102567423B (zh) * 2010-12-31 2014-12-03 成都致远诺亚舟教育科技有限公司 一种诗词关联搜索方法和***
CN102567424B (zh) * 2010-12-31 2014-12-03 成都致远诺亚舟教育科技有限公司 一种诗词关联库***及其实现方法和电子学习设备
CN102622371B (zh) * 2011-01-28 2015-06-03 成都致远诺亚舟教育科技有限公司 一种历史关联库***及其实现方法和电子学习设备
US9785628B2 (en) * 2011-09-29 2017-10-10 Microsoft Technology Licensing, Llc System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication
TWI456412B (zh) * 2011-10-11 2014-10-11 Univ Ming Chuan 製作知識地圖的方法
JP6342678B2 (ja) * 2014-03-07 2018-06-13 クラリオン株式会社 関連データ生成装置、関連データ生成方法およびプログラム
CN105653533B (zh) * 2014-11-13 2019-10-25 腾讯数码(深圳)有限公司 一种更新分类关联词集合的方法和装置
US9734141B2 (en) 2015-09-22 2017-08-15 Yang Chang Word mapping
JP2019522229A (ja) 2016-04-26 2019-08-08 ポンディ エデュケーション インコーポレイテッドPonddy Education Inc. 親和性知識ベースの、コンピュータによる学習システム
CN110069599A (zh) * 2019-03-13 2019-07-30 平安城市建设科技(深圳)有限公司 基于近似词的检索方法、装置、设备及可读存储介质
CN110032675A (zh) * 2019-03-13 2019-07-19 平安城市建设科技(深圳)有限公司 基于共现词的检索方法、装置、设备及可读存储介质
CN110059156A (zh) * 2019-03-13 2019-07-26 平安城市建设科技(深圳)有限公司 基于关联词的协同检索方法、装置、设备及可读存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877203A (ja) 1994-09-07 1996-03-22 Fuji Xerox Co Ltd 文書検索装置
JP3625344B2 (ja) * 1996-11-05 2005-03-02 株式会社ビデオリサーチ 視聴チャンネル検出装置
JP3099756B2 (ja) * 1996-10-31 2000-10-16 富士ゼロックス株式会社 文書処理装置、単語抽出装置及び単語抽出方法
JP3596210B2 (ja) 1997-01-16 2004-12-02 富士ゼロックス株式会社 関連語辞書作成装置
US6029165A (en) * 1997-11-12 2000-02-22 Arthur Andersen Llp Search and retrieval information system and method
US6553566B1 (en) * 1998-08-27 2003-04-22 X Out Corporation Viewer controlled multi-function system for processing television signals
US7209942B1 (en) * 1998-12-28 2007-04-24 Kabushiki Kaisha Toshiba Information providing method and apparatus, and information reception apparatus
JP2000348042A (ja) * 1999-06-03 2000-12-15 Fujitsu Ltd 統合シソーラス作成装置、修正シソーラス作成装置、情報収集型シソーラス作成装置、統合シソーラス作成プログラム記憶媒体、修正シソーラス作成プログラム記憶媒体、および情報収集型シソーラス作成プログラム記憶媒体
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
JP2001117935A (ja) * 1999-10-19 2001-04-27 Fujitsu Ltd テキスト情報アクセス装置、その方法、及び記録媒体
JP3994368B2 (ja) * 2000-01-25 2007-10-17 ソニー株式会社 情報処理装置および情報処理方法、並びに記録媒体
WO2002010981A2 (en) * 2000-07-28 2002-02-07 Easyask, Inc. Distributed search system and method
JP2002077755A (ja) * 2000-08-29 2002-03-15 Sharp Corp エージェントインタフェース装置
JP2002082987A (ja) * 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体
US7065550B2 (en) * 2001-02-14 2006-06-20 International Business Machines Corporation Information provision over a network based on a user's profile
US7191115B2 (en) * 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US20030126227A1 (en) * 2001-12-31 2003-07-03 Koninklijke Philips Electronics N.V Method of populating an explicit profile
US7640164B2 (en) * 2002-07-04 2009-12-29 Denso Corporation System for performing interactive dialog
US7657907B2 (en) * 2002-09-30 2010-02-02 Sharp Laboratories Of America, Inc. Automatic user profiling
US7340460B1 (en) * 2003-04-04 2008-03-04 Yahoo! Inc. Vector analysis of histograms for units of a concept network in search query processing
JP2004348607A (ja) 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索方法、コンテンツ検索システム、コンテンツ検索用プログラムおよびコンテンツ検索用プログラムが記録された記録媒体
NZ545093A (en) * 2003-07-14 2007-07-27 Orative Corp System and method for active mobile collaboration
WO2006046390A1 (ja) * 2004-10-29 2006-05-04 Matsushita Electric Industrial Co., Ltd. 情報検索装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504357B2 (en) 2007-08-03 2013-08-06 Panasonic Corporation Related word presentation device

Also Published As

Publication number Publication date
CN100454303C (zh) 2009-01-21
US20060282258A1 (en) 2006-12-14
WO2006073095A1 (ja) 2006-07-13
US8280720B2 (en) 2012-10-02
CN1930567A (zh) 2007-03-14
JPWO2006073095A1 (ja) 2008-06-12

Similar Documents

Publication Publication Date Title
JP3917648B2 (ja) 連想辞書作成装置
JP4008954B2 (ja) 情報検索装置
KR102154735B1 (ko) 프로그램 추천 장치 및 프로그램 추천 프로그램
JP4977589B2 (ja) 固有表現抽出装置、固有表現抽出方法、及びプログラム
JP4399514B2 (ja) 対話型番組検索装置
US20090300011A1 (en) Contents retrieval device
JP4487018B2 (ja) 関連シーン付与装置及び関連シーン付与方法
JP2005115790A (ja) 情報検索方法、情報表示装置及びプログラム
JP2009043156A (ja) 番組検索装置および番組検索方法
JPH1069496A (ja) インターネット検索装置
JPH10275157A (ja) データ処理装置
JP4734048B2 (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP2006302024A (ja) 関連文書表示方法及びプログラム
JP2010218385A (ja) コンテンツ検索装置及びコンピュータプログラム
JP2012141681A (ja) クエリセグメント位置決定装置
JP2004362121A (ja) 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2011067808A1 (ja) 番組推薦装置および番組推薦方法
JP5415369B2 (ja) 番組検索装置および番組検索プログラム
JP2005202485A (ja) 映像提示装置
JP2005115791A (ja) 情報検索方法、情報取得装置及びプログラム
JP3759700B2 (ja) 利用者嗜好反映型検索方法及びその実施装置並びにその処理プログラムと記録媒体
JP2005157690A (ja) 電子機器装置及び情報提供方法
JP5439050B2 (ja) 関連コンテンツ表示装置及びコンピュータプログラム
JP5566924B2 (ja) 候補提示装置、方法及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3917648

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

SZ02 Written request for trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z02

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S131 Request for trust registration of transfer of right

Free format text: JAPANESE INTERMEDIATE CODE: R313135

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250