JP4388137B2 - コンテンツ検索装置及びコンテンツ検索方法 - Google Patents
コンテンツ検索装置及びコンテンツ検索方法 Download PDFInfo
- Publication number
- JP4388137B2 JP4388137B2 JP2009528429A JP2009528429A JP4388137B2 JP 4388137 B2 JP4388137 B2 JP 4388137B2 JP 2009528429 A JP2009528429 A JP 2009528429A JP 2009528429 A JP2009528429 A JP 2009528429A JP 4388137 B2 JP4388137 B2 JP 4388137B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- keyword
- keywords
- section
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/913—Multimedia
- Y10S707/914—Video
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の実施の形態に係るコンテンツ検索装置100を示す構成図である。図1に示すように、コンテンツ検索装置100は、コンテンツデータベース101、辞書データベース102、入力部103、入力選別部104、コンテンツデータベース更新部105、関連区間算出部106、辞書更新部107、属性取得部108、関連キーワード取得部109、出力生成部110、及び出力部111を備える。
次に、上記実施の形態の変形例1について図面を用いて説明する。
次に、上記実施の形態の変形例2について図面を用いて説明する。
21 コンテンツ属性
22 タイトル
23 放送日
24 キーワード
25 概要
31、32 区間辞書
41 コンテンツ属性
42 関連区間
43 キーワード
44 関連キーワード
45 関連度
70 コンテンツリスト
71 関連キーワードリスト
100 コンテンツ検索装置
101 コンテンツデータベース
102 辞書データベース
102a 関連語辞書
103 入力部
104 入力選別部
105 コンテンツデータベース更新部
106 関連区間算出部
107 辞書更新部
108 属性取得部
109 関連キーワード取得部
110 出力生成部
111 出力部
121、122、123、124、125、126 時間区間
1001 前回更新区間
1002、1102 追加区間
1003、1004 新関連区間
1101 前回コンテンツ更新区間
1103 キーワード比較区間
Claims (11)
- コンテンツの内容を示すキーワードに関連する関連キーワードを用いて、コンテンツの分類を示すコンテンツ属性ごとにコンテンツが記憶されたコンテンツデータベースから、所定コンテンツを検索するコンテンツ検索装置であって、
所定の時間区間を表す関連区間ごとに、前記関連区間に含まれるコンテンツであって前記コンテンツ属性により示される分類に属するコンテンツの内容を示す複数のキーワード間の関連度が記憶される辞書データベースと、
前記コンテンツデータベースに記憶される第1コンテンツの内容を示す複数の第1キーワードと、前記コンテンツデータベースに記憶された第2コンテンツの内容を示す複数の第2キーワードとにより算出される前記コンテンツ属性ごとの相違度が所定基準値を満たすか否かに基づき、前記第1コンテンツと前記第2コンテンツとが同一の時間区間に含まれるように定められる関連区間を前記コンテンツ属性ごとに算出する関連区間算出手段と、
前記関連区間算出手段により算出された関連区間に含まれるコンテンツにおいて、前記コンテンツ属性ごとに算出されるキーワード間の関連度と、前記関連区間と、を用いて前記辞書データベースに記憶されている関連度を更新する辞書更新手段と、
前記辞書データベースに記憶されている関連度に応じて、ユーザが入力したキーワードに関連する関連キーワードを前記関連区間ごとに出力するための出力情報を生成する出力生成手段と
を備えることを特徴とするコンテンツ検索装置。 - 前記関連区間算出手段は、前記相違度が所定基準値を超える場合には、前記第1コンテンツに対応する時間区間により定められる関連区間を算出し、前記相違度が所定基準値以下である場合には、前記辞書データベースに記憶された最新の関連区間と前記第1コンテンツに対応する時間区間とを足し合わせた時間区間により定められる関連区間を算出する
ことを特徴とする請求項1に記載のコンテンツ検索装置。 - 前記関連区間算出手段は、前記辞書データベースに記憶される最新の関連区間に含まれるコンテンツを前記第2コンテンツとして、関連区間を算出する
ことを特徴とする請求項2に記載のコンテンツ検索装置。 - 前記関連区間算出手段は、前記第1キーワードのうち出現頻度が高い所定の数のキーワードと、前記第2キーワードのうち出現頻度が高い所定の数のキーワードとの相違度が所定基準値を満たすか否かに基づき、関連区間を算出する
ことを特徴とする請求項3に記載のコンテンツ検索装置。 - 前記関連区間算出手段は、前記コンテンツデータベースに前回新たに加えられたコンテンツに対応する時間区間のうち、予め定められた長さの時間の時間区間に含まれるコンテンツを前記第2コンテンツとして、関連区間を算出する
ことを特徴とする請求項2に記載のコンテンツ検索装置。 - 前記コンテンツ検索装置は、さらに、
ユーザが入力したキーワードに関連するコンテンツ属性を取得する属性取得手段と、
前記辞書データベースを参照することにより、前記ユーザが入力したキーワードと前記属性取得手段により取得されたコンテンツ属性とに対応する関連キーワードを、関連区間ごとに取得する関連キーワード取得手段とを備え、
前記出力生成手段は、前記関連キーワード取得手段により取得された関連キーワードを出力するための前記出力情報を生成する
ことを特徴とする請求項1に記載のコンテンツ検索装置。 - 前記関連キーワード取得手段は、前記属性取得手段により複数のコンテンツ属性が取得された場合は、前記複数のコンテンツ属性の各々に対して関連キーワードを生成し、
前記出力生成手段は、前記複数のコンテンツ属性の各々に対して生成された関連キーワードを、コンテンツ属性ごと、関連区間ごとに出力するための出力情報を生成する
ことを特徴とする請求項6に記載のコンテンツ検索装置。 - 関連区間算出手段は、前記第1キーワードのうち前記第2キーワードと重複しないキーワードの数を、第2キーワードの数により除した値である相違度が所定基準値を満たすか否かに基づき、関連区間を算出する
ことを特徴とする請求項1に記載のコンテンツ検索装置。 - コンテンツの内容を示すキーワードに関連する関連キーワードを用いて、コンテンツの分類を示すコンテンツ属性ごとにコンテンツが記憶されたコンテンツデータベースから、所定コンテンツをコンピュータが検索するコンテンツ検索方法であって、
前記コンピュータは、
所定の時間区間を表す関連区間ごとに、前記関連区間に含まれるコンテンツであって前記コンテンツ属性により示される分類に属するコンテンツの内容を示す複数のキーワード間の関連度が記憶される辞書データベースを備え、
前記コンテンツ検索方法は、
前記コンテンツデータベースに記憶される第1コンテンツの内容を示す複数の第1キーワードと、前記コンテンツデータベースに記憶された第2コンテンツの内容を示す複数の第2キーワードとにより算出される前記コンテンツ属性ごとの相違度が所定基準値を満たすか否かに基づき、前記第1コンテンツと前記第2コンテンツとが同一の時間区間に含まれるように定められる関連区間を、前記コンピュータが前記コンテンツ属性ごとに算出する関連区間算出ステップと、
前記関連区間算出ステップにより算出された関連区間に含まれるコンテンツにおいて、前記コンテンツ属性ごとに算出されるキーワード間の関連度と、前記関連区間と、を用いて前記辞書データベースに記憶されている関連度を前記コンピュータが更新する辞書更新ステップと、
前記辞書データベースに記憶されている関連度に応じて、ユーザが入力したキーワードに関連する関連キーワードを前記関連区間ごとに出力するための出力情報を前記コンピュータが生成する出力生成ステップと
を含むことを特徴とするコンテンツ検索方法。 - コンテンツの内容を示すキーワードに関連する関連キーワードを用いて、コンテンツの分類を示すコンテンツ属性ごとにコンテンツが記憶されたコンテンツデータベースから、所定コンテンツを検索する、コンピュータ実行可能なプログラムであって、
前記コンピュータは、
所定の時間区間を表す関連区間ごとに、前記関連区間に含まれるコンテンツであって前記コンテンツ属性により示される分類に属するコンテンツの内容を示す複数のキーワード間の関連度が記憶される辞書データベースを備え、
前記プログラムは、
前記コンテンツデータベースに記憶される第1コンテンツの内容を示す複数の第1キーワードと、前記コンテンツデータベースに記憶された第2コンテンツの内容を示す複数の第2キーワードとにより算出される前記コンテンツ属性ごとの相違度が所定基準値を満たすか否かに基づき、前記第1コンテンツと前記第2コンテンツとが同一の時間区間に含まれるように定められる関連区間を前記コンテンツ属性ごとに算出する関連区間算出ステップと、
前記関連区間算出ステップにより算出された関連区間に含まれるコンテンツにおいて、前記コンテンツ属性ごとに算出されるキーワード間の関連度と、前記関連区間と、を用いて前記辞書データベースに記憶されている関連度を更新する辞書更新ステップと、
前記辞書データベースに記憶されている関連度に応じて、ユーザが入力したキーワードに関連する関連キーワードを前記関連区間ごとに出力するための出力情報を生成する出力生成ステップと
をコンピュータに実行させることを特徴とするプログラム。 - コンテンツの内容を示すキーワードに関連する関連キーワードを用いて、コンテンツの分類を示すコンテンツ属性ごとにコンテンツが記憶されたコンテンツデータベースを更新する装置であって、
所定の時間区間を表す関連区間ごとに、前記関連区間に含まれるコンテンツであって前記コンテンツ属性により示される分類に属するコンテンツの内容を示す複数のキーワード間の関連度が記憶される辞書データベースと、
前記コンテンツデータベースに記憶される第1コンテンツの内容を示す複数の第1キーワードと、前記コンテンツデータベースに記憶された第2コンテンツの内容を示す複数の第2キーワードとにより算出される前記コンテンツ属性ごとの相違度が所定基準値を満たすか否かに基づき、前記第1コンテンツと前記第2コンテンツとが同一の時間区間に含まれるように定められる関連区間を前記コンテンツ属性ごとに算出する関連区間算出手段と、
前記関連区間算出手段により算出された関連区間に含まれるコンテンツにおいて、前記コンテンツ属性ごとに算出されるキーワード間の関連度と、前記関連区間と、を用いて前記辞書データベースに記憶されている関連度を更新する辞書更新手段と、
を備えることを特徴とする装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008059914 | 2008-03-10 | ||
JP2008059914 | 2008-03-10 | ||
PCT/JP2009/000926 WO2009113266A1 (ja) | 2008-03-10 | 2009-03-02 | コンテンツ検索装置及びコンテンツ検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4388137B2 true JP4388137B2 (ja) | 2009-12-24 |
JPWO2009113266A1 JPWO2009113266A1 (ja) | 2011-07-21 |
Family
ID=41064940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009528429A Expired - Fee Related JP4388137B2 (ja) | 2008-03-10 | 2009-03-02 | コンテンツ検索装置及びコンテンツ検索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8073851B2 (ja) |
JP (1) | JP4388137B2 (ja) |
CN (1) | CN101889281B (ja) |
WO (1) | WO2009113266A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8768930B2 (en) * | 2009-10-10 | 2014-07-01 | Oracle International Corporation | Product classification in procurement systems |
JP5005835B2 (ja) * | 2009-10-22 | 2012-08-22 | パナソニック株式会社 | 再生装置、再生方法、プログラムおよび記録媒体 |
US8385723B2 (en) * | 2010-06-18 | 2013-02-26 | Microsoft Corporation | Recording of sports related television programming |
KR101196935B1 (ko) | 2010-07-05 | 2012-11-05 | 엔에이치엔(주) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
KR101196989B1 (ko) * | 2010-07-06 | 2012-11-02 | 엔에이치엔(주) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
US8719207B2 (en) | 2010-07-27 | 2014-05-06 | Oracle International Corporation | Method and system for providing decision making based on sense and respond |
CN101916268B (zh) * | 2010-08-04 | 2012-07-25 | 哈尔滨工业大学深圳研究生院 | 汉语词组库的建立及更新方法 |
US9348941B2 (en) * | 2011-06-16 | 2016-05-24 | Microsoft Technology Licensing, Llc | Specification of database table relationships for calculation |
US20130066632A1 (en) * | 2011-09-14 | 2013-03-14 | At&T Intellectual Property I, L.P. | System and method for enriching text-to-speech synthesis with automatic dialog act tags |
CN103744897A (zh) * | 2013-12-24 | 2014-04-23 | 华为技术有限公司 | 故障信息的关联搜索方法、***和网络管理*** |
CN104331434A (zh) * | 2014-10-22 | 2015-02-04 | 乐视网信息技术(北京)股份有限公司 | 一种生成搜索提示词服务的方法及其装置 |
CN105912645B (zh) * | 2016-04-08 | 2019-03-05 | 上海智臻智能网络科技股份有限公司 | 一种智能问答方法及装置 |
CN110574102B (zh) * | 2017-05-11 | 2023-05-16 | 株式会社村田制作所 | 信息处理***、信息处理装置、记录介质以及词典数据库的更新方法 |
US20220075949A1 (en) * | 2018-12-20 | 2022-03-10 | Dennis Mark Germishuys | Association Determination |
JP7085499B2 (ja) * | 2019-01-23 | 2022-06-16 | 株式会社日立製作所 | テキストデータ収集装置及び方法 |
CN109933691B (zh) * | 2019-02-11 | 2023-06-09 | 北京百度网讯科技有限公司 | 用于内容检索的方法、装置、设备和存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3157257B2 (ja) * | 1992-03-23 | 2001-04-16 | 日本電信電話株式会社 | 情報重要度決定方法 |
JP3168479B2 (ja) | 1992-05-01 | 2001-05-21 | 日本電信電話株式会社 | 時間変動する情報に対応する情報の蓄積及び検索方法 |
JP4034374B2 (ja) | 1997-02-18 | 2008-01-16 | 株式会社ニューズウオッチ | 情報検索システムおよび情報検索方法 |
JPH11175530A (ja) * | 1997-12-08 | 1999-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 情報潮流提示方法および装置ならび情報潮流提示プログラムを記録した記録媒体 |
JP2000242652A (ja) | 1999-02-18 | 2000-09-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報潮流検索方法、装置、および情報潮流検索プログラムを記録した記録媒体 |
JP2001216311A (ja) | 2000-02-01 | 2001-08-10 | Just Syst Corp | イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置 |
JP2002183175A (ja) | 2000-12-08 | 2002-06-28 | Hitachi Ltd | テキストマイニング方法 |
GB0307148D0 (en) * | 2003-03-27 | 2003-04-30 | British Telecomm | Data retrieval system |
JP2004318723A (ja) | 2003-04-18 | 2004-11-11 | Nippon Telegr & Teleph Corp <Ntt> | 関連情報提供スケジュール作成方法および装置 |
US20050120391A1 (en) * | 2003-12-02 | 2005-06-02 | Quadrock Communications, Inc. | System and method for generation of interactive TV content |
JP3978221B2 (ja) * | 2003-12-26 | 2007-09-19 | 松下電器産業株式会社 | 辞書作成装置および辞書作成方法 |
JP4366249B2 (ja) * | 2004-06-02 | 2009-11-18 | パイオニア株式会社 | 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報取得装置 |
WO2006046390A1 (ja) * | 2004-10-29 | 2006-05-04 | Matsushita Electric Industrial Co., Ltd. | 情報検索装置 |
JP2007188225A (ja) | 2006-01-12 | 2007-07-26 | Yafoo Japan Corp | 要約文抽出システム |
-
2009
- 2009-03-02 CN CN2009801012516A patent/CN101889281B/zh not_active Expired - Fee Related
- 2009-03-02 WO PCT/JP2009/000926 patent/WO2009113266A1/ja active Application Filing
- 2009-03-02 JP JP2009528429A patent/JP4388137B2/ja not_active Expired - Fee Related
- 2009-03-02 US US12/672,085 patent/US8073851B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPWO2009113266A1 (ja) | 2011-07-21 |
WO2009113266A1 (ja) | 2009-09-17 |
US8073851B2 (en) | 2011-12-06 |
US20100293169A1 (en) | 2010-11-18 |
CN101889281B (zh) | 2012-10-17 |
CN101889281A (zh) | 2010-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4388137B2 (ja) | コンテンツ検索装置及びコンテンツ検索方法 | |
US9654834B2 (en) | Computing similarity between media programs | |
KR100921078B1 (ko) | 정보 처리 장치 및 방법 | |
KR101061234B1 (ko) | 정보처리 장치와 방법, 및 기록 매체 | |
US8452760B2 (en) | Relevancy presentation apparatus, method, and program | |
KR102001647B1 (ko) | 지식 패널들을 컨텍스트화 | |
US20090077056A1 (en) | Customization of search results | |
US20070074254A1 (en) | Locating content in a television environment | |
JP2010067175A (ja) | ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法 | |
US20120036139A1 (en) | Content recommendation device, method of recommending content, and computer program product | |
US20090300011A1 (en) | Contents retrieval device | |
CN103984740A (zh) | 基于组合标签的检索页显示的方法和*** | |
JP2011529600A (ja) | 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置 | |
CN103069825A (zh) | 用于电视搜索助手的***和方法 | |
JP6219967B2 (ja) | ラベル付非テキスト系アイテムを検索するためのシステム及び方法 | |
JP5553715B2 (ja) | 電子番組表生成システム、放送局、テレビ受信機、サーバ及び電子番組表生成方法 | |
US8838616B2 (en) | Server device for creating list of general words to be excluded from search result | |
JP5545883B2 (ja) | 推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラム | |
US11934406B2 (en) | Digital content data generation systems and methods | |
CN100496091C (zh) | 在有线电视单向机顶盒中进行全文检索的*** | |
JP5415369B2 (ja) | 番組検索装置および番組検索プログラム | |
US11838597B1 (en) | Systems and methods for content discovery by automatic organization of collections or rails | |
KR102072723B1 (ko) | 콘텐츠 추천어 제공 방법 및 그 콘텐츠 제공 장치 | |
Jiang et al. | A new technology of query expansion based on new user interest model | |
KR20010019415A (ko) | 멀티미디어 데이타 구조 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090908 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4388137 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121009 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131009 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |