JP5952241B2 - 情報付与装置、情報付与方法および情報付与プログラム - Google Patents
情報付与装置、情報付与方法および情報付与プログラム Download PDFInfo
- Publication number
- JP5952241B2 JP5952241B2 JP2013181731A JP2013181731A JP5952241B2 JP 5952241 B2 JP5952241 B2 JP 5952241B2 JP 2013181731 A JP2013181731 A JP 2013181731A JP 2013181731 A JP2013181731 A JP 2013181731A JP 5952241 B2 JP5952241 B2 JP 5952241B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- time
- data
- series data
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(2)請求項2、4、5に記載の発明によれば、前記不規則変動成分として抽出した単語発生頻度に関する時系列データの分布から算出した尖度および歪度に基づいて、単語特徴度を計算しているので、話題性を考慮した適切なメタデータを付与することができる。
ここで、trendwi(t)は傾向変動、seasonalwi(t)は周期変動、remainderwi(t)は不規則変動を示す。本発明では不規則変動remainderwi(t)を番組放送によって生じた変動として利用することとする。このとき、remainderwi(t)は負の値を含むため、以降では次の式(7)のh´wi(t)を不規則変動成分として用いる。
(a)尖度が大きいほど、分布の尖り度合いや集まり度合いが大きくなるため、単語発生数に突発的に大きな変動が起きており、番組放送の影響を大きく受けている。
(b)歪度が大きいほど、分布は例えば図9(c)のように時間軸の正の方向に裾を伸ばすため、対象の単語が長期間検索等され続けており、番組放送の影響を長く受けている。
20…形態素解析部
30…単語抽出部
40…単語発生時間計算部
50…単語特徴度計算部
60…特徴語抽出部
70…時系列テキストDB
80…文書DB
Claims (5)
- 番組に関連する情報を付与する情報付与装置であって、
番組データから、番組内容に関するテキストデータおよび番組の放送時間を表す日時データを含むメタデータを抽出するメタデータ抽出手段と、
前記メタデータ抽出手段により抽出されたテキストデータを形態素解析し、その解析結果から単語データを抽出する単語抽出手段と、
前記単語抽出手段により抽出された単語データの各単語が、検索ログやツイッターから得た時系列テキストデータ中に発生した単語発生時間を計算する単語発生時間計算手段と、
前記単語抽出手段により抽出された単語データの単語について、前記単語発生時間計算手段により計算された単語発生時間の情報を量子化することで、単語発生頻度に関する時系列データhwi(t)を作成し、前記作成された時系列データhwi(t)から傾向変動成分および周期変動成分を分離して、番組に起因する変動が含まれる不規則変動成分を抽出した時系列データh´wi(t)を作成し、前記作成された時系列データh´wi(t)および前記メタデータ抽出手段により抽出された日時データを用いて、時系列データに基づく単語特徴度を計算し、文書群が格納された文書データベースを参照して文書群に基づく単語特徴度を計算し、前記時系列データに基づく単語特徴度および文書群に基づく単語特徴度を用いて最終的な単語特徴度を計算する単語特徴度計算手段と、
前記単語特徴度計算手段により計算された最終的な単語特徴度を用いて、前記単語抽出手段により抽出された単語データから特徴語を、番組に関連する情報として抽出する特徴語抽出手段と、
を備えたことを特徴とする情報付与装置。 - 前記単語特徴度計算手段は、
時系列データに基づく単語特徴度を計算する際に、
前記時系列データh´wi(t)および前記日時データを用いて、時系列データの分布から算出した尖度および歪度を含む、時系列データの変動に基づく単語特徴度を計算し、
前記計算された時系列データの変動に基づく単語特徴度と単語発生数そのものを考慮した単語特徴度とから前記時系列データに基づく単語特徴度を計算する
ことを特徴とする請求項1に記載の情報付与装置。 - 番組に関連する情報を付与する情報付与方法であって、
メタデータ抽出手段が、番組データから、番組内容に関するテキストデータおよび番組の放送時間を表す日時データを含むメタデータを抽出するステップと、
単語抽出手段が、前記メタデータ抽出手段により抽出されたテキストデータを形態素解析し、その解析結果から単語データを抽出するステップと、
単語発生時間計算手段が、前記単語抽出手段により抽出された単語データの各単語が、検索ログやツイッターから得た時系列テキストデータ中に発生した単語発生時間を計算するステップと、
単語特徴度計算手段が、前記単語抽出手段により抽出された単語データの単語について、前記単語発生時間計算手段により計算された単語発生時間の情報を量子化することで、単語発生頻度に関する時系列データhwi(t)を作成するステップと、
単語特徴度計算手段が、前記作成された時系列データhwi(t)から傾向変動成分および周期変動成分を分離して、番組に起因する変動が含まれる不規則変動成分を抽出した時系列データh´wi(t)を作成するステップと、
単語特徴度計算手段が、前記作成された時系列データh´wi(t)および前記メタデータ抽出手段により抽出された日時データを用いて、時系列データに基づく単語特徴度を計算するステップと、
単語特徴度計算手段が、文書群を格納した文書データベースを参照して文書群に基づく単語特徴度を計算するステップと、
単語特徴度計算手段が、前記時系列データに基づく単語特徴度および文書群に基づく単語特徴度を用いて最終的な単語特徴度を計算するステップと、
特徴語抽出手段が、前記単語特徴度計算手段により計算された最終的な単語特徴度を用いて、前記単語抽出手段により抽出された単語データから特徴語を、番組に関連する情報として抽出するステップと、
を備えたことを特徴とする情報付与方法。 - 前記単語特徴度計算手段が時系列データに基づく単語特徴度を計算するステップは、
前記時系列データh´wi(t)および前記日時データを用いて、時系列データの分布から算出した尖度および歪度を含む、時系列データの変動に基づく単語特徴度を計算し、
前記計算された時系列データの変動に基づく単語特徴度と単語発生数そのものを考慮した単語特徴度とから前記時系列データに基づく単語特徴度を計算する
ことを特徴とする請求項3に記載の情報付与方法。 - コンピュータを請求項1又は2に記載の各手段として機能させる情報付与プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013181731A JP5952241B2 (ja) | 2013-09-03 | 2013-09-03 | 情報付与装置、情報付与方法および情報付与プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013181731A JP5952241B2 (ja) | 2013-09-03 | 2013-09-03 | 情報付与装置、情報付与方法および情報付与プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015049766A JP2015049766A (ja) | 2015-03-16 |
JP5952241B2 true JP5952241B2 (ja) | 2016-07-13 |
Family
ID=52699711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013181731A Active JP5952241B2 (ja) | 2013-09-03 | 2013-09-03 | 情報付与装置、情報付与方法および情報付与プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5952241B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4800846B2 (ja) * | 2006-06-01 | 2011-10-26 | 日本電信電話株式会社 | 話題度算出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP5392228B2 (ja) * | 2010-10-14 | 2014-01-22 | 株式会社Jvcケンウッド | 番組検索装置および番組検索方法 |
JP2012099021A (ja) * | 2010-11-04 | 2012-05-24 | Nippon Telegr & Teleph Corp <Ntt> | 話題出力装置及び方法及びプログラム |
-
2013
- 2013-09-03 JP JP2013181731A patent/JP5952241B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015049766A (ja) | 2015-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220044139A1 (en) | Search system and corresponding method | |
US20200192935A1 (en) | Segmentation Of Video According To Narrative Theme | |
Martinez et al. | Violence rating prediction from movie scripts | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
CN103020140A (zh) | 一种对互联网用户评论内容自动过滤的方法和装置 | |
CN108108353B (zh) | 一种基于弹幕的视频语义标注方法、装置及电子设备 | |
US20200257724A1 (en) | Methods, devices, and storage media for content retrieval | |
Elsawy et al. | Tweetmogaz v2: Identifying news stories in social media | |
JP5952241B2 (ja) | 情報付与装置、情報付与方法および情報付与プログラム | |
Langlois et al. | VIRUS: video information retrieval using subtitles | |
KR102275095B1 (ko) | 개인 미디어 제작을 위한 유튜브 동영상 메타데이터 취득 및 정보화 방법 | |
US20160112772A1 (en) | Synchronization between multimedia flows and social network threads | |
JP5102883B2 (ja) | ユーザ発言抽出装置とその方法と、プログラム | |
AT&T | \376\377\000w\000w\000w\0002\0000\0001\0001\000d\000e\000m\000o\000_\000s\000o\000c\000i\000a\000l\000t\000v\000_\000f\000i\000n\000a\000l | |
Galuščáková et al. | Experiments with segmentation strategies for passage retrieval in audio-visual documents | |
JP5400819B2 (ja) | シーン重要点抽出装置、シーン重要点抽出方法及びシーン重要点抽出プログラム | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
KR20220085219A (ko) | 유튜브의 영상의 메타데이터를 이용한 광고 필터링 방법 | |
Ariyasu et al. | Message analysis algorithms and their application to social tv | |
JP2018180913A (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
Khwileh et al. | Investigating segment-based query expansion for user-generated spoken content retrieval | |
Mochizuki et al. | Re-mining Topics Popular in the Recent Past from a Large-Scale Closed Caption TV Corpus | |
Galuščáková et al. | Visual descriptors in methods for video hyperlinking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150727 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5952241 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |