JP2001229180A - コンテンツ検索装置 - Google Patents

コンテンツ検索装置

Info

Publication number
JP2001229180A
JP2001229180A JP2000039691A JP2000039691A JP2001229180A JP 2001229180 A JP2001229180 A JP 2001229180A JP 2000039691 A JP2000039691 A JP 2000039691A JP 2000039691 A JP2000039691 A JP 2000039691A JP 2001229180 A JP2001229180 A JP 2001229180A
Authority
JP
Japan
Prior art keywords
keyword
content
topic
unit
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000039691A
Other languages
English (en)
Inventor
Yoshiori Narahara
佳織 楢原
Nobuyuki Omori
信行 大森
Hiroto Inagaki
博人 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000039691A priority Critical patent/JP2001229180A/ja
Publication of JP2001229180A publication Critical patent/JP2001229180A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 音声情報や画像情報等の入力情報を音声認識
や画像認識して自動的にキーワードを抽出して、所望の
適切なコンテンツを効率的に取得する。 【解決手段】 音声入力部1からの入力音声情報を音声
認識部2で音声認識した結果を音声認識結果通知部3か
らキーワードとして出力し、このキーワードとキーワー
ドコンテンツ対応テーブル部5においてコンテンツに対
応して記憶管理されているキーワードとをキーワード比
較部4で比較して、音声認識結果のキーワードに対応す
るキーワードをキーワードコンテンツ対応テーブル部5
から検出し、この検出したキーワードに対応するコンテ
ンツをキーワードコンテンツ対応テーブル部5から取得
し、このコンテンツをコンテンツ蓄積部7から検索して
読み出し、コンテンツ出力部8から出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力情報に含まれ
るキーワードを認識し、この認識したキーワードにマッ
チングするコンテンツを検索して出力するコンテンツ検
索装置に関する。
【0002】
【従来の技術】従来、ユーザが所望のコンテンツを検索
して取り出すためには、ユーザ自身がそのコンテンツに
関するキーワードを手作業で入力し、この入力したキー
ワードに対応するコンテンツを取り出していた。
【0003】
【発明が解決しようとする課題】上述したように、従来
は、ユーザ自身が手作業でキーワードを入力して、所望
のコンテンツを取り出しているため、適切なコンテンツ
を取得するためのキーワード入力に手間取り、ユーザに
対して大きな負担がかかるという問題があった。
【0004】本発明は、上記に鑑みてなされたもので、
その目的とするところは、音声情報や画像情報等の入力
情報を音声認識や画像認識してキーワードを抽出して、
所望の適切なコンテンツを効率的に取得し得るコンテン
ツ検索装置を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、音声情報を入力する音声
入力手段と、この音声入力手段から入力される音声情報
を認識する音声認識手段と、この音声認識手段で認識さ
れた認識結果をキーワードとして出力する音声認識結果
通知手段と、複数のコンテンツを蓄積するコンテンツ蓄
積手段と、各コンテンツに定められているキーワードを
各コンテンツに対応してテーブルとして記憶管理するキ
ーワードコンテンツ対応テーブル手段と、前記音声認識
結果通知手段から出力される音声認識結果のキーワード
と前記キーワードコンテンツ対応テーブル手段において
コンテンツに対応して記憶管理されているキーワードと
を比較して、音声認識結果のキーワードに対応するキー
ワードをキーワードコンテンツ対応テーブル手段から検
出して出力するキーワード比較手段と、このキーワード
比較手段から出力されるキーワードに対応するコンテン
ツを前記キーワードコンテンツ対応テーブル手段から取
得し、このコンテンツを前記コンテンツ蓄積手段から検
索して読み出すように制御する制御手段と、この制御手
段の制御によりコンテンツ蓄積手段から読み出されたコ
ンテンツを出力するコンテンツ出力手段とを有すること
を要旨とする。
【0006】請求項1記載の本発明にあっては、入力音
声情報を音声認識した結果をキーワードとし、このキー
ワードとキーワードコンテンツ対応テーブル手段におい
てコンテンツに対応して記憶管理されているキーワード
とを比較して、音声認識結果のキーワードに対応するキ
ーワードをキーワードコンテンツ対応テーブル手段から
検出し、この検出したキーワードに対応するコンテンツ
をキーワードコンテンツ対応テーブル手段から取得し、
このコンテンツをコンテンツ蓄積手段から検索して読み
出して出力するため、ユーザ自身が手作業でキーワード
を入力する必要がなく、所望のコンテンツを取り出し得
る適切なキーワードを音声認識により自動的に抽出で
き、ユーザに手間をかけたり、大きな負担をかけること
なく、ユーザの操作性を効率化することができる。
【0007】また、請求項2記載の本発明は、画像情報
を入力する画像入力手段と、この画像入力手段から入力
される画像情報を認識する画像認識手段と、この画像認
識手段で認識された認識結果をキーワードとして出力す
る画像認識結果通知手段と、複数のコンテンツを蓄積す
るコンテンツ蓄積手段と、各コンテンツに定められてい
るキーワードを各コンテンツに対応してテーブルとして
記憶管理するキーワードコンテンツ対応テーブル手段
と、前記画像認識結果通知手段から出力される画像認識
結果のキーワードと前記キーワードコンテンツ対応テー
ブル手段においてコンテンツに対応して記憶管理されて
いるキーワードとを比較して、画像認識結果のキーワー
ドに対応するキーワードをキーワードコンテンツ対応テ
ーブル手段から検出して出力するキーワード比較手段
と、このキーワード比較手段から出力されるキーワード
に対応するコンテンツを前記キーワードコンテンツ対応
テーブル手段から取得し、このコンテンツを前記コンテ
ンツ蓄積手段から検索して読み出すように制御する制御
手段と、この制御手段の制御によりコンテンツ蓄積手段
から読み出されたコンテンツを出力するコンテンツ出力
手段とを有することを要旨とする。
【0008】請求項2記載の本発明にあっては、入力画
像情報を画像認識した結果をキーワードとし、このキー
ワードとキーワードコンテンツ対応テーブル手段におい
てコンテンツに対応して記憶管理されているキーワード
とを比較して、画像認識結果のキーワードに対応するキ
ーワードをキーワードコンテンツ対応テーブル手段から
検出し、この検出したキーワードに対応するコンテンツ
をキーワードコンテンツ対応テーブル手段から取得し、
このコンテンツをコンテンツ蓄積手段から検索して読み
出して出力するため、ユーザ自身が手作業でキーワード
を入力する必要がなく、所望のコンテンツを取り出し得
る適切なキーワードを画像認識により自動的に抽出で
き、ユーザに手間をかけたり、大きな負担をかけること
なく、ユーザの操作性を効率化することができる。
【0009】更に、請求項3記載の本発明は、音声情報
を入力する音声入力手段と、この音声入力手段から入力
される音声情報を認識する音声認識手段と、この音声認
識手段で認識された認識結果をキーワードとして出力す
る音声認識結果通知手段と、前記音声情報の入力に同期
して画像情報を入力する画像入力手段と、この画像入力
手段から入力される画像情報を前記音声情報の認識処理
に同期して認識する画像認識手段と、この画像認識手段
で認識された認識結果をキーワードとして出力する画像
認識結果通知手段と、前記音声認識結果通知手段から出
力されるキーワードと画像認識結果通知手段から出力さ
れるキーワードとを比較し、両キーワードが一致するか
否かを判定する比較判定手段と、両キーワードが一致す
る場合には、該キーワードを対象キーワードとし、一致
しない場合には、画像認識結果通知手段から出力される
画像認識結果のキーワードを対象キーワードとして選択
するキーワード選択手段と、複数のコンテンツを蓄積す
るコンテンツ蓄積手段と、各コンテンツに定められてい
るキーワードを各コンテンツに対応してテーブルとして
記憶管理するキーワードコンテンツ対応テーブル手段
と、前記対象キーワードと前記キーワードコンテンツ対
応テーブル手段においてコンテンツに対応して記憶管理
されているキーワードとを比較して、前記対象キーワー
ドに対応するキーワードをキーワードコンテンツ対応テ
ーブル手段から検出して出力するキーワード比較手段
と、このキーワード比較手段から出力されるキーワード
に対応するコンテンツを前記キーワードコンテンツ対応
テーブル手段から取得し、このコンテンツを前記コンテ
ンツ蓄積手段から検索して読み出すように制御する制御
手段と、この制御手段の制御によりコンテンツ蓄積手段
から読み出されたコンテンツを出力するコンテンツ出力
手段とを有することを要旨とする。
【0010】請求項3記載の本発明にあっては、音声情
報と画像情報を同期して入力し、入力音声情報の音声認
識と入力画像情報の画像認識を同期して行い、音声認識
結果のキーワードと画像認識結果のキーワードとを比較
し、両キーワードが一致しない場合には画像認識結果の
キーワードを対象キーワードとし、この対象キーワード
とキーワードコンテンツ対応テーブル手段においてコン
テンツに対応して記憶管理されているキーワードとを比
較して、対象キーワードに対応するキーワードをキーワ
ードコンテンツ対応テーブル手段から検出し、この検出
したキーワードに対応するコンテンツをキーワードコン
テンツ対応テーブル手段から取得し、このコンテンツを
コンテンツ蓄積手段から検索して読み出して出力するた
め、ユーザ自身が手作業でキーワードを入力する必要が
なく、所望のコンテンツを取り出し得る適切なキーワー
ドを画像認識により自動的に抽出でき、ユーザに手間を
かけたり、大きな負担をかけることなく、ユーザの操作
性を効率化することができる。
【0011】請求項4記載の本発明は、請求項2または
3記載の本発明において、前記画像認識手段が、入力画
像情報からテロップを画像情報として認識するテロップ
認識手段と、この認識したテロップから文字情報を切り
出し、この切り出した文字情報を認識結果として出力す
る切り出し手段とを有することを要旨とする。
【0012】請求項4記載の本発明にあっては、入力画
像情報からテロップを画像情報として認識し、この認識
したテロップから文字情報を切り出し、この切り出した
文字情報を画像認識結果のキーワードとし、このキーワ
ードとキーワードコンテンツ対応テーブル手段のキーワ
ードとを比較して、キーワードを検出し、この検出した
キーワードに対応するコンテンツをキーワードコンテン
ツ対応テーブル手段から取得し、このコンテンツをコン
テンツ蓄積手段から検索して読み出して出力するため、
ユーザ自身が手作業でキーワードを入力する必要がな
く、所望のコンテンツを取り出し得る適切なキーワード
を画像認識により自動的に抽出でき、ユーザに手間をか
けたり、大きな負担をかけることなく、ユーザの操作性
を効率化することができる。
【0013】また、請求項5記載の本発明は、請求項2
または3記載の本発明において、前記画像認識手段が、
入力画像情報からキャプションを画像情報として認識す
るキャプション認識手段と、この認識したキャプション
から文字情報を切り出し、この切り出した文字情報を認
識結果として出力する切り出し手段とを有することを要
旨とする。
【0014】請求項5記載の本発明にあっては、入力画
像情報からキャプションを画像情報として認識し、この
認識したキャプションから文字情報を切り出し、この切
り出した文字情報を画像認識結果のキーワードとし、こ
のキーワードとキーワードコンテンツ対応テーブル手段
のキーワードとを比較して、キーワードを検出し、この
検出したキーワードに対応するコンテンツをキーワード
コンテンツ対応テーブル手段から取得し、このコンテン
ツをコンテンツ蓄積手段から検索して読み出して出力す
るため、ユーザ自身が手作業でキーワードを入力する必
要がなく、所望のコンテンツを取り出し得る適切なキー
ワードを画像認識により自動的に抽出でき、ユーザに手
間をかけたり、大きな負担をかけることなく、ユーザの
操作性を効率化することができる。
【0015】更に、請求項6記載の本発明は、請求項1
乃至5のいずれかに記載の本発明において、前記コンテ
ンツ蓄積手段が、コンテンツ検索装置の外部に設けら
れ、前記制御手段は、この外部に設けられたコンテンツ
蓄積手段にアクセスして、該コンテンツ蓄積手段からコ
ンテンツを読み出す外部アクセス手段を有することを要
旨とする。
【0016】請求項6記載の本発明にあっては、コンテ
ンツ蓄積手段は外部に設けられ、この外部に設けられた
コンテンツ蓄積手段にアクセスしてコンテンツを読み出
す。
【0017】請求項7記載の本発明は、請求項1乃至5
のいずれかに記載の本発明において、前記コンテンツ蓄
積手段が、着脱可能な記録媒体で構成されていることを
要旨とする。
【0018】請求項7記載の本発明にあっては、コンテ
ンツ蓄積手段が着脱可能な記録媒体で構成されている。
【0019】また、請求項8記載の本発明は、請求項1
乃至7のいずれかに記載の本発明において、前記キーワ
ードコンテンツ対応テーブル手段が、着脱可能な記録媒
体で構成されていることを要旨とする。
【0020】請求項8記載の本発明にあっては、キーワ
ードコンテンツ対応テーブル手段が着脱可能な記録媒体
で構成されている。
【0021】更に、請求項9記載の本発明は、請求項1
または3記載の本発明において、前記音声認識手段で認
識された認識結果を形態素解析して、局所話題範囲を決
定し、局所話題語の抽出を行い、この抽出した局所話題
語に対して上位・下位概念関係および類義語関係に基づ
き前記認識結果が誤認識であるか否かを判定する誤認識
判定手段と、この判定の結果、誤認識と判定された認識
結果に対して一文字違いの単語の類義語関係を有する単
語を対象単語として選択し、この対象単語と局所話題語
との概念距離に基づき前記認識結果に対する訂正候補を
出力する訂正候補出力手段とを有することを要旨とす
る。
【0022】請求項9記載の本発明にあっては、音声認
識結果を形態素解析して、局所話題範囲を決定し、局所
話題語の抽出を行い、局所話題語に対して上位・下位概
念関係および類義語関係に基づき認識結果が誤認識であ
るか否かを判定し、誤認識と判定された認識結果に対し
て一文字違いの単語の類義語関係を有する単語を対象単
語として選択し、この対象単語と局所話題語との概念距
離に基づき認識結果に対する訂正候補を出力するため、
認識結果が誤ったとしても、正しい訂正候補のキーワー
ドを取得でき、適切なコンテンツを取得することができ
る。
【0023】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。図1は、本発明の第1の実施形態に
係わるコンテンツ検索方法を実施するコンテンツ検索装
置の構成を示すブロック図である。同図に示すコンテン
ツ検索装置は、音声情報が入力される音声入力部1、こ
の音声入力部1から入力される音声情報を認識する音声
認識部2、この音声認識部2で認識された認識結果をキ
ーワードとして出力する音声認識結果通知部3、複数の
コンテンツを蓄積しているコンテンツ蓄積部7、各コン
テンツに定められているキーワードを各コンテンツに対
応してテーブルとして管理しているキーワードコンテン
ツ対応テーブル部5、音声認識結果通知部3から出力さ
れる音声認識結果のキーワードとキーワードコンテンツ
対応テーブル部5においてコンテンツに対応して記憶管
理されているキーワードとを比較し、音声認識結果のキ
ーワードに対応するキーワードをキーワードコンテンツ
対応テーブル部5から検出して出力するキーワード比較
部4、このキーワード比較部4から出力されるキーワー
ドに対応するコンテンツをキーワードコンテンツ対応テ
ーブル部5から取得し、このコンテンツをコンテンツ蓄
積部7から検索して読み出すように制御する制御部6、
この制御部6の制御によりコンテンツ蓄積部7から読み
出されたコンテンツを出力するコンテンツ出力部8から
構成されている。
【0024】次に、図2に示すフローチャートを参照し
て、図1に示す第1の実施形態の作用について説明す
る。
【0025】まず、例えばテレビ、ラジオなどのオーデ
ィオビジュアル機器から入力される音声情報または通信
インタフェースなどを介して入力される音声情報が音声
入力部1を介して入力されると(ステップS100)、こ
の入力された音声情報は、音声認識部2で音声認識され
(ステップS101)、この音声認識結果がキーワードと
して音声認識結果通知部3から出力される(ステップS
102)。
【0026】音声認識結果通知部3から出力されたキー
ワードは、キーワード比較部4に入力されるとともに、
またキーワード比較部4にはキーワードコンテンツ対応
テーブル部5においてコンテンツに対応して記憶されて
いるキーワードも入力され(ステップS103)、両キー
ワードはキーワード比較部4で比較され、音声認識結果
のキーワードに対応するキーワードがキーワードコンテ
ンツ対応テーブル部5から検出され出力される(ステッ
プS104)。
【0027】このキーワード比較部4から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
5が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部5から出力される
(ステップS105)。制御部6は、キーワードコンテン
ツ対応テーブル部5から出力されたコンテンツを受け取
ると、コンテンツ蓄積部7にアクセスし(ステップS10
6)、このコンテンツをコンテンツ蓄積部7から検索し
て読み出し(ステップS107)、この読み出したコンテ
ンツをコンテンツ出力部8から出力する(ステップS10
8)。
【0028】図3は、本発明の第2の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図1に示した第1の実
施形態が音声情報を対象としているのに対して画像情報
を対象とするものであって、図1の音声入力部1、音声
認識部2、および音声認識結果通知部3がそれぞれ画像
情報を入力する画像入力部9、この画像入力部9から入
力される画像情報を認識する画像認識部10、およびこ
の画像認識部10で認識された認識結果をキーワードと
して出力する画像認識結果通知部11に置き換えられて
いる点が異なるのみであり、その他のキーワード比較部
4、キーワードコンテンツ対応テーブル部5、制御部
6、コンテンツ蓄積部7およびコンテンツ出力部8は図
1の実施形態のものと同じである。
【0029】図4に示すフローチャートを参照して、図
3に示す第2の実施形態の作用について説明する。
【0030】オーディオビジュアル機器などからの画像
情報が画像入力部9を介して入力されると(ステップS
200)、この画像情報は、画像認識部10で画像認識さ
れ(ステップS201)、この画像認識結果がキーワード
として画像認識結果通知部11から出力される(ステッ
プS202)。
【0031】画像認識結果通知部11から出力されたキ
ーワードは、キーワード比較部4に入力されるととも
に、またキーワード比較部4にはキーワードコンテンツ
対応テーブル部5においてコンテンツに対応して記憶さ
れているキーワードも入力され(ステップS203)、両
キーワードはキーワード比較部4で比較され、画像認識
結果のキーワードに対応するキーワードがキーワードコ
ンテンツ対応テーブル部5から検出され出力される(ス
テップS204)。
【0032】このキーワード比較部4から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
5が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部5から出力される
(ステップS205)。制御部6は、キーワードコンテン
ツ対応テーブル部5から出力されたコンテンツを受け取
ると、コンテンツ蓄積部7にアクセスし(ステップS20
6)、このコンテンツをコンテンツ蓄積部7から検索し
て読み出し(ステップS207)、この読み出したコンテ
ンツをコンテンツ出力部8から出力する(ステップS20
8)。
【0033】図5は、本発明の第3の実施形態に係わる
コンテンツ検索方法の処理手順を示すフローチャートで
ある。同図に示すコンテンツ検索方法は、図1に示した
音声情報を対象としたコンテンツ検索装置と図3に示し
た画像情報を対象としたコンテンツ検索装置の両方の機
能を組み合わせたコンテンツ検索装置で構成されるもの
である。
【0034】図5のコンテンツ検索処理では、まずオー
ディオビジュアル機器からの音声情報および画像情報が
それぞれ音声入力部1および画像入力部9を介して入力
されると(ステップS300,303)、この入力された音声
情報および画像情報は、それぞれ音声認識部2および画
像認識部10で同期して音声認識および画像認識され
(ステップS301,304)、この音声および画像認識結果
がそれぞれキーワードとして音声認識結果通知部3およ
び画像認識結果通知部11から出力される(ステップS
302,305)。
【0035】音声認識結果通知部3および画像認識結果
通知部11から出力された両キーワードは、比較され、
両認識結果が一致するか否かが判定される(ステップS
306)。両キーワードが一致する場合には、このキーワ
ードを対象とするキーワードとして出力されるが、一致
しない場合には、画像認識結果通知部11から出力され
る画像認識結果のキーワードが対象とするキーワードと
して出力され(ステップS308)、キーワード比較部4
に入力されるとともに、またキーワード比較部4にはキ
ーワードコンテンツ対応テーブル部5においてコンテン
ツに対応して記憶されているキーワードも入力され(ス
テップS309)、両キーワードはキーワード比較部4で
比較され、認識結果の対象とするキーワードに対応する
キーワードがキーワードコンテンツ対応テーブル部5か
ら検出され出力される(ステップS310)。
【0036】このキーワード比較部4から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
5が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部5から出力される
(ステップS311)。制御部6は、キーワードコンテン
ツ対応テーブル部5から出力されたコンテンツを受け取
ると、コンテンツ蓄積部7にアクセスし(ステップS31
2)、このコンテンツをコンテンツ蓄積部7から検索し
て読み出し(ステップS313)、この読み出したコンテ
ンツをコンテンツ出力部8から出力する(ステップS31
4)。
【0037】図6は、本発明の第4の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図3に示した第2の実
施形態において入力画像情報から画像情報としてテロッ
プを認識し、このテロップから文字情報を切り出し、こ
の切り出した文字情報を認識結果のキーワードとするも
のであり、図3の実施形態の画像認識部10および画像
認識結果通知部11の代わりにテロップ認識部12およ
びテロップ認識結果通知部13を有する点が異なるもの
であり、その他の構成および作用は同じである。
【0038】すなわち、図6におけるテロップ認識部1
2は、画像入力部9からの入力画像情報からテロップを
画像情報として認識するテロップ認識手段、およびこの
認識したテロップから文字情報を切り出し、この切り出
した文字情報を認識結果として出力する切り出し手段か
ら構成され、テロップ認識結果通知部13は、この切り
出し手段から出力される認識結果をキーワードとして出
力するものである。
【0039】図7に示すフローチャートを参照して、図
6に示す第4の実施形態の作用について説明する。
【0040】オーディオビジュアル機器などからの画像
情報が画像入力部9を介して入力されると(ステップS
400)、この画像情報に含まれるテロップがテロップ認
識部12で認識され(ステップS401)、この認識され
たテロップから文字情報が切り出され、テロップ認識結
果通知部13からテロップ認識結果がキーワードとして
出力される(ステップS402)。
【0041】画像認識結果通知部11から出力されたキ
ーワードは、キーワード比較部4に入力されるととも
に、またキーワード比較部4にはキーワードコンテンツ
対応テーブル部5においてコンテンツに対応して記憶さ
れているキーワードも入力され(ステップS403)、両
キーワードはキーワード比較部4で比較され、テロップ
認識結果のキーワードに対応するキーワードがキーワー
ドコンテンツ対応テーブル部5から検出され出力される
(ステップS404)。
【0042】このキーワード比較部4から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
5が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部5から出力される
(ステップS405)。制御部6は、キーワードコンテン
ツ対応テーブル部5から出力されたコンテンツを受け取
ると、コンテンツ蓄積部7にアクセスし(ステップS40
6)、このコンテンツをコンテンツ蓄積部7から検索し
て読み出し(ステップS407)、この読み出したコンテ
ンツをコンテンツ出力部8から出力する(ステップS40
8)。
【0043】図8は、本発明の第5の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図6に示した第4の実
施形態においてテロップの代わりにキャプションを入力
画像情報から画像情報として認識し、このキャプション
から文字情報を切り出し、この切り出した文字情報を認
識結果のキーワードとするものであり、図6の実施形態
のテロップ認識部12およびテロップ認識結果通知部1
3の代わりにキャプション認識部14およびキャプショ
ン認識結果通知部15を有する点が異なるものであり、
その他の構成および作用は同じである。
【0044】すなわち、図8におけるキャプション認識
部14は、画像入力部9からの入力画像情報からキャプ
ションを画像情報として認識するキャプション認識手
段、およびこの認識したキャプションから文字情報を切
り出し、この切り出した文字情報を認識結果として出力
する切り出し手段から構成され、キャプション認識結果
通知部15は、この切り出し手段から出力される認識結
果をキーワードとして出力するものである。
【0045】図9に示すフローチャートを参照して、図
8に示す第5の実施形態の作用について説明する。
【0046】オーディオビジュアル機器などからの画像
情報が画像入力部9を介して入力されると(ステップS
500)、この画像情報に含まれるキャプションがキャプ
ション認識部14で認識され(ステップS501)、この
認識されたキャプションから文字情報が切り出され、キ
ャプション認識結果通知部15からキャプション認識結
果がキーワードとして出力される(ステップS502)。
【0047】キャプション認識結果通知部15から出力
されたキーワードは、キーワード比較部4に入力される
とともに、またキーワード比較部4にはキーワードコン
テンツ対応テーブル部5においてコンテンツに対応して
記憶されているキーワードも入力され(ステップS50
3)、両キーワードはキーワード比較部4で比較され、
キャプション認識結果のキーワードに対応するキーワー
ドがキーワードコンテンツ対応テーブル部5から検出さ
れ出力される(ステップS504)。
【0048】このキーワード比較部4から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
5が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部5から出力される
(ステップS505)。制御部6は、キーワードコンテン
ツ対応テーブル部5から出力されたコンテンツを受け取
ると、コンテンツ蓄積部7にアクセスし(ステップS50
6)、このコンテンツをコンテンツ蓄積部7から検索し
て読み出し(ステップS507)、この読み出したコンテ
ンツをコンテンツ出力部8から出力する(ステップS50
8)。
【0049】なお、上述した各実施形態において、音声
認識または画像認識した認識結果をキーワードとして出
力する場合に、その推定確率が所定の閾値以下の場合に
は、該キーワードを出力せず、その旨を単にユーザに通
知するようにしている。また、上述したように認識され
たキーワードの数が一定個数の場合には、設定値を変更
して、すなわち基準となる出現確率を増加させて、認識
処理を繰り返し行うようにしている。なお、推定確率は
例えば音声認識においては尤度と呼ばれるものである。
次に、認識の対象となる音声、映像、文字などから推定
確率を求める処理について説明する。
【0050】この処理では、まず上述した各実施形態で
説明したように、入力部から入力された音声情報や画像
情報などの入力コンテンツから特徴量を抽出する。この
特徴量は、例えば入力情報が音声であれば、LPC(線
形予測分析)デルタケプトスラム等を用いて抽出され、
またテロップなどの画像であれば、特徴量は文字を表す
パターンなどである。
【0051】特徴量が抽出されると、この特徴量に対応
するシンボルの候補を複数決定する。これは特徴量を見
出しとするシンボル(例えば、文字または文字の連鎖)
の候補と出現確率pとの対応関係を多数格納したデー
タベースから特徴量に基づきシンボルの候補と出現確率
を決定することにより行われる。なお、iは文字列
を区別するための符号である。
【0052】次に、このように決定された複数のシンボ
ルをつなぎ合わせて、キーワードの候補を複数決定す
る。これは、複数決定されたシンボルの候補を入力され
た順序につなぎ合わせるなどにより、ひとかたまりの文
字列、すなわちキーワードもどきの候補を複数決定する
ことにより行われる。この時、各文字列候補の生じる推
定確率は、出現確率pの積TTi・piで計算され
る。そして、決定された文字列の中から単語辞書によっ
て存在する単語を抽出する。但し、通常は文字列と単語
が一致することはなく、決定された文字列の中からプラ
ス・マイナス数文字の単語を更に選び出す。
【0053】次に、上述したように決定された複数のキ
ーワードの中から推定確率が所定の閾値以上のものにつ
いて候補となる単語をキーワードとして選択し、この選
択したキーワードを上述した各実施形態において使用す
るようにしている。
【0054】図10および図11は、本発明の第6の実
施形態に係わるコンテンツ検索方法の処理手順を示すフ
ローチャートである。両図に示すコンテンツ検索方法
は、上述した図1〜図9に示した各実施形態において入
力音声情報または入力画像情報から認識された認識結果
から誤った認識部分を判定して訂正し、訂正された認識
結果の候補を出力するものである。
【0055】すなわち、図10および図11において
は、まず上述したように音声認識部2、画像認識部1
0、テロップ認識部12、またはキャプション認識部1
4などで認識された認識結果の文章を受け取り、この文
章を形態素解析して、該文章を単語に分割するととも
に、単語の品詞を決定する(ステップS601)。それか
ら、この形態素解析された結果を入力として速覧処理
し、大局話題範囲と大局話題語を組にした大局話題リス
トを抽出する(ステップS602)。
【0056】速覧処理では、文章を書くときの特有の言
い回しに基づいて、ある話題の継続する部分である大局
話題範囲と、その話題を表す単語である大局話題語を決
定する。大局話題とは、文章の上位レベルの話題であ
り、例えば、「章」などにおける話題のことである。出
力は、大局話題範囲と大局話題語を組にした大局話題リ
ストである。
【0057】上述したように、大局話題範囲と大局話題
語を組にした大局話題リストが抽出されると、この大局
話題範囲と大局話題語を組みにした大局話題リストから
一つの組の大局話題を選択する(ステップS603)。そ
して、この選択した組の大局話題範囲に含まれている単
語から一つの単語を選択し、この単語を対象単語とする
(ステップS604)。対象単語は、以下の処理で前記認
識結果の正誤を判定し、誤りの場合は修正する対象とな
る単語である。
【0058】次に、上述したように選択された対象単語
の認識が誤っているか正しいかの判定処理を行うべく、
まず大局話題が対象単語の概念の上位概念または下位概
念であるかについて上位・下位関係の有無を調べる(ス
テップS605)。この大局話題が対象単語の概念の上位
概念または下位概念であるかについての判定は、例えば
概念ツリーを利用して行う。概念ツリーは、木構造のル
ートを最上位の概念とし、各ノードに概念を割り当てた
ものである。ある2つの概念の間に上位・下位関係があ
るかどうかは、一方の概念からルートへのパス上に他方
の概念のノードがあるかどうか調べ、ある場合は上位・
下位関係がある場合であり、ない場合は上位・下位関係
はないと判定する。そして、上述したように大局話題リ
ストから選択した大局話題が対象単語の概念の上位概念
または下位概念である場合には、前記認識結果は正しい
ものと判定して、本処理は終了するが、そうでない場合
には、ステップS606に進み、類義語辞書により、大局
話題と対象単語に対して類義語の関係があるか否かの判
定を行う。類義語辞書は、例えば図12に示すように、
一行に類義語の関係にある語が記述されている。すなわ
ち、大局話題と対象単語が類義語辞書の同一行にある場
合は、類義語の関係にあることが分かる。そして、この
ステップS606の判定の結果、大局話題が対象単語の類
義語である場合には、認識結果は正しいものと判定し
て、本処理は終了するが、そうでない場合には、図11
のステップS701以降の誤り訂正処理に進む。
【0059】すなわち、以上の誤り判定処理において、
大局話題と注目している対象単語に上位・下位概念の関
係もなく、類義語も関係のない場合は、前記認識結果は
誤りと判定され、図11のステップS701以降の誤り訂
正処理に進む。なお、このような判定は、ある話題の下
位の話題は、上位の話題に何らかの関連のある話題であ
るという仮定によるものである。
【0060】図11のステップS701以降の誤り訂正処
理では、まず注目している対象単語の1文字違いの単語
を辞書から選び出す(ステップS701)。これは、正し
い認識結果の候補と思われる単語である。それから、こ
の選択した単語の中に大局話題語の類義語があるか否か
を判定し(ステップS702)、大局話題語の類義語があ
る場合は、この類義語を選択する(ステップS703)。
【0061】次に、上述したように類義語を選択した場
合には、この類義語を現在選択されている単語として含
めて、また類義語がない場合には、先に選択した単語を
現在選択されている単語とし、この現在選択されている
単語から一つの単語を対象単語として取り出す(ステッ
プS704)。そして、この選択した対象単語と大局話題
語との概念距離を計算する(ステップS705)。概念距
離は、概念ツリー上の2つの概念を結ぶ最短のパスの長
さである。長さは、概念の間のアークの数で表す。
【0062】それから、このように計算した概念距離が
保存している最小概念距離よりも小さいか否を判定し
(ステップS706)、小さい場合には、ステップS705で
計算した概念距離を最小概念距離として保存する(ステ
ップS707)。そして、この現在注目している対象単語
の訂正候補をステップS704で取り出した単語とする
(ステップS708)。
【0063】次に、ステップS701で取り出した全ての
単語について上述したステップS704からステップS708
までの処理を行ったか否かを判定し、全ての単語につい
て同じ処理を繰り返し行う(ステップS709)。
【0064】また、ステップS604で取り出した全ての
対象単語について上述したステップS604からステップ
S709までの処理を行ったか否かを判定し、全ての対象
単語について同じ処理を繰り返し行う(ステップS71
0)。
【0065】更に、ステップS603で取り出した全ての
大局話題についてステップS603からステップS710まで
の処理を行ったか否を判定し、全ての大局話題について
同じ処理を繰り返し行う(ステップS711)。全ての大
局話題について同じ処理を繰り返し行った結果、誤認識
した単語の訂正候補がステップS708で保存された単語
として出力されることになる(ステップS712)。
【0066】テキストコンテンツの意味上から話題を速
覧処理と称し、以下の方法により話題語が速覧処理によ
って抽出される。話題とは、通常、「ある事柄について
話されている主題」を表す。ここでは、特に、事柄に相
当する「主題」を段落中の名詞句で表現した語句を「話
題語」と呼び、話題語が含む文を「話題文」と称する。
そして、ある話題がもつスコープ、すなわち、ある話題
が継続的に主題となっている領域を「話題のスコープ」
と称する。勿論、ある「話題のスコープ」において、こ
れらの話題のスコープは、入れ子形式になる可能性もあ
る。ここでは、話題のスコープの入れ子構造を「話題レ
ベル」と称するが、本発明では、話題のレベルを2レベ
ルの有する構成としている。上位の話題レベルは、明示
的に話題が提示されるような大局的な話題(大局話題と
呼ぶ)が相当する。一方、明示的ではないが、局所的に
話題が細かく転換するような話題(ここでは「局所話
題」と呼ぶ)が下位の話題レベルに相当する。
【0067】次に、このような話題抽出処理について図
14に示すフローチャートを参照して説明する。
【0068】図14に示す話題抽出処理では、処理対象
文書入力処理として要約対象の文書が入力される(ステ
ップS810)。この処理対象文書入力処理では、入力さ
れた文書ファイルを開き、文書の内容を抽出する。この
ように入力された文書は次のステップS820で処理対象
文書形態素解析処理を受けて、形態素解析用辞書31を
用いて形態素解析され、文書中に記述されている各文の
単語を確定するとともに、各単語の品詞、活用形などの
形態素情報を確定する。このように形態素解析された情
報は、話題単位確定処理を受ける(ステップS830)。
【0069】なお、形態素解析とは、入力された文字列
を単語辞書に対して検索を行い、品詞情報(品詞)、文頭
可否情報(文頭可)、前方接続情報(前接)、後方接続情
報(後接)などの情報を取得する処理である。通常の単
語辞書では、TREI辞書構造という特別な辞書構造を
行うことにより高速な検索を行えるようになっている。
辞書項目として、"ああ"、"あいさつ"、"あい"などがあ
る場合、それぞれの第一文字(ここでは、日本語である
ので、C言語の文字であり、アルファベットと異なり、
日本語文字2byteを指し示す)が同じもの、第二文字目
が同じものなど、それぞれ順次に、木構造的に構成され
る。そして、最後の文字まで、一致した場合には、その
単語辞書項目に対する品詞情報(品詞)、文頭可否情報
(文頭可)、前方接続情報(前接)、後方接続情報(後
接)などの情報記述される。
【0070】文頭可否情報とは、文頭にあってよいかど
うかを示すフラグである。文頭可であれば、文頭に存在
してもよいが、文頭否であれば、文頭にあることが許可
されない単語ということになる。前方接続情報とは、前
の単語の品詞または属性が適正な場合だけ接続が許可さ
れ、前接で接続が許可されない単語の場合、候補として
削除される。同様に後方接続情報も、後の単語の品詞ま
たは属性が適正な場合だけ接続が許可され、後接で接続
が許可されない単語の場合、候補として削除される。こ
のような、品詞接続により、候補を選択する。最尤候補
は、コスト最小法とよぶ方法により選択する。
【0071】最小コスト法とは、最もコストが最小なる
形態素候補を最尤候補とする処理方式である。形態素解
析において利用されるコストは、接続コストと単語コス
トの2種類のコストがある。接続コストは、ある単語と
単語を接続する場合に必要なコストである。単語と単語
であるため、単語+該活用に対する接続コストは0とな
る。単語コストとは、その単語に関するコストであり、
例えば、使用頻度が高い単語は、コストが低くなる。ま
た、活用は単語ではないので、コストは0となる。形態
素解析により、テキスト部が単語単位に分解されると同
時に、各単語に尤も正しいと考えられる品詞が付与され
る。なお、図13に示す話題構造における「A社の特徴
について述べる」という例では、次に示す表1のように
形態素解析される。
【0072】
【表1】 次の話題単位確定処理(ステップS830)では、上述し
た処理対象文書形態素解析処理の形態素解析結果に基づ
いて、文書内に記述されている文を確定し、確定した文
を話題単位とする。この話題単位確定処理では、入力さ
れた文を話題単位に分割する。話題単位とは、通常の文
に近いが、話題があるなしにかかわらず、通常の1つの
話題が含まれると判断される単位である。通常は、文を
話題単位として認定するが、文頭に話題継続型手掛かり
句が出現した文については、話題のスコープが続いてい
るとして、複数の文を話題単位とする。以降、話題単位
ごとに処理が進められる。
【0073】次の話題マーカ・話題手がかり句抽出処理
(ステップS840)においては、話題単位確定処理で確
定された話題単位ごとに、話題を明示的または非明示的
に示す後接単語である話題マーカや、話題を確定する手
がかりとなる文頭の接続詞より構成される話題手がかり
句を話題マーカ・話題手がかり句記憶部33に記憶され
ている話題マーカ・話題手がかり句に基づき抽出する。
【0074】話題マーカーは、話題をあらわす可能性の
ある名詞句が出現している可能性を表わす後置詞的役割
を有する。例えば、主題を明示する修辞句として、格助
詞「が」「を」、係助詞「は」、「について」などがあ
る。話題の導入は、「まず」「第一に」などの手掛かり
句から判断される。また、「1。」「第1章」などの文
章論理構造は、話題のスコープを明確にする。「これ
は、」「この結果」などは、話題が継続することを表わ
す。「〜に関して尋ねますが、」などのような疑問表
現、「たとえば」などのような例示表現は、局所話題を
導入するための修辞表現であると言える。
【0075】話題語を決定する上で用いられる修辞句を
ここでは「話題マーカー」と呼ぶ。話題マーカーには、
話題の対象を抽出する役割を果たすマーカーであり、明
示マーカー、非明示マーカーがある。なお、この話題マ
ーカーの明示マーカーには、例えば「について」「に関
して」などがあり、また非明示マーカーには、例えば
「が」「を」「に」などがある。但し、明示マーカーは
語句を提示することしか機能を持たないマーカーであ
り、非明示マーカーは「が」や「を」のように主語、目
的語のような文法的役割を示す語が語句を提示するため
にも用いられるものである。
【0076】また、直接的に話題語を明示するわけでは
ないが、文または単文が話題語を含む可能性のあること
を示す話題手掛かり句がある。話題手掛かり句は、話題
の意味的なまとまりを検出するための手掛かりとするも
のであり、この話題手掛かり句には、入れ子開始型、話
題転換型、入れ子終了型などがあり、入れ子開始型に
は、例えば「まず」「第1に」「最初に」などあり、ま
た話題転換型には、例えば「次に」「ところで」「第2
に」「第2に」などがあり、入れ子終了型には、例えば
「最後に」「終わりに」などがある。
【0077】更に、話題手掛かり句には、話題の継続を
示す話題継続型手掛かり句や、話題開始、終了、転換型
手掛かり句などがあり、さらに、局所話題を抽出するた
めの手掛かりとして、例示、疑問表現がある。この例示
の例は、「例えば〜」「つまり〜」「具体的には〜」な
どがあり、前言を受けて、その具体例を導く表現のこと
である。また、疑問表現の例は、「〜か」「〜ですか」
「〜ますか」などというように疑問を示す語句のことで
ある。なお、これらの語句の利用は予め形態素解析によ
ってテキストを単語毎に分割し、各単語毎に品詞が与え
られたうえで、始めて特定されるものである。
【0078】次のステップS850の顕著名詞句抽出処理
では、前記話題マーカ・話題手がかり句抽出処理で抽出
された各話題単位ごとの話題マーカおよび話題手がかり
句を基に話題の候補と考えられる顕著な名詞句を抽出す
る。話題マーカーの前にある単語中から、話題語の候補
である顕著名詞句が選別される。顕著名詞句とは、話題
語の候補として認定される可能性のある名詞句であり、
代名詞表現されている名詞など、単独で意味をなさない
名詞句について除いた名詞句である。もちろん、話題手
掛かり句(話題開始/転換/終了/継続)、例示表現、疑問
表現そのものは顕著名詞句にはならない。
【0079】次の大局話題抽出処理(ステップS860)
では、前記話題マーカ・話題手がかり句抽出処理および
顕著名詞句抽出処理で抽出された話題マーカ、話題手が
かり句、および顕著名詞句に基づいて、大局的な話題を
抽出する。話題は、これらの話題マーカー、顕著名詞
句、話題手掛かり句の情報を用いて抽出される。例え
ば、図13に示した話題構造の例では、話題マーカーは
アウトライン文字で、話題手掛かり句は下線で、最終的
に抽出された話題は四角で示されている。第一文では、
「において」という話題マーカーが抽出されている。第
二文では、「まず」「第一に」が話題手掛かり句として
抽出されている。
【0080】大局話題は、大局話題導入部の検出および
大局話題の話題語抽出という手順で抽出される。
【0081】大局話題導入部の検出においては、文章の
第一文であったり、話題手掛かり句を含む話題単位があ
る場合には、その話題単位を大局話題の導入部の候補と
する。話題単位の先頭の単文に顕著名詞句が含まれてい
る場合には、その話題単位を大局話題導入部と判定す
る。顕著名詞句がその話題単位にない場合には、次の話
題単位を話題導入部の候補とする。同様の処理を文末ま
でつづけ、大局話題導入部を決定する。これは、話題手
掛かり句がある周辺にはかならず大局話題導入部がある
という考え方に基づくものである。つまり、文章を書く
場合、話題手掛かり句で導入的な表現をした場合、話題
はその近くに必ずあるはずであるという考えに基づくも
のである。
【0082】次に、大局話題の話題語検出においては、
大局話題導入部において抽出された顕著名詞句の中でも
っとも話題語として適切な名詞句を話題語として抽出す
る。以下の優先順位に基づき、かつ、最も最初に出現し
た名詞句を大局話題の話題語とする。
【0083】(1) 顕著名詞句が明示マーカーによっ
て提示されている場合、または固有名詞を含む顕著名詞
句の場合 (2) 固有名詞を含まない顕著名詞句の場合 勿論、それ以前の大局話題導入部において抽出された話
題語とは重複する場合には話題語としては抽出しない。
【0084】図13に示した話題構造の例では、大局話
題として、最初の行から「A社の特徴」、2番目の行か
ら「X業界」が抽出される。
【0085】次のステップS870の局所話題抽出処理に
おいては、前記話題マーカ・話題手がかり句抽出処理お
よび顕著名詞句抽出処理で抽出された話題マーカ、話題
手がかり句および顕著名詞句と、さらに前記大局話題抽
出処理で抽出された大局話題に基づき、局所的に発生す
る局所的話題を抽出する。
【0086】この局所話題の抽出においては、局所話題
は、「たとえば、」などの例示や、"〜と聞かれれば"な
どの疑問表現により局所的に話題が導入される場合のこ
とをいう。局所的に発生する話題であるため、話題の内
容を表現するには、ある程度の文数を必要とする。その
ため、局所話題では、話題単位がある数以上の文から表
現されることを最低条件とする。最低条件を満たした話
題単位の中で、顕著名詞句をもつものを局所話題の候補
とし、その中で、以下の優先度の高いもののうち、最も
最初に出現した顕著名詞句を局所話題の話題語とした。
【0087】(1) 顕著名詞句が疑問表現の直前にあ
る場合、または顕著名詞句が例示表現の直後にある場合 (2) 顕著名詞句が明示マーカーによって提示されて
いる場合、または顕著名詞句が大局話題導入部に含まれ
ている場合 (3) どの大局話題にも含まれていない固有名詞が顕
著名詞句に含まれる場合勿論、局所話題は、大局話題導
入部に含まれてはならないし、直前の大局話題導入処理
で抽出した話題語と同一であってはならない。図13に
示した話題構造の例では、「たとえば、B社の提携が
…」の部分が局所話題として抽出される。これらの局所
話題の導入部については、導入だけをチェックしている
だけで、局所話題がいつ終了したかはわからない。逆
に、通常の文章では、話題の導入には比較的明確に述べ
る性質があるが、終わりが曖昧であることが多々あり、
明確には話題のスコープを特定することができない。そ
のため、次の局所話題または大局話題が出現するまで
が、この局所話題のスコープであるということになる。
【0088】このような方式により意味的な話題語が抽
出される。本意味話題語抽出処理により、図13に示し
た話題構造に示す入力文例に適用し、意味的話題語を抽
出すると、この入力文例で「について」という話題マー
カーを検索し、この話題マーカー「について」の直前に
ある「A社の特徴」が話題語として抽出される。
【0089】上述したように、認識結果の誤りを訂正す
ることで、マッチングの精度をあげ、コンテンツが選択
され易くなり、クライアントからは多くの広告が配信さ
れ、ユーザは他種類の情報を得られるようになる。
【0090】次に、図15〜図19に示すフローチャー
トを参照して、図14のステップS830,S840,S85
0,S860,S870にそれぞれ示した話題単位確定処理、
話題マーカ・話題手掛かり句抽出処理、著名名詞句抽出
処理、大局話題抽出処理、および局所話題抽出処理につ
いて説明する。
【0091】まず、図15に示すフローチャートを参照
して、話題単位確定処理について説明する。
【0092】図15の話題単位確定処理では、まず話題
単位の数を計数するためのパラメータTを1に設定し
(ステップS1001)、入力された文を文末まで読み込ん
だか否かを判定する(ステップS1003)。文末まで読み
込んだ場合には、本処理を終了するが、文末まで読み込
んでいない場合には、ステップS1005に進み、ステップ
S1005以降の処理を文末まで読み込むまで繰り返し行
う。
【0093】ステップS1005では、前記処理対象文書形
態素解析処理で得られた単位毎の結果を順次入力して、
文が「。」句点で終了しているか否かを判定する(ステ
ップS1007)。「。」句点で終了している場合には、入
力した先頭から「。」までの部分を話題単位とし、パラ
メータTを+1する(ステップS1009)。「。」句点で
終了していない場合には、「・」や数字から始まる箇条
書きが連続しているか否かを判定する(ステップS101
1)。箇条書きが連続している場合には、「・」や数字
で始まる箇条書きの先頭から文末までの部分を話題単位
とし、パラメータTを+1する(ステップS1013)。
【0094】箇条書きが連続していない場合には、形態
素解析の結果、文末表現の活用形が終止形となっている
か否かを判定する(ステップS1015)。終止形になって
いる場合には、形成素解析の結果、文末表現の活用形が
終止形となっている所から文末までの部分を話題単位と
する(ステップS1017)。
【0095】ステップS1015の判定で終止形になってい
ない場合には、文字の間に複数のスペース(半角または
全角)があるか否かを判定する(ステップS1019)。文
字の間に複数のスペースがある場合には、文字の間に複
数のスペース(半角または全角)のある所から文末まで
の部分を話題単位とする(ステップS1021)。
【0096】また、ステップS1019の判定で文字の間に
複数のスペースがない場合には、文がまだ継続している
と判断し(ステップS1023)、ステップS1003に戻り、
ステップS1005以降の処理を繰り返し行う。以上のよう
にして、話題単位が確定されることになる。
【0097】次に、図16に示すフローチャートを参照
して、話題マーカ・手掛かり句抽出処理について説明す
る。
【0098】この処理では、まず話題単位文の数を計数
するためのパラメータTを1に設定し(ステップS110
1)、このTが最大値になったか否かを判定し(ステッ
プS1103)、最大値になった場合には、本処理を終了す
るが、最大値になっていない場合には、次のステップS
1105以降の処理をTが最大値になるまで繰り返し行う。
【0099】ステップS1105では、図14に示す話題マ
ーカ・話題手がかり句記憶部33に記憶されている話題
マーカ・話題手がかり句を読み込む。それから、話題単
位文Tの中の形態素を読み込み、形態素の数を計数する
ためのパラメータMを1に設定する(ステップS110
7)。次に、話題単位文の中でM番目の形態素と話題マ
ーカ、話題手がかり句が一致しているか否かを判定する
(ステップS1109)。一致する場合には、話題単位毎に
一致した話題マーカ・話題手がかり句を蓄積記憶する
(ステップS1111)。
【0100】ステップS1109の判定において一致してい
ない場合には、次の形態素をチェックし、パラメータM
を+1する(ステップS1113)。それから、パラメータ
Mが形態素計数用パラメータの所定の最大値まで終了し
たか否かを判定し(ステップS1115)、終了していない
場合には、ステップS1109に戻って、同じ処理をパラメ
ータMがその最大値になるまで繰り返し行うが、終了し
ている場合には、次の話題単位文の処理を行うべく、パ
ラメータTを+1して、ステップS1103に戻り(ステッ
プS1117)、ステップS1105以降の処理をパラメータT
が話題単位文計数用パラメータの所定の最大値になるま
で繰り返し行う。以上のようにして、話題マーカ・話題
手がかり句が抽出されることになる。
【0101】次に、図17に示すフローチャートを参照
して、顕著名詞句抽出処理について説明する。
【0102】図17の顕著名詞句抽出処理では、まず話
題単位文の数を計数するためのパラメータTを1に設定
し(ステップS1201)、このTが話題単位文計数用パラ
メータの所定の最大値になったか否かを判定し(ステッ
プS1203)、最大値になった場合には、本処理を終了す
るが、最大値になっていない場合には、次のステップS
1205以降の処理をTが最大値になるまで繰り返し行う。
【0103】ステップS1205では、話題マーカ・話題手
がかり句で抽出された話題マーカ・話題手がかり句を読
み込む。それから、話題単位文の中で話題マーカがある
か否かを判定する(ステップS1207)。話題マーカがな
い場合には、ステップS1203に戻るが、話題マーカがあ
る場合には、この話題マーカの位置をPとする(ステッ
プS1209)。
【0104】そして、この位置Pより前にある自立語を
抽出し記録する(ステップS1211)。それから、以上の
処理で文の先頭まできたか否かを判定し(ステップS12
13)、文の先頭まできた場合には、今まで記録した自立
語等を顕著名詞句として記録してステップS1203に戻る
(ステップS1215)。
【0105】文の先頭まできていない場合には、前の付
属語が「の」のような名詞句を接続する名詞句である場
合には、この名詞句を記録し、Pをこの付属語の位置に
設定する(ステップS1217)。それから、ステップS12
11に戻り、同じ処理を文の先頭まで繰り返し行う。
【0106】次に、図18に示すフローチャートを参照
して、大局話題抽出処理について説明する。
【0107】図18の大局話題抽出処理では、まず話題
単位の数を計数するためのパラメータTを1に設定し
(ステップS1301)、このTが話題単位計数用パラメー
タの所定の最大値になったか否かを判定し(ステップS
1303)、最大値になった場合には、本処理を終了する
が、最大値になっていない場合には、次のステップS13
05以降の処理をTが最大値になるまで繰り返し行う。
【0108】ステップS1305では、話題マーカ・話題手
がかり句抽出処理で抽出された話題マーカ・話題手がか
り句を読み込み、また話題マーカ・話題手がかり句抽出
処理で話題単位を抽出する毎に話題単位計数用のパラメ
ータTを+1ずつインクリメントするとともに、また顕
著名詞句抽出処理で抽出された顕著名詞句を読み込む
(ステップS1305)。それから、話題単位計数用のパラ
メータT=1であるか、すなわち文の先頭であるかまた
は話題手がかり句を有し、顕著名詞句を有するか否かを
判定する(ステップS1307)。有しない場合には、ステ
ップS1303に戻って,同じ処理を繰り返し行うが、有す
る場合には、話題単位計数用のパラメータTで示される
話題単位を大局話題導入部として記録する(ステップS
1309)。
【0109】次に、明示マーカが後接続する顕著名詞句
であるか、顕著名詞句中に固有名詞を含むか、かつ今ま
で大局話題として記録されていないかどうかが判定され
る(ステップS1311)。そうである場合には、顕著名詞
句を大局話題として記録し、ステップS1303に戻り、同
じ処理をTが話題単位用パラメータの所定の最大値にな
るまで繰り返すが(ステップS1313)、そうでない場合
には、更に明示マーカが後接続する顕著名詞句である
か、顕著名詞句中に固有名詞を含まないか、かつ今まで
大局話題として記録されていないかどうかが判定される
(ステップS1315)。そうである場合には、顕著名詞句
を大局話題として記録し、ステップS1303に戻り(ステ
ップS1317)、同じ処理をTが最大値になるまで繰り返
し行う。以上の処理により大局話題が抽出されることに
なる。
【0110】次に、図19に示すフローチャートを参照
して、局所話題抽出処理について説明する。
【0111】図19の局所話題抽出処理では、まず大局
話題の数を計数するためのパラメータTを1に設定し
(ステップS1401)、このTが大局話題計数用パラメー
タの所定の最大値になったか否かを判定し(ステップS
1403)、最大値になった場合には、本処理を終了する
が、最大値になっていない場合には、次のステップS14
05以降の処理をTが最大値になるまで繰り返し行う。
【0112】ステップS1405では、話題マーカ・話題手
がかり句抽出処理で抽出された話題マーカ・話題手、顕
著名詞句抽出処理で抽出された顕著名詞句、および大局
話題抽出処理で抽出された大局話題、大局話題導入部を
読み込むとともに、大局話題抽出処理で大局話題を抽出
する毎に大局話題計数用パラメータTを+1インクリメ
ントする(ステップS1405)。
【0113】それから、Tが1より大きいか否か(T>
1)、すなわち文の先頭でないか否かおよび顕著名詞句
を有するか否かが判定される(ステップS1407)。否で
ある場合には、ステップS1403に戻るが、そうである場
合には、顕著名詞句が疑問表現の直前または例示表現の
直後にあり、かつ今まで大局話題として記録されていな
いか否かが判定される(ステップS1409)。そうである
場合には、顕著名詞句を局所話題として記録し、ステッ
プS1403に戻るが、そうでない場合には、更に顕著名詞
句が明示マーカに後接続するかまたは顕著名詞句が大局
話題導入部に含まれ、かつ今まで大局話題として記録さ
れていないか否かが判定される(ステップS1413)。そ
うである場合には、顕著名詞句を局所話題として記録
し、ステップS1403に戻るが、そうでない場合には、更
にどの大局話題にも含まれていない固有名詞が顕著名詞
に含まれ、かつ今まで大局話題として記録されていない
か否かが判定される(ステップS1417)。そうである場
合には、顕著名詞句を局所話題として記録し、ステップ
S1403に戻り(ステップS1419)、同じ処理をTが大局
話題計数用パラメータの所定の最大値になるまで繰り返
し行う。以上の処理により局所話題が抽出されることに
なる。
【0114】なお、上記実施形態は、図示で示した装置
構成を有するコンテンツ検索装置について説明したが、
本発明はこのような構成装置に限定されるものでないこ
とは勿論であるとともに、更に本コンテンツ検索装置の
処理手順を実施するコンテンツ検索方法にも適用し得る
ものである。また、このようなコンテンツ検索方法の処
理手順をプログラムとして記録媒体に記録して、この記
録媒体をコンピュータシステムに組み込むとともに、該
記録媒体に記録されたプログラムをコンピュータシステ
ムにダウンロードまたはインストールし、該プログラム
でコンピュータシステムを作動させることにより、コン
テンツ検索方法を実施するコンテンツ検索装置として機
能させることができることは勿論であり、このような記
録媒体を用いることにより、その流通性を高めることが
できるものである。
【0115】
【発明の効果】以上説明したように、本発明によれば、
入力音声情報を音声認識した結果をキーワードとし、こ
のキーワードとキーワードコンテンツ対応テーブル手段
のキーワードとを比較して、音声認識結果のキーワード
に対応するキーワードを検出し、このキーワードに対応
するコンテンツをキーワードコンテンツ対応テーブル手
段から取得し、このコンテンツをコンテンツ蓄積手段か
ら検索して読み出して出力するので、ユーザ自身が手作
業でキーワードを入力する必要がなく、所望のコンテン
ツを取り出し得る適切なキーワードを音声認識により自
動的に抽出でき、ユーザに手間をかけたり、大きな負担
をかけることなく、ユーザの操作性を効率化することが
できる。
【0116】また、本発明によれば、入力画像情報を画
像認識した結果をキーワードとし、このキーワードとキ
ーワードコンテンツ対応テーブル手段のキーワードとを
比較して、画像認識結果のキーワードに対応するキーワ
ードをキーワードコンテンツ対応テーブル手段から検出
し、このキーワードに対応するコンテンツをキーワード
コンテンツ対応テーブル手段から取得し、このコンテン
ツをコンテンツ蓄積手段から検索して読み出して出力す
るので、ユーザ自身が手作業でキーワードを入力する必
要がなく、所望のコンテンツを取り出し得る適切なキー
ワードを画像認識により自動的に抽出でき、ユーザに手
間をかけたり、大きな負担をかけることなく、ユーザの
操作性を効率化することができる。
【0117】更に、発明によれば、入力音声情報の音声
認識と入力画像情報の画像認識を同期して行い、音声認
識結果のキーワードと画像認識結果のキーワードとを比
較し、一致しない場合には画像認識結果のキーワードを
対象キーワードとし、この対象キーワードとキーワード
コンテンツ対応テーブル手段のキーワードとを比較し
て、対象キーワードに対応するキーワードをキーワード
コンテンツ対応テーブル手段から検出し、このキーワー
ドに対応するコンテンツを取得し、このコンテンツをコ
ンテンツ蓄積手段から検索して読み出して出力するの
で、ユーザ自身が手作業でキーワードを入力する必要が
なく、所望のコンテンツを取り出し得る適切なキーワー
ドを画像認識により自動的に抽出でき、ユーザに手間を
かけたり、大きな負担をかけることなく、ユーザの操作
性を効率化することができる。
【0118】本発明によれば、入力画像情報からテロッ
プを画像情報として認識し、この認識したテロップから
文字情報を切り出し、この切り出した文字情報を画像認
識結果のキーワードとし、このキーワードとキーワード
コンテンツ対応テーブル手段のキーワードとを比較し
て、キーワードを検出し、このキーワードに対応するコ
ンテンツをキーワードコンテンツ対応テーブル手段から
取得し、このコンテンツをコンテンツ蓄積手段から検索
して読み出して出力するので、ユーザ自身が手作業でキ
ーワードを入力する必要がなく、所望のコンテンツを取
り出し得る適切なキーワードを画像認識により自動的に
抽出でき、ユーザに手間をかけたり、大きな負担をかけ
ることなく、ユーザの操作性を効率化することができ
る。
【0119】また、本発明によれば、入力画像情報から
キャプションを画像情報として認識し、このキャプショ
ンから文字情報を切り出し、この切り出した文字情報を
画像認識結果のキーワードとし、このキーワードとキー
ワードコンテンツ対応テーブル手段のキーワードとを比
較して、キーワードを検出し、このキーワードに対応す
るコンテンツをキーワードコンテンツ対応テーブル手段
から取得し、このコンテンツをコンテンツ蓄積手段から
検索して読み出して出力するので、ユーザ自身が手作業
でキーワードを入力する必要がなく、所望のコンテンツ
を取り出し得る適切なキーワードを画像認識により自動
的に抽出でき、ユーザに手間をかけたり、大きな負担を
かけることなく、ユーザの操作性を効率化することがで
きる。
【0120】更に、本発明によれば、音声認識結果を形
態素解析して、局所話題範囲を決定し、局所話題語の抽
出を行い、局所話題語に対して上位・下位概念関係およ
び類義語関係に基づき認識結果が誤認識であるか否かを
判定し、誤認識と判定された認識結果に対して一文字違
いの単語の類義語関係を有する単語を対象単語として選
択し、この対象単語と局所話題語との概念距離に基づき
認識結果に対する訂正候補を出力するので、認識結果が
誤ったとしても、正しい訂正候補のキーワードを取得で
き、適切なコンテンツを取得することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係わるコンテンツ検
索方法を実施するコンテンツ検索装置の構成を示すブロ
ック図である。
【図2】図1に示す第1の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。
【図3】本発明の第2の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。
【図4】図3に示す第2の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。
【図5】本発明の第3の実施形態に係わるコンテンツ検
索方法の処理手順を示すフローチャートである。
【図6】本発明の第4の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。
【図7】図6に示す第4の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。
【図8】本発明の第5の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。
【図9】図8に示す第5の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。
【図10】本発明の第6の実施形態に係わるコンテンツ
検索方法の処理手順の一部を示すフローチャートであ
る。
【図11】本発明の第6の実施形態に係わるコンテンツ
検索方法の処理手順の図10に続く部分を示すフローチ
ャートである。
【図12】類義語辞書の一例を示す図である。
【図13】話題構造の例を示す図である。
【図14】話題抽出処理を示すフローチャートである。
【図15】図14のステップS830における話題単位確
定処理を示すフローチャートである。
【図16】図14のステップS840における話題マーカ
・話題手掛かり句抽出処理を示すフローチャートであ
る。
【図17】図14のステップS850における著名名詞句
抽出処理を示すフローチャートである。
【図18】図14のステップS860における大局話題抽
出処理を示すフローチャートである。
【図19】図14のステップS870における局所話題抽
出処理を示すフローチャートである。
【符号の説明】
1 音声入力部 2 音声認識部 3 音声認識結果通知部 4 キーワード比較部 5 キーワードコンテンツ対応テーブル部 6 制御部 7 コンテンツ蓄積部 8 コンテンツ出力部 10 画像認識部 11 画像認識結果通知部 12 テロップ認識部 13 テロップ認識結果通知部 14 キャプション認識部 15 キャプション認識結果通知部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 稲垣 博人 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 NK31 NK54 PP07 PP10 PP25

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声情報を入力する音声入力手段と、 この音声入力手段から入力される音声情報を認識する音
    声認識手段と、 この音声認識手段で認識された認識結果をキーワードと
    して出力する音声認識結果通知手段と、 複数のコンテンツを蓄積するコンテンツ蓄積手段と、 各コンテンツに定められているキーワードを各コンテン
    ツに対応してテーブルとして記憶管理するキーワードコ
    ンテンツ対応テーブル手段と、 前記音声認識結果通知手段から出力される音声認識結果
    のキーワードと前記キーワードコンテンツ対応テーブル
    手段においてコンテンツに対応して記憶管理されている
    キーワードとを比較して、音声認識結果のキーワードに
    対応するキーワードをキーワードコンテンツ対応テーブ
    ル手段から検出して出力するキーワード比較手段と、 このキーワード比較手段から出力されるキーワードに対
    応するコンテンツを前記キーワードコンテンツ対応テー
    ブル手段から取得し、このコンテンツを前記コンテンツ
    蓄積手段から検索して読み出すように制御する制御手段
    と、 この制御手段の制御によりコンテンツ蓄積手段から読み
    出されたコンテンツを出力するコンテンツ出力手段とを
    有することを特徴とするコンテンツ検索装置。
  2. 【請求項2】 画像情報を入力する画像入力手段と、 この画像入力手段から入力される画像情報を認識する画
    像認識手段と、 この画像認識手段で認識された認識結果をキーワードと
    して出力する画像認識結果通知手段と、 複数のコンテンツを蓄積するコンテンツ蓄積手段と、 各コンテンツに定められているキーワードを各コンテン
    ツに対応してテーブルとして記憶管理するキーワードコ
    ンテンツ対応テーブル手段と、 前記画像認識結果通知手段から出力される画像認識結果
    のキーワードと前記キーワードコンテンツ対応テーブル
    手段においてコンテンツに対応して記憶管理されている
    キーワードとを比較して、画像認識結果のキーワードに
    対応するキーワードをキーワードコンテンツ対応テーブ
    ル手段から検出して出力するキーワード比較手段と、 このキーワード比較手段から出力されるキーワードに対
    応するコンテンツを前記キーワードコンテンツ対応テー
    ブル手段から取得し、このコンテンツを前記コンテンツ
    蓄積手段から検索して読み出すように制御する制御手段
    と、 この制御手段の制御によりコンテンツ蓄積手段から読み
    出されたコンテンツを出力するコンテンツ出力手段とを
    有することを特徴とするコンテンツ検索装置。
  3. 【請求項3】 音声情報を入力する音声入力手段と、 この音声入力手段から入力される音声情報を認識する音
    声認識手段と、 この音声認識手段で認識された認識結果をキーワードと
    して出力する音声認識結果通知手段と、 前記音声情報の入力に同期して画像情報を入力する画像
    入力手段と、 この画像入力手段から入力される画像情報を前記音声情
    報の認識処理に同期して認識する画像認識手段と、 この画像認識手段で認識された認識結果をキーワードと
    して出力する画像認識結果通知手段と、 前記音声認識結果通知手段から出力されるキーワードと
    画像認識結果通知手段から出力されるキーワードとを比
    較し、両キーワードが一致するか否かを判定する比較判
    定手段と、 両キーワードが一致する場合には、該キーワードを対象
    キーワードとし、一致しない場合には、画像認識結果通
    知手段から出力される画像認識結果のキーワードを対象
    キーワードとして選択するキーワード選択手段と、 複数のコンテンツを蓄積するコンテンツ蓄積手段と、 各コンテンツに定められているキーワードを各コンテン
    ツに対応してテーブルとして記憶管理するキーワードコ
    ンテンツ対応テーブル手段と、 前記対象キーワードと前記キーワードコンテンツ対応テ
    ーブル手段においてコンテンツに対応して記憶管理され
    ているキーワードとを比較して、前記対象キーワードに
    対応するキーワードをキーワードコンテンツ対応テーブ
    ル手段から検出して出力するキーワード比較手段と、 このキーワード比較手段から出力されるキーワードに対
    応するコンテンツを前記キーワードコンテンツ対応テー
    ブル手段から取得し、このコンテンツを前記コンテンツ
    蓄積手段から検索して読み出すように制御する制御手段
    と、 この制御手段の制御によりコンテンツ蓄積手段から読み
    出されたコンテンツを出力するコンテンツ出力手段とを
    有することを特徴とするコンテンツ検索装置。
  4. 【請求項4】 前記画像認識手段は、入力画像情報から
    テロップを画像情報として認識するテロップ認識手段
    と、この認識したテロップから文字情報を切り出し、こ
    の切り出した文字情報を認識結果として出力する切り出
    し手段とを有することを特徴とする請求項2または3記
    載のコンテンツ検索装置。
  5. 【請求項5】 前記画像認識手段は、入力画像情報から
    キャプションを画像情報として認識するキャプション認
    識手段と、この認識したキャプションから文字情報を切
    り出し、この切り出した文字情報を認識結果として出力
    する切り出し手段とを有することを特徴とする請求項2
    または3記載のコンテンツ検索装置。
  6. 【請求項6】 前記コンテンツ蓄積手段は、コンテンツ
    検索装置の外部に設けられ、前記制御手段は、この外部
    に設けられたコンテンツ蓄積手段にアクセスして、該コ
    ンテンツ蓄積手段からコンテンツを読み出す外部アクセ
    ス手段を有することを特徴とする請求項1乃至5のいず
    れかに記載のコンテンツ検索装置。
  7. 【請求項7】 前記コンテンツ蓄積手段は、着脱可能な
    記録媒体で構成されていることを特徴とする請求項1乃
    至5のいずれかに記載のコンテンツ検索装置。
  8. 【請求項8】 前記キーワードコンテンツ対応テーブル
    手段は、着脱可能な記録媒体で構成されていることを特
    徴とする請求項1乃至7のいずれかに記載のコンテンツ
    検索装置。
  9. 【請求項9】 前記音声認識手段および画像認識手段で
    認識された認識結果を形態素解析して、局所話題範囲を
    決定し、局所話題語の抽出を行い、この抽出した局所話
    題語に対して上位・下位概念関係および類義語関係に基
    づき前記認識結果が誤認識であるか否かを判定する誤認
    識判定手段と、この判定の結果、誤認識と判定された認
    識結果に対して一文字違いの単語の類義語関係を有する
    単語を対象単語として選択し、この対象単語と局所話題
    語との概念距離に基づき前記認識結果に対する訂正候補
    を出力する訂正候補出力手段とを有することを特徴とす
    る請求項1または2または3記載のコンテンツ検索装
    置。
JP2000039691A 2000-02-17 2000-02-17 コンテンツ検索装置 Pending JP2001229180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000039691A JP2001229180A (ja) 2000-02-17 2000-02-17 コンテンツ検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000039691A JP2001229180A (ja) 2000-02-17 2000-02-17 コンテンツ検索装置

Publications (1)

Publication Number Publication Date
JP2001229180A true JP2001229180A (ja) 2001-08-24

Family

ID=18563218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000039691A Pending JP2001229180A (ja) 2000-02-17 2000-02-17 コンテンツ検索装置

Country Status (1)

Country Link
JP (1) JP2001229180A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004064393A1 (ja) * 2003-01-15 2004-07-29 Matsushita Electric Industrial Co., Ltd. 放送受信方法、放送受信システム、記録媒体、及びプログラム
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
JP2008276737A (ja) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム
US7676496B2 (en) 2004-10-04 2010-03-09 Sony Corporation Content management system, content management method and computer program
JP2011508319A (ja) * 2007-12-19 2011-03-10 グーグル・インコーポレーテッド ビデオ品質測定
US7945439B2 (en) 2006-06-09 2011-05-17 Sony Corporation Information processing apparatus, information processing method, and computer program
JP2011128766A (ja) * 2009-12-16 2011-06-30 Canon Inc 入力装置及び方法
JP2014006680A (ja) * 2012-06-25 2014-01-16 Sony Corp ビデオ記録装置、情報処理システム、情報処理方法および記録媒体
US9690787B2 (en) 2004-10-07 2017-06-27 Saturn Licensing Llc Contents management system, contents management method, and computer program
JP7456923B2 (ja) 2020-11-27 2024-03-27 株式会社 日立産業制御ソリューションズ 検索装置、プログラムおよび検索方法
US11971940B2 (en) 2019-01-23 2024-04-30 Medullar Solutions Inc. Data processing system for data search and retrieval augmentation and enhanced data storage

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004064393A1 (ja) * 2003-01-15 2004-07-29 Matsushita Electric Industrial Co., Ltd. 放送受信方法、放送受信システム、記録媒体、及びプログラム
US7698138B2 (en) 2003-01-15 2010-04-13 Panasonic Corporation Broadcast receiving method, broadcast receiving system, recording medium, and program
US7676496B2 (en) 2004-10-04 2010-03-09 Sony Corporation Content management system, content management method and computer program
US9690787B2 (en) 2004-10-07 2017-06-27 Saturn Licensing Llc Contents management system, contents management method, and computer program
US8126712B2 (en) 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
US7945439B2 (en) 2006-06-09 2011-05-17 Sony Corporation Information processing apparatus, information processing method, and computer program
JP2008276737A (ja) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム
US8402025B2 (en) 2007-12-19 2013-03-19 Google Inc. Video quality measures
JP2011508319A (ja) * 2007-12-19 2011-03-10 グーグル・インコーポレーテッド ビデオ品質測定
JP2011128766A (ja) * 2009-12-16 2011-06-30 Canon Inc 入力装置及び方法
JP2014006680A (ja) * 2012-06-25 2014-01-16 Sony Corp ビデオ記録装置、情報処理システム、情報処理方法および記録媒体
US11971940B2 (en) 2019-01-23 2024-04-30 Medullar Solutions Inc. Data processing system for data search and retrieval augmentation and enhanced data storage
JP7456923B2 (ja) 2020-11-27 2024-03-27 株式会社 日立産業制御ソリューションズ 検索装置、プログラムおよび検索方法

Similar Documents

Publication Publication Date Title
CN105917327B (zh) 用于将文本输入到电子设备中的***和方法
US8332205B2 (en) Mining transliterations for out-of-vocabulary query terms
CN109635270B (zh) 双向概率性的自然语言重写和选择
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US8117026B2 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US9405823B2 (en) Spoken document retrieval using multiple speech transcription indices
US5680511A (en) Systems and methods for word recognition
US9195646B2 (en) Training data generation apparatus, characteristic expression extraction system, training data generation method, and computer-readable storage medium
US6873993B2 (en) Indexing method and apparatus
US20150112677A1 (en) Document Editing Using Anchors
JP2002531892A (ja) テキストの自動区分
EP2418589A1 (en) Retrieval device
US20060241936A1 (en) Pronunciation specifying apparatus, pronunciation specifying method and recording medium
JP2001229180A (ja) コンテンツ検索装置
JP2010157241A (ja) Ocr結果を補正するための方法、システム、及びコンピュータ読み取り可能な記録媒体
JP5097802B2 (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
JPH08263478A (ja) 中国語簡繁体字文書変換装置
KR100617319B1 (ko) 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
JP2009295101A (ja) 音声データ検索システム
CN111310457B (zh) 词语搭配不当识别方法、装置、电子设备和存储介质
JPWO2012131822A1 (ja) 音声認識結果整形装置、音声認識結果整形方法及びプログラム
JP2008242607A (ja) 言語処理結果から妥当な候補を選択する装置、方法およびプログラム
JP2000276482A (ja) 文書検索装置及び文書検索方法
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体