JP2001229180A

JP2001229180A - コンテンツ検索装置

Info

Publication number: JP2001229180A
Application number: JP2000039691A
Authority: JP
Inventors: Yoshiori Narahara; 佳織楢原; Nobuyuki Omori; 信行大森; Hiroto Inagaki; 博人稲垣
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2000-02-17
Filing date: 2000-02-17
Publication date: 2001-08-24

Abstract

(57)【要約】【課題】音声情報や画像情報等の入力情報を音声認識
や画像認識して自動的にキーワードを抽出して、所望の
適切なコンテンツを効率的に取得する。【解決手段】音声入力部１からの入力音声情報を音声
認識部２で音声認識した結果を音声認識結果通知部３か
らキーワードとして出力し、このキーワードとキーワー
ドコンテンツ対応テーブル部５においてコンテンツに対
応して記憶管理されているキーワードとをキーワード比
較部４で比較して、音声認識結果のキーワードに対応す
るキーワードをキーワードコンテンツ対応テーブル部５
から検出し、この検出したキーワードに対応するコンテ
ンツをキーワードコンテンツ対応テーブル部５から取得
し、このコンテンツをコンテンツ蓄積部７から検索して
読み出し、コンテンツ出力部８から出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力情報に含まれ
るキーワードを認識し、この認識したキーワードにマッ
チングするコンテンツを検索して出力するコンテンツ検
索装置に関する。

【０００２】

【従来の技術】従来、ユーザが所望のコンテンツを検索
して取り出すためには、ユーザ自身がそのコンテンツに
関するキーワードを手作業で入力し、この入力したキー
ワードに対応するコンテンツを取り出していた。

【０００３】

【発明が解決しようとする課題】上述したように、従来
は、ユーザ自身が手作業でキーワードを入力して、所望
のコンテンツを取り出しているため、適切なコンテンツ
を取得するためのキーワード入力に手間取り、ユーザに
対して大きな負担がかかるという問題があった。

【０００４】本発明は、上記に鑑みてなされたもので、
その目的とするところは、音声情報や画像情報等の入力
情報を音声認識や画像認識してキーワードを抽出して、
所望の適切なコンテンツを効率的に取得し得るコンテン
ツ検索装置を提供することにある。

【０００５】

【課題を解決するための手段】上記目的を達成するた
め、請求項１記載の本発明は、音声情報を入力する音声
入力手段と、この音声入力手段から入力される音声情報
を認識する音声認識手段と、この音声認識手段で認識さ
れた認識結果をキーワードとして出力する音声認識結果
通知手段と、複数のコンテンツを蓄積するコンテンツ蓄
積手段と、各コンテンツに定められているキーワードを
各コンテンツに対応してテーブルとして記憶管理するキ
ーワードコンテンツ対応テーブル手段と、前記音声認識
結果通知手段から出力される音声認識結果のキーワード
と前記キーワードコンテンツ対応テーブル手段において
コンテンツに対応して記憶管理されているキーワードと
を比較して、音声認識結果のキーワードに対応するキー
ワードをキーワードコンテンツ対応テーブル手段から検
出して出力するキーワード比較手段と、このキーワード
比較手段から出力されるキーワードに対応するコンテン
ツを前記キーワードコンテンツ対応テーブル手段から取
得し、このコンテンツを前記コンテンツ蓄積手段から検
索して読み出すように制御する制御手段と、この制御手
段の制御によりコンテンツ蓄積手段から読み出されたコ
ンテンツを出力するコンテンツ出力手段とを有すること
を要旨とする。

【０００６】請求項１記載の本発明にあっては、入力音
声情報を音声認識した結果をキーワードとし、このキー
ワードとキーワードコンテンツ対応テーブル手段におい
てコンテンツに対応して記憶管理されているキーワード
とを比較して、音声認識結果のキーワードに対応するキ
ーワードをキーワードコンテンツ対応テーブル手段から
検出し、この検出したキーワードに対応するコンテンツ
をキーワードコンテンツ対応テーブル手段から取得し、
このコンテンツをコンテンツ蓄積手段から検索して読み
出して出力するため、ユーザ自身が手作業でキーワード
を入力する必要がなく、所望のコンテンツを取り出し得
る適切なキーワードを音声認識により自動的に抽出で
き、ユーザに手間をかけたり、大きな負担をかけること
なく、ユーザの操作性を効率化することができる。

【０００７】また、請求項２記載の本発明は、画像情報
を入力する画像入力手段と、この画像入力手段から入力
される画像情報を認識する画像認識手段と、この画像認
識手段で認識された認識結果をキーワードとして出力す
る画像認識結果通知手段と、複数のコンテンツを蓄積す
るコンテンツ蓄積手段と、各コンテンツに定められてい
るキーワードを各コンテンツに対応してテーブルとして
記憶管理するキーワードコンテンツ対応テーブル手段
と、前記画像認識結果通知手段から出力される画像認識
結果のキーワードと前記キーワードコンテンツ対応テー
ブル手段においてコンテンツに対応して記憶管理されて
いるキーワードとを比較して、画像認識結果のキーワー
ドに対応するキーワードをキーワードコンテンツ対応テ
ーブル手段から検出して出力するキーワード比較手段
と、このキーワード比較手段から出力されるキーワード
に対応するコンテンツを前記キーワードコンテンツ対応
テーブル手段から取得し、このコンテンツを前記コンテ
ンツ蓄積手段から検索して読み出すように制御する制御
手段と、この制御手段の制御によりコンテンツ蓄積手段
から読み出されたコンテンツを出力するコンテンツ出力
手段とを有することを要旨とする。

【０００８】請求項２記載の本発明にあっては、入力画
像情報を画像認識した結果をキーワードとし、このキー
ワードとキーワードコンテンツ対応テーブル手段におい
てコンテンツに対応して記憶管理されているキーワード
とを比較して、画像認識結果のキーワードに対応するキ
ーワードをキーワードコンテンツ対応テーブル手段から
検出し、この検出したキーワードに対応するコンテンツ
をキーワードコンテンツ対応テーブル手段から取得し、
このコンテンツをコンテンツ蓄積手段から検索して読み
出して出力するため、ユーザ自身が手作業でキーワード
を入力する必要がなく、所望のコンテンツを取り出し得
る適切なキーワードを画像認識により自動的に抽出で
き、ユーザに手間をかけたり、大きな負担をかけること
なく、ユーザの操作性を効率化することができる。

【０００９】更に、請求項３記載の本発明は、音声情報
を入力する音声入力手段と、この音声入力手段から入力
される音声情報を認識する音声認識手段と、この音声認
識手段で認識された認識結果をキーワードとして出力す
る音声認識結果通知手段と、前記音声情報の入力に同期
して画像情報を入力する画像入力手段と、この画像入力
手段から入力される画像情報を前記音声情報の認識処理
に同期して認識する画像認識手段と、この画像認識手段
で認識された認識結果をキーワードとして出力する画像
認識結果通知手段と、前記音声認識結果通知手段から出
力されるキーワードと画像認識結果通知手段から出力さ
れるキーワードとを比較し、両キーワードが一致するか
否かを判定する比較判定手段と、両キーワードが一致す
る場合には、該キーワードを対象キーワードとし、一致
しない場合には、画像認識結果通知手段から出力される
画像認識結果のキーワードを対象キーワードとして選択
するキーワード選択手段と、複数のコンテンツを蓄積す
るコンテンツ蓄積手段と、各コンテンツに定められてい
るキーワードを各コンテンツに対応してテーブルとして
記憶管理するキーワードコンテンツ対応テーブル手段
と、前記対象キーワードと前記キーワードコンテンツ対
応テーブル手段においてコンテンツに対応して記憶管理
されているキーワードとを比較して、前記対象キーワー
ドに対応するキーワードをキーワードコンテンツ対応テ
ーブル手段から検出して出力するキーワード比較手段
と、このキーワード比較手段から出力されるキーワード
に対応するコンテンツを前記キーワードコンテンツ対応
テーブル手段から取得し、このコンテンツを前記コンテ
ンツ蓄積手段から検索して読み出すように制御する制御
手段と、この制御手段の制御によりコンテンツ蓄積手段
から読み出されたコンテンツを出力するコンテンツ出力
手段とを有することを要旨とする。

【００１０】請求項３記載の本発明にあっては、音声情
報と画像情報を同期して入力し、入力音声情報の音声認
識と入力画像情報の画像認識を同期して行い、音声認識
結果のキーワードと画像認識結果のキーワードとを比較
し、両キーワードが一致しない場合には画像認識結果の
キーワードを対象キーワードとし、この対象キーワード
とキーワードコンテンツ対応テーブル手段においてコン
テンツに対応して記憶管理されているキーワードとを比
較して、対象キーワードに対応するキーワードをキーワ
ードコンテンツ対応テーブル手段から検出し、この検出
したキーワードに対応するコンテンツをキーワードコン
テンツ対応テーブル手段から取得し、このコンテンツを
コンテンツ蓄積手段から検索して読み出して出力するた
め、ユーザ自身が手作業でキーワードを入力する必要が
なく、所望のコンテンツを取り出し得る適切なキーワー
ドを画像認識により自動的に抽出でき、ユーザに手間を
かけたり、大きな負担をかけることなく、ユーザの操作
性を効率化することができる。

【００１１】請求項４記載の本発明は、請求項２または
３記載の本発明において、前記画像認識手段が、入力画
像情報からテロップを画像情報として認識するテロップ
認識手段と、この認識したテロップから文字情報を切り
出し、この切り出した文字情報を認識結果として出力す
る切り出し手段とを有することを要旨とする。

【００１２】請求項４記載の本発明にあっては、入力画
像情報からテロップを画像情報として認識し、この認識
したテロップから文字情報を切り出し、この切り出した
文字情報を画像認識結果のキーワードとし、このキーワ
ードとキーワードコンテンツ対応テーブル手段のキーワ
ードとを比較して、キーワードを検出し、この検出した
キーワードに対応するコンテンツをキーワードコンテン
ツ対応テーブル手段から取得し、このコンテンツをコン
テンツ蓄積手段から検索して読み出して出力するため、
ユーザ自身が手作業でキーワードを入力する必要がな
く、所望のコンテンツを取り出し得る適切なキーワード
を画像認識により自動的に抽出でき、ユーザに手間をか
けたり、大きな負担をかけることなく、ユーザの操作性
を効率化することができる。

【００１３】また、請求項５記載の本発明は、請求項２
または３記載の本発明において、前記画像認識手段が、
入力画像情報からキャプションを画像情報として認識す
るキャプション認識手段と、この認識したキャプション
から文字情報を切り出し、この切り出した文字情報を認
識結果として出力する切り出し手段とを有することを要
旨とする。

【００１４】請求項５記載の本発明にあっては、入力画
像情報からキャプションを画像情報として認識し、この
認識したキャプションから文字情報を切り出し、この切
り出した文字情報を画像認識結果のキーワードとし、こ
のキーワードとキーワードコンテンツ対応テーブル手段
のキーワードとを比較して、キーワードを検出し、この
検出したキーワードに対応するコンテンツをキーワード
コンテンツ対応テーブル手段から取得し、このコンテン
ツをコンテンツ蓄積手段から検索して読み出して出力す
るため、ユーザ自身が手作業でキーワードを入力する必
要がなく、所望のコンテンツを取り出し得る適切なキー
ワードを画像認識により自動的に抽出でき、ユーザに手
間をかけたり、大きな負担をかけることなく、ユーザの
操作性を効率化することができる。

【００１５】更に、請求項６記載の本発明は、請求項１
乃至５のいずれかに記載の本発明において、前記コンテ
ンツ蓄積手段が、コンテンツ検索装置の外部に設けら
れ、前記制御手段は、この外部に設けられたコンテンツ
蓄積手段にアクセスして、該コンテンツ蓄積手段からコ
ンテンツを読み出す外部アクセス手段を有することを要
旨とする。

【００１６】請求項６記載の本発明にあっては、コンテ
ンツ蓄積手段は外部に設けられ、この外部に設けられた
コンテンツ蓄積手段にアクセスしてコンテンツを読み出
す。

【００１７】請求項７記載の本発明は、請求項１乃至５
のいずれかに記載の本発明において、前記コンテンツ蓄
積手段が、着脱可能な記録媒体で構成されていることを
要旨とする。

【００１８】請求項７記載の本発明にあっては、コンテ
ンツ蓄積手段が着脱可能な記録媒体で構成されている。

【００１９】また、請求項８記載の本発明は、請求項１
乃至７のいずれかに記載の本発明において、前記キーワ
ードコンテンツ対応テーブル手段が、着脱可能な記録媒
体で構成されていることを要旨とする。

【００２０】請求項８記載の本発明にあっては、キーワ
ードコンテンツ対応テーブル手段が着脱可能な記録媒体
で構成されている。

【００２１】更に、請求項９記載の本発明は、請求項１
または３記載の本発明において、前記音声認識手段で認
識された認識結果を形態素解析して、局所話題範囲を決
定し、局所話題語の抽出を行い、この抽出した局所話題
語に対して上位・下位概念関係および類義語関係に基づ
き前記認識結果が誤認識であるか否かを判定する誤認識
判定手段と、この判定の結果、誤認識と判定された認識
結果に対して一文字違いの単語の類義語関係を有する単
語を対象単語として選択し、この対象単語と局所話題語
との概念距離に基づき前記認識結果に対する訂正候補を
出力する訂正候補出力手段とを有することを要旨とす
る。

【００２２】請求項９記載の本発明にあっては、音声認
識結果を形態素解析して、局所話題範囲を決定し、局所
話題語の抽出を行い、局所話題語に対して上位・下位概
念関係および類義語関係に基づき認識結果が誤認識であ
るか否かを判定し、誤認識と判定された認識結果に対し
て一文字違いの単語の類義語関係を有する単語を対象単
語として選択し、この対象単語と局所話題語との概念距
離に基づき認識結果に対する訂正候補を出力するため、
認識結果が誤ったとしても、正しい訂正候補のキーワー
ドを取得でき、適切なコンテンツを取得することができ
る。

【００２３】

【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。図１は、本発明の第１の実施形態に
係わるコンテンツ検索方法を実施するコンテンツ検索装
置の構成を示すブロック図である。同図に示すコンテン
ツ検索装置は、音声情報が入力される音声入力部１、こ
の音声入力部１から入力される音声情報を認識する音声
認識部２、この音声認識部２で認識された認識結果をキ
ーワードとして出力する音声認識結果通知部３、複数の
コンテンツを蓄積しているコンテンツ蓄積部７、各コン
テンツに定められているキーワードを各コンテンツに対
応してテーブルとして管理しているキーワードコンテン
ツ対応テーブル部５、音声認識結果通知部３から出力さ
れる音声認識結果のキーワードとキーワードコンテンツ
対応テーブル部５においてコンテンツに対応して記憶管
理されているキーワードとを比較し、音声認識結果のキ
ーワードに対応するキーワードをキーワードコンテンツ
対応テーブル部５から検出して出力するキーワード比較
部４、このキーワード比較部４から出力されるキーワー
ドに対応するコンテンツをキーワードコンテンツ対応テ
ーブル部５から取得し、このコンテンツをコンテンツ蓄
積部７から検索して読み出すように制御する制御部６、
この制御部６の制御によりコンテンツ蓄積部７から読み
出されたコンテンツを出力するコンテンツ出力部８から
構成されている。

【００２４】次に、図２に示すフローチャートを参照し
て、図１に示す第１の実施形態の作用について説明す
る。

【００２５】まず、例えばテレビ、ラジオなどのオーデ
ィオビジュアル機器から入力される音声情報または通信
インタフェースなどを介して入力される音声情報が音声
入力部１を介して入力されると（ステップＳ100）、こ
の入力された音声情報は、音声認識部２で音声認識され
（ステップＳ101）、この音声認識結果がキーワードと
して音声認識結果通知部３から出力される（ステップＳ
102）。

【００２６】音声認識結果通知部３から出力されたキー
ワードは、キーワード比較部４に入力されるとともに、
またキーワード比較部４にはキーワードコンテンツ対応
テーブル部５においてコンテンツに対応して記憶されて
いるキーワードも入力され（ステップＳ103）、両キー
ワードはキーワード比較部４で比較され、音声認識結果
のキーワードに対応するキーワードがキーワードコンテ
ンツ対応テーブル部５から検出され出力される（ステッ
プＳ104）。

【００２７】このキーワード比較部４から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
５が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部５から出力される
（ステップＳ105）。制御部６は、キーワードコンテン
ツ対応テーブル部５から出力されたコンテンツを受け取
ると、コンテンツ蓄積部７にアクセスし（ステップＳ10
6）、このコンテンツをコンテンツ蓄積部７から検索し
て読み出し（ステップＳ107）、この読み出したコンテ
ンツをコンテンツ出力部８から出力する（ステップＳ10
8）。

【００２８】図３は、本発明の第２の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図１に示した第１の実
施形態が音声情報を対象としているのに対して画像情報
を対象とするものであって、図１の音声入力部１、音声
認識部２、および音声認識結果通知部３がそれぞれ画像
情報を入力する画像入力部９、この画像入力部９から入
力される画像情報を認識する画像認識部１０、およびこ
の画像認識部１０で認識された認識結果をキーワードと
して出力する画像認識結果通知部１１に置き換えられて
いる点が異なるのみであり、その他のキーワード比較部
４、キーワードコンテンツ対応テーブル部５、制御部
６、コンテンツ蓄積部７およびコンテンツ出力部８は図
１の実施形態のものと同じである。

【００２９】図４に示すフローチャートを参照して、図
３に示す第２の実施形態の作用について説明する。

【００３０】オーディオビジュアル機器などからの画像
情報が画像入力部９を介して入力されると（ステップＳ
200）、この画像情報は、画像認識部１０で画像認識さ
れ（ステップＳ201）、この画像認識結果がキーワード
として画像認識結果通知部１１から出力される（ステッ
プＳ202）。

【００３１】画像認識結果通知部１１から出力されたキ
ーワードは、キーワード比較部４に入力されるととも
に、またキーワード比較部４にはキーワードコンテンツ
対応テーブル部５においてコンテンツに対応して記憶さ
れているキーワードも入力され（ステップＳ203）、両
キーワードはキーワード比較部４で比較され、画像認識
結果のキーワードに対応するキーワードがキーワードコ
ンテンツ対応テーブル部５から検出され出力される（ス
テップＳ204）。

【００３２】このキーワード比較部４から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
５が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部５から出力される
（ステップＳ205）。制御部６は、キーワードコンテン
ツ対応テーブル部５から出力されたコンテンツを受け取
ると、コンテンツ蓄積部７にアクセスし（ステップＳ20
6）、このコンテンツをコンテンツ蓄積部７から検索し
て読み出し（ステップＳ207）、この読み出したコンテ
ンツをコンテンツ出力部８から出力する（ステップＳ20
8）。

【００３３】図５は、本発明の第３の実施形態に係わる
コンテンツ検索方法の処理手順を示すフローチャートで
ある。同図に示すコンテンツ検索方法は、図１に示した
音声情報を対象としたコンテンツ検索装置と図３に示し
た画像情報を対象としたコンテンツ検索装置の両方の機
能を組み合わせたコンテンツ検索装置で構成されるもの
である。

【００３４】図５のコンテンツ検索処理では、まずオー
ディオビジュアル機器からの音声情報および画像情報が
それぞれ音声入力部１および画像入力部９を介して入力
されると（ステップＳ300,303）、この入力された音声
情報および画像情報は、それぞれ音声認識部２および画
像認識部１０で同期して音声認識および画像認識され
（ステップＳ301,304）、この音声および画像認識結果
がそれぞれキーワードとして音声認識結果通知部３およ
び画像認識結果通知部１１から出力される（ステップＳ
302,305）。

【００３５】音声認識結果通知部３および画像認識結果
通知部１１から出力された両キーワードは、比較され、
両認識結果が一致するか否かが判定される（ステップＳ
306）。両キーワードが一致する場合には、このキーワ
ードを対象とするキーワードとして出力されるが、一致
しない場合には、画像認識結果通知部１１から出力され
る画像認識結果のキーワードが対象とするキーワードと
して出力され（ステップＳ308）、キーワード比較部４
に入力されるとともに、またキーワード比較部４にはキ
ーワードコンテンツ対応テーブル部５においてコンテン
ツに対応して記憶されているキーワードも入力され（ス
テップＳ309）、両キーワードはキーワード比較部４で
比較され、認識結果の対象とするキーワードに対応する
キーワードがキーワードコンテンツ対応テーブル部５か
ら検出され出力される（ステップＳ310）。

【００３６】このキーワード比較部４から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
５が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部５から出力される
（ステップＳ311）。制御部６は、キーワードコンテン
ツ対応テーブル部５から出力されたコンテンツを受け取
ると、コンテンツ蓄積部７にアクセスし（ステップＳ31
2）、このコンテンツをコンテンツ蓄積部７から検索し
て読み出し（ステップＳ313）、この読み出したコンテ
ンツをコンテンツ出力部８から出力する（ステップＳ31
4）。

【００３７】図６は、本発明の第４の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図３に示した第２の実
施形態において入力画像情報から画像情報としてテロッ
プを認識し、このテロップから文字情報を切り出し、こ
の切り出した文字情報を認識結果のキーワードとするも
のであり、図３の実施形態の画像認識部１０および画像
認識結果通知部１１の代わりにテロップ認識部１２およ
びテロップ認識結果通知部１３を有する点が異なるもの
であり、その他の構成および作用は同じである。

【００３８】すなわち、図６におけるテロップ認識部１
２は、画像入力部９からの入力画像情報からテロップを
画像情報として認識するテロップ認識手段、およびこの
認識したテロップから文字情報を切り出し、この切り出
した文字情報を認識結果として出力する切り出し手段か
ら構成され、テロップ認識結果通知部１３は、この切り
出し手段から出力される認識結果をキーワードとして出
力するものである。

【００３９】図７に示すフローチャートを参照して、図
６に示す第４の実施形態の作用について説明する。

【００４０】オーディオビジュアル機器などからの画像
情報が画像入力部９を介して入力されると（ステップＳ
400）、この画像情報に含まれるテロップがテロップ認
識部１２で認識され（ステップＳ401）、この認識され
たテロップから文字情報が切り出され、テロップ認識結
果通知部１３からテロップ認識結果がキーワードとして
出力される（ステップＳ402）。

【００４１】画像認識結果通知部１１から出力されたキ
ーワードは、キーワード比較部４に入力されるととも
に、またキーワード比較部４にはキーワードコンテンツ
対応テーブル部５においてコンテンツに対応して記憶さ
れているキーワードも入力され（ステップＳ403）、両
キーワードはキーワード比較部４で比較され、テロップ
認識結果のキーワードに対応するキーワードがキーワー
ドコンテンツ対応テーブル部５から検出され出力される
（ステップＳ404）。

【００４２】このキーワード比較部４から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
５が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部５から出力される
（ステップＳ405）。制御部６は、キーワードコンテン
ツ対応テーブル部５から出力されたコンテンツを受け取
ると、コンテンツ蓄積部７にアクセスし（ステップＳ40
6）、このコンテンツをコンテンツ蓄積部７から検索し
て読み出し（ステップＳ407）、この読み出したコンテ
ンツをコンテンツ出力部８から出力する（ステップＳ40
8）。

【００４３】図８は、本発明の第５の実施形態に係わる
コンテンツ検索装置の構成を示すブロック図である。同
図に示すコンテンツ検索装置は、図６に示した第４の実
施形態においてテロップの代わりにキャプションを入力
画像情報から画像情報として認識し、このキャプション
から文字情報を切り出し、この切り出した文字情報を認
識結果のキーワードとするものであり、図６の実施形態
のテロップ認識部１２およびテロップ認識結果通知部１
３の代わりにキャプション認識部１４およびキャプショ
ン認識結果通知部１５を有する点が異なるものであり、
その他の構成および作用は同じである。

【００４４】すなわち、図８におけるキャプション認識
部１４は、画像入力部９からの入力画像情報からキャプ
ションを画像情報として認識するキャプション認識手
段、およびこの認識したキャプションから文字情報を切
り出し、この切り出した文字情報を認識結果として出力
する切り出し手段から構成され、キャプション認識結果
通知部１５は、この切り出し手段から出力される認識結
果をキーワードとして出力するものである。

【００４５】図９に示すフローチャートを参照して、図
８に示す第５の実施形態の作用について説明する。

【００４６】オーディオビジュアル機器などからの画像
情報が画像入力部９を介して入力されると（ステップＳ
500）、この画像情報に含まれるキャプションがキャプ
ション認識部１４で認識され（ステップＳ501）、この
認識されたキャプションから文字情報が切り出され、キ
ャプション認識結果通知部１５からキャプション認識結
果がキーワードとして出力される（ステップＳ502）。

【００４７】キャプション認識結果通知部１５から出力
されたキーワードは、キーワード比較部４に入力される
とともに、またキーワード比較部４にはキーワードコン
テンツ対応テーブル部５においてコンテンツに対応して
記憶されているキーワードも入力され（ステップＳ50
3）、両キーワードはキーワード比較部４で比較され、
キャプション認識結果のキーワードに対応するキーワー
ドがキーワードコンテンツ対応テーブル部５から検出さ
れ出力される（ステップＳ504）。

【００４８】このキーワード比較部４から出力されるキ
ーワードに対してキーワードコンテンツ対応テーブル部
５が検索され、該キーワードに対応するコンテンツがキ
ーワードコンテンツ対応テーブル部５から出力される
（ステップＳ505）。制御部６は、キーワードコンテン
ツ対応テーブル部５から出力されたコンテンツを受け取
ると、コンテンツ蓄積部７にアクセスし（ステップＳ50
6）、このコンテンツをコンテンツ蓄積部７から検索し
て読み出し（ステップＳ507）、この読み出したコンテ
ンツをコンテンツ出力部８から出力する（ステップＳ50
8）。

【００４９】なお、上述した各実施形態において、音声
認識または画像認識した認識結果をキーワードとして出
力する場合に、その推定確率が所定の閾値以下の場合に
は、該キーワードを出力せず、その旨を単にユーザに通
知するようにしている。また、上述したように認識され
たキーワードの数が一定個数の場合には、設定値を変更
して、すなわち基準となる出現確率を増加させて、認識
処理を繰り返し行うようにしている。なお、推定確率は
例えば音声認識においては尤度と呼ばれるものである。
次に、認識の対象となる音声、映像、文字などから推定
確率を求める処理について説明する。

【００５０】この処理では、まず上述した各実施形態で
説明したように、入力部から入力された音声情報や画像
情報などの入力コンテンツから特徴量を抽出する。この
特徴量は、例えば入力情報が音声であれば、ＬＰＣ（線
形予測分析）デルタケプトスラム等を用いて抽出され、
またテロップなどの画像であれば、特徴量は文字を表す
パターンなどである。

【００５１】特徴量が抽出されると、この特徴量に対応
するシンボルの候補を複数決定する。これは特徴量を見
出しとするシンボル（例えば、文字または文字の連鎖）
の候補と出現確率ｐ_ｉとの対応関係を多数格納したデー
タベースから特徴量に基づきシンボルの候補と出現確率
ｐ_ｉを決定することにより行われる。なお、ｉは文字列
を区別するための符号である。

【００５２】次に、このように決定された複数のシンボ
ルをつなぎ合わせて、キーワードの候補を複数決定す
る。これは、複数決定されたシンボルの候補を入力され
た順序につなぎ合わせるなどにより、ひとかたまりの文
字列、すなわちキーワードもどきの候補を複数決定する
ことにより行われる。この時、各文字列候補の生じる推
定確率は、出現確率ｐ_ｉの積ＴＴｉ・ｐｉで計算され
る。そして、決定された文字列の中から単語辞書によっ
て存在する単語を抽出する。但し、通常は文字列と単語
が一致することはなく、決定された文字列の中からプラ
ス・マイナス数文字の単語を更に選び出す。

【００５３】次に、上述したように決定された複数のキ
ーワードの中から推定確率が所定の閾値以上のものにつ
いて候補となる単語をキーワードとして選択し、この選
択したキーワードを上述した各実施形態において使用す
るようにしている。

【００５４】図１０および図１１は、本発明の第６の実
施形態に係わるコンテンツ検索方法の処理手順を示すフ
ローチャートである。両図に示すコンテンツ検索方法
は、上述した図１〜図９に示した各実施形態において入
力音声情報または入力画像情報から認識された認識結果
から誤った認識部分を判定して訂正し、訂正された認識
結果の候補を出力するものである。

【００５５】すなわち、図１０および図１１において
は、まず上述したように音声認識部２、画像認識部１
０、テロップ認識部１２、またはキャプション認識部１
４などで認識された認識結果の文章を受け取り、この文
章を形態素解析して、該文章を単語に分割するととも
に、単語の品詞を決定する（ステップＳ601）。それか
ら、この形態素解析された結果を入力として速覧処理
し、大局話題範囲と大局話題語を組にした大局話題リス
トを抽出する（ステップＳ602）。

【００５６】速覧処理では、文章を書くときの特有の言
い回しに基づいて、ある話題の継続する部分である大局
話題範囲と、その話題を表す単語である大局話題語を決
定する。大局話題とは、文章の上位レベルの話題であ
り、例えば、「章」などにおける話題のことである。出
力は、大局話題範囲と大局話題語を組にした大局話題リ
ストである。

【００５７】上述したように、大局話題範囲と大局話題
語を組にした大局話題リストが抽出されると、この大局
話題範囲と大局話題語を組みにした大局話題リストから
一つの組の大局話題を選択する（ステップＳ603）。そ
して、この選択した組の大局話題範囲に含まれている単
語から一つの単語を選択し、この単語を対象単語とする
（ステップＳ604）。対象単語は、以下の処理で前記認
識結果の正誤を判定し、誤りの場合は修正する対象とな
る単語である。

【００５８】次に、上述したように選択された対象単語
の認識が誤っているか正しいかの判定処理を行うべく、
まず大局話題が対象単語の概念の上位概念または下位概
念であるかについて上位・下位関係の有無を調べる（ス
テップＳ605）。この大局話題が対象単語の概念の上位
概念または下位概念であるかについての判定は、例えば
概念ツリーを利用して行う。概念ツリーは、木構造のル
ートを最上位の概念とし、各ノードに概念を割り当てた
ものである。ある２つの概念の間に上位・下位関係があ
るかどうかは、一方の概念からルートへのパス上に他方
の概念のノードがあるかどうか調べ、ある場合は上位・
下位関係がある場合であり、ない場合は上位・下位関係
はないと判定する。そして、上述したように大局話題リ
ストから選択した大局話題が対象単語の概念の上位概念
または下位概念である場合には、前記認識結果は正しい
ものと判定して、本処理は終了するが、そうでない場合
には、ステップＳ606に進み、類義語辞書により、大局
話題と対象単語に対して類義語の関係があるか否かの判
定を行う。類義語辞書は、例えば図１２に示すように、
一行に類義語の関係にある語が記述されている。すなわ
ち、大局話題と対象単語が類義語辞書の同一行にある場
合は、類義語の関係にあることが分かる。そして、この
ステップＳ606の判定の結果、大局話題が対象単語の類
義語である場合には、認識結果は正しいものと判定し
て、本処理は終了するが、そうでない場合には、図１１
のステップＳ701以降の誤り訂正処理に進む。

【００５９】すなわち、以上の誤り判定処理において、
大局話題と注目している対象単語に上位・下位概念の関
係もなく、類義語も関係のない場合は、前記認識結果は
誤りと判定され、図１１のステップＳ701以降の誤り訂
正処理に進む。なお、このような判定は、ある話題の下
位の話題は、上位の話題に何らかの関連のある話題であ
るという仮定によるものである。

【００６０】図１１のステップＳ701以降の誤り訂正処
理では、まず注目している対象単語の１文字違いの単語
を辞書から選び出す（ステップＳ701）。これは、正し
い認識結果の候補と思われる単語である。それから、こ
の選択した単語の中に大局話題語の類義語があるか否か
を判定し（ステップＳ702）、大局話題語の類義語があ
る場合は、この類義語を選択する（ステップＳ703）。

【００６１】次に、上述したように類義語を選択した場
合には、この類義語を現在選択されている単語として含
めて、また類義語がない場合には、先に選択した単語を
現在選択されている単語とし、この現在選択されている
単語から一つの単語を対象単語として取り出す（ステッ
プＳ704）。そして、この選択した対象単語と大局話題
語との概念距離を計算する（ステップＳ705）。概念距
離は、概念ツリー上の2つの概念を結ぶ最短のパスの長
さである。長さは、概念の間のアークの数で表す。

【００６２】それから、このように計算した概念距離が
保存している最小概念距離よりも小さいか否を判定し
（ステップＳ706）、小さい場合には、ステップＳ705で
計算した概念距離を最小概念距離として保存する（ステ
ップＳ707）。そして、この現在注目している対象単語
の訂正候補をステップＳ704で取り出した単語とする
（ステップＳ708）。

【００６３】次に、ステップＳ701で取り出した全ての
単語について上述したステップＳ704からステップＳ708
までの処理を行ったか否かを判定し、全ての単語につい
て同じ処理を繰り返し行う（ステップＳ709）。

【００６４】また、ステップＳ604で取り出した全ての
対象単語について上述したステップＳ604からステップ
Ｓ709までの処理を行ったか否かを判定し、全ての対象
単語について同じ処理を繰り返し行う（ステップＳ71
0）。

【００６５】更に、ステップＳ603で取り出した全ての
大局話題についてステップＳ603からステップＳ710まで
の処理を行ったか否を判定し、全ての大局話題について
同じ処理を繰り返し行う（ステップＳ711）。全ての大
局話題について同じ処理を繰り返し行った結果、誤認識
した単語の訂正候補がステップＳ708で保存された単語
として出力されることになる（ステップＳ712）。

【００６６】テキストコンテンツの意味上から話題を速
覧処理と称し、以下の方法により話題語が速覧処理によ
って抽出される。話題とは、通常、「ある事柄について
話されている主題」を表す。ここでは、特に、事柄に相
当する「主題」を段落中の名詞句で表現した語句を「話
題語」と呼び、話題語が含む文を「話題文」と称する。
そして、ある話題がもつスコープ、すなわち、ある話題
が継続的に主題となっている領域を「話題のスコープ」
と称する。勿論、ある「話題のスコープ」において、こ
れらの話題のスコープは、入れ子形式になる可能性もあ
る。ここでは、話題のスコープの入れ子構造を「話題レ
ベル」と称するが、本発明では、話題のレベルを２レベ
ルの有する構成としている。上位の話題レベルは、明示
的に話題が提示されるような大局的な話題（大局話題と
呼ぶ）が相当する。一方、明示的ではないが、局所的に
話題が細かく転換するような話題（ここでは「局所話
題」と呼ぶ）が下位の話題レベルに相当する。

【００６７】次に、このような話題抽出処理について図
１４に示すフローチャートを参照して説明する。

【００６８】図１４に示す話題抽出処理では、処理対象
文書入力処理として要約対象の文書が入力される（ステ
ップＳ810）。この処理対象文書入力処理では、入力さ
れた文書ファイルを開き、文書の内容を抽出する。この
ように入力された文書は次のステップＳ820で処理対象
文書形態素解析処理を受けて、形態素解析用辞書３１を
用いて形態素解析され、文書中に記述されている各文の
単語を確定するとともに、各単語の品詞、活用形などの
形態素情報を確定する。このように形態素解析された情
報は、話題単位確定処理を受ける（ステップＳ830）。

【００６９】なお、形態素解析とは、入力された文字列
を単語辞書に対して検索を行い、品詞情報(品詞)、文頭
可否情報(文頭可)、前方接続情報（前接）、後方接続情
報（後接）などの情報を取得する処理である。通常の単
語辞書では、ＴＲＥＩ辞書構造という特別な辞書構造を
行うことにより高速な検索を行えるようになっている。
辞書項目として、"ああ"、"あいさつ"、"あい"などがあ
る場合、それぞれの第一文字（ここでは、日本語である
ので、Ｃ言語の文字であり、アルファベットと異なり、
日本語文字２byteを指し示す）が同じもの、第二文字目
が同じものなど、それぞれ順次に、木構造的に構成され
る。そして、最後の文字まで、一致した場合には、その
単語辞書項目に対する品詞情報(品詞)、文頭可否情報
(文頭可)、前方接続情報（前接）、後方接続情報（後
接）などの情報記述される。

【００７０】文頭可否情報とは、文頭にあってよいかど
うかを示すフラグである。文頭可であれば、文頭に存在
してもよいが、文頭否であれば、文頭にあることが許可
されない単語ということになる。前方接続情報とは、前
の単語の品詞または属性が適正な場合だけ接続が許可さ
れ、前接で接続が許可されない単語の場合、候補として
削除される。同様に後方接続情報も、後の単語の品詞ま
たは属性が適正な場合だけ接続が許可され、後接で接続
が許可されない単語の場合、候補として削除される。こ
のような、品詞接続により、候補を選択する。最尤候補
は、コスト最小法とよぶ方法により選択する。

【００７１】最小コスト法とは、最もコストが最小なる
形態素候補を最尤候補とする処理方式である。形態素解
析において利用されるコストは、接続コストと単語コス
トの２種類のコストがある。接続コストは、ある単語と
単語を接続する場合に必要なコストである。単語と単語
であるため、単語＋該活用に対する接続コストは０とな
る。単語コストとは、その単語に関するコストであり、
例えば、使用頻度が高い単語は、コストが低くなる。ま
た、活用は単語ではないので、コストは０となる。形態
素解析により、テキスト部が単語単位に分解されると同
時に、各単語に尤も正しいと考えられる品詞が付与され
る。なお、図１３に示す話題構造における「Ａ社の特徴
について述べる」という例では、次に示す表１のように
形態素解析される。

【００７２】

【表1】次の話題単位確定処理（ステップＳ830）では、上述し
た処理対象文書形態素解析処理の形態素解析結果に基づ
いて、文書内に記述されている文を確定し、確定した文
を話題単位とする。この話題単位確定処理では、入力さ
れた文を話題単位に分割する。話題単位とは、通常の文
に近いが、話題があるなしにかかわらず、通常の１つの
話題が含まれると判断される単位である。通常は、文を
話題単位として認定するが、文頭に話題継続型手掛かり
句が出現した文については、話題のスコープが続いてい
るとして、複数の文を話題単位とする。以降、話題単位
ごとに処理が進められる。

【００７３】次の話題マーカ・話題手がかり句抽出処理
（ステップＳ840）においては、話題単位確定処理で確
定された話題単位ごとに、話題を明示的または非明示的
に示す後接単語である話題マーカや、話題を確定する手
がかりとなる文頭の接続詞より構成される話題手がかり
句を話題マーカ・話題手がかり句記憶部３３に記憶され
ている話題マーカ・話題手がかり句に基づき抽出する。

【００７４】話題マーカーは、話題をあらわす可能性の
ある名詞句が出現している可能性を表わす後置詞的役割
を有する。例えば、主題を明示する修辞句として、格助
詞「が」「を」、係助詞「は」、「について」などがあ
る。話題の導入は、「まず」「第一に」などの手掛かり
句から判断される。また、「１。」「第１章」などの文
章論理構造は、話題のスコープを明確にする。「これ
は、」「この結果」などは、話題が継続することを表わ
す。「〜に関して尋ねますが、」などのような疑問表
現、「たとえば」などのような例示表現は、局所話題を
導入するための修辞表現であると言える。

【００７５】話題語を決定する上で用いられる修辞句を
ここでは「話題マーカー」と呼ぶ。話題マーカーには、
話題の対象を抽出する役割を果たすマーカーであり、明
示マーカー、非明示マーカーがある。なお、この話題マ
ーカーの明示マーカーには、例えば「について」「に関
して」などがあり、また非明示マーカーには、例えば
「が」「を」「に」などがある。但し、明示マーカーは
語句を提示することしか機能を持たないマーカーであ
り、非明示マーカーは「が」や「を」のように主語、目
的語のような文法的役割を示す語が語句を提示するため
にも用いられるものである。

【００７６】また、直接的に話題語を明示するわけでは
ないが、文または単文が話題語を含む可能性のあること
を示す話題手掛かり句がある。話題手掛かり句は、話題
の意味的なまとまりを検出するための手掛かりとするも
のであり、この話題手掛かり句には、入れ子開始型、話
題転換型、入れ子終了型などがあり、入れ子開始型に
は、例えば「まず」「第１に」「最初に」などあり、ま
た話題転換型には、例えば「次に」「ところで」「第２
に」「第２に」などがあり、入れ子終了型には、例えば
「最後に」「終わりに」などがある。

【００７７】更に、話題手掛かり句には、話題の継続を
示す話題継続型手掛かり句や、話題開始、終了、転換型
手掛かり句などがあり、さらに、局所話題を抽出するた
めの手掛かりとして、例示、疑問表現がある。この例示
の例は、「例えば〜」「つまり〜」「具体的には〜」な
どがあり、前言を受けて、その具体例を導く表現のこと
である。また、疑問表現の例は、「〜か」「〜ですか」
「〜ますか」などというように疑問を示す語句のことで
ある。なお、これらの語句の利用は予め形態素解析によ
ってテキストを単語毎に分割し、各単語毎に品詞が与え
られたうえで、始めて特定されるものである。

【００７８】次のステップＳ850の顕著名詞句抽出処理
では、前記話題マーカ・話題手がかり句抽出処理で抽出
された各話題単位ごとの話題マーカおよび話題手がかり
句を基に話題の候補と考えられる顕著な名詞句を抽出す
る。話題マーカーの前にある単語中から、話題語の候補
である顕著名詞句が選別される。顕著名詞句とは、話題
語の候補として認定される可能性のある名詞句であり、
代名詞表現されている名詞など、単独で意味をなさない
名詞句について除いた名詞句である。もちろん、話題手
掛かり句(話題開始/転換/終了/継続)、例示表現、疑問
表現そのものは顕著名詞句にはならない。

【００７９】次の大局話題抽出処理（ステップＳ860）
では、前記話題マーカ・話題手がかり句抽出処理および
顕著名詞句抽出処理で抽出された話題マーカ、話題手が
かり句、および顕著名詞句に基づいて、大局的な話題を
抽出する。話題は、これらの話題マーカー、顕著名詞
句、話題手掛かり句の情報を用いて抽出される。例え
ば、図１３に示した話題構造の例では、話題マーカーは
アウトライン文字で、話題手掛かり句は下線で、最終的
に抽出された話題は四角で示されている。第一文では、
「において」という話題マーカーが抽出されている。第
二文では、「まず」「第一に」が話題手掛かり句として
抽出されている。

【００８０】大局話題は、大局話題導入部の検出および
大局話題の話題語抽出という手順で抽出される。

【００８１】大局話題導入部の検出においては、文章の
第一文であったり、話題手掛かり句を含む話題単位があ
る場合には、その話題単位を大局話題の導入部の候補と
する。話題単位の先頭の単文に顕著名詞句が含まれてい
る場合には、その話題単位を大局話題導入部と判定す
る。顕著名詞句がその話題単位にない場合には、次の話
題単位を話題導入部の候補とする。同様の処理を文末ま
でつづけ、大局話題導入部を決定する。これは、話題手
掛かり句がある周辺にはかならず大局話題導入部がある
という考え方に基づくものである。つまり、文章を書く
場合、話題手掛かり句で導入的な表現をした場合、話題
はその近くに必ずあるはずであるという考えに基づくも
のである。

【００８２】次に、大局話題の話題語検出においては、
大局話題導入部において抽出された顕著名詞句の中でも
っとも話題語として適切な名詞句を話題語として抽出す
る。以下の優先順位に基づき、かつ、最も最初に出現し
た名詞句を大局話題の話題語とする。

【００８３】（1）顕著名詞句が明示マーカーによっ
て提示されている場合、または固有名詞を含む顕著名詞
句の場合（2）固有名詞を含まない顕著名詞句の場合勿論、それ以前の大局話題導入部において抽出された話
題語とは重複する場合には話題語としては抽出しない。

【００８４】図１３に示した話題構造の例では、大局話
題として、最初の行から「Ａ社の特徴」、２番目の行か
ら「Ｘ業界」が抽出される。

【００８５】次のステップＳ870の局所話題抽出処理に
おいては、前記話題マーカ・話題手がかり句抽出処理お
よび顕著名詞句抽出処理で抽出された話題マーカ、話題
手がかり句および顕著名詞句と、さらに前記大局話題抽
出処理で抽出された大局話題に基づき、局所的に発生す
る局所的話題を抽出する。

【００８６】この局所話題の抽出においては、局所話題
は、「たとえば、」などの例示や、"〜と聞かれれば"な
どの疑問表現により局所的に話題が導入される場合のこ
とをいう。局所的に発生する話題であるため、話題の内
容を表現するには、ある程度の文数を必要とする。その
ため、局所話題では、話題単位がある数以上の文から表
現されることを最低条件とする。最低条件を満たした話
題単位の中で、顕著名詞句をもつものを局所話題の候補
とし、その中で、以下の優先度の高いもののうち、最も
最初に出現した顕著名詞句を局所話題の話題語とした。

【００８７】（1）顕著名詞句が疑問表現の直前にあ
る場合、または顕著名詞句が例示表現の直後にある場合（2）顕著名詞句が明示マーカーによって提示されて
いる場合、または顕著名詞句が大局話題導入部に含まれ
ている場合（3）どの大局話題にも含まれていない固有名詞が顕
著名詞句に含まれる場合勿論、局所話題は、大局話題導
入部に含まれてはならないし、直前の大局話題導入処理
で抽出した話題語と同一であってはならない。図１３に
示した話題構造の例では、「たとえば、Ｂ社の提携が
…」の部分が局所話題として抽出される。これらの局所
話題の導入部については、導入だけをチェックしている
だけで、局所話題がいつ終了したかはわからない。逆
に、通常の文章では、話題の導入には比較的明確に述べ
る性質があるが、終わりが曖昧であることが多々あり、
明確には話題のスコープを特定することができない。そ
のため、次の局所話題または大局話題が出現するまで
が、この局所話題のスコープであるということになる。

【００８８】このような方式により意味的な話題語が抽
出される。本意味話題語抽出処理により、図１３に示し
た話題構造に示す入力文例に適用し、意味的話題語を抽
出すると、この入力文例で「について」という話題マー
カーを検索し、この話題マーカー「について」の直前に
ある「Ａ社の特徴」が話題語として抽出される。

【００８９】上述したように、認識結果の誤りを訂正す
ることで、マッチングの精度をあげ、コンテンツが選択
され易くなり、クライアントからは多くの広告が配信さ
れ、ユーザは他種類の情報を得られるようになる。

【００９０】次に、図１５〜図１９に示すフローチャー
トを参照して、図１４のステップＳ830，Ｓ840，Ｓ85
0，Ｓ860，Ｓ870にそれぞれ示した話題単位確定処理、
話題マーカ・話題手掛かり句抽出処理、著名名詞句抽出
処理、大局話題抽出処理、および局所話題抽出処理につ
いて説明する。

【００９１】まず、図１５に示すフローチャートを参照
して、話題単位確定処理について説明する。

【００９２】図１５の話題単位確定処理では、まず話題
単位の数を計数するためのパラメータＴを1に設定し
（ステップＳ1001）、入力された文を文末まで読み込ん
だか否かを判定する（ステップＳ1003）。文末まで読み
込んだ場合には、本処理を終了するが、文末まで読み込
んでいない場合には、ステップＳ1005に進み、ステップ
Ｓ1005以降の処理を文末まで読み込むまで繰り返し行
う。

【００９３】ステップＳ1005では、前記処理対象文書形
態素解析処理で得られた単位毎の結果を順次入力して、
文が「。」句点で終了しているか否かを判定する（ステ
ップＳ1007）。「。」句点で終了している場合には、入
力した先頭から「。」までの部分を話題単位とし、パラ
メータＴを＋１する（ステップＳ1009）。「。」句点で
終了していない場合には、「・」や数字から始まる箇条
書きが連続しているか否かを判定する（ステップＳ101
1）。箇条書きが連続している場合には、「・」や数字
で始まる箇条書きの先頭から文末までの部分を話題単位
とし、パラメータＴを＋１する（ステップＳ1013）。

【００９４】箇条書きが連続していない場合には、形態
素解析の結果、文末表現の活用形が終止形となっている
か否かを判定する（ステップＳ1015）。終止形になって
いる場合には、形成素解析の結果、文末表現の活用形が
終止形となっている所から文末までの部分を話題単位と
する（ステップＳ1017）。

【００９５】ステップＳ1015の判定で終止形になってい
ない場合には、文字の間に複数のスペース（半角または
全角）があるか否かを判定する（ステップＳ1019）。文
字の間に複数のスペースがある場合には、文字の間に複
数のスペース（半角または全角）のある所から文末まで
の部分を話題単位とする（ステップＳ1021）。

【００９６】また、ステップＳ1019の判定で文字の間に
複数のスペースがない場合には、文がまだ継続している
と判断し（ステップＳ1023）、ステップＳ1003に戻り、
ステップＳ1005以降の処理を繰り返し行う。以上のよう
にして、話題単位が確定されることになる。

【００９７】次に、図１６に示すフローチャートを参照
して、話題マーカ・手掛かり句抽出処理について説明す
る。

【００９８】この処理では、まず話題単位文の数を計数
するためのパラメータＴを１に設定し（ステップＳ110
1）、このＴが最大値になったか否かを判定し（ステッ
プＳ1103）、最大値になった場合には、本処理を終了す
るが、最大値になっていない場合には、次のステップＳ
1105以降の処理をＴが最大値になるまで繰り返し行う。

【００９９】ステップＳ1105では、図１４に示す話題マ
ーカ・話題手がかり句記憶部３３に記憶されている話題
マーカ・話題手がかり句を読み込む。それから、話題単
位文Ｔの中の形態素を読み込み、形態素の数を計数する
ためのパラメータＭを１に設定する（ステップＳ110
7）。次に、話題単位文の中でＭ番目の形態素と話題マ
ーカ、話題手がかり句が一致しているか否かを判定する
（ステップＳ1109）。一致する場合には、話題単位毎に
一致した話題マーカ・話題手がかり句を蓄積記憶する
（ステップＳ1111）。

【０１００】ステップＳ1109の判定において一致してい
ない場合には、次の形態素をチェックし、パラメータＭ
を＋１する（ステップＳ1113）。それから、パラメータ
Ｍが形態素計数用パラメータの所定の最大値まで終了し
たか否かを判定し（ステップＳ1115）、終了していない
場合には、ステップＳ1109に戻って、同じ処理をパラメ
ータＭがその最大値になるまで繰り返し行うが、終了し
ている場合には、次の話題単位文の処理を行うべく、パ
ラメータＴを＋１して、ステップＳ1103に戻り（ステッ
プＳ1117）、ステップＳ1105以降の処理をパラメータＴ
が話題単位文計数用パラメータの所定の最大値になるま
で繰り返し行う。以上のようにして、話題マーカ・話題
手がかり句が抽出されることになる。

【０１０１】次に、図１７に示すフローチャートを参照
して、顕著名詞句抽出処理について説明する。

【０１０２】図１７の顕著名詞句抽出処理では、まず話
題単位文の数を計数するためのパラメータＴを１に設定
し（ステップＳ1201）、このＴが話題単位文計数用パラ
メータの所定の最大値になったか否かを判定し（ステッ
プＳ1203）、最大値になった場合には、本処理を終了す
るが、最大値になっていない場合には、次のステップＳ
1205以降の処理をＴが最大値になるまで繰り返し行う。

【０１０３】ステップＳ1205では、話題マーカ・話題手
がかり句で抽出された話題マーカ・話題手がかり句を読
み込む。それから、話題単位文の中で話題マーカがある
か否かを判定する（ステップＳ1207）。話題マーカがな
い場合には、ステップＳ1203に戻るが、話題マーカがあ
る場合には、この話題マーカの位置をＰとする（ステッ
プＳ1209）。

【０１０４】そして、この位置Ｐより前にある自立語を
抽出し記録する（ステップＳ1211）。それから、以上の
処理で文の先頭まできたか否かを判定し（ステップＳ12
13）、文の先頭まできた場合には、今まで記録した自立
語等を顕著名詞句として記録してステップＳ1203に戻る
（ステップＳ1215）。

【０１０５】文の先頭まできていない場合には、前の付
属語が「の」のような名詞句を接続する名詞句である場
合には、この名詞句を記録し、Ｐをこの付属語の位置に
設定する（ステップＳ1217）。それから、ステップＳ12
11に戻り、同じ処理を文の先頭まで繰り返し行う。

【０１０６】次に、図１８に示すフローチャートを参照
して、大局話題抽出処理について説明する。

【０１０７】図１８の大局話題抽出処理では、まず話題
単位の数を計数するためのパラメータＴを１に設定し
（ステップＳ1301）、このＴが話題単位計数用パラメー
タの所定の最大値になったか否かを判定し（ステップＳ
1303）、最大値になった場合には、本処理を終了する
が、最大値になっていない場合には、次のステップＳ13
05以降の処理をＴが最大値になるまで繰り返し行う。

【０１０８】ステップＳ1305では、話題マーカ・話題手
がかり句抽出処理で抽出された話題マーカ・話題手がか
り句を読み込み、また話題マーカ・話題手がかり句抽出
処理で話題単位を抽出する毎に話題単位計数用のパラメ
ータＴを＋１ずつインクリメントするとともに、また顕
著名詞句抽出処理で抽出された顕著名詞句を読み込む
（ステップＳ1305）。それから、話題単位計数用のパラ
メータＴ＝１であるか、すなわち文の先頭であるかまた
は話題手がかり句を有し、顕著名詞句を有するか否かを
判定する（ステップＳ1307）。有しない場合には、ステ
ップＳ1303に戻って，同じ処理を繰り返し行うが、有す
る場合には、話題単位計数用のパラメータＴで示される
話題単位を大局話題導入部として記録する（ステップＳ
1309）。

【０１０９】次に、明示マーカが後接続する顕著名詞句
であるか、顕著名詞句中に固有名詞を含むか、かつ今ま
で大局話題として記録されていないかどうかが判定され
る（ステップＳ1311）。そうである場合には、顕著名詞
句を大局話題として記録し、ステップＳ1303に戻り、同
じ処理をＴが話題単位用パラメータの所定の最大値にな
るまで繰り返すが（ステップＳ1313）、そうでない場合
には、更に明示マーカが後接続する顕著名詞句である
か、顕著名詞句中に固有名詞を含まないか、かつ今まで
大局話題として記録されていないかどうかが判定される
（ステップＳ1315）。そうである場合には、顕著名詞句
を大局話題として記録し、ステップＳ1303に戻り（ステ
ップＳ1317）、同じ処理をＴが最大値になるまで繰り返
し行う。以上の処理により大局話題が抽出されることに
なる。

【０１１０】次に、図１９に示すフローチャートを参照
して、局所話題抽出処理について説明する。

【０１１１】図１９の局所話題抽出処理では、まず大局
話題の数を計数するためのパラメータＴを１に設定し
（ステップＳ1401）、このＴが大局話題計数用パラメー
タの所定の最大値になったか否かを判定し（ステップＳ
1403）、最大値になった場合には、本処理を終了する
が、最大値になっていない場合には、次のステップＳ14
05以降の処理をＴが最大値になるまで繰り返し行う。

【０１１２】ステップＳ1405では、話題マーカ・話題手
がかり句抽出処理で抽出された話題マーカ・話題手、顕
著名詞句抽出処理で抽出された顕著名詞句、および大局
話題抽出処理で抽出された大局話題、大局話題導入部を
読み込むとともに、大局話題抽出処理で大局話題を抽出
する毎に大局話題計数用パラメータＴを＋１インクリメ
ントする（ステップＳ1405）。

【０１１３】それから、Ｔが１より大きいか否か（Ｔ＞
１）、すなわち文の先頭でないか否かおよび顕著名詞句
を有するか否かが判定される（ステップＳ1407）。否で
ある場合には、ステップＳ1403に戻るが、そうである場
合には、顕著名詞句が疑問表現の直前または例示表現の
直後にあり、かつ今まで大局話題として記録されていな
いか否かが判定される（ステップＳ1409）。そうである
場合には、顕著名詞句を局所話題として記録し、ステッ
プＳ1403に戻るが、そうでない場合には、更に顕著名詞
句が明示マーカに後接続するかまたは顕著名詞句が大局
話題導入部に含まれ、かつ今まで大局話題として記録さ
れていないか否かが判定される（ステップＳ1413）。そ
うである場合には、顕著名詞句を局所話題として記録
し、ステップＳ1403に戻るが、そうでない場合には、更
にどの大局話題にも含まれていない固有名詞が顕著名詞
に含まれ、かつ今まで大局話題として記録されていない
か否かが判定される（ステップＳ1417）。そうである場
合には、顕著名詞句を局所話題として記録し、ステップ
Ｓ1403に戻り（ステップＳ1419）、同じ処理をＴが大局
話題計数用パラメータの所定の最大値になるまで繰り返
し行う。以上の処理により局所話題が抽出されることに
なる。

【０１１４】なお、上記実施形態は、図示で示した装置
構成を有するコンテンツ検索装置について説明したが、
本発明はこのような構成装置に限定されるものでないこ
とは勿論であるとともに、更に本コンテンツ検索装置の
処理手順を実施するコンテンツ検索方法にも適用し得る
ものである。また、このようなコンテンツ検索方法の処
理手順をプログラムとして記録媒体に記録して、この記
録媒体をコンピュータシステムに組み込むとともに、該
記録媒体に記録されたプログラムをコンピュータシステ
ムにダウンロードまたはインストールし、該プログラム
でコンピュータシステムを作動させることにより、コン
テンツ検索方法を実施するコンテンツ検索装置として機
能させることができることは勿論であり、このような記
録媒体を用いることにより、その流通性を高めることが
できるものである。

【０１１５】

【発明の効果】以上説明したように、本発明によれば、
入力音声情報を音声認識した結果をキーワードとし、こ
のキーワードとキーワードコンテンツ対応テーブル手段
のキーワードとを比較して、音声認識結果のキーワード
に対応するキーワードを検出し、このキーワードに対応
するコンテンツをキーワードコンテンツ対応テーブル手
段から取得し、このコンテンツをコンテンツ蓄積手段か
ら検索して読み出して出力するので、ユーザ自身が手作
業でキーワードを入力する必要がなく、所望のコンテン
ツを取り出し得る適切なキーワードを音声認識により自
動的に抽出でき、ユーザに手間をかけたり、大きな負担
をかけることなく、ユーザの操作性を効率化することが
できる。

【０１１６】また、本発明によれば、入力画像情報を画
像認識した結果をキーワードとし、このキーワードとキ
ーワードコンテンツ対応テーブル手段のキーワードとを
比較して、画像認識結果のキーワードに対応するキーワ
ードをキーワードコンテンツ対応テーブル手段から検出
し、このキーワードに対応するコンテンツをキーワード
コンテンツ対応テーブル手段から取得し、このコンテン
ツをコンテンツ蓄積手段から検索して読み出して出力す
るので、ユーザ自身が手作業でキーワードを入力する必
要がなく、所望のコンテンツを取り出し得る適切なキー
ワードを画像認識により自動的に抽出でき、ユーザに手
間をかけたり、大きな負担をかけることなく、ユーザの
操作性を効率化することができる。

【０１１７】更に、発明によれば、入力音声情報の音声
認識と入力画像情報の画像認識を同期して行い、音声認
識結果のキーワードと画像認識結果のキーワードとを比
較し、一致しない場合には画像認識結果のキーワードを
対象キーワードとし、この対象キーワードとキーワード
コンテンツ対応テーブル手段のキーワードとを比較し
て、対象キーワードに対応するキーワードをキーワード
コンテンツ対応テーブル手段から検出し、このキーワー
ドに対応するコンテンツを取得し、このコンテンツをコ
ンテンツ蓄積手段から検索して読み出して出力するの
で、ユーザ自身が手作業でキーワードを入力する必要が
なく、所望のコンテンツを取り出し得る適切なキーワー
ドを画像認識により自動的に抽出でき、ユーザに手間を
かけたり、大きな負担をかけることなく、ユーザの操作
性を効率化することができる。

【０１１８】本発明によれば、入力画像情報からテロッ
プを画像情報として認識し、この認識したテロップから
文字情報を切り出し、この切り出した文字情報を画像認
識結果のキーワードとし、このキーワードとキーワード
コンテンツ対応テーブル手段のキーワードとを比較し
て、キーワードを検出し、このキーワードに対応するコ
ンテンツをキーワードコンテンツ対応テーブル手段から
取得し、このコンテンツをコンテンツ蓄積手段から検索
して読み出して出力するので、ユーザ自身が手作業でキ
ーワードを入力する必要がなく、所望のコンテンツを取
り出し得る適切なキーワードを画像認識により自動的に
抽出でき、ユーザに手間をかけたり、大きな負担をかけ
ることなく、ユーザの操作性を効率化することができ
る。

【０１１９】また、本発明によれば、入力画像情報から
キャプションを画像情報として認識し、このキャプショ
ンから文字情報を切り出し、この切り出した文字情報を
画像認識結果のキーワードとし、このキーワードとキー
ワードコンテンツ対応テーブル手段のキーワードとを比
較して、キーワードを検出し、このキーワードに対応す
るコンテンツをキーワードコンテンツ対応テーブル手段
から取得し、このコンテンツをコンテンツ蓄積手段から
検索して読み出して出力するので、ユーザ自身が手作業
でキーワードを入力する必要がなく、所望のコンテンツ
を取り出し得る適切なキーワードを画像認識により自動
的に抽出でき、ユーザに手間をかけたり、大きな負担を
かけることなく、ユーザの操作性を効率化することがで
きる。

【０１２０】更に、本発明によれば、音声認識結果を形
態素解析して、局所話題範囲を決定し、局所話題語の抽
出を行い、局所話題語に対して上位・下位概念関係およ
び類義語関係に基づき認識結果が誤認識であるか否かを
判定し、誤認識と判定された認識結果に対して一文字違
いの単語の類義語関係を有する単語を対象単語として選
択し、この対象単語と局所話題語との概念距離に基づき
認識結果に対する訂正候補を出力するので、認識結果が
誤ったとしても、正しい訂正候補のキーワードを取得で
き、適切なコンテンツを取得することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係わるコンテンツ検
索方法を実施するコンテンツ検索装置の構成を示すブロ
ック図である。

【図２】図１に示す第１の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。

【図３】本発明の第２の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。

【図４】図３に示す第２の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。

【図５】本発明の第３の実施形態に係わるコンテンツ検
索方法の処理手順を示すフローチャートである。

【図６】本発明の第４の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。

【図７】図６に示す第４の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。

【図８】本発明の第５の実施形態に係わるコンテンツ検
索装置の構成を示すブロック図である。

【図９】図８に示す第５の実施形態のコンテンツ検索装
置の作用を示すフローチャートである。

【図１０】本発明の第６の実施形態に係わるコンテンツ
検索方法の処理手順の一部を示すフローチャートであ
る。

【図１１】本発明の第６の実施形態に係わるコンテンツ
検索方法の処理手順の図１０に続く部分を示すフローチ
ャートである。

【図１２】類義語辞書の一例を示す図である。

【図１３】話題構造の例を示す図である。

【図１４】話題抽出処理を示すフローチャートである。

【図１５】図１４のステップＳ830における話題単位確
定処理を示すフローチャートである。

【図１６】図１４のステップＳ840における話題マーカ
・話題手掛かり句抽出処理を示すフローチャートであ
る。

【図１７】図１４のステップＳ850における著名名詞句
抽出処理を示すフローチャートである。

【図１８】図１４のステップＳ860における大局話題抽
出処理を示すフローチャートである。

【図１９】図１４のステップＳ870における局所話題抽
出処理を示すフローチャートである。

【符号の説明】

１音声入力部２音声認識部３音声認識結果通知部４キーワード比較部５キーワードコンテンツ対応テーブル部６制御部７コンテンツ蓄積部８コンテンツ出力部１０画像認識部１１画像認識結果通知部１２テロップ認識部１３テロップ認識結果通知部１４キャプション認識部１５キャプション認識結果通知部

───────────────────────────────────────────────────── フロントページの続き (72)発明者稲垣博人東京都千代田区大手町二丁目３番１号日本電信電話株式会社内Ｆターム(参考） 5B075 NK31 NK54 PP07 PP10 PP25

Claims

【特許請求の範囲】

【請求項１】音声情報を入力する音声入力手段と、この音声入力手段から入力される音声情報を認識する音
声認識手段と、この音声認識手段で認識された認識結果をキーワードと
して出力する音声認識結果通知手段と、複数のコンテンツを蓄積するコンテンツ蓄積手段と、各コンテンツに定められているキーワードを各コンテン
ツに対応してテーブルとして記憶管理するキーワードコ
ンテンツ対応テーブル手段と、前記音声認識結果通知手段から出力される音声認識結果
のキーワードと前記キーワードコンテンツ対応テーブル
手段においてコンテンツに対応して記憶管理されている
キーワードとを比較して、音声認識結果のキーワードに
対応するキーワードをキーワードコンテンツ対応テーブ
ル手段から検出して出力するキーワード比較手段と、このキーワード比較手段から出力されるキーワードに対
応するコンテンツを前記キーワードコンテンツ対応テー
ブル手段から取得し、このコンテンツを前記コンテンツ
蓄積手段から検索して読み出すように制御する制御手段
と、この制御手段の制御によりコンテンツ蓄積手段から読み
出されたコンテンツを出力するコンテンツ出力手段とを
有することを特徴とするコンテンツ検索装置。
【請求項２】画像情報を入力する画像入力手段と、この画像入力手段から入力される画像情報を認識する画
像認識手段と、この画像認識手段で認識された認識結果をキーワードと
して出力する画像認識結果通知手段と、複数のコンテンツを蓄積するコンテンツ蓄積手段と、各コンテンツに定められているキーワードを各コンテン
ツに対応してテーブルとして記憶管理するキーワードコ
ンテンツ対応テーブル手段と、前記画像認識結果通知手段から出力される画像認識結果
のキーワードと前記キーワードコンテンツ対応テーブル
手段においてコンテンツに対応して記憶管理されている
キーワードとを比較して、画像認識結果のキーワードに
対応するキーワードをキーワードコンテンツ対応テーブ
ル手段から検出して出力するキーワード比較手段と、このキーワード比較手段から出力されるキーワードに対
応するコンテンツを前記キーワードコンテンツ対応テー
ブル手段から取得し、このコンテンツを前記コンテンツ
蓄積手段から検索して読み出すように制御する制御手段
と、この制御手段の制御によりコンテンツ蓄積手段から読み
出されたコンテンツを出力するコンテンツ出力手段とを
有することを特徴とするコンテンツ検索装置。
【請求項３】音声情報を入力する音声入力手段と、この音声入力手段から入力される音声情報を認識する音
声認識手段と、この音声認識手段で認識された認識結果をキーワードと
して出力する音声認識結果通知手段と、前記音声情報の入力に同期して画像情報を入力する画像
入力手段と、この画像入力手段から入力される画像情報を前記音声情
報の認識処理に同期して認識する画像認識手段と、この画像認識手段で認識された認識結果をキーワードと
して出力する画像認識結果通知手段と、前記音声認識結果通知手段から出力されるキーワードと
画像認識結果通知手段から出力されるキーワードとを比
較し、両キーワードが一致するか否かを判定する比較判
定手段と、両キーワードが一致する場合には、該キーワードを対象
キーワードとし、一致しない場合には、画像認識結果通
知手段から出力される画像認識結果のキーワードを対象
キーワードとして選択するキーワード選択手段と、複数のコンテンツを蓄積するコンテンツ蓄積手段と、各コンテンツに定められているキーワードを各コンテン
ツに対応してテーブルとして記憶管理するキーワードコ
ンテンツ対応テーブル手段と、前記対象キーワードと前記キーワードコンテンツ対応テ
ーブル手段においてコンテンツに対応して記憶管理され
ているキーワードとを比較して、前記対象キーワードに
対応するキーワードをキーワードコンテンツ対応テーブ
ル手段から検出して出力するキーワード比較手段と、このキーワード比較手段から出力されるキーワードに対
応するコンテンツを前記キーワードコンテンツ対応テー
ブル手段から取得し、このコンテンツを前記コンテンツ
蓄積手段から検索して読み出すように制御する制御手段
と、この制御手段の制御によりコンテンツ蓄積手段から読み
出されたコンテンツを出力するコンテンツ出力手段とを
有することを特徴とするコンテンツ検索装置。
【請求項４】前記画像認識手段は、入力画像情報から
テロップを画像情報として認識するテロップ認識手段
と、この認識したテロップから文字情報を切り出し、こ
の切り出した文字情報を認識結果として出力する切り出
し手段とを有することを特徴とする請求項２または３記
載のコンテンツ検索装置。
【請求項５】前記画像認識手段は、入力画像情報から
キャプションを画像情報として認識するキャプション認
識手段と、この認識したキャプションから文字情報を切
り出し、この切り出した文字情報を認識結果として出力
する切り出し手段とを有することを特徴とする請求項２
または３記載のコンテンツ検索装置。
【請求項６】前記コンテンツ蓄積手段は、コンテンツ
検索装置の外部に設けられ、前記制御手段は、この外部
に設けられたコンテンツ蓄積手段にアクセスして、該コ
ンテンツ蓄積手段からコンテンツを読み出す外部アクセ
ス手段を有することを特徴とする請求項1乃至５のいず
れかに記載のコンテンツ検索装置。
【請求項７】前記コンテンツ蓄積手段は、着脱可能な
記録媒体で構成されていることを特徴とする請求項１乃
至５のいずれかに記載のコンテンツ検索装置。
【請求項８】前記キーワードコンテンツ対応テーブル
手段は、着脱可能な記録媒体で構成されていることを特
徴とする請求項１乃至７のいずれかに記載のコンテンツ
検索装置。
【請求項９】前記音声認識手段および画像認識手段で
認識された認識結果を形態素解析して、局所話題範囲を
決定し、局所話題語の抽出を行い、この抽出した局所話
題語に対して上位・下位概念関係および類義語関係に基
づき前記認識結果が誤認識であるか否かを判定する誤認
識判定手段と、この判定の結果、誤認識と判定された認
識結果に対して一文字違いの単語の類義語関係を有する
単語を対象単語として選択し、この対象単語と局所話題
語との概念距離に基づき前記認識結果に対する訂正候補
を出力する訂正候補出力手段とを有することを特徴とす
る請求項１または２または３記載のコンテンツ検索装
置。