JP7009840B2

JP7009840B2 - 情報処理装置、情報処理方法及び対話制御システム

Info

Publication number: JP7009840B2
Application number: JP2017165209A
Authority: JP
Inventors: 匠見馬場; 岳今井; 恵多比良; 美和岡林; 達郎松本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-08-30
Filing date: 2017-08-30
Publication date: 2022-01-26
Anticipated expiration: 2037-08-30
Also published as: US20190065623A1; US11170051B2; JP2019045937A

Description

本発明は、ウェブページを自動対話に適用する技術に関する。

対話形式で自動的にウェブページを読み上げるようにすれば、例えば多くのウェブページを提供するニュースサイトを活用して、幅広い分野に関して聴覚による情報提供を行える。

一般的に、ウェブページは、ブラウザによって表示されることを前提として作成されている。表示されたイメージに複数のテキスト表示領域が含まれる場合、閲覧者は、領域の配置や文字の大きさなども考慮して、興味に応じて読むべき領域を直感的に把握して、テキストを読み進める。

一方、自動対話において、ウェブページから抽出されたテキストをマシンターンにおいて自動的に読み上げる場合に、読み上げるテキストの順番が妥当でなければ、聞き手の理解を促すことにならない。

しかし、ウェブページから抽出されたテキストを読み上げる対話用の制御データを作成する準備段階で、作成者がその都度に聞き手の理解に配慮して読み上げる順を指示することは困難である。

特開２０１３－２１８６２７号公報特開２００４－３０３０９７号公報特表２０１５－５０２６０３号公報特開２０１２－０２７８５２号公報

本発明の目的は、一側面では、同種のウェブページを情報源とした自動対話を簡単に準備できるようにすることである。

一態様に係る情報処理装置は、（Ａ）第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、（Ｂ）特性データに基づいて、第２ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部とを有する。

一側面としては、同種のウェブページを情報源とした自動対話を簡単に準備できるようになる。

図１は、対話制御テーブルの構成例を示す図である。図２は、ウェブページの表示イメージ例を示す図である。図３は、特性テーブルの構成例を示す図である。図４は、フェーズを示す図である。図５は、ネットワーク構成例を示す図である。図６は、対話サーバのモジュール構成例を示す図である。図７は、第１準備処理フローを示す図である。図８は、領域名設定処理フローを示す図である。図９は、操作画面の例を示す図である。図１０は、領域処理フローを示す図である。図１１は、領域名の入力ウィンドウの例を示す図である。図１２は、次候補設定処理（Ａ）フローを示す図である。図１３は、テキスト表示領域間のドラッグ操作の例を示す図である。図１４は、契機文言設定処理（Ａ）フローを示す図である。図１５は、契機文言の入力ウィンドウの例を示す図である。図１６は、契機文言設定処理（Ａ）フローを示す図である。図１７は、第２準備処理（Ａ）フローを示す図である。図１８は、第２準備処理（Ａ）フローを示す図である。図１９は、選択条件設定処理（Ａ）フローを示す図である。図２０は、選択条件設定処理（Ａ）フローを示す図である。図２１は、提供処理（Ａ）フローを示す図である。図２２は、ユーザ端末のモジュール構成例を示す図である。図２３は、対話処理フローを示す図である。図２４は、適用処理フローを示す図である。図２５は、適用処理フローを示す図である。図２６は、適用処理フローを示す図である。図２７は、既定テーブルの例を示す図である。図２８は、次候補設定処理（Ｂ）フローを示す図である。図２９は、契機文言設定処理（Ｂ）フローを示す図である。図３０は、次候補設定処理（Ｃ）フローを示す図である。図３１は、契機文言設定処理（Ｃ）フローを示す図である。図３２は、次候補設定処理（Ｄ）フローを示す図である。図３３は、選択条件設定処理（Ｂ）フローを示す図である。図３４は、実施の形態６における対話制御テーブルの例を示す図である。図３５は、第２準備処理（Ｂ）フローを示す図である。図３６は、第２準備処理（Ｂ）フローを示す図である。図３７Ａは、第２準備処理（Ｃ）フローを示す図である。図３７Ｂは、第２準備処理（Ｃ）フローを示す図である。図３８は、提供処理（Ｂ）フローを示す図である。図３９Ａは、第２準備処理（Ｄ）フロー例を示す図である。図３９Ｂは、第２準備処理（Ｄ）フロー例を示す図である。図４０は、コンピュータの機能ブロック図である。

［実施の形態１］
まず、ユーザ端末においてユーザとの自動対話の制御に用いる対話制御テーブルについて説明する。図１に、対話制御テーブルの構成例を示す。対話制御テーブルは、ユーザ端末が発話する内容（発話コンテンツ）を含む対話制御データの例である。

対話制御テーブルは、ヘッダにページＵＲＬ（Uniform Resource Locator）を設定するためのフィールドを有している。ページＵＲＬは、対話制御テーブルの基礎となったウェブページの格納位置を示す。図２に、ページＵＲＬから取得されたウェブページの表示イメージの例を示す。このようなウェブページからテキストを抽出して発話内容として利用する。

対話制御テーブルは、発話内容に対応するレコードを有している。対話制御テーブルのレコードは、発話内容ＩＤが設定されるフィールドと、テキストデータが設定されるフィールドと、領域名が設定されるフィールドと、選択条件が設定されるフィールドと、リンク先のフィールドとを有している。

発話内容ＩＤは、発話内容を識別する。テキストデータは、発話内容に相当する。領域名は、当該テキストデータの抽出元となったテキスト表示領域の名前である。選択条件は、自動対話において当該発話内容が選択される条件である。選択条件が設定されるフィールドは、契機文言が設定されるフィールドと、次選択対象のフィールドと含んでいる。

契機文言は、ユーザの発言に含まれることを想定して、発話内容が選択される契機となるものである。次選択対象のフィールドには、当該テキストデータを読み上げたマシンターンの次のマシンターンにおいて読み上げられるテキストデータを特定する発話内容ＩＤである。リンク先のフィールドには、抽出元のテキスト表示領域がクリックされた場合のリンク先のＵＲＬが設定される。

図示した１番目のレコードは、発話内容ＩＤ：Ｔ１で特定されるテキストデータ「クマの子供、映像公開」は、領域名がタイトルであるテキスト表示領域から抽出されたことを示している。更に、１番目のレコードは、自動対話におけるユーザの発言に「要約」又は「大まかに」の契機文言が含まれていた場合に、次のマシンターンにおいて発話内容ＩＤ：Ｔ２の発話内容が選択されることを示している。つまり、ユーザ端末が「クマの子供、映像公開」という音声を出力した後に、ユーザが「大まかに」と発言すれば、続けてユーザ端末が「動物園は、生後２ヶ月を迎えたクマの子供の映像を公開した。」という文を発することになる。

上述した対話制御テーブルは、ウェブページの他に、当該ウェブページの特性を示すテーブルを参照して生成される。図３に、特性テーブルの構成例を示す。特性テーブルは、特性データの例である。特性テーブルは、ヘッダにドメイン名を設定するためのフィールドを有している。ドメイン名は、ウェブページを提供するサイトを特定する。つまり、当該特性テーブルは、当該ドメイン名を含むＵＲＬから取得したウェブページに適用されることを示している。

特性テーブルは、発話内容を抽出するテキスト表示領域に対応するレコードを有している。特性テーブルのレコードは、領域名が設定されるフィールドと、タグ条件が設定されるフィールドと、契機文言が設定されるフィールドと、次候補のフィールドとを有している。

領域名は、発話内容を抽出する元となるテキスト表示領域の名前である。タグ条件は、当該テキスト表示領域に関する構成要素、つまり構造化文書における記述部分を区切る階層的タグによって特定される。契機文言は、当該テキスト表示領域から抽出されたテキストデータが音声出力される契機となる文言である。次候補のフィールドには、当該テキストデータの音声出力の次のマシンターンで選択される発話内容の元となるテキスト表示領域の名前が設定される。

図示した１番目のレコードは、Ｂｏｄｙ＞ｄｉｖ＃ｍａｉｎ＞ｄｉｖ＃ｔｉｔｌｅのタグで特定される構成要素は、タイトルという名前のテキスト表示領域に関する記述部分であることを示している。また、１番目のレコードは、このテキスト表示領域から抽出されるテキストデータは、「話題」と言う文言を含むユーザの発言の後に音声出力することに適していることを示している。更に、１番目のレコードは、このテキスト表示領域から抽出される内容を発した後に、概要のテキスト表示領域から抽出される発話内容又は本文のテキスト表示領域から抽出される発話内容に移ることを想定していることを示している。

図４に、本実施の形態におけるフェーズを示す。また、図５に、ネットワーク構成例を示す。この例で、対話サーバ５０１、Ｗｅｂサーバ５０３及びユーザ端末５０５は、いずれもインターネットに接続している。

第１準備フェーズ（Ｓ４０１）では、対話サーバ５０１において第１準備処理を行う。第１準備処理では、上述した特性テーブル（図３）が生成される。第１準備処理は、例えば新たに利用するサイトを設定した場合に起動される。或いは、対象のサイトにおけるデータ更新を検出した場合に第１準備処理を起動するようにしてもよい。また、定期的に第１準備処理を起動するようにしてもよい。

第２準備フェーズ（Ｓ４０３）では、対話サーバ５０１において第２準備処理を行う。第２準備処理では、上述した対話制御テーブル（図１）が生成される。第２準備フェーズ（Ｓ４０３）は、第１準備フェーズ（Ｓ４０１）に直ぐに続いてもよく、第１準備フェーズ（Ｓ４０１）に続かなくてもよい。第２準備処理は、対象のサイトにおけるデータ更新を検出した場合に起動されるようにしてもよい。また、定期的に第２準備処理を起動するようにしてもよい。或いは、対話フェーズ（Ｓ４０５）の直前に、第２準備処理を起動するようにしてもよい。

対話フェーズ（Ｓ４０５）では、ユーザ端末５０５が対話サーバ５０１から対話制御テーブル（図１）を取得して、ユーザとの自動対話を行う。

図６に、対話サーバ５０１のモジュール構成例を示す。対話サーバ５０１は、取得部６０１、第１生成部６０３、第２生成部６０５及び提供部６０７を有する。

取得部６０１は、サイト内のウェブページを取得する。取得部６０１は、ウェブスクレイピングの技術を用いるようにしてもよい。第１生成部６０３は、特性テーブルを生成する。第２生成部６０５は、対話制御テーブルを生成する。提供部６０７は、ユーザ端末５０５に対話制御テーブルを提供する。提供部６０７は、受信部６１１、特定部６１３及び送信部６１５を含む。受信部６１１は、ユーザ端末５０５から対話制御テーブルの要求を受信する。特定部６１３は、要求に応じて対話制御テーブルを特定する。送信部６１５は、対話制御テーブルをユーザ端末５０５宛に送信する。

対話サーバ５０１は、更に、ＤＯＭ（Document Object Model）解析部６２１、形態素解析部６２３及びブラウザ６２５を有する。ＤＯＭ解析部６２１は、ＤＯＭ解析処理を行う。形態素解析部６２３は、形態素解析処理を行う。ブラウザ６２５は、構造化文書を解析してイメージを表示する。

対話サーバ５０１は、更に、検証部６３１及び修正部６３３を有する。検証部６３１は、生成した対話制御テーブルをチェックして、対話制御テーブルの生成が失敗したか否かを判定する。修正部６３３は、特性テーブルを修正する。

対話サーバ５０１は、更に、サイト記憶部６４１、ウェブページ記憶部６４３、特性データ記憶部６４５、制御データ記憶部６４７、単語データベース６４９、既定テーブル記憶部６５１及びクリック履歴記憶部６５３を有する。サイト記憶部６４１は、ウェブページ取得の対象となるサイトのドメイン名を記憶する。ウェブページ記憶部６４３は、ウェブページを記憶する。特性データ記憶部６４５は、特性テーブルを記憶する。制御データ記憶部６４７は、対話制御テーブルを記憶する。単語データベース６４９は、単語間の関連度、単語の特徴度及び単語の分類などに関するデータを提供する。既定テーブル記憶部６５１は、既定テーブルを記憶する。既定テーブルについては、図２７を用いて後述する。クリック履歴記憶部６５３は、テキスト表示領域がクリックされた履歴（クリック履歴）を記憶する。

上述した取得部６０１、第１生成部６０３、第２生成部６０５、提供部６０７、受信部６１１、特定部６１３、送信部６１５、ＤＯＭ解析部６２１、形態素解析部６２３、検証部６３１及び修正部６３３は、ハードウエア資源（例えば、図４０）と、以下で述べる処理を例えばＣＰＵ（Central Processing Unit）に実行させるプログラムとを用いて実現される。

上述したサイト記憶部６４１、ウェブページ記憶部６４３、特性データ記憶部６４５、制御データ記憶部６４７、単語データベース６４９、既定テーブル記憶部６５１及びクリック履歴記憶部６５３は、ハードウエア資源（例えば、図４０）を用いて実現される。

続いて、第１準備処理について説明する。図７に、第１準備処理フローを示す。取得部６０１は、サイト記憶部６４１に記憶されているドメイン名に基づいて、所定サイトからサンプルとなるウェブページを取得する（Ｓ７０１）。サンプルとなるウェブページは、任意である。ウェブページは、例えばＨＴＭＬ（HyperText Markup Language）文書やＸＭＬ（eXtensible Markup Language）文書のような構造化文書の形式であるものとする。

第１生成部６０３は、ヘッダにドメイン名を設定した新しい特性テーブルを生成する（Ｓ７０３）。この段階で、特性テーブルには、未だレコードが設けられていない。

第１生成部６０３は、ＤＯＭ解析部６２１によるＤＯＭ解析処理を実行させる（Ｓ７０５）。ＤＯＭ解析部６２１は、当該ウェブページに関するＤＯＭ解析処理において、構造化されたタグに基づいて、構造化文書であるウェブページに含まれるＤＯＭ要素を特定する。ＤＯＭ要素は、構成要素の例である。

第１生成部６０３は、テキスト表示領域に相当するＤＯＭ要素（テキスト表示に関する記述を含む構成要素）を特定する（Ｓ７０７）。そして、第１生成部６０３は、特性テーブルに当該テキスト表示領域に対応するレコードを設ける（Ｓ７０９）。

第１生成部６０３は、当該レコードに、構成要素を特定するタグ条件を設定する（Ｓ７１１）。そして、第１生成部６０３は、領域名設定処理を実行する（Ｓ７１３）。第１生成部６０３は、領域名設定処理において、Ｓ７０９で設けられたレコードに領域名を設定する。

図８に、領域名設定処理フローを示す。第１生成部６０３は、ブラウザ６２５から、展開されたウェブページのイメージを取得する（Ｓ８０１）。第１生成部６０３は、イメージにおけるテキスト表示領域に太枠を重ねて、操作画面を表示する（Ｓ８０３）。図９に、このとき表示される操作画面の例を示す。

第１生成部６０３は、テキスト表示領域内のクリック操作を検出したか否かを判定する（Ｓ８０５）。テキスト表示領域内のクリック操作を検出したと判定した場合には、第１生成部６０３は、当該テキスト表示領域に対応するレコードに領域名が設定されているか否かを判定する（Ｓ８０７）。当該テキスト表示領域に対応するレコードに領域名が既に設定されていると判定した場合には、Ｓ８０５の処理に戻る。

一方、当該テキスト表示領域に対応するレコードに未だ領域名が設定されていないと判定した場合には、第１生成部６０３は、領域処理を実行する（Ｓ８０９）。第１生成部６０３は、領域処理において、クリックされたテキスト表示領域に関する領域名を受け付ける。

図１０に、領域処理フローを示す。第１生成部６０３は、領域名の入力ウィンドウを表示する（Ｓ１００１）。図１１に、領域名の入力ウィンドウの例を示す。

第１生成部６０３は、ユーザ操作によって入力された領域名を受け付けて、入力ウィンドウを消去する（Ｓ１００３）。第１生成部６０３は、受け付けた領域名を、当該テキスト表示領域に対応するレコードに設定する（Ｓ１００５）。そして、第１生成部６０３は、テキスト表示領域に網掛けパターンを重ねて表示する（Ｓ１００７）。領域処理を終えると、呼び出し元の領域名設定処理に復帰する。

図８の説明に戻る。領域処理を終えると、Ｓ８０５の処理に戻る。

一方、Ｓ８０５においてテキスト表示領域内のクリック操作を検出していないと判定した場合には、第１生成部６０３は、取消ボタンをクリックされたか否かを判定する（Ｓ８１１）。取消ボタンをクリックされたと判定した場合には、第１生成部６０３は、特性テーブルに設定されている各領域名をクリアし（Ｓ８１３）。各網掛けパターンの表示を終える（Ｓ８１５）。そして、Ｓ８０５に示した処理に戻って、上述した処理を繰り返す。

一方、取消ボタンをクリックされていないと判定した場合には、第１生成部６０３は、確定ボタンをクリックされたか否かを判定する（Ｓ８１７）。確定ボタンをクリックされていないと判定した場合には、Ｓ８０５に示した処理に戻って、上述した処理を繰り返す。

一方、確定ボタンをクリックされたと判定した場合には、第１生成部６０３は、領域名が設定されていないレコードを削除する（Ｓ８１９）。以降、領域名が設定されたテキスト表示領域は発話内容を抽出する対象として選択されたものとして扱われ、それ以外のテキスト表示領域は発話内容を抽出する対象として選択されなかったものとして扱われる。

領域名設定処理を終えると、呼び出し元の第１準備処理に復帰する。

図７の説明に戻る。第１生成部６０３は、次候補設定処理を実行する（Ｓ７１５）。第１生成部６０３は、次候補設定処理において、Ｓ７０９で設けられたレコードに次候補の領域名を設定する。

本実施の形態では、次候補設定処理（Ａ）が実行される。図１２に、次候補設定処理（Ａ）フローを示す。第１生成部６０３は、展開されたウェブページのイメージを取得する（Ｓ１２０１）。第１生成部６０３は、イメージに含まれるテキスト表示領域のうち、先に選択されたテキスト表示領域に太枠を重ねて、操作画面を表示する（Ｓ１２０３）。先に表示した操作画面を利用する場合には、Ｓ１２０１及びＳ１２０３の処理を省くようにしてもよい。

第１生成部６０３は、或るテキスト表示領域から別のテキスト表示領域に到るドラッグ操作を検出したか否かを判定する（Ｓ１２０５）。図１３に、テキスト表示領域間のドラッグ操作の例を示す。矢印１３０１は、ドラッグ操作における検出点の軌跡を表している。この例で、１番目のテキスト表示領域が開始点を含み、２番目のテキスト表示領域が終了点を含む。

テキスト表示領域間のドラッグ操作を検出したと判定した場合には、第１生成部６０３は、開始点を含むテキスト表示領域に対応するレコードを特定する（Ｓ１２０７）。そして、第１生成部６０３は、当該レコードの次候補のフィールドに、終了点を含むテキスト表示領域の領域名を設定する（Ｓ１２０９）。

一方、Ｓ１２０５において、テキスト表示領域間のドラッグ操作を検出していないと判定した場合には、第１生成部６０３は、取消ボタンをクリックされたか否かを判定する（Ｓ１２１１）。取消ボタンをクリックされたと判定した場合には、第１生成部６０３は、第１生成部６０３は、特性テーブルにおける各次候補のフィールドをクリアする（Ｓ１２１３）。そして、Ｓ１２０５に示した処理に戻って、上述した処理を繰り返す。

一方、取消ボタンをクリックされなかったと判定した場合には、第１生成部６０３は、確定ボタンをクリックされたか否かを判定する（Ｓ１２１５）。確定ボタンをクリックされなかったと判定した場合には、Ｓ１２０５に示した処理に戻って、上述した処理を繰り返す。一方、確定ボタンをクリックされたと判定した場合には、次候補設定処理（Ａ）を終え、呼び出し元の第１準備処理に復帰する。

図７の説明に戻る。第１生成部６０３は、契機文言設定処理を実行する（Ｓ７１７）。第１生成部６０３は、契機文言設定処理において、Ｓ７０９で設けられたレコードに契機文言を設定する。

本実施の形態では、契機文言設定処理（Ａ）が実行される。図１４に、契機文言設定処理（Ａ）フローを示す。第１生成部６０３は、展開されたウェブページのイメージを取得する（Ｓ１４０１）。第１生成部６０３は、イメージに含まれるテキスト表示領域のうち、選択されたテキスト表示領域に太枠を重ねて、操作画面を表示する（Ｓ１４０３）。先に表示した操作画面を利用する場合には、Ｓ１４０１及びＳ１４０３の処理を省くようにしてもよい。

第１生成部６０３は、特性テーブルのレコードを１つ特定する（Ｓ１４０５）。第２生成部６０５は、例えば先頭から順番にレコードを１つ特定する。

第１生成部６０３は、当該レコードで特定されるテキスト表示領域に重ねて、契機文言の入力ウィンドウを表示する（Ｓ１４０７）。図１５に、契機文言の入力ウィンドウの例を示す。

第１生成部６０３は、ユーザ操作によって入力された契機文言を受け付けて、入力ウィンドウを消去する（Ｓ１４０９）。第１生成部６０３は、受け付けた契機文言を、当該レコードに設定する（Ｓ１４１１）。第１生成部６０３は、当該テキスト表示領域に網掛けパターンを重ねて表示する（Ｓ１４１３）。

第１生成部６０３は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ１４１５）。未特定のレコードがあると判定した場合には、Ｓ１４０５に示した処理に戻って、上述した処理を繰り返す。一方、未特定のレコードがないと判定した場合には、端子Ａを介して、図１６に示したＳ１６０１の処理に移る。

第１生成部６０３は、取消ボタンをクリックされたか否かを判定する（Ｓ１６０１）。取消ボタンをクリックされたと判定した場合には、第１生成部６０３は、特性テーブルに設定されている各契機文言をクリアし（Ｓ１６０３）、各網掛けパターンの表示を終える（Ｓ１６０５）。そして、端子Ｂを介して、図１４に示したＳ１４０５の処理に戻る。

一方、取消ボタンをクリックされていないと判定した場合には、第１生成部６０３は、確定ボタンをクリックされたか否かを判定する（Ｓ１６０７）。確定ボタンをクリックされていないと判定した場合には、Ｓ１６０１の処理に戻る。

一方、確定ボタンをクリックされたと判定した場合には、契機文言設定処理を終え、呼び出し元の第１準備処理に復帰する。

図７に示すように、契機文言設定処理から復帰すると、第１準備処理を終える。この段階で、所定サイトに関する特性テーブルが完成する。

続いて、第２準備処理について説明する。本実施の形態では、第２準備処理（Ａ）が実行される。図１７に、第２準備処理（Ａ）フローを示す。取得部６０１は、サイト内のウェブページを１つ取得する（Ｓ１７０１）。取得するウェブページの範囲は、任意である。取得部６０１は、サイトで保持するすべてのウェブページを取得するようにしてもよい。或るいは、取得部６０１は、一部のウェブページを取得するようにしてもよい。

第２生成部６０５は、ヘッダにページＵＲＬを設定した新しい対話制御テーブルを生成する（Ｓ１７０３）。この段階で、対話制御テーブルには、未だレコードが設けられていない。

第２生成部６０５は、特性テーブルのレコードを１つ特定する（Ｓ１７０５）。第２生成部６０５は、例えば先頭から順番にレコードを１つ特定する。

第２生成部６０５は、Ｓ１７０１で取得したウェブページから、当該レコードに設定されているタグ条件に合致する構成要素を抽出する（Ｓ１７０７）。このとき、ウェブページに関してＤＯＭ解析部６２１によるＤＯＭ解析処理を行って、第２生成部６０５は、ＤＯＭ解析処理の結果に基づいて、タグ条件に合致するＤＯＭ要素を特定するようにしてもよい。

第２生成部６０５は、対話制御テーブルに当該構成要素に対応するレコードを設ける（Ｓ１７０９）。第２生成部６０５は、発話内容ＩＤを割り当て、当該レコードに設定する（Ｓ１７１１）。

次に、第２生成部６０５は、当該構成要素に含まれるテキストデータを抽出する（Ｓ１７１３）。この抽出されるテキストデータは、当該構成要素におけるテキスト表示の記述に従って表示されるテキストに相当する。端子Ｃを介して、図１８に示したＳ１８０１の処理に移る。

第２生成部６０５は、図１７のＳ１７０９で設けた対話制御テーブルのレコードに、抽出したテキストデータを設定する（Ｓ１８０１）。更に、第２生成部６０５は、Ｓ１７０５で特定した特性テーブルのレコードに設定されている領域名を、対話制御テーブルの当該レコードに設定する（Ｓ１８０３）。

次に、第２生成部６０５は、当該構成要素にリンク先のＵＲＬが含まれるか否かを判定する（Ｓ１８０５）。例えば、領域名：関連ニュースの構成要素の場合には、当該ニュースのウェブページへリンクするためのＵＲＬが記述されている。

当該構成要素にリンク先のＵＲＬが含まれると判定した場合には、第２生成部６０５は、図１７のＳ１７０９で設けた対話制御テーブルのレコードにおけるリンク先のフィールドに、当該ＵＲＬを設定する（Ｓ１８０７）。Ｓ１８０５において、当該構成要素にリンク先のＵＲＬが含まれないと判定した場合には、そのままＳ１８０９の処理に移る。

第２生成部６０５は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ１８０９）。未特定のレコードがあると判定した場合には、端子Ｄを介して、図１７に示したＳ１７０５の処理に戻る。

一方、未特定のレコードがないと判定した場合には、第２生成部６０５は、選択条件設定処理を実行する（Ｓ１８１１）。第２生成部６０５は、選択条件設定処理を実行して、選択条件を設定する。

本実施の形態では、選択条件設定処理（Ａ）が実行される。図１９に、選択条件設定処理（Ａ）フローを示す。第２生成部６０５は、対話制御テーブルのレコードを１つ特定する（Ｓ１９０１）。第２生成部６０５は、例えば先頭から順番にレコードを１つ特定する。その場合、最初に発話内容ＩＤ：Ｔ１のレコードが特定される。

第２生成部６０５は、当該レコードに設定されている領域名を読む（Ｓ１９０３）。例えば発話内容ＩＤ：Ｔ１のレコードの場合には、領域名：タイトルが読まれる。

第２生成部６０５は、特性テーブルから当該領域名に対応する次候補を読む（Ｓ１９０５）。具体的には、第２生成部６０５は、当該領域名が設定されているレコードを特定し、当該レコードの次候補のフィールドに設定されている領域名を読む。例えば領域名：タイトルの場合、領域名の「概要」及び「本文」が読まれる。そして、端子Ｆを介して、図２０に示したＳ２００１の処理に移る。

第２生成部６０５は、Ｓ１９０５で読んだ次候補の領域名のうち、未処理の領域名があるか否かを判定する（Ｓ２００１）。未処理の次候補（領域名）があると判定した場合には、第２生成部６０５は、未処理の次候補（領域名）を１つ特定する（Ｓ２００３）。そして、第２生成部６０５は、特性テーブルにおいて、当該次候補（領域名）が設定されているレコードを特定する（Ｓ２００５）。例えば、次候補の領域名：概要が特定された場合には、図３に示した特性テーブルの第２レコードが特定される。

第２生成部６０５は、当該レコードに設定されている契機文言を読み（Ｓ２００７）、Ｓ１９０１で特定した対話制御テーブルのレコードに当該契機文言を設定する（Ｓ２００９）。例えば図３に示した特性テーブルの第２レコードに設定されている契機文言：「要約」及び「大まかに」が、図１に示した対話制御テーブルの第１レコードに設定される。

第２生成部６０５は、対話制御テーブルにおいて、Ｓ２００３で特定した次候補（領域名）に対応する発話内容ＩＤを特定する（Ｓ２０１１）。例えば次候補（領域名）が概要であれば、図１に示した対話制御テーブルにおいて領域名のフィールドに概要が設定されている第２レコードの発話内容ＩＤ：Ｔ２が特定される。

そして、第２生成部６０５は、Ｓ１９０１で特定した対話制御テーブルのレコードにおいて、Ｓ２００９で設定した契機文言に対応する次選択対象のフィールドに、当該発話内容ＩＤを設定する（Ｓ２０１３）。そして、Ｓ２００１に示した処理に戻って、上述した処理を繰り返す。例えば、契機文言：「要約」及び「大まかに」に対応する次選択対象として発話内容ＩＤ：Ｔ２が設定される。

Ｓ２００１において、未処理の次候補（領域名）がないと判定した場合には、第２生成部６０５は、対話制御テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ２０１５）。未特定のレコードがあると判定した場合には、端子Ｇを介して、図１９に示したＳ１９０１の処理に戻る。

一方、対話制御テーブルにおいて、未特定のレコードがないと判定した場合には、選択条件設定処理を終え、呼び出し元の第２準備処理に復帰する。

図１８の説明に戻る。選択条件設定処理から復帰すると、第２生成部６０５は、未取得のウェブページがあるか否かを判定する（Ｓ１８１３）。未取得のウェブページがあると判定した場合には、端子Ｅを介して、図１７に示したＳ１７０１の処理に戻る。

一方、未取得のウェブページがないと判定した場合には、第２準備処理を終える。この段階で、所定サイトのウェブページに基づく対話制御テーブルの生成が完了する。

続いて、対話フェーズ（Ｓ４０５）における対話サーバ５０１の処理について説明する。

対話フェーズ（Ｓ４０５）において、提供部６０７は、提供処理を実行する。本実施の形態では、提供処理（Ａ）が実行される。図２１に、提供処理（Ａ）フローを示す。受信部６１１は、ユーザ端末５０５から対話制御テーブルの要求を受信する（Ｓ２１０１）。上述した通り、対話制御テーブルの要求をテーブル要求という。テーブル要求には、文字列が付加されている場合と、ページＵＲＬが付加されている場合と、文字列とページＵＲＬとのいずれも付加されていない場合があるものとする。

特定部６１３は、受信したテーブル要求に文字列が付加されているか否かを判定する（Ｓ２１０３）。当該テーブル要求に文字列が付加されていると判定した場合には、特定部６１３は、当該文字列との関連度が高い対話制御テーブルを特定する（Ｓ２１０５）。例えば、特定部６１３は、単語データベース６４９を参照して当該文字列に含まれる特徴語を特定し、当該特徴語と関連度の高い単語を含むテキストデータを有する対話制御テーブルを選択する。

一方、当該テーブル要求に文字列が付加されていないと判定した場合には、特定部６１３は、当該テーブル要求にページＵＲＬが付加されているか否かを判定する（Ｓ２１０７）。当該テーブル要求にページＵＲＬが付加されていると判定した場合には、特定部６１３は、ページＵＲＬに対応する対話制御テーブルを特定する（Ｓ２１０９）。

一方、当該テーブル要求にページＵＲＬが付加されていないと判定した場合には、特定部６１３は、推奨する対話制御テーブルを特定する（Ｓ２１１１）。推奨する対話制御テーブルを特定する方法は、任意である。例えば、最新の対話制御テーブルを推奨するようにしてもよい。

送信部６１５は、特定した対話制御テーブルを要求元であるユーザ端末５０５宛に送信する（Ｓ２１１３）。そして、Ｓ２１０１に示した処理に戻って、上述した処理を繰り返す。

続いて、対話フェーズにおけるユーザ端末５０５の動作について説明する。図２２に、ユーザ端末５０５のモジュール構成例を示す。ユーザ端末５０５は、音声入力部２２０１、音声認識部２２０３、対話制御部２２０５、音声合成部２２０７及び音声出力部２２０９を有する。

音声入力部２２０１は、ユーザ音声を入力する。音声認識部２２０３は、ユーザ音声を認識してテキストを出力する。対話制御部２２０５は、ユーザとの自動対話を制御する。対話制御部２２０５は、送信部２２２１、受信部２２２３及び適用部２２２５を有する。送信部２２２１は、テーブル要求を送信する。受信部２２２３は、対話制御テーブルを受信する。適用部２２２５は、受信した対話制御テーブルに基づく自動対話を行う。音声合成部２２０７は、テキストに基づいて人工音声を合成する。音声出力部２２０９は、合成された人工音声を出力する。

上述した音声入力部２２０１、音声認識部２２０３、対話制御部２２０５、音声合成部２２０７、音声出力部２２０９、送信部２２２１、受信部２２２３及び適用部２２２５は、ハードウエア資源（例えば、図４０）と、以下で述べる処理を例えばＣＰＵに実行させるプログラムとを用いて実現される。

対話制御部２２０５による対話処理について説明する。図２３に、対話処理フローを示す。音声認識部２２０３は、音声入力部２２０１で入力した音声について音声認識処理を実行し、対話制御部２２０５は、音声認識部２２０３からユーザ発言の文字列を取得する（Ｓ２３０１）。

送信部２２２１は、ユーザ発言の文字列を付加したテーブル要求を、対話サーバ５０１宛に送信する（Ｓ２３０３）。

受信部２２２３は、取得部６０１から対話制御テーブルを受信すると（Ｓ２３０５）、適用部２２２５は、適用処理を実行する（Ｓ２３０７）。適用部２２２５は、適用処理において、対話制御テーブルを適用した自動対話を行い、更に次の対話制御テーブルを取得部６０１に求める処理も行う。

図２４に、適用処理フローを示す。適用部２２２５は、対話制御テーブルにおける１番目のレコードを特定する（Ｓ２４０１）。この例では、１番目の発話内容からマシン発話を開始するが、１番目以外の発話内容からマシン発話を開始するようにしてもよい。つまり、最初に特定するレコードを他の方法で決めるようにしてもよい。

適用部２２２５は、当該レコードに設定されているテキストデータを読む（Ｓ２４０３）。適用部２２２５は、当該テキストデータに基づいて音声合成部２２０７による音声合成処理を実行し、合成された人工音声を音声出力部２２０９において出力する（Ｓ２４０５）。そして、端子Ｈを介して、図２５に示したＳ２５０１の処理に移る。

音声認識部２２０３は、音声入力部２２０１で入力した音声について音声認識処理を実行し、適用部２２２５は、音声認識部２２０３からユーザ発言の文字列を取得する（Ｓ２５０１）。

適用部２２２５は、対象となっている対話制御テーブルのレコードに設定されている契機文言を読む（Ｓ２５０３）。そして、適用部２２２５は、ユーザ発言の文字列にいずれかの契機文言が含まれているか否かを判定する（Ｓ２５０５）。

ユーザ発言の文字列にいずれかの契機文言が含まれていると判定した場合には、適用部２２２５は、当該契機文言に対応する次選択対象の発話内容ＩＤを特定する（Ｓ２５０７）。そして、適用部２２２５は、当該発話内容ＩＤのレコードに設定されているテキストデータを読む（Ｓ２５０９）。そして、適用部２２２５は、当該テキストデータに基づいて音声合成部２２０７による音声合成処理を実行し、音声出力部２２０９において人工音声を出力する（Ｓ２５１１）。

そして、Ｓ２５０１に示した処理に戻って、上述した処理を繰り返す。以降のＳ２５０３の処理においては、Ｓ２５０７で特定された発話内容ＩＤのレコードを対象として処理を行うようにする。

Ｓ２５０５において、ユーザ発言の文字列にいずれの契機文言も含まれていないと判定した場合には、端子Ｉを介して、図２６に示したＳ２６０１の処理に移る。

適用部２２２５は、ユーザ発言の文字列に進行指示の文言が含まれているか否かを判定する（Ｓ２６０１）。進行指示の文言は、例えば「続けて」又は「進んで」のような文言である。

ユーザ発言の文字列に進行指示の文言が含まれていると判定した場合には、適用部２２２５は、対象となっている対話制御テーブルのレコードにリンク先のＵＲＬが設定されているか否かを判定する（Ｓ２６０３）。対象のレコードにリンク先のＵＲＬが設定されていると判定した場合には、適用部２２２５は、当該リンク先のＵＲＬ（ページＵＲＬに相当する）を付加したテーブル要求を対話サーバ５０１宛に送信する（Ｓ２６０５）。そして、適用処理を終えて、呼び出し元の対話処理に復帰する。

一方、Ｓ２６０１においてユーザ発言の文字列に進行指示の文言が含まれていないと判定した場合及びＳ２６０３において対象のレコードにリンク先のＵＲＬが設定されていないと判定した場合には、適用部２２２５は、ユーザ発言の文字列を付加したテーブル要求を対話サーバ５０１宛に送信する（Ｓ２６０７）。そして、適用処理を終えて、呼び出し元の対話処理に復帰する。

図２３の説明に戻る。適用処理を終えると、Ｓ２３０５に示した処理に戻って、上述した処理を繰り返す。

本実施の形態によれば、同種のウェブページを情報源とした自動対話を簡単に準備できる。

また、特性テーブルに基づいて対話制御テーブルに契機文言を設定するので、聞き手の興味に応じたマシン発話に資する。

［実施の形態２］
本実施の形態では、予め用意されている既定テーブルを参照して、領域名に応じて自動的に次候補及び契機文言を設定する例について説明する。

図２７に、既定テーブルの例を示す。既定テーブルは、想定される領域名に対応するレコードを有している。既定テーブルのレコードは、領域名が設定されるフィールドと、契機文言が設定されるフィールドと、次候補のフィールドとを有している。既定テーブルの各レコードは、領域名と契機文言とを対応付けていると共に、領域名と次候補となる領域名とを対応付けている。これらの対応付けは、想定に基づくものであってもよい。

本実施の形態では、次候補設定処理（Ａ）に代えて、次候補設定処理（Ｂ）を実行する。図２８に、次候補設定処理（Ｂ）フローを示す。第１生成部６０３は、特性テーブルのレコードを１つ特定する（Ｓ２８０１）。

第１生成部６０３は、当該レコードに設定されている領域名を読み（Ｓ２８０３）、既定テーブルから当該領域名に対応する次候補の領域名を取得する（Ｓ２８０５）。そして、第１生成部６０３は、取得した次候補の領域名を当該レコードの次候補のフィールドに設定する（Ｓ２８０７）。

第１生成部６０３は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ２８０９）。未特定のレコードがあると判定した場合には、Ｓ２８０１に示した処理に戻って、上述した処理を繰り返す。

一方、未特定のレコードがないと判定した場合には、次候補設定処理（Ｂ）を終え、呼び出し元の第１準備処理に復帰する。

また、本実施の形態では、契機文言設定処理（Ａ）に代えて、契機文言設定処理（Ｂ）を実行する。図２９に、契機文言設定処理（Ｂ）フローを示す。第１生成部６０３は、特性テーブルのレコードを１つ特定する（Ｓ２９０１）。

第１生成部６０３は、当該レコードに設定されている領域名を読み（Ｓ２９０３）、既定テーブルから当該領域名に対応する契機文言を取得する（Ｓ２９０５）。そして、第１生成部６０３は、取得した契機文言を当該レコードの次候補に設定する（Ｓ２９０７）。

第１生成部６０３は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ２９０９）。未特定のレコードがあると判定した場合には、Ｓ２９０１に示した処理に戻って、上述した処理を繰り返す。

一方、未特定のレコードがないと判定した場合には、契機文言設定処理（Ｂ）を終え、呼び出し元の第１準備処理に復帰する。

本実施の形態によれば、領域名に応じて自動的に次候補を設定するので、ユーザ操作によって次候補を設定する手間が省ける。

また、領域名に応じて自動的に契機文言を設定するので、ユーザ操作によって契機文言を設定する手間が省ける。

［実施の形態３］
本実施の形態では、他のサイトに関する特性テーブルを参照して、領域名に応じて自動的に次候補の領域名及び契機文言を設定する例について説明する。

本実施の形態では、次候補設定処理（Ａ）に代えて、次候補設定処理（Ｃ）を実行する。図３０に、次候補設定処理（Ｃ）フローを示す。第１生成部６０３は、特性テーブルのレコードを１つ特定する（Ｓ３００１）。

第１生成部６０３は、当該レコードに設定されている領域名を読み（Ｓ３００３）、他の特性テーブルから当該領域名に対応する次候補の領域名を取得する（Ｓ３００５）。そして、第１生成部６０３は、取得した次候補の領域名を当該レコードの次候補のフィールドに設定する（Ｓ３００７）。

第１生成部６０３は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ３００９）。未特定のレコードがあると判定した場合には、Ｓ３００１に示した処理に戻って、上述した処理を繰り返す。

一方、未特定のレコードがないと判定した場合には、次候補設定処理（Ｃ）を終え、呼び出し元の第１準備処理に復帰する。

また、本実施の形態では、契機文言設定処理（Ａ）に代えて、契機文言設定処理（Ｃ）を実行する。図３１に、契機文言設定処理（Ｃ）フローを示す。第１生成部６０３は、特性テーブルのレコードを１つ特定する（Ｓ３１０１）。

第１生成部６０３は、当該レコードに設定されている領域名を読み（Ｓ３１０３）、他の特性テーブルから当該領域名に対応する契機文言を取得する（Ｓ３１０５）。そして、第１生成部６０３は、取得した契機文言を当該レコードの次候補に設定する（Ｓ３１０７）。

第１生成部６０３は、特性テーブルにおいて、未特定のレコードがあるか否かを判定する（Ｓ３１０９）。未特定のレコードがあると判定した場合には、Ｓ３１０１に示した処理に戻って、上述した処理を繰り返す。

一方、未特定のレコードがないと判定した場合には、契機文言設定処理（Ｃ）を終え、呼び出し元の第１準備処理に復帰する。

［実施の形態４］
本実施の形態では、テキスト表示領域に対するクリック履歴に基づいて次候補を設定する例について説明する。

本実施の形態では、次候補設定処理（Ａ）に代えて、次候補設定処理（Ｄ）を実行する。図３２に、次候補設定処理（Ｄ）フローを示す。第１生成部６０３は、クリック履歴記憶部６５３に基づいて、テキスト表示領域のうち、クリック回数が最多のものを選択する（Ｓ３２０１）。

第１生成部６０３は、特性テーブルのレコードのうち、当該テキスト表示領域以外のレコードにおける次候補のフィールドに当該テキスト表示領域の領域名を設定する（Ｓ３２０３）。そして、次候補設定処理（Ｄ）を終え、呼び出し元の第１準備処理に復帰する。次候補設定処理（Ｄ）は、次候補設定処理（Ａ）乃至（Ｃ）のいずれかと併せて実行されるようにしてもよい。

本実施の形態によれば、次候補を設定する手間が省ける。

［実施の形態５］
本実施の形態では、発話内容に基づいて契機文言を設定する例について説明する。

本実施の形態では、選択条件設定処理（Ａ）に代えて、選択条件設定処理（Ｂ）を実行する。図３３に、選択条件設定処理（Ｂ）フローを示す。Ｓ１９０１の処理は、図１９の場合と同様である。

第２生成部６０５は、形態素解析処理によって、Ｓ１９０１で特定されたレコードに設定されているテキストデータに含まれる単語を特定する（Ｓ３３０１）。

第２生成部６０５は、特定した単語の中からキーワードを選択する（Ｓ３３０３）。例えば、第２生成部６０５は、単語データベース６４９を参照して特徴度の高い単語を選択する。

第２生成部６０５は、当該キーワードをＳ１９０１で特定されたレコードにおける契機文言のフィールドに設定する（Ｓ３３０５）。

その他の処理は、選択条件設定処理（Ａ）の場合と同様である。

本実施の形態によれば、発話内容に基づいて契機文言を特定するので、発話内容に即した契機文言を設定することができる。

［実施の形態６］
本実施の形態では、構成要素から抽出されたテキストデータを分割して、分割されたテキストデータに前後関係に基づく契機文言を設定する例について説明する。

図３４に、実施の形態６における対話制御テーブルの例を示す。この例では、本文のテキストデータ「動物園によると、クマの子供は、体長約××センチ、体重約××××グラムになった。公開された映像では、母親に抱かれ、順調に成長する様子がうかがえる。飼育員は、『母子ともに健康である。』と話している。」が所定の文字数を超えていると判定された。そして、本文のテキストデータは、所定の文字数以下のブロック「動物園によると、クマの子供は、体長約××センチ、体重約××××グラムになった。公開された映像では、母親に抱かれ、順調に成長する様子がうかがえる。」とブロック「飼育員は、『母子ともに健康である。』と話している。」に分割されている。

分割されたブロック、つまり部分的なテキストデータは、１つの発話内容として扱われる。但し、ブロックの前後関係を考慮した選択条件が設定されている。例えば、ユーザが「次に」と発言すれば、次のブロックが読み上げられるようになっている。また、ユーザが「前に」と発言すれば、前のブロックが読み上げられるようになっている。

本実施の形態では、第２準備処理（Ａ）に代えて、第２準備処理（Ｂ）を実行する。図３５に、第２準備処理（Ｂ）フローを示す。Ｓ１７０１乃至Ｓ１７０７の処理は、図１７の場合と同様である。

第２生成部６０５は、Ｓ１７０７で抽出された構成要素に対応するレコードの数を特定する（Ｓ３５０１）。具体的には、第２生成部６０５は、当該構成要素に含まれるテキストデータの文字数が所定値を超える場合に、当該所定値以下の文字数のブロックに、テキストデータを文単位で分割する。そして、第２生成部６０５は、分割したブロックの数をレコードの数とする。

レコードの数が２つ以上である場合、Ｓ１７０９の処理において、第２生成部６０５は、当該数のレコードを設けるようにする。

レコードの数が２つ以上である場合、Ｓ１７１１の処理において、第２生成部６０５は、各レコードに異なる発話内容ＩＤを割り当てるようにする。

レコードの数が２つ以上である場合、Ｓ１７１３の処理において、第２生成部６０５は、抽出したテキストデータから分割されたブロックを各レコードに割り当てる。

図３６の説明に移る。レコードの数が２つ以上である場合、Ｓ１８０１の処理において、第２生成部６０５は、割り当てたブロックを各レコードにおけるテキストデータのフィールドに設定する。

レコードの数が２つ以上である場合、Ｓ１８０３の処理において、第２生成部６０５は、各レコードに同様の領域名を設定する。尚、第２生成部６０５は、領域名にブロックの順番を表す数字を付加するようにしてもよい。

レコードの数が２つ以上である場合、Ｓ１８１１の処理において、各レコードに同様の選択条件を設定する。

同じ領域名のレコードの数が２つ以上である場合、第２生成部６０５は、選択条件を追加する（Ｓ３６０１）。

具体的には、第２生成部６０５は、最後のレコード以外のレコードについて、選択条件を追加する。追加される選択条件の契機文言には、例えば「次に」が設定される。また、次選択対象のフィールドには、次レコードを特定する発話内容ＩＤが設定される。第２生成部６０５は、更に最初のレコード以外のレコードについて、選択条件を追加する。追加される選択条件の契機文言には、例えば「前に」が設定される。また、次選択対象のフィールドには、前レコードを特定する発話内容ＩＤが設定される。

Ｓ１８１３の処理は、図１８の場合と同様である。

本実施の形態によれば、長いテキストを段階的にマシン発話できるようになる。

［実施の形態７］
本実施の形態では、リンク先のＵＲＬからウェブページを取得して、対話制御テーブルを生成する例について説明する。

本実施の形態では、第２準備処理（Ａ）に代えて、第２準備処理（Ｃ）を実行する。第２準備処理（Ｃ）において、図１７と同様の処理を行う。

続いて、図３７Ａに示したＳ１８０１乃至Ｓ１８１１の処理を行う。Ｓ１８０１乃至Ｓ１８１１の処理は、図１８の場合と同様である。Ｓ１８１１の処理を終えると、端子Ｊを介して、図３７Ｂに示したＳ３７０１の処理に移る。

第２生成部６０５は、Ｓ１８０７で設定したリンク先のＵＲＬと同じページＵＲＬの対話制御テーブルがあるか否かを判定する（Ｓ３７０１）。リンク先のＵＲＬと同じページＵＲＬの対話制御テーブルがあると判定した場合には、Ｓ１８１３の処理に移る。

一方、リンク先のＵＲＬと同じページＵＲＬの対話制御テーブルがないと判定した場合には、取得部６０１がリンク先のＵＲＬからウェブページを取得して、第２生成部６０５は、リンク先のＵＲＬに対応する対話制御テーブルを生成する（Ｓ３７０３）。対話制御テーブルを生成する処理は、図１７のＳ１７０３乃至図１８のＳ１８１１に示した処理と同様である。

本実施の形態によれば、リンク先のＵＲＬから取得したウェブページに関する対話制御テーブルを用意するので、自動対話における話題の展開に資する。

［実施の形態８］
本実施の形態では、ユーザ端末５０５が指定したページＵＲＬからウェブページを取得して、対話制御テーブルを生成する例について説明する。

本実施の形態では、提供処理（Ａ）に代えて、提供処理（Ｂ）を実行する。図３８に、提供処理（Ｂ）フローを示す。Ｓ２１０１乃至Ｓ２１０７の処理は、図２１の場合と同様である。

Ｓ２１０７において、Ｓ２１０１で受信したテーブル要求にページＵＲＬが付加されていると判定した場合には、特定部６１３は、ページＵＲＬに対応する対話制御テーブルがあるか否かを判定する（Ｓ３８０１）。ページＵＲＬに対応する対話制御テーブルがあると判定した場合には、Ｓ２１０９の処理に移る。Ｓ２１０９の処理は、図２１の場合と同様である。

一方、ページＵＲＬに対応する対話制御テーブルがないと判定した場合には、取得部６０１がページＵＲＬからウェブページを取得して、第２生成部６０５は、対話制御テーブルを生成する（Ｓ３８０３）。対話制御テーブルを生成する処理は、図１７のＳ１７０３乃至図１８のＳ１８１１に示した処理と同様である。そして、Ｓ２１１３において、送信部６１５は、生成した対話制御テーブルを要求元であるユーザ端末５０５宛に送信する。

Ｓ２１１１の処理は、図２１の場合と同様である。

本実施の形態によれば、指定されたページＵＲＬに従って対話制御テーブルを用意するので、話題の展開に資する。

［実施の形態９］
本実施の形態では、対話制御テーブルの生成が失敗したか否かを判定して、対話制御テーブルの生成が失敗したと判定した場合に、特性テーブルを修正する例について説明する。

本実施の形態では、第２準備処理（Ａ）に代えて、第２準備処理（Ｄ）を実行する。第２準備処理（Ｄ）において、図１７と同様の処理を行う。

続いて、図３９Ａに示したＳ１８０１乃至Ｓ１８１３の処理を行う。Ｓ１８０１乃至Ｓ１８１３の処理は、図１８の場合と同様である。Ｓ１８１３の処理を終えると、端子Ｋを介して、図３９Ｂに示したＳ３９０１の処理に移る。

検証部６３１は、生成した対話制御テーブルをチェックして、対話制御テーブルの生成が失敗したか否かを判定する（Ｓ３９０１）。例えば、検証部６３１は、対話制御テーブルの何れかのレコードに設定されているテキストデータの文字数が所定値を下回るか否かを判定する。そして、検証部６３１は、当該文字数が所定値以下である場合に、対話制御テーブルの生成が失敗したと判定する。一方、当該文字数が所定値以下ではない場合には、対話制御テーブルの生成が成功したと判定する。

修正部６３３は、対話制御テーブルの生成が失敗したか否かによって処理を分岐させる（Ｓ３９０３）。対話制御テーブルの生成が失敗していない場合には、そのまま第２準備処理（Ｄ）を終える。

一方、対話制御テーブルの生成が失敗している場合には、修正部６３３は、特性テーブルを修正する（Ｓ３９０５）。例えば、失敗した対話制御テーブルの基礎であるウェブページのＵＲＬと同じページＵＲＬに対応する対話制御テーブルが存在する場合には、過去のウェブページ、つまり現在構成と異なる構成に係るウェブページに関して正しく対話制御テーブルを導けたことを意味する。修正部６３３は、正しく導けた過去の対話制御テーブルに基づいて、特性テーブルを修正する。

具体的には、修正部６３３は、過去の対話制御テーブルに設定されているテキストデータと同様のテキストデータを含む構成要素を、現在のウェブページの構成要素の中から特定する。そして、修正部６３３は、過去の対話制御テーブルにおけるタグ条件を、特定した現在の構成要素を特定するタグの条件に書き換えることによって、現在の構成に従った特性テーブルに修正することができる。尚、この修正は、ウェブページの構成のみが変更になり、表示されるテキスト自体は変更になっていないことを前提としている。

修正部６３３は、失敗した対話制御テーブルを削除する（Ｓ３９０７）。修正部６３３は、エラー出力を行って（Ｓ３９０９）、第２準備処理（Ｄ）を終える。エラー出力を行った場合には、自動的に再度第２準備処理（Ｄ）を実行するようにしてもよい。

本実施の形態によれば、ウェブページの構成変更に対応することができる。

尚、対話サーバ５０１とユーザ端末５０５とは、一体の装置であってもよい。その場合に、対話サーバ５０１の提供部６０７と、ユーザ端末５０５の対話制御部２２０５は、ネットワークを介さずに内部的にデータを引き渡すようにしてもよい。

以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上述の機能ブロック構成はプログラムモジュール構成に一致しない場合もある。

また、上で説明した各記憶領域の構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ、処理の順番を入れ替えることや複数の処理を並列に実行させるようにしても良い。

なお、上で述べた対話サーバ５０１及びユーザ端末５０５は、コンピュータ装置であって、図４０に示すように、メモリ２５０１とＣＰＵ２５０３とハードディスク・ドライブ（ＨＤＤ：Hard Disk Drive）２５０５と表示装置２５０９に接続される表示制御部２５０７とリムーバブル・ディスク２５１１用のドライブ装置２５１３と入力装置２５１５とネットワークに接続するための通信制御部２５１７とがバス２５１９で接続されている。オペレーティング・システム（ＯＳ：Operating System）及び本実施例における処理を実施するためのアプリケーション・プログラムは、ＨＤＤ２５０５に格納されており、ＣＰＵ２５０３により実行される際にはＨＤＤ２５０５からメモリ２５０１に読み出される。ＣＰＵ２５０３は、アプリケーション・プログラムの処理内容に応じて表示制御部２５０７、通信制御部２５１７、ドライブ装置２５１３を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ２５０１に格納されるが、ＨＤＤ２５０５に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク２５１１に格納されて頒布され、ドライブ装置２５１３からＨＤＤ２５０５にインストールされる。インターネットなどのネットワーク及び通信制御部２５１７を経由して、ＨＤＤ２５０５にインストールされる場合もある。このようなコンピュータ装置は、上で述べたＣＰＵ２５０３、メモリ２５０１などのハードウエアとＯＳ及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。

以上述べた本発明の実施の形態をまとめると、以下のようになる。

本実施の形態に係る情報処理装置は、（Ａ）第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、（Ｂ）特性データに基づいて、第２ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部とを有する。

このようにすれば、同種のウェブページを情報源とした自動対話を簡単に準備できる。

更に、上記第１生成部は、第１前後関係を適用する契機となる文言を特性データに設定するようにしてもよい。また、上記第２生成部は、自動認識したユーザ発言に当該文言が含まれる場合に、第１前後関係に基づく第２前後関係を適用して次に読み上げるテキストを選択する条件を対話制御データに設定するようにしてもよい。

このようにすれば、聞き手の興味に応じたマシン発話に資する。

更に、上記第１生成部は、テキスト表示領域の名前に応じて第１前後関係を設定するようにしてもよい。

このようにすれば、第１前後関係を設定する手間が省ける。

更に、上記第１生成部は、テキスト表示領域の名前に応じて上記文言を設定するようにしてもよい。

このようにすれば、上記文言を設定する手間が省ける。

更に、上記第１生成部は、テキスト表示領域に対するユーザ指示の履歴に基づいて第１前後関係を設定するようにしてもよい。

更に、上記第２生成部は、上記構成要素から抽出されたテキストに基づいて上記文言を特定するようにしてもよい。

このようにすれば、テキストに即した文言を設定することができる。

更に、上記第２生成部は、上記構成要素から抽出されたテキストを分割して、分割されたテキスト間に第３前後関係を設定するようにしてもよい。

このようにすれば、長いテキストを段階的にマシン発話できるようになる。

更に、上記情報処理装置は、上記構成要素にリンク先が設定されている場合に、当該リンク先から第２ウェブページを取得する取得部を有するようにしてもよい。

このようにすれば、自動対話における話題の展開に資する。

更に、上記情報処理装置は、格納位置が指定されて対話制御データを要求された場合に、当該格納位置から第２ウェブページを取得する取得部を有するようにしてもよい。

更に、上記情報処理装置は、対話制御データの生成が失敗したか否かを判定する判定部を有するようにしてもよい。また、上記情報処理装置は、対話制御データの生成が失敗したと判定した場合に、特性データを修正する修正部を有するようにしてもよい。

このようにすれば、ウェブページの構成変更に対応することができる。

なお、上で述べた情報処理装置による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、ＣＤ－ＲＯＭ、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納されるようにしてもよい。尚、中間的な処理結果は、一般的にメインメモリ等の記憶装置に一時保管される。

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）
第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、
前記特性データに基づいて、第２ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部と
を有する情報処理装置。

（付記２）
前記第１生成部は、前記第１前後関係を適用する契機となる文言を前記特性データに設定し、
前記第２生成部は、自動認識したユーザ発言に当該文言が含まれる場合に、前記第１前後関係に基づく前記第２前後関係を適用して次に読み上げる前記テキストを選択する条件を前記対話制御データに設定する
付記１記載の情報処理装置。

（付記３）
前記第１生成部は、前記テキスト表示領域の名前に応じて前記第１前後関係を設定する
付記１又は２記載の情報処理装置。

（付記４）
前記第１生成部は、前記テキスト表示領域の名前に応じて前記文言を設定する
付記２記載の情報処理装置。

（付記５）
前記第１生成部は、前記テキスト表示領域に対するユーザ指示の履歴に基づいて前記第１前後関係を設定する
付記１又は２記載の情報処理装置。

（付記６）
前記第２生成部は、前記構成要素から抽出された前記テキストに基づいて前記文言を特定する
付記２記載の情報処理装置。

（付記７）
前記第２生成部は、前記構成要素から抽出された前記テキストを分割して、分割されたテキスト間に第３前後関係を設定する
付記１乃至６のいずれか１つ記載の情報処理装置。

（付記８）
更に、
前記構成要素にリンク先が設定されている場合に、当該リンク先から前記第２ウェブページを取得する取得部
を有する付記１乃至７のいずれか１つ記載の情報処理装置。

（付記９）
更に、
格納位置が指定されて前記対話制御データを要求された場合に、当該格納位置から前記第２ウェブページを取得する取得部
を有する付記１乃至７のいずれか１つ記載の情報処理装置。

（付記１０）
更に、
前記対話制御データの生成が失敗したか否かを判定する判定部と、
前記対話制御データの生成が失敗したと判定した場合に、前記特性データを修正する修正部と
を有する付記１乃至９のいずれか１つ記載の情報処理装置。

（付記１１）
第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成し、
前記特性データに基づいて、第２ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する
処理を含み、コンピュータにより実行される情報処理方法。

（付記１２）
第１情報処理装置と第２情報処理装置とを含む対話制御システムであって、
前記第１情報処理装置は、
第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、
前記特性データに基づいて、第２ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部と
を有し、
前記第２情報処理装置は、
前記対話制御データに基づいて自動対話を行う制御部
を有する対話制御システム。

５０１対話サーバ５０３Ｗｅｂサーバ
５０５ユーザ端末６０１取得部
６０３第１生成部６０５第２生成部
６０７提供部６１１受信部
６１３特定部６１５送信部
６２１ＤＯＭ解析部６２３形態素解析部
６２５ブラウザ６３１検証部
６３３修正部６４１サイト記憶部
６４３ウェブページ記憶部６４５特性データ記憶部
６４７制御データ記憶部６４９単語データベース
６５１既定テーブル記憶部６５３クリック履歴記憶部
２２０１音声入力部２２０３音声認識部
２２０５対話制御部２２０７音声合成部
２２０９音声出力部２２２１送信部
２２２３受信部２２２５適用部

Claims

第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、
前記特性データに基づいて、前記第１ウェブページのサイトと同一サイトに含まれるか又は前記第１ウェブページと同種の第２ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部と
を有する情報処理装置。
前記第１生成部は、前記第１前後関係に従ってあるテキスト表示領域から他のテキスト表示領域へ遷移させる契機となる文言を、前記特性データに設定し、
前記第２生成部は、
前記特性データの前記第１前後関係における前記あるテキスト表示領域に対応し且つ前記第２ウェブページに含まれるテキスト表示領域の第１テキストから、前記第１前後関係における前記他のテキスト表示領域に対応し且つ前記第２ウェブページに含まれるテキスト表示領域の第２テキストへ遷移させる第２前後関係について、前記第１テキストから前記第２のテキストへ遷移させる契機となる文言として、前記特性データに設定された前記文言を、前記対話制御データに設定する
請求項１記載の情報処理装置。
前記第１生成部は、前記テキスト表示領域の名前に応じて前記第１前後関係を設定する
請求項１又は２記載の情報処理装置。
前記第１生成部は、前記テキスト表示領域の名前に応じて前記文言を設定する
請求項２記載の情報処理装置。
前記第１生成部は、前記テキスト表示領域に対するユーザ指示の履歴に基づいて前記第１前後関係を設定する
請求項１又は２記載の情報処理装置。
前記第２生成部は、前記構成要素から抽出された前記テキストに基づいて前記文言を特定する
請求項２記載の情報処理装置。
前記第２生成部は、前記構成要素から抽出された前記テキストを分割して、分割されたテキスト間に第３前後関係を設定する
請求項１乃至６のいずれか１つ記載の情報処理装置。
更に、
前記構成要素にリンク先が設定されている場合に、当該リンク先から第３ウェブページを取得する取得部
を有し、
前記第２生成部が、前記第３ウェブページについて対話制御データを生成する
請求項１乃至７のいずれか１つ記載の情報処理装置。
第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成し、
前記特性データに基づいて、前記第１ウェブページのサイトと同一サイトに含まれるか又は前記第１ウェブページと同種の第２ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する
処理を含み、コンピュータにより実行される情報処理方法。
第１情報処理装置と第２情報処理装置とを含む対話制御システムであって、
前記第１情報処理装置は、
第１ウェブページの表示イメージに含まれるテキスト表示領域間について第１前後関係を設定した特性データを生成する第１生成部と、
前記特性データに基づいて、前記第１ウェブページのサイトと同一サイトに含まれるか又は前記第１ウェブページと同種の第２ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第２前後関係を設定した対話制御データを生成する第２生成部と
を有し、
前記第２情報処理装置は、
前記対話制御データに基づいて自動対話を行う制御部
を有する対話制御システム。