JP2006235671A - 会話装置及びコンピュータ読み取り可能な記録媒体。 - Google Patents
会話装置及びコンピュータ読み取り可能な記録媒体。 Download PDFInfo
- Publication number
- JP2006235671A JP2006235671A JP2005044948A JP2005044948A JP2006235671A JP 2006235671 A JP2006235671 A JP 2006235671A JP 2005044948 A JP2005044948 A JP 2005044948A JP 2005044948 A JP2005044948 A JP 2005044948A JP 2006235671 A JP2006235671 A JP 2006235671A
- Authority
- JP
- Japan
- Prior art keywords
- file
- text
- keyword
- voice
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
【課題】利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示または音声で対応する会話装置において、利用者が自分の嗜好により仮想人物の映像やテキスト等のリンクを簡単に設定でき、背景音や肉声を容易に使用できるようにする。
【解決手段】利用者が入力したテキスト、または入力した音声から認識されたテキストの中から所定のキーワードを検索し、このキーワードにリンクされた仮想人物の動画ファイル、テキストファイル、音声ファイルなどをデータ格納部7から取得して合成した合成ファイルをもとに、仮想人物がテキストまたは音声を伴って答える映像を、表示部によって表示する。その際に、キーワードを任意に設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、複数のテキストファイルまたは複数の音声ファイルの中から任意のファイルを選択し、リンク関係を記憶部に記憶する。
【選択図】図1
【解決手段】利用者が入力したテキスト、または入力した音声から認識されたテキストの中から所定のキーワードを検索し、このキーワードにリンクされた仮想人物の動画ファイル、テキストファイル、音声ファイルなどをデータ格納部7から取得して合成した合成ファイルをもとに、仮想人物がテキストまたは音声を伴って答える映像を、表示部によって表示する。その際に、キーワードを任意に設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、複数のテキストファイルまたは複数の音声ファイルの中から任意のファイルを選択し、リンク関係を記憶部に記憶する。
【選択図】図1
Description
この発明は、利用者の音声入力などに対し、映像で表現された仮想人物が音声などで答える会話装置に関する。
利用者の音声入力などに対し、映像で表現された仮想人物(ロボット)が音声などで答える会話装置には、例えば、下記の特許文献1が存在する。
特開2000-259601 この特許文献1の装置では、コンピュータを用いて、利用者が音声入力を行うと、その入力を音声認識部が認識して、応答文構築部が応答文を構築し、その応答文をもとにして合成された音声と、応答文に応じた仮想人物の動作の映像が生成されて、ディスプレイなどに表示される。
しかしながら、前記特許文献1の装置では、
(1)利用者が各キーワードに対する映像や文章等のリンクを簡単に設定することができない。
すなわち、前記特許文献1では、応答に関する台本等のデータ書き換えを行う記載があるものの、この書き換えに関しては、利用者が仮想人物を自分の嗜好性に合うように変えたいと思ったときに、どのような手続および手段でそれをなし得るのかが不明である。また、この仮想人物をどこまで自分の好みに近づけられるかは不明である。
(1)利用者が各キーワードに対する映像や文章等のリンクを簡単に設定することができない。
すなわち、前記特許文献1では、応答に関する台本等のデータ書き換えを行う記載があるものの、この書き換えに関しては、利用者が仮想人物を自分の嗜好性に合うように変えたいと思ったときに、どのような手続および手段でそれをなし得るのかが不明である。また、この仮想人物をどこまで自分の好みに近づけられるかは不明である。
つまり、利用者YがAという言葉を含んだ文章を入力した際、それに対して映像で示される仮想人物Bに、Cという表情およびしぐさを伴いつつ、Dという言葉を返して欲しいと考え、なおかつその場面の背景にGという効果音を伴った表現をこの仮想人物に求めたとする。さらにこの利用者Yは、自分がこの仮想人物Bに話しかける際、自分の話しかけのひとつひとつに対し、自分の好むとおりの表情、しぐさ、言葉、背景等を変化させて完全に自分の嗜好性に合うような対応をこの仮想人物Bに実行させたいと考えたとする。
そして、上記利用者Yは、この特許文献1のソフトを利用してすぐに人物Bの表情や言葉等の対応を自分の好みに完全に合うように、自分の決めたひとつひとつのキーワードごとにこの人格の書き換えを行おうとしたとする。そのY氏が、プログラム等の知識はまったく持たないとすると、このようなきめ細かい書き換え作業は、この前記特許文献1では不可能である。その理由を下記に書きに記す。
[1] 前記特許文献1の段落「0016」には、映像ロボットの動作の選択は、利用者入力文のキーワードによるか、もしくは、入力文を形態素解析するとある。そして、この形態素解析の方法については、段落「0020」に具体的方法の記載があが、このようにプログラム解析を用いて選択された動作が、利用者の仮想人物に望んだ動作と完全に一致することは不可能である。そこでもし利用者が選択された動作の変更を望んだ場合、それに対応することはプログラムの変更を伴うため、非常に困難かまたは不可能である。
[2] 上記[1]のキーワードによる動作の変更については、ある特定のキーワードに特定の動作を1つずつリンクさせていく必要があるはずである。ところが、この特許文献1の中には、リンク設定部に関する記述がまったく無い。請求項などで列挙された変更可能部分はすべて、映像のデータそのものの変更のみであり、これは文章のリンク設定についても同様である。
一連の装置の中にリンク設定部を設けなければ、特定キーワードに対する文章や映像のリンクはすべて各データベース内で行われることとなる。すなわち、この特許文献1による装置を用いる利用者は、キーワードを1つ追加するたびに文章と映像それぞれのデータベースを別個に書き換えなければならない。しかもこのデータはどのような形でデータベース内に保管されているかはまったく不明なので、利用者の意図どおりの変更が可能かどうかは不明である。一例として、あるキーワードに2つの動作を連続して仮想人物に行わせ、その2つの動作にあわせて2つの文章を出力させたいと考えたとする。このような連続した動作がひとつのキーワードに対して可能なのか、また可能だとしてもそれぞれの動作にタイミングを合わせて文章を出力することが可能なのかが不明である。
(2)この特許文献1では、音声ファイルが扱えない。
音声変換装置は、今の技術レベルではその感情表現の豊かさ等において肉声に遠く及ばない。そこでもし利用者が波音等の背景音や肉声を使用したいと考えた場合、この特許文献1ではそれに対応できない。
(3)この特許文献1の段落「0021」には、この特許文献1の別プログラム内での使用に関する記述があるが、別プログラムやインターネット上の別サイト等(以下、単に「別サイト等」という。)へリンクする装置はどこにも無い。したがってこの特許文献1による装置では、仮想人物等の会話以外のことはほとんど何もできず、それを可能にしたければまた別の装置が必要になるのである。このことは実用上たいへんな違いである。
音声変換装置は、今の技術レベルではその感情表現の豊かさ等において肉声に遠く及ばない。そこでもし利用者が波音等の背景音や肉声を使用したいと考えた場合、この特許文献1ではそれに対応できない。
(3)この特許文献1の段落「0021」には、この特許文献1の別プログラム内での使用に関する記述があるが、別プログラムやインターネット上の別サイト等(以下、単に「別サイト等」という。)へリンクする装置はどこにも無い。したがってこの特許文献1による装置では、仮想人物等の会話以外のことはほとんど何もできず、それを可能にしたければまた別の装置が必要になるのである。このことは実用上たいへんな違いである。
すなわち、もしこの特許文献1による装置が別サイト等へのリンクが可能であり、かつこの装置(プログラムソ フト)がインターネット上のサーバーに置かれていたとする。すると利用者は、携帯電話等を使ってこのサーバーにアクセスし、あたかも人間の秘書に命ずるようにこの仮想人物へ様々な指示を出すことが可能となる。この仮想人物は、与えられたキーワードに対応するサイト等へリンク可能であるので、そのリンク先サイト等内にある様々なプログラムを実行し、その結果を利用者携帯に表示することができる。これら一連の作業を、人間的な受け答えを伴って実行できることとなる。したがってこの特許文献1は、IT利用者に対して新しい会話型インターフェースを提供できることとなる。
この発明は、以上の問題点を解決するために、(1)利用者が各キーワードに対する映像や文章等のリンクを簡単に設定でき、よって、利用者が仮想人物の応答を自分の嗜好性に合うように変えることができ、(2)背景音や肉声を容易に使用でき、(3)あたかも人間の秘書に命ずるように仮想人物へ様々な指示を出し、この仮想人物は、与えられたキーワードに対応してサイト等内にある様々なプログラムを実行し、その結果を利用者へ表示することができる会話装置を提供することを目的とする。
この発明は、以上の問題点を解決するために、(1)利用者が各キーワードに対する映像や文章等のリンクを簡単に設定でき、よって、利用者が仮想人物の応答を自分の嗜好性に合うように変えることができ、(2)背景音や肉声を容易に使用でき、(3)あたかも人間の秘書に命ずるように仮想人物へ様々な指示を出し、この仮想人物は、与えられたキーワードに対応してサイト等内にある様々なプログラムを実行し、その結果を利用者へ表示することができる会話装置を提供することを目的とする。
以上の課題を解決するために、第一発明は、利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示または音声で答える会話装置であって、利用者がテキストまたは音声を入力する入力部と、この入力の内容の中から所定のキーワードを検索するキーワード検索部と、前記キーワードを設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、利用者が自分で応答用のテキストファイルを作成し又は複数の音声ファイルの中から任意のファイルを選択し、前記設定したキーワード、前記選択した動画ファイル、及び前記作成したテキストファイルまたは音声ファイルをリンクするキーワードリンク設定部と、その設定された動画ファイルやテキストファイルおよび音声ファイルを表示する表示部と、前記複数の仮想人物の動画ファイル、前記複数のテキストファイルまたは複数の音声ファイルを格納するデータ格納部と、前記キーワード、及びこれらの前記リンクの関係を記憶する記憶部と、を有することを特徴とする会話装置である。
第二発明は、さらに、前記キーワードにリンクされるファイルには、別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示するアクセス実行プログラムファイルが含まれ、このアクセス実行プログラムを実行できるアクセス装置を備えたことを特徴とする会話装置である。
第三発明は、利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示または音声で答える会話装置として機能するためコンピュータが読み取り可能な記録媒体であって、利用者が入力部から入力したテキスト、または音声から認識されたテキストの中から所定のキーワードを検索する手順と、前記キーワードを設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、利用者が自分で応答用のテキストファイルを作成し又は複数の音声ファイルの中から任意のファイルを選択し、前記設定したキーワード、前記選択した動画ファイル、及び前記作成したテキストファイルまたは音声ファイルをリンクする手順と、その設定された動画ファイルやテキストファイルおよび音声ファイルを表示する手順と、前記複数の仮想人物の動画ファイル、前記複数のテキストファイルまたは複数の音声ファイルを格納するデータ格納部と、前記キーワード、及びこれらの前記リンクの関係を記憶する手順と、が実行できるプログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体である。
第四発明は、さらに、前記キーワードにリンクされるファイルには、アクセス装置を介して別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示するアクセス実行プログラムファイルが含まれることを特徴とするコンピュータ読み取り可能な記録媒体である。
第一、第二、第三、又は第四発明によれば、以下の効果を得る。
(1)キーワードリンク設定部により、利用者は各キーワードに対する仮想人物の動画、及び、テキストまたは音声の少なくとも一方、のリンクを簡単に設定することができ、これにより、利用者が仮想人物の対応を自分の嗜好性に高度に合うように容易に変えることができる。
(1)キーワードリンク設定部により、利用者は各キーワードに対する仮想人物の動画、及び、テキストまたは音声の少なくとも一方、のリンクを簡単に設定することができ、これにより、利用者が仮想人物の対応を自分の嗜好性に高度に合うように容易に変えることができる。
また、キーワードリンク設定部を設け、そこで設定したリンク関係を記憶する記憶部を、仮想人物の動画、テキストまたは音声を格納するデータ格納部と別に設ければ、リンク作業はデータ格納部が通常設けられるデータベースの外で行うことができる。よって、利用者は、データベースを別個に書き換えなくても、仮想人物の対応を容易に細かく、意図どおりに変更が可能となる。
(2)さらに、肉声などの音声ファイルを扱い、リンク関係に入れるので、音声変換装置による機械声よりも豊かな肉声が使用でき、さらに、波音等の背景音を使用することも容易に行える。
次に、第二、または第四発明によれば、さらに、以下の効果を得る。
(3)利用者は、あたかも人間の秘書に命ずるように仮想人物へ様々な指示をテキスト入力または音声入力によって出し、この入力の内容の中から検索されたキーワードにリンクされたアクセス実行プログラムが、別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示させることができる。
次に、第二、または第四発明によれば、さらに、以下の効果を得る。
(3)利用者は、あたかも人間の秘書に命ずるように仮想人物へ様々な指示をテキスト入力または音声入力によって出し、この入力の内容の中から検索されたキーワードにリンクされたアクセス実行プログラムが、別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示させることができる。
この発明の実施形態に係る装置を、図1〜図6に示す。
(装置)
図1〜図3において、この会話装置1を説明する。この会話装置1はコンピュータによって実現される。
この会話装置1(図1に示す)は、利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示や音声で応答する装置である。
仮想人物3(図6下方参照)が表現される動画ファイル5は多数がデータ格納部7に格納されている。仮想人物3のキャラクターも複数が用意され、キャラ1、キャラ2、・・・とされる。図2に示すように、各キャラクターにはそれぞれ、泣く、笑う、挨拶、お辞儀、怒る、驚き、誤る、・・・などの表情およびしぐさの動画が用意される。
(装置)
図1〜図3において、この会話装置1を説明する。この会話装置1はコンピュータによって実現される。
この会話装置1(図1に示す)は、利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示や音声で応答する装置である。
仮想人物3(図6下方参照)が表現される動画ファイル5は多数がデータ格納部7に格納されている。仮想人物3のキャラクターも複数が用意され、キャラ1、キャラ2、・・・とされる。図2に示すように、各キャラクターにはそれぞれ、泣く、笑う、挨拶、お辞儀、怒る、驚き、誤る、・・・などの表情およびしぐさの動画が用意される。
また、応答に用いられるテキストファイル9及び音声ファイル11も多数が、データ格納部7に格納されている。「おはようございます」「こんにちは」「こんばんわ」「お元気ですか」「いい天気ですね」「あいにくの雨ですね」・・・など、日常の挨拶で使用されるものを中心にほとんどの言葉がテキストファイル9や音声ファイル11に含まれる。
音声ファイル11には、仮想人物3の声としての音声ファイルだけではなく、背景音として、波の音、鳥の声、・・・などの自然音、バックグランドミュージックなどの効果音のファイルが含まれる。音声は、肉声、自然音、楽器や電子楽器による音楽、機械的な音声、合成音声、などを広く含む。
キーワードリンク設定部13では、キーワードをテキストなどで作って、あるいは選択して設定し、その設定したキーワードに対し、複数の仮想人物3の動画の中から任意の動画ファイル5を選択し、複数のテキストファイル9または複数の音声ファイル11の中から任意のファイルを選択し、これらをリンクする。これらの選択が容易なように、各ファイルのアドレスが編集用データ一覧(図3右上部参照)として準備される。
キーワードリンク設定部13では、キーワードをテキストなどで作って、あるいは選択して設定し、その設定したキーワードに対し、複数の仮想人物3の動画の中から任意の動画ファイル5を選択し、複数のテキストファイル9または複数の音声ファイル11の中から任意のファイルを選択し、これらをリンクする。これらの選択が容易なように、各ファイルのアドレスが編集用データ一覧(図3右上部参照)として準備される。
以上のキーワード14、及びこれらのリンク関係は、リンク関係一覧(図3右下部参照)としてまとめられ、編集用データ一覧とともに編集用データ15として、記憶部に記憶する。この記憶部は、この実施形態では、データ格納部7の一部が兼ねる。
テキスト入力部17では、利用者はテキストを入力して仮想人物3に話しかける。
音声入力部19では、利用者は自分の音声を入力して仮想人物3に話しかける。音声は音声認識部21によりテキストに認識される。
テキスト入力部17では、利用者はテキストを入力して仮想人物3に話しかける。
音声入力部19では、利用者は自分の音声を入力して仮想人物3に話しかける。音声は音声認識部21によりテキストに認識される。
キーワード検索部23は、この入力の内容の中から所定のキーワードを検索する。
合成ファイル作成部25は、検索されたキーワードにリンクされた仮想人物3の動画ファイル5、テキストファイル9、音声ファイル11を合成し、合成ファイルを作成する。
合成ファイル作成部25は、検索されたキーワードにリンクされた仮想人物3の動画ファイル5、テキストファイル9、音声ファイル11を合成し、合成ファイルを作成する。
音声表示部27は、この合成ファイルをもとに仮想人物3の音声及び効果音などの音声を表出する。
映像テキスト表示部29は、この合成ファイルをもとに仮想人物3の動画や文字(テキスト)を映像として表示する。
映像テキスト表示部29は、この合成ファイルをもとに仮想人物3の動画や文字(テキスト)を映像として表示する。
(装置の利用手順)
(1)仮想人物3としてのある特定の人物もしくはアニメキャラクターの動画を、様々な表情やしぐさごとに細かく分類し、分類された部分をファイルにしてそれぞれデータ格納部7の中に別々のアドレスを付けてあらかじめ保管しておく(図3右上部参照)。
(1)仮想人物3としてのある特定の人物もしくはアニメキャラクターの動画を、様々な表情やしぐさごとに細かく分類し、分類された部分をファイルにしてそれぞれデータ格納部7の中に別々のアドレスを付けてあらかじめ保管しておく(図3右上部参照)。
(2)上記(1)で分類した動画ファイル5のひとつひとつにタイトルをつけ、各タイトルとそのアドレスの一覧を編集用データ一覧に保管しておく。その他、効果音等の音声ファイル11も同様に編集用データ一覧に保管しておく(図3右下部参照)。
(3)利用者30はキーワードリンク設定部13でリンクを設定する。このとき実際の操作は、コンピュータの表示部に表示される画面(図4)により、左端のキーワード設定窓に、直接にテキストを入力するか、その下方のキーワード一覧の窓から選択するかして入力し、設定する。
(3)利用者30はキーワードリンク設定部13でリンクを設定する。このとき実際の操作は、コンピュータの表示部に表示される画面(図4)により、左端のキーワード設定窓に、直接にテキストを入力するか、その下方のキーワード一覧の窓から選択するかして入力し、設定する。
このようにして設定したキーワードに対し、応答に使用したい仮想人物3の動画ファイル5を選択し、テキストファイル9や音声ファイル11を選択する。この音声ファイル11は、利用者が予め自分で自由に作成しておくことができるものとする。そして、これらをリンクする。実際の操作は、コンピュータの表示部に表示される画面(図4)により、各ファイルにチェックマークを付けることで選択すれば、自動的にリンクがなされる(図3右下部、図5参照)。
(4)利用者30は、テキスト入力部17でテキストを入力するか、または、音声入力部19で自分の音声を入力するかして、仮想人物3に話しかける。実際の操作は、例えば、コンピュータの表示部に表示される画面(図6)により、文章入力窓(図6上部)に、テキストを入力し、送信ボタンをクリックする。
(5)キーワードにリンクされた仮想人物3の動画ファイル5、テキストファイル9、音声ファイル11などから合成された合成ファイルをもとに、音声表示部27から、仮想人物3の音声及び効果音などの音声が表出され、映像テキスト表示部29から、仮想人物3の動画や文字(テキスト)が映像として表示される。
実際の表示は、例えば、コンピュータの表示部に表示される画面(図6)の映像・テキスト表示窓に、仮想人物3の動画(図6下部左)やテキスト(図6下部右)が表示され、同時に、音声が流れる。
(その他)
テキスト入力や音声入力において、キーワードを先頭にもってくるような入力を行う。また、これらによって入力された言葉の途中にキーワードがある場合には、テキスト入力であれば、その直前で改行し、キーワードを2行目の先頭にもってくるようにする。またキーワード検索の際には、文字数の多いキーワードから優先して選択させるようにする。
テキスト入力や音声入力において、キーワードを先頭にもってくるような入力を行う。また、これらによって入力された言葉の途中にキーワードがある場合には、テキスト入力であれば、その直前で改行し、キーワードを2行目の先頭にもってくるようにする。またキーワード検索の際には、文字数の多いキーワードから優先して選択させるようにする。
「実施形態の効果」
この実施形態によれば、以下の効果を得る。
(1)キーワードリンク設定部13により、利用者は各キーワードに対する仮想人物3の動画、テキスト、音声などのリンクを簡単に設定することができ、これにより、利用者が仮想人物3の対応を自分の嗜好性に高度に合うように容易に変えることができる。
例えば、利用者30が自分の嗜好性に高度に合うように、Aという言葉を含んだテキストまたは音声を入力した際、それに対して動画で示される仮想人物Bに、Cという表情およびしぐさを伴いつつ、Dという言葉を返して欲しいと考え、なおかつその場面の背景にGという効果音を伴った表現をこの仮想人物3に求めるときには、キーワードAに、仮想人物Bが行うCという表情およびしぐさの動画、及び、テキストDや音声の少なくとも一方、のリンクを簡単に設定できる。
この実施形態によれば、以下の効果を得る。
(1)キーワードリンク設定部13により、利用者は各キーワードに対する仮想人物3の動画、テキスト、音声などのリンクを簡単に設定することができ、これにより、利用者が仮想人物3の対応を自分の嗜好性に高度に合うように容易に変えることができる。
例えば、利用者30が自分の嗜好性に高度に合うように、Aという言葉を含んだテキストまたは音声を入力した際、それに対して動画で示される仮想人物Bに、Cという表情およびしぐさを伴いつつ、Dという言葉を返して欲しいと考え、なおかつその場面の背景にGという効果音を伴った表現をこの仮想人物3に求めるときには、キーワードAに、仮想人物Bが行うCという表情およびしぐさの動画、及び、テキストDや音声の少なくとも一方、のリンクを簡単に設定できる。
さらに、テキストや音声で話しかけた言葉(キーワードを含む)に対するそのような自分の好むとおりの表情、しぐさ、言葉、背景等のリンク関係を、自分の話しかけのひとつひとつに対し、変化させて格納でき、よって、プログラム等の知識はまったく持たない利用者30であっても、より完全に自分の嗜好性に合うような対応をこの仮想人物Bに実行させることが可能となる。
また、キーワードリンク設定部13を設け、そこで設定したリンク関係を記憶する記憶部を、仮想人物3の動画、テキストまたは音声を格納するデータ格納部7と別に設ければ、リンク作業はデータ格納部7が通常設けられるデータベースの外で行うことができる。よって、利用者は、データベースを別個に書き換えなくても、仮想人物3の対応を容易に細かく、意図どおりに変更が可能となる。
一例として、ある一つのキーワードに2つの動作を連続して仮想人物3に行わせ、その2つの動作にあわせて2つの文章を出力させることも、容易に行える。
(2)さらに、音声ファイル11を扱い、リンク関係に入れるので、音声変換装置による機械声よりも豊かな肉声が使用でき、さらに、波音等の背景音を使用することも容易に行える。
(2)さらに、音声ファイル11を扱い、リンク関係に入れるので、音声変換装置による機械声よりも豊かな肉声が使用でき、さらに、波音等の背景音を使用することも容易に行える。
「他の実施形態」
以上の実施形態では、画像は、複数の仮想人物3の動画の中から任意の動画を選択するものであったが、他の実施形態では、仮想人物3の背景画を静止画ファイルとして選択できるようにしても良い。
以上の実施形態では、画像は、複数の仮想人物3の動画の中から任意の動画を選択するものであったが、他の実施形態では、仮想人物3の背景画を静止画ファイルとして選択できるようにしても良い。
以上の実施形態では、データ格納部7の一部が、リンク関係一覧と編集用データ一覧とからなる編集用データ15を記憶する記憶部を形成するものであったが、他の実施形態では、この記憶部は別に設けられるものとすることができる。これによりリンクの変更が、データ格納部7の内部の変更を伴わずに行えるという効果がある。この効果は、データ格納部7が独立したデータベース内に構築されるときに、特に有効である。
以上の実施形態では、データ格納部7は会話装置1の内部に設けられるものであったが、他の実施形態では、会話装置1の外部に設けられ、インターネットを介して利用することも可能である。
すなわち、動画ファイル5などが格納されたデータ格納部7を、外部のインターネット上のサーバーが管理するデータベースに構築する。このとき、編集用データ15を記憶する記憶部は装置1内に設ける。また、検索されたキーワードにリンクする動画ファイル5のアドレスは、外部のサーバーアドレスとなる。
すなわち、動画ファイル5などが格納されたデータ格納部7を、外部のインターネット上のサーバーが管理するデータベースに構築する。このとき、編集用データ15を記憶する記憶部は装置1内に設ける。また、検索されたキーワードにリンクする動画ファイル5のアドレスは、外部のサーバーアドレスとなる。
そして、別サイトアクセス装置37(図1参照)により、入力された音声などから検索されたキーワードがリンクするサーバーアドレスへアクセスし、テキストファイル9、音声ファイル11、動画ファイル5を用いて、動画データと合成して合成ファイルを作成する。
利用者は、この作成された合成ファイルを、このサーバーにアクセスしたコンピュータ31や携帯電話33等のモニターで閲覧する。
なお、1つのキーワードにリンクするサーバーアドレスや各ファイルは複数を可能とする。すなわち、1つのキーワードに対し2つ以上の動画ファイル5を連続して表示できることとする。これにより、1つのキーワードで、仮想人格に複数の表情や動作を組み合わせた複雑な動作を行わせることができる。
なお、1つのキーワードにリンクするサーバーアドレスや各ファイルは複数を可能とする。すなわち、1つのキーワードに対し2つ以上の動画ファイル5を連続して表示できることとする。これにより、1つのキーワードで、仮想人格に複数の表情や動作を組み合わせた複雑な動作を行わせることができる。
以上の実施形態では、キーワードにリンクするファイルは、動画ファイル5や音声ファイル11であったが、他の実施形態では、別プログラムやインターネット35上の別サイトへアクセスしてプログラムを実行し結果を記録して表示するアクセス実行プログラムファイルを含ませることができる。この別サイトへのアクセスは、別サイトアクセス装置37(図1参照)によって行う。
このようにして、別のサイトへアクセスし、そこにあるプログラムを実行することが可能となるので、これを会話装置1のモニターに映すと、サーバー上の仮想人物3が利用者の命令で様々な仕事を実行しているように見える。
つまり、利用者は、あたかも人間の秘書に命ずるように仮想人物3へ様々な指示をテキストや音声によって出し、この入力の内容の中から検索されたキーワードにリンクされたアクセス実行プログラムが、別プログラムやインターネット35上の別サイトへアクセスしてプログラムを実行し、結果を記録して表示させることができる。
以上の実施形態では、合成ファイル作成部25が、動画ファイル5、テキストファイル9、音声ファイル11を合成し、この合成ファイルを作成した後に、音声表示部27や映像テキスト表示部29が表示を行っていたが、他の実施形態では、合成ファイル作成部25を設けずに、動画ファイル5、テキストファイル9、音声ファイル11を直接に音声表示部27や映像テキスト表示部29で表示しても良い。
つまり、利用者は、あたかも人間の秘書に命ずるように仮想人物3へ様々な指示をテキストや音声によって出し、この入力の内容の中から検索されたキーワードにリンクされたアクセス実行プログラムが、別プログラムやインターネット35上の別サイトへアクセスしてプログラムを実行し、結果を記録して表示させることができる。
以上の実施形態では、合成ファイル作成部25が、動画ファイル5、テキストファイル9、音声ファイル11を合成し、この合成ファイルを作成した後に、音声表示部27や映像テキスト表示部29が表示を行っていたが、他の実施形態では、合成ファイル作成部25を設けずに、動画ファイル5、テキストファイル9、音声ファイル11を直接に音声表示部27や映像テキスト表示部29で表示しても良い。
1…会話装置、3…仮想人物、5…動画ファイル、7…データ格納部、9…テキストファイル、11…音声ファイル、13…キーワードリンク設定部、15…編集用データ、17…テキスト入力部、19…音声入力部、21…音声認識部、23…キーワード検索部、25…合成ファイル作成部、27…音声表示部、29…映像テキスト表示部、30・・利用者、31…コンピュータ、33…携帯電話、35…インターネット、37…別サイトアクセス装置。
Claims (4)
- 利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示または音声で答える会話装置であって、利用者がテキストまたは音声を入力する入力部と、この入力の内容の中から所定のキーワードを検索するキーワード検索部と、前記キーワードを設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、利用者が自分で応答用のテキストファイルを作成し又は複数の音声ファイルの中から任意のファイルを選択し、前記設定したキーワード、前記選択した動画ファイル、及び前記作成したテキストファイルまたは音声ファイルをリンクするキーワードリンク設定部と、その設定された動画ファイルやテキストファイルおよび音声ファイルを表示する表示部と、前記複数の仮想人物の動画ファイル、前記複数のテキストファイルまたは複数の音声ファイルを格納するデータ格納部と、前記キーワード、及びこれらの前記リンクの関係を記憶する記憶部と、を有することを特徴とする会話装置。
- 前記キーワードにリンクされるファイルには、別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示するアクセス実行プログラムファイルが含まれ、このアクセス実行プログラムを実行できるアクセス装置を備えたことを特徴とする会話装置。
- 利用者のテキスト入力または音声入力に対し、動画で表現された仮想人物がテキスト表示または音声で答える会話装置として機能するためコンピュータが読み取り可能な記録媒体であって、利用者が入力部から入力したテキスト、または音声から認識されたテキストの中から所定のキーワードを検索する手順と、前記キーワードを設定し、複数の仮想人物の動画の中から任意の動画ファイルを選択し、利用者が自分で応答用のテキストファイルを作成し又は複数の音声ファイルの中から任意のファイルを選択し、前記設定したキーワード、前記選択した動画ファイル、及び前記作成したテキストファイルまたは音声ファイルをリンクする手順と、その設定された動画ファイルやテキストファイルおよび音声ファイルを表示する手順と、前記複数の仮想人物の動画ファイル、前記複数のテキストファイルまたは複数の音声ファイルを格納するデータ格納部と、前記キーワード、及びこれらの前記リンクの関係を記憶する手順と、が実行できるプログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
- 前記キーワードにリンクされるファイルには、アクセス装置を介して別プログラムやインターネット上の別サイトへアクセスしてプログラムを実行し結果を記録して表示するアクセス実行プログラムファイルが含まれることを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005044948A JP2006235671A (ja) | 2005-02-22 | 2005-02-22 | 会話装置及びコンピュータ読み取り可能な記録媒体。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005044948A JP2006235671A (ja) | 2005-02-22 | 2005-02-22 | 会話装置及びコンピュータ読み取り可能な記録媒体。 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006235671A true JP2006235671A (ja) | 2006-09-07 |
Family
ID=37043291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005044948A Pending JP2006235671A (ja) | 2005-02-22 | 2005-02-22 | 会話装置及びコンピュータ読み取り可能な記録媒体。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006235671A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012150363A (ja) * | 2011-01-20 | 2012-08-09 | Kddi Corp | メッセージ映像編集プログラムおよびメッセージ映像編集装置 |
WO2015186445A1 (ja) * | 2014-06-03 | 2015-12-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2017204231A (ja) * | 2016-05-13 | 2017-11-16 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN113407850A (zh) * | 2021-07-15 | 2021-09-17 | 北京百度网讯科技有限公司 | 一种虚拟形象的确定和获取方法、装置以及电子设备 |
JP2022532696A (ja) * | 2020-04-13 | 2022-07-19 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | インタラクション方法、装置、システム、電子デバイス及び記憶媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153145A (ja) * | 1995-12-01 | 1997-06-10 | Matsushita Electric Ind Co Ltd | エージェント表示装置 |
JP2000259601A (ja) * | 1999-03-05 | 2000-09-22 | Masami Kato | 会話装置および方法 |
-
2005
- 2005-02-22 JP JP2005044948A patent/JP2006235671A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153145A (ja) * | 1995-12-01 | 1997-06-10 | Matsushita Electric Ind Co Ltd | エージェント表示装置 |
JP2000259601A (ja) * | 1999-03-05 | 2000-09-22 | Masami Kato | 会話装置および方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012150363A (ja) * | 2011-01-20 | 2012-08-09 | Kddi Corp | メッセージ映像編集プログラムおよびメッセージ映像編集装置 |
WO2015186445A1 (ja) * | 2014-06-03 | 2015-12-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN106463110A (zh) * | 2014-06-03 | 2017-02-22 | 索尼公司 | 信息处理设备、信息处理方法和程序 |
JPWO2015186445A1 (ja) * | 2014-06-03 | 2017-04-20 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10657959B2 (en) | 2014-06-03 | 2020-05-19 | Sony Corporation | Information processing device, information processing method, and program |
JP2017204231A (ja) * | 2016-05-13 | 2017-11-16 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2022532696A (ja) * | 2020-04-13 | 2022-07-19 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | インタラクション方法、装置、システム、電子デバイス及び記憶媒体 |
CN113407850A (zh) * | 2021-07-15 | 2021-09-17 | 北京百度网讯科技有限公司 | 一种虚拟形象的确定和获取方法、装置以及电子设备 |
CN113407850B (zh) * | 2021-07-15 | 2022-08-26 | 北京百度网讯科技有限公司 | 一种虚拟形象的确定和获取方法、装置以及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6753707B2 (ja) | コミュニケーションを支援する人工知能システム | |
JP6896690B2 (ja) | マルチメディアコンテンツにおける文脈探索 | |
JP5996734B2 (ja) | 動画を自動的にアセンブリする方法およびシステム | |
JP5671557B2 (ja) | クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法 | |
AU2014331209B2 (en) | Method for dialogue between a machine, such as a humanoid robot, and a human interlocutor; computer program product; and humanoid robot for implementing such a method | |
US8972265B1 (en) | Multiple voices in audio content | |
CN107040452B (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
JP6087333B2 (ja) | 情報提供システム、情報提供方法、及びプログラム | |
US20180189247A1 (en) | Augmenting Text with Multimedia Assets | |
WO2008001350A2 (en) | Method and system of providing a personalized performance | |
JP6345577B2 (ja) | 情報提供システム、情報提供方法、プログラム、及びデータ構造 | |
US20190295199A1 (en) | Intelligent legal simulator | |
CN109389427A (zh) | 问卷推送方法、装置、计算机设备和存储介质 | |
CN105893771A (zh) | 一种信息服务方法和装置、一种用于信息服务的装置 | |
JP7096172B2 (ja) | キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法 | |
CN115082602A (zh) | 生成数字人的方法、模型的训练方法、装置、设备和介质 | |
KR20210131892A (ko) | 대화형 청중 시뮬레이션을 제공하는 장치 및 방법 | |
Pauletto et al. | Exploring expressivity and emotion with artificial voice and speech technologies | |
JP2006235671A (ja) | 会話装置及びコンピュータ読み取り可能な記録媒体。 | |
JP6932162B2 (ja) | 地域に基づくアイテム推薦端末装置及びアイテム推薦情報提供方法。 | |
CN111523069A (zh) | 一种基于3d引擎实现电子书播放3d效果的方法及其*** | |
Lamberti et al. | A multimodal interface for virtual character animation based on live performance and Natural Language Processing | |
KR101113940B1 (ko) | 사용자 설정 상황에서 사용자가 선택한 단어를 기반으로 하는 언어 학습 시스템 및 그 언어 학습 방법 | |
KR101113938B1 (ko) | 망자와의 대화를 제공하는 망자 커뮤니티 시스템 및 그 망자 커뮤니티 방법 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100720 |