JP2005110726A - 学習装置及びその方法 - Google Patents

学習装置及びその方法 Download PDF

Info

Publication number
JP2005110726A
JP2005110726A JP2003345071A JP2003345071A JP2005110726A JP 2005110726 A JP2005110726 A JP 2005110726A JP 2003345071 A JP2003345071 A JP 2003345071A JP 2003345071 A JP2003345071 A JP 2003345071A JP 2005110726 A JP2005110726 A JP 2005110726A
Authority
JP
Japan
Prior art keywords
speech
recognition
recognized
stored
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003345071A
Other languages
English (en)
Other versions
JP3919726B2 (ja
Inventor
Kenichi Maeda
賢一 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003345071A priority Critical patent/JP3919726B2/ja
Publication of JP2005110726A publication Critical patent/JP2005110726A/ja
Application granted granted Critical
Publication of JP3919726B2 publication Critical patent/JP3919726B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)
  • Toys (AREA)

Abstract

【課題】レベルの低い知的な動作を実現することによって、成人や老人でも楽しめる学習装置を提供する。
【解決手段】赤ちゃんロボット100に内蔵した学習装置10は、音声認識部12、物体認識部14、登録記憶部16、音声合成部18、モード切り替えスイッチ20とから構成される。赤ちゃんロボット100が、人間の顔と名前を学習して、同じ顔を見た際に学習した名前を発声するという動作を真似ることが可能となる。
【選択図】 図1

Description

本発明は、ロボットや人形の玩具に内蔵して利用できる学習装置に関するものである。
従来の玩具ロボットは、主として機械的な動きを実現するためのものである。従って、単純な動きのパターンを繰り返すという、小さな子供向けの玩具として利用されるに止まっている。
これからは、子供より成人や老人の人口が多くなるため、玩具としても成人や老人が楽しめるロボットが必要とされている。しかし、人工的に知的な動作をさせたり複雑な行動を実現するためには、まだまだ将来の技術開発を待たなくてはならない。
また、ロボットには、ユーザーの顔を識別するものが提案されている(例えば、特許文献1参照)。
特開2002−157596公報
しかし、上記のようにロボットに顔識別装置を内蔵しても、その識別した情報をどのように有効に使用するかは開示されていない。
そこで、本発明では、ロボットや人形の玩具などに内蔵する学習装置において、顔識別情報を用いて赤ちゃんやアニメの主人公をモチーフとしたレベルの低い知的な動作を実現することによって、成人や老人でも楽しめるものを提供することを目的とする。
請求項1に係る発明は、画像入力手段から入力した画像から物体を認識する物体認識手段と、前記登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識手段と、前記物体を登録させる登録モードにおいて、前記音声認識手段によって認識された名詞に関する記号列を含む音声データと、前記物体認識手段によって認識された物体に関する画像データを対応付けて記憶する登録記憶手段と、前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識手段によって認識された物体が、前記登録記憶手段に記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成手段と、を有することを特徴とする学習装置である。
請求項2に係る発明は、前記物体認識手段は、人間の顔を認識する顔認識手段であることを特徴とする請求項1記載の学習装置である。
請求項3に係る発明は、前記音声認識手段は、指示代名詞、助詞、助動詞の少なくともいずれかに属するキーワードを認識するキーワード認識手段を有し、前記音声認識手段は、入力された音声の中で前記キーワード認識手段によって認識されたキーワードを除く文字列を名詞として認識することを特徴とする請求項1記載の学習装置である。
請求項4に係る発明は、前記音声認識手段によって認識された音声データには、抑揚の調子を表すピッチ情報を含み、前記音声合成手段は、前記名詞の文字列と前記ピッチ情報と前記素片事書の素片から音声を合成することを特徴とする請求項1記載の学習装置である。
請求項5に係る発明は、前記学習装置は、ロボット、人形、または、玩具に内蔵され、前記音声合成手段は、前記素片辞書が、前記学習装置を内蔵したロボット、または、人形、または、玩具の外観に合わせた素片から構成されていることを特徴とする請求項1記載の学習装置である。
請求項6に係る発明は、画像入力手段から入力した画像から物体を認識する物体認識ステップと、前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識ステップと、前記登録モードにおいて、前記音声認識ステップによって認識された名詞に関する記号列を含む音声データと、前記物体認識ステップによって認識された物体に関する画像データを対応付けて記憶する登録記憶ステップと、前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識ステップで認識された物体が、前記登録記憶ステップで記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成ステップと、を有することを特徴とする学習方法である。
請求項7に係る発明は、画像入力手段から入力した画像から物体を認識する物体認識機能と、前記登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識機能と、前記物体を登録させる登録モードにおいて、前記音声認識機能で認識された名詞に関する記号列を含む音声データと、前記物体認識機能で認識された物体に関する画像データを対応付けて記憶する登録記憶機能と、前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識機能で認識された物体が、前記登録記憶機能で記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成機能と、をコンピュータによって実現することを特徴とする学習方法のプログラムである。
請求項1、2、6、7に係る発明の学習装置について説明する。
登録モードにおいて、画像入力手段から入力した画像から顔などの所定の物体を認識すると共に、音声入力装置から入力した音声から名詞を認識する。そして、認識された名詞に関する記号列を含む音声データと、認識された物体に関する画像データを対応付けて記憶する。
認識モードにおいて、認識された物体が、前記記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する。
請求項3に係る発明の学習装置では、指示代名詞、助詞、助動詞などに属する言葉であるキーワードが認識された場合には、登録する記号列から、そのキーワードを除いて、キーワードとの位置関係により名詞らしい部分のみを取り出すことができる。
請求項4に係る発明の学習装置では、ピッチ情報から抑揚を再現することにより本当に人間が発声するように聞くことできる。
請求項5に係る発明の学習装置では、ロボット、人形、または、玩具が本当に発声するように聞くことできる。
本発明によれば、レベルの低い知的な動作を実現することによって、成人や老人でも楽しめる学習装置を提供することを可能とし、本発明を内蔵したものは、将来のおもちゃ的なロボットの範囲を超えることが可能となり、実用上多大な効果が得られる
例えば、赤ちゃんが人や物体を覚えていく様子を模倣することになり、子供が大きくなって独立したり子供のない成人や、寂しい思いをしている老人のなぐさめとなることが期待できる。
あるいは、アニメの主人公が飼い主である所有者の名前などを覚えていくという様子を模倣することにより、従来のユーザである子供に対しても魅力的なものとなることが期待できる。
以下に図1〜図11を参照して、本発明の一実施形態について説明する。
(1)赤ちゃんロボット100の構成
本実施形態は、赤ちゃんが母親の顔を学習するという動作をモチーフとして実施した本発明の典型的な実施形態である。
図4は、本実施形態の学習装置10を内蔵した赤ちゃんロボット100の外観である。この赤ちゃんロボットには、マイク102とビデオカメラやデジタルカメラなどのカメラ104が内蔵されている。但し、カメラ104とマイク102は、実物の赤ちゃんと同じように目や耳の位置にある必要はないため、目立ちにくい髪の毛の中や衣類の一部であって良い。好ましくは、衣類のボタンに似せて作れば良い。
(2)学習装置10の構成
図1は、本実施形態の学習装置10を示すブロック図である。
学習装置10は、音声認識部12、物体認識部14、登録記憶部16、音声合成部18、モード切り替えスイッチ20とから構成される。
この学習装置10は、音声認識と物体認識を組み合わせることにより、赤ちゃんロボット100が見ている顔と聞いている音声とを対応付けて登録することにより、簡単な学習過程を模擬する。
まず、図2のフローチャートに示すように、「登録モード」において、ユーザーは自分の顔を赤ちゃんロボット100に見せながら、自分の名前を赤ちゃんロボット100に聞かせる。最も典型的な例としては、女性が赤ちゃんロボット100に自分の顔を見せて「ママ」というように名前を聞かせる。これにより、赤ちゃんロボット100は、その音声を認識して文字列のような記号列に変換して記憶すると共に、物体認識の学習により顔の辞書をその記号列と関連付けて登録する。
次に、図3のフローチャートに示すように、「認識モード」において、赤ちゃんロボット100は、以前見せられた顔を再度見た場合に、その顔と同時に聞いた音声の記号を自分の音声で発声する。最も典型的な例としては、赤ちゃんらしい声で「ママ」と発声する。
このようにして赤ちゃんロボット100が、人間の顔と名前を学習して、同じ顔を見た際に学習した名前を発声するという動作を真似ることが可能となる。
以下、各部12〜16の構成をそれぞれ説明する。なお、これら構成12〜16の各機能は、コンピュータに記憶されたプログラムによって実現する。
(2−1)モード切り替えスイッチ20
モード切り替えスイッチ20は、学習装置10の機能を登録モードと認識モードを切り替えるものであり、赤ちゃんロボット100の背中などに設ける。
(2−2)音声認識部12
(2−2−1)第1の実施形態の音声認識部12
音声認識部12は、登録モードで機能するものであり、マイク102と、マイク102からの信号を適当なレベルに増幅する増幅器、不必要な帯域をカットするフィルター、増幅されたアナログ信号をディジタル化するA/D変換器、ディジタル化された信号をHMMのような既知のアルゴリズムによって認識する認識部からなる。
そして、登録モードにおいて登録記憶部16にユーザーが発声した名前を音声辞書に記憶させる。
(2−2−2)第2の実施形態の音声認識部12
ユーザーが対象物の名前のみを発声するという約束事に従って使えば、以上の第1の実施形態の音声認識部12を実現することができる。
しかし、一般には、「ママですよ」とか「これが犬ですよ」というように、対象物の名称以外に「ですよ」とか「これが」というような不要の言葉が入ることがある。これに対応するために、図5に示すように、音声認識部12にキーワード認識部13をさらに設ける。
キーワード認識部13は、指示代名詞、助詞、助動詞などに属する言葉であるキーワードが認識された場合には、登録する記号列から、そのキーワードを除いて、キーワードとの位置関係により名詞らしい部分のみを取り出す。そして、登録記憶部16にキーワードを取り除いた名前の記号列の音声データを音声辞書に記憶させる。
図6に、最後が「ですよ」というキーワードである場合を想定した場合の動作をフローチャートで示す。
なお、最初に「これが」とか、「私が」とかいうキーワードを想定する場合も、ほぼ同じような動作で対応することが可能である。この場合は、キーワードの位置が最初なので、フローチャート中「前」とある部分を「後」にする必要がある。
(2−3)物体認識部14と登録記憶部16の構成
次に、物体認識部14と登録記憶部16の構成について説明する。
この物体認識部14と登録記憶部16については、顔認識の登録モードと認識モードに分けて説明する。
(2−3−1)登録モード
顔認識の登録モードのフローチャートを図8に示す。
登録モードにおいては、人物の顔が写った顔画像をM′枚取り込み、M′より少ないM個の主成分を抽出して画像データとして登録記憶部16の画像辞書に記憶する。これには、よく知られた主成分分析の方法を応用することができる。
そして、図11に示すように、登録記憶部16において、画像辞書と音声辞書を対応させて記憶させる。この場合には、同じ時刻に発声された音声辞書と認識した顔の画像辞書を、認識した時刻を基準に対応させて記憶させる。
なお、前に登録された名前と同じ名前が登録される場合の動作に関しては、全く独立に2個の名前と画像データを登録しても良いし、前のものを置き換えても良い。
また、前に登録された画像データを新しいデータで更新しても良い。その際には、画像データのみでなく、前記主成分分析に使われた相関行列を同時に記録しておくようにすれば良い。この処理のフローチャートを図10に示す。
図10でfは入力画像をメッシュで表現した際に、各メッシュの濃度値を並べたベクトルである。記号<・,・>はシャッテン積と呼ばれ、ベクトルとその転置を掛けて行列を作る演算である。K、K′は、この演算結果を重み付きで加えたもので特性核と呼ばれる、一種の相関行列である。ここでは、Kは一つしか書いていないが、一般には、登録された複数のカテゴリ毎に、そのカテゴリと同じ数だけある。K′は、新しく登録されるカテゴリに対するもので、登録後はKと同じ扱いとなる。
(2−3−2)認識モード
認識モードにおいては、顔画像をN′枚取り込み、N′より少ないN個の主成分を抽出し、N次元の部分空間を構成し、登録記憶部16においてこの部分空間と画像データのM次元の部分空間との間の角度を計算する。
部分空間を校正するには、登録モードと同様の主成分分析を利用することができる。また、部分空間の間の角度を測るには、相互部分空間法と呼ばれる方法を用いる。
具体的には、M個の主成分を{φ}、N個の主成分を{ψ}としたとき、 X=(xij
但し
Figure 2005110726
または
Figure 2005110726
なる行列Xの最大固有値として、最も小さい角度を計算することができることが知られている。角度をθとすると、最大固有値λとの関係は、λ=cosθである。この技術に関しては、特許文献2(特開平11−265452号公報参照、前田 賢一,山口 修,福井 和広:“物体認識装置および物体認識方法”)。
(2−4)音声合成部18の構成
認識モードにおいて、登録記憶部16で画像認識の結果が記憶されたものと一致すると、それと関連付けて記憶されていた音声辞書から音声データを呼び出し、その音声データの記号列を使って音声合成を行う。
音声合成は、記号列から音声を合成するという処理を行うが、そのためには、記号列以外に、音声の素片(個々の音素を合成する音の材料)と、抑揚の情報が必要である。
音素の素片は、予め登録されたものを用いる。例えば、赤ちゃんの声から収集した素片を使うと、赤ちゃんの声で合成が可能となる。なお、素片としては、上記したように赤ちゃんを模倣する場合には赤ちゃんの素片を予め収集しておいたものを利用するが、アニメの主人公の場合には、声優に発声してもらった音声から素片を収集して利用する。
しかし、登録したままの記号列を音声合成にかけると、まさにロボット的な抑揚のない音声が発生されることになる。この問題を解決するためには、音声認識部12で抑揚も学習させることが有効である。これは音声のピッチを抽出して記号と対応付けながらピッチ情報として記憶するようにすればよい。そして、音声合成部18において、このピッチ情報から抑揚を再現することにより本当にその人間が発声するように聞くことできる。その登録の状態のフローチャートを図7に示す。
(変更例)
本発明は、上記実施形態に限定されるものではなく、その主旨を変更することなく、いろいろな変更例が考えられる。
例えば、漫画の主人公のロボットが、飼い主の名前を覚えるようにしても良い。
また、上記実施形態では、ユーザーの顔を認識させていたが、これに代えてボールなどの物体を認識させてもよい。例えば、犬型のロボットにボールや骨を覚えさせるようにすることもできる。
本発明は、ロボット、または、人間や赤ちゃんの人形、動物の人形、アニメや漫画のキャラクターの人形やロボット、その他の玩具に内蔵して使用するものである。
本発明の一実施形態の学習装置のブロック図である。 本実施形態の学習装置の登録モードのフローチャートである。 本実施形態の学習装置の認識モードのフローチャートである。 本実施形態の赤ちゃんロボットの外観図である。 第2の実施形態の音声認識部を有した学習装置のブロック図である。 キーワード認識部14を有した音声認識のフローチャートである。 抑揚を含めた学習のフローチャートである。 登録モード中の顔認識のフローチャートである。 認識モード中の顔認識のフローチャートである。 更新登録のフローチャートである。 登録記憶部16の記憶状態を示す構成図である。
符号の説明
10 学習装置
12 音声認識部
14 物体認識部
16 登録記憶部
18 音声合成部
100 赤ちゃんロボット
102 マイク
104 カメラ

Claims (7)

  1. 画像入力手段から入力した画像から物体を認識する物体認識手段と、
    前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識手段と、
    前記登録モードにおいて、前記音声認識手段によって認識された名詞に関する記号列を含む音声データと、前記物体認識手段によって認識された物体に関する画像データを対応付けて記憶する登録記憶手段と、
    前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識手段によって認識された物体が、前記登録記憶手段に記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成手段と、
    を有する
    ことを特徴とする学習装置。
  2. 前記物体認識手段は、人間の顔を認識する顔認識手段である
    ことを特徴とする請求項1記載の学習装置。
  3. 前記音声認識手段は、指示代名詞、助詞、助動詞の少なくともいずれかに属するキーワードを認識するキーワード認識手段を有し、
    前記音声認識手段は、入力された音声の中で前記キーワード認識手段によって認識されたキーワードを除く文字列を名詞として認識する
    ことを特徴とする請求項1記載の学習装置。
  4. 前記音声認識手段によって認識された音声データには、抑揚の調子を表すピッチ情報を含み、
    前記音声合成手段は、前記名詞の文字列と前記ピッチ情報と前記素片事書の素片から音声を合成する
    ことを特徴とする請求項1記載の学習装置。
  5. 前記学習装置は、ロボット、人形、または、玩具に内蔵され、
    前記音声合成手段は、
    前記素片辞書が、前記学習装置を内蔵したロボット、または、人形、または、玩具の外観に合わせた素片から構成されている
    ことを特徴とする請求項1記載の学習装置。
  6. 画像入力手段から入力した画像から物体を認識する物体認識ステップと、
    前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識ステップと、
    前記登録モードにおいて、前記音声認識ステップによって認識された名詞に関する記号列を含む音声データと、前記物体認識ステップによって認識された物体に関する画像データを対応付けて記憶する登録記憶ステップと、
    前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識ステップで認識された物体が、前記登録記憶ステップで記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成ステップと、
    を有する
    ことを特徴とする学習方法。
  7. 画像入力手段から入力した画像から物体を認識する物体認識機能と、
    前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識機能と、
    前記登録モードにおいて、前記音声認識機能で認識された名詞に関する記号列を含む音声データと、前記物体認識機能で認識された物体に関する画像データを対応付けて記憶する登録記憶機能と、
    前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識機能で認識された物体が、前記登録記憶機能で記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成機能と、
    をコンピュータによって実現する
    ことを特徴とする学習方法のプログラム。
JP2003345071A 2003-10-02 2003-10-02 学習装置及びその方法 Expired - Fee Related JP3919726B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003345071A JP3919726B2 (ja) 2003-10-02 2003-10-02 学習装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003345071A JP3919726B2 (ja) 2003-10-02 2003-10-02 学習装置及びその方法

Publications (2)

Publication Number Publication Date
JP2005110726A true JP2005110726A (ja) 2005-04-28
JP3919726B2 JP3919726B2 (ja) 2007-05-30

Family

ID=34538446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003345071A Expired - Fee Related JP3919726B2 (ja) 2003-10-02 2003-10-02 学習装置及びその方法

Country Status (1)

Country Link
JP (1) JP3919726B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648652A (zh) * 2019-11-07 2020-01-03 浙江如意实业有限公司 一种智能互动玩具
US20210291379A1 (en) * 2018-12-03 2021-09-23 Groove X, Inc. Robot, speech synthesizing program, and speech output method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110815243A (zh) * 2019-11-14 2020-02-21 深圳市博悦生活用品有限公司 智能语音双语早教机器人

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109559A (ja) * 2000-10-02 2002-04-12 Canon Inc キャラクタ生成システム、装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP2002258885A (ja) * 2001-02-27 2002-09-11 Sharp Corp テキスト音声合成装置およびプログラム記録媒体
JP2002264051A (ja) * 2001-03-09 2002-09-18 Japan Science & Technology Corp ロボット視聴覚システム
JP2002318590A (ja) * 2001-04-20 2002-10-31 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2003117866A (ja) * 2001-10-16 2003-04-23 Nec Corp ロボット装置及びその制御方法
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
JP2003255991A (ja) * 2002-03-06 2003-09-10 Sony Corp 対話制御システム、対話制御方法及びロボット装置
JP2003255989A (ja) * 2002-03-06 2003-09-10 Sony Corp 学習装置及び学習方法並びにロボット装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109559A (ja) * 2000-10-02 2002-04-12 Canon Inc キャラクタ生成システム、装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP2002258885A (ja) * 2001-02-27 2002-09-11 Sharp Corp テキスト音声合成装置およびプログラム記録媒体
JP2002264051A (ja) * 2001-03-09 2002-09-18 Japan Science & Technology Corp ロボット視聴覚システム
JP2002318590A (ja) * 2001-04-20 2002-10-31 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2003117866A (ja) * 2001-10-16 2003-04-23 Nec Corp ロボット装置及びその制御方法
JP2003202895A (ja) * 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
JP2003255991A (ja) * 2002-03-06 2003-09-10 Sony Corp 対話制御システム、対話制御方法及びロボット装置
JP2003255989A (ja) * 2002-03-06 2003-09-10 Sony Corp 学習装置及び学習方法並びにロボット装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"オフィス移動ロボットJijo−2の音声対話システム", 日本ロボット学会誌 第18巻 第2号, vol. 第18巻 第2号, CSNG200100742024, 15 March 2000 (2000-03-15), JP, pages 300 - 307, ISSN: 0000777943 *
"形状・構造に関する言語シンボルの概念を学習により獲得するための画像−言語知識表現法", 電子情報通信学会論文誌 VOL.J80−D−II NO.9〔情報・システムII−情報処理〕, vol. 第J80−D−II巻 第9号, CSNG199700192021, 25 September 1997 (1997-09-25), JP, pages 2446 - 2456, ISSN: 0000777942 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210291379A1 (en) * 2018-12-03 2021-09-23 Groove X, Inc. Robot, speech synthesizing program, and speech output method
CN110648652A (zh) * 2019-11-07 2020-01-03 浙江如意实业有限公司 一种智能互动玩具
CN110648652B (zh) * 2019-11-07 2021-10-01 浙江如意实业有限公司 一种智能互动玩具

Also Published As

Publication number Publication date
JP3919726B2 (ja) 2007-05-30

Similar Documents

Publication Publication Date Title
AU2018204246B2 (en) Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method
CN108231070B (zh) 语音对话装置、语音对话方法、记录介质以及机器人
US7676372B1 (en) Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
CN111276120B (zh) 语音合成方法、装置和计算机可读存储介质
Roy et al. Learning words from sights and sounds: A computational model
CN105224073B (zh) 一种基于语音控制的点读手表及其点读方法
CN110136698A (zh) 用于确定嘴型的方法、装置、设备和存储介质
CN110931111A (zh) 基于虚拟现实及多模态信息的孤独症辅助干预***及方法
JP2000187435A (ja) 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法
JP4250340B2 (ja) 仮想ペット装置及びその制御プログラム記録媒体
Filntisis et al. Video-realistic expressive audio-visual speech synthesis for the Greek language
KR20180012192A (ko) 유아동용 학습 장치 및 그 동작 방법
ES2942894T3 (es) Procedimiento de lectura automática de labios utilizando un componente funcional y para suministrar el componente funcional
JP3919726B2 (ja) 学習装置及びその方法
JP7495125B2 (ja) ロボット、音声合成プログラム、及び音声出力方法
Roweis Data-driven production models for speech processing
JPH0772888A (ja) 情報処理装置
JP6972526B2 (ja) コンテンツ提供装置、コンテンツ提供方法、及びプログラム
US20070003140A1 (en) Electronic device and method for outputting response information in electronic device
JP4250635B2 (ja) 仮想ペット装置及びその制御プログラム記録媒体
JP4254400B2 (ja) 画像生成装置およびその画像生成方法、ならびにコンピュータ読み取り可能な記録媒体
JP2006142407A (ja) ロボット装置およびロボット装置システム
TW201712647A (zh) 呈現發音方式的方法及機器人
JP3848076B2 (ja) 仮想生物システム及び仮想生物システムにおけるパタン学習方法
JP2002372988A (ja) 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070213

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140223

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees