JP2005110726A - 学習装置及びその方法 - Google Patents
学習装置及びその方法 Download PDFInfo
- Publication number
- JP2005110726A JP2005110726A JP2003345071A JP2003345071A JP2005110726A JP 2005110726 A JP2005110726 A JP 2005110726A JP 2003345071 A JP2003345071 A JP 2003345071A JP 2003345071 A JP2003345071 A JP 2003345071A JP 2005110726 A JP2005110726 A JP 2005110726A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- recognition
- recognized
- stored
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
- Toys (AREA)
Abstract
【解決手段】赤ちゃんロボット100に内蔵した学習装置10は、音声認識部12、物体認識部14、登録記憶部16、音声合成部18、モード切り替えスイッチ20とから構成される。赤ちゃんロボット100が、人間の顔と名前を学習して、同じ顔を見た際に学習した名前を発声するという動作を真似ることが可能となる。
【選択図】 図1
Description
例えば、赤ちゃんが人や物体を覚えていく様子を模倣することになり、子供が大きくなって独立したり子供のない成人や、寂しい思いをしている老人のなぐさめとなることが期待できる。
本実施形態は、赤ちゃんが母親の顔を学習するという動作をモチーフとして実施した本発明の典型的な実施形態である。
図1は、本実施形態の学習装置10を示すブロック図である。
モード切り替えスイッチ20は、学習装置10の機能を登録モードと認識モードを切り替えるものであり、赤ちゃんロボット100の背中などに設ける。
(2−2−1)第1の実施形態の音声認識部12
音声認識部12は、登録モードで機能するものであり、マイク102と、マイク102からの信号を適当なレベルに増幅する増幅器、不必要な帯域をカットするフィルター、増幅されたアナログ信号をディジタル化するA/D変換器、ディジタル化された信号をHMMのような既知のアルゴリズムによって認識する認識部からなる。
ユーザーが対象物の名前のみを発声するという約束事に従って使えば、以上の第1の実施形態の音声認識部12を実現することができる。
次に、物体認識部14と登録記憶部16の構成について説明する。
顔認識の登録モードのフローチャートを図8に示す。
認識モードにおいては、顔画像をN′枚取り込み、N′より少ないN個の主成分を抽出し、N次元の部分空間を構成し、登録記憶部16においてこの部分空間と画像データのM次元の部分空間との間の角度を計算する。
但し
認識モードにおいて、登録記憶部16で画像認識の結果が記憶されたものと一致すると、それと関連付けて記憶されていた音声辞書から音声データを呼び出し、その音声データの記号列を使って音声合成を行う。
本発明は、上記実施形態に限定されるものではなく、その主旨を変更することなく、いろいろな変更例が考えられる。
12 音声認識部
14 物体認識部
16 登録記憶部
18 音声合成部
100 赤ちゃんロボット
102 マイク
104 カメラ
Claims (7)
- 画像入力手段から入力した画像から物体を認識する物体認識手段と、
前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識手段と、
前記登録モードにおいて、前記音声認識手段によって認識された名詞に関する記号列を含む音声データと、前記物体認識手段によって認識された物体に関する画像データを対応付けて記憶する登録記憶手段と、
前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識手段によって認識された物体が、前記登録記憶手段に記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成手段と、
を有する
ことを特徴とする学習装置。 - 前記物体認識手段は、人間の顔を認識する顔認識手段である
ことを特徴とする請求項1記載の学習装置。 - 前記音声認識手段は、指示代名詞、助詞、助動詞の少なくともいずれかに属するキーワードを認識するキーワード認識手段を有し、
前記音声認識手段は、入力された音声の中で前記キーワード認識手段によって認識されたキーワードを除く文字列を名詞として認識する
ことを特徴とする請求項1記載の学習装置。 - 前記音声認識手段によって認識された音声データには、抑揚の調子を表すピッチ情報を含み、
前記音声合成手段は、前記名詞の文字列と前記ピッチ情報と前記素片事書の素片から音声を合成する
ことを特徴とする請求項1記載の学習装置。 - 前記学習装置は、ロボット、人形、または、玩具に内蔵され、
前記音声合成手段は、
前記素片辞書が、前記学習装置を内蔵したロボット、または、人形、または、玩具の外観に合わせた素片から構成されている
ことを特徴とする請求項1記載の学習装置。 - 画像入力手段から入力した画像から物体を認識する物体認識ステップと、
前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識ステップと、
前記登録モードにおいて、前記音声認識ステップによって認識された名詞に関する記号列を含む音声データと、前記物体認識ステップによって認識された物体に関する画像データを対応付けて記憶する登録記憶ステップと、
前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識ステップで認識された物体が、前記登録記憶ステップで記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成ステップと、
を有する
ことを特徴とする学習方法。 - 画像入力手段から入力した画像から物体を認識する物体認識機能と、
前記物体を登録させる登録モードにおいて、音声入力装置から入力した音声から名詞を認識する音声認識機能と、
前記登録モードにおいて、前記音声認識機能で認識された名詞に関する記号列を含む音声データと、前記物体認識機能で認識された物体に関する画像データを対応付けて記憶する登録記憶機能と、
前記登録された物体か否かを認識させる認識モードにおいて、前記物体認識機能で認識された物体が、前記登録記憶機能で記憶された物体と一致したときに、前記記憶された物体と対応して記憶されている音声データと予め記憶されている素片辞書の音声の素片に基づいて音声を合成する音声合成機能と、
をコンピュータによって実現する
ことを特徴とする学習方法のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003345071A JP3919726B2 (ja) | 2003-10-02 | 2003-10-02 | 学習装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003345071A JP3919726B2 (ja) | 2003-10-02 | 2003-10-02 | 学習装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005110726A true JP2005110726A (ja) | 2005-04-28 |
JP3919726B2 JP3919726B2 (ja) | 2007-05-30 |
Family
ID=34538446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003345071A Expired - Fee Related JP3919726B2 (ja) | 2003-10-02 | 2003-10-02 | 学習装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3919726B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648652A (zh) * | 2019-11-07 | 2020-01-03 | 浙江如意实业有限公司 | 一种智能互动玩具 |
US20210291379A1 (en) * | 2018-12-03 | 2021-09-23 | Groove X, Inc. | Robot, speech synthesizing program, and speech output method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110815243A (zh) * | 2019-11-14 | 2020-02-21 | 深圳市博悦生活用品有限公司 | 智能语音双语早教机器人 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109559A (ja) * | 2000-10-02 | 2002-04-12 | Canon Inc | キャラクタ生成システム、装置、方法、及びコンピュータ読み取り可能な記憶媒体 |
JP2002258885A (ja) * | 2001-02-27 | 2002-09-11 | Sharp Corp | テキスト音声合成装置およびプログラム記録媒体 |
JP2002264051A (ja) * | 2001-03-09 | 2002-09-18 | Japan Science & Technology Corp | ロボット視聴覚システム |
JP2002318590A (ja) * | 2001-04-20 | 2002-10-31 | Sony Corp | 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体 |
JP2003117866A (ja) * | 2001-10-16 | 2003-04-23 | Nec Corp | ロボット装置及びその制御方法 |
JP2003202895A (ja) * | 2002-01-10 | 2003-07-18 | Sony Corp | 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム |
JP2003255991A (ja) * | 2002-03-06 | 2003-09-10 | Sony Corp | 対話制御システム、対話制御方法及びロボット装置 |
JP2003255989A (ja) * | 2002-03-06 | 2003-09-10 | Sony Corp | 学習装置及び学習方法並びにロボット装置 |
-
2003
- 2003-10-02 JP JP2003345071A patent/JP3919726B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109559A (ja) * | 2000-10-02 | 2002-04-12 | Canon Inc | キャラクタ生成システム、装置、方法、及びコンピュータ読み取り可能な記憶媒体 |
JP2002258885A (ja) * | 2001-02-27 | 2002-09-11 | Sharp Corp | テキスト音声合成装置およびプログラム記録媒体 |
JP2002264051A (ja) * | 2001-03-09 | 2002-09-18 | Japan Science & Technology Corp | ロボット視聴覚システム |
JP2002318590A (ja) * | 2001-04-20 | 2002-10-31 | Sony Corp | 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体 |
JP2003117866A (ja) * | 2001-10-16 | 2003-04-23 | Nec Corp | ロボット装置及びその制御方法 |
JP2003202895A (ja) * | 2002-01-10 | 2003-07-18 | Sony Corp | 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム |
JP2003255991A (ja) * | 2002-03-06 | 2003-09-10 | Sony Corp | 対話制御システム、対話制御方法及びロボット装置 |
JP2003255989A (ja) * | 2002-03-06 | 2003-09-10 | Sony Corp | 学習装置及び学習方法並びにロボット装置 |
Non-Patent Citations (2)
Title |
---|
"オフィス移動ロボットJijo−2の音声対話システム", 日本ロボット学会誌 第18巻 第2号, vol. 第18巻 第2号, CSNG200100742024, 15 March 2000 (2000-03-15), JP, pages 300 - 307, ISSN: 0000777943 * |
"形状・構造に関する言語シンボルの概念を学習により獲得するための画像−言語知識表現法", 電子情報通信学会論文誌 VOL.J80−D−II NO.9〔情報・システムII−情報処理〕, vol. 第J80−D−II巻 第9号, CSNG199700192021, 25 September 1997 (1997-09-25), JP, pages 2446 - 2456, ISSN: 0000777942 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210291379A1 (en) * | 2018-12-03 | 2021-09-23 | Groove X, Inc. | Robot, speech synthesizing program, and speech output method |
CN110648652A (zh) * | 2019-11-07 | 2020-01-03 | 浙江如意实业有限公司 | 一种智能互动玩具 |
CN110648652B (zh) * | 2019-11-07 | 2021-10-01 | 浙江如意实业有限公司 | 一种智能互动玩具 |
Also Published As
Publication number | Publication date |
---|---|
JP3919726B2 (ja) | 2007-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018204246B2 (en) | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method | |
CN108231070B (zh) | 语音对话装置、语音对话方法、记录介质以及机器人 | |
US7676372B1 (en) | Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech | |
CN111276120B (zh) | 语音合成方法、装置和计算机可读存储介质 | |
Roy et al. | Learning words from sights and sounds: A computational model | |
CN105224073B (zh) | 一种基于语音控制的点读手表及其点读方法 | |
CN110136698A (zh) | 用于确定嘴型的方法、装置、设备和存储介质 | |
CN110931111A (zh) | 基于虚拟现实及多模态信息的孤独症辅助干预***及方法 | |
JP2000187435A (ja) | 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法 | |
JP4250340B2 (ja) | 仮想ペット装置及びその制御プログラム記録媒体 | |
Filntisis et al. | Video-realistic expressive audio-visual speech synthesis for the Greek language | |
KR20180012192A (ko) | 유아동용 학습 장치 및 그 동작 방법 | |
ES2942894T3 (es) | Procedimiento de lectura automática de labios utilizando un componente funcional y para suministrar el componente funcional | |
JP3919726B2 (ja) | 学習装置及びその方法 | |
JP7495125B2 (ja) | ロボット、音声合成プログラム、及び音声出力方法 | |
Roweis | Data-driven production models for speech processing | |
JPH0772888A (ja) | 情報処理装置 | |
JP6972526B2 (ja) | コンテンツ提供装置、コンテンツ提供方法、及びプログラム | |
US20070003140A1 (en) | Electronic device and method for outputting response information in electronic device | |
JP4250635B2 (ja) | 仮想ペット装置及びその制御プログラム記録媒体 | |
JP4254400B2 (ja) | 画像生成装置およびその画像生成方法、ならびにコンピュータ読み取り可能な記録媒体 | |
JP2006142407A (ja) | ロボット装置およびロボット装置システム | |
TW201712647A (zh) | 呈現發音方式的方法及機器人 | |
JP3848076B2 (ja) | 仮想生物システム及び仮想生物システムにおけるパタン学習方法 | |
JP2002372988A (ja) | 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070213 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100223 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140223 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |