JP6693111B2 - 対話装置、ロボット、対話方法及びプログラム - Google Patents

対話装置、ロボット、対話方法及びプログラム Download PDF

Info

Publication number
JP6693111B2
JP6693111B2 JP2015243001A JP2015243001A JP6693111B2 JP 6693111 B2 JP6693111 B2 JP 6693111B2 JP 2015243001 A JP2015243001 A JP 2015243001A JP 2015243001 A JP2015243001 A JP 2015243001A JP 6693111 B2 JP6693111 B2 JP 6693111B2
Authority
JP
Japan
Prior art keywords
user
authentication
dialogue
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015243001A
Other languages
English (en)
Other versions
JP2017108767A (ja
Inventor
豊 小野寺
豊 小野寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2015243001A priority Critical patent/JP6693111B2/ja
Priority to US15/289,078 priority patent/US10614203B2/en
Priority to CN201611019757.0A priority patent/CN107053186B/zh
Publication of JP2017108767A publication Critical patent/JP2017108767A/ja
Application granted granted Critical
Publication of JP6693111B2 publication Critical patent/JP6693111B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/70Multimodal biometrics, e.g. combining information from different biometric modalities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Game Theory and Decision Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Toys (AREA)
  • Manipulator (AREA)
  • Collating Specific Patterns (AREA)

Description

本発明は、対話装置、ロボット、対話方法及びプログラムに関する。
近時、ユーザを認証(例えば、個人認証や年齢・性別などを認証)して、そのユーザに合わせて対話するロボットが知られてきている。
ここで、特許文献1には、ロボットの認証に関して、ユーザの顔が画角に収まらない場合、ユーザの顔が画角内に入るように音声誘導するロボットが開示されている。
特開2007−152444号公報
ところで、ユーザとロボットとの位置関係は多様であり、対面の場合(画角内にユーザの顔が入る場合)もあれば、双方共に同方向を向いたりユーザがロボットを抱えるような場合(画角内にユーザの顔が入らない場合)もある。画角内にユーザの顔が入らない場合に、上記特許文献1のように音声誘導すると、ユーザは違和感を覚え、場合によっては自然な会話に支障をきたすおそれがある。
一方で、ユーザが近くにいるにもかかわらず、画角内にユーザの顔が入らないからといってそのユーザの認証を行わずに対話を行うのは好ましくない。
このようなことから、認証ができないような状況(特に、ユーザとロボットとの距離が近接しているのに認証できない状況)であっても、ユーザに違和感を感じさせることなく自然に認証(個人認証や年齢・性別などの認証)を行うことが望まれている。
そこで、本発明は、上述した事情に鑑みてなされたものであり、ユーザに違和感を感じさせることなく自然に認証を行う対話装置等を提供することを目的とする。
上記目的を達成するため、本発明の対話装置は、
ユーザの顔を撮影する撮影手段と、
音声を取得する取得手段と、
前記撮影手段により撮影された前記ユーザの顔又は前記取得手段により取得された前記ユーザの音声に基づいて、前記ユーザの認証を行う認証手段と、
前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段と、
前記発話を促されたユーザの音声に基づいて前記認証手段が前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御手段と、
自機が前記ユーザにより保持されていることを示す保持状態か否か判定する保持判定手段と、を備え、
前記発話促進手段は、前記認証手段が前記ユーザを認証できず、前記保持判定手段が前記ユーザによる保持状態であると判定し、かつ、前記ユーザが前記撮影手段の画角に収まらない場合、前記ユーザの発話を促す、
とを特徴とする。
本発明によれば、ユーザに違和感を感じさせることなく自然に認証を行うことができる。
実施形態に係る対話装置の外観を示す図である。 実施形態に係る対話装置の構成を示す図である。 認証用DB(Data Base)の一例を示す図である。 個人情報DBの一例を示す図である。 質問テンプレートの一例を示す図である。 応答テンプレートの一例を示す図である。 実施形態に係る対話処理のフローチャートを示す図である。
以下、図1を参照しながら、本発明の実施形態に係る対話装置の概要について説明する。この対話装置1は、対話相手となるユーザを認証して対話する対話エンジンであって、ロボット100に内蔵される。ロボット100は、対話装置1を内蔵することで、コミュニケーションロボットとしての人工知能を備え、ユーザと対話可能になる。
ロボット100は、ユーザとのインターフェイスとして、耳部分がユーザの音声を収音するマイク41、口部分がユーザに音声出力するスピーカ42、目部分がユーザを撮影するカメラ40、となっている。このロボット100は、人が親しみを感じるように、抱き心地のよい素材でできており、かわいい外見をしている。この実施形態においてはロボット100が玩具用である場合を例にとって説明するが、用途は玩具用に限らずコミュニケーションを必要とするものであれば適用することができる。
図2に示すように、ロボット100は、上記インターフェイス(カメラ40、マイク41、スピーカ42)以外に、操作ボタン43、電池44、対話装置1、を備える。
操作ボタン43は、対話装置1を操作するための各種ボタンであって、例えば、電源ボタンなどである。電池44は、対話装置1に内蔵される充電池である。
対話装置1は、加速度センサ45、制御部10、記憶部30を備える。
加速度センサ45は、XYZ方向(3軸)の加速度を測定するセンサである。この加速度センサ45は、後述するように、ユーザがロボット100を抱いた状態を含む保持状態か否かを検知するために使用される。
制御部10は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などで構成される。制御部10は、ROMに記憶されたプログラム(例えば、後述する対話処理に係るプログラム)を実行することにより、各部(認証部11、保持判定部12、発話促進部13、対話制御部14、リセット部15)の機能を実現する。
記憶部30は、フラッシュメモリなどの不揮発性メモリである。各データベース(認証用DB31、個人情報DB32、対話用DB33)については後述する。
次に、制御部10の機能について説明する。
制御部10は、機能として、認証部11、保持判定部12、発話促進部13、対話制御部14、を備える。
認証部11は、音声又は画像によりユーザの認証を行う。この実施形態においては、ユーザの個人情報(例えば、ニックネームやプロフィールなどの詳細な情報)を特定する個人認証を行う場合を例にとって説明する。この場合、認証部11は、音声又は画像(特に、顔画像)を用いて、ユーザの個人認証を行う。
具体的には、認証部11は、個人認証のために認証用DB31を用いる。認証用DB31は、図3に示すように、ユーザ名毎に、そのユーザの顔画像と声紋とを対応付けたデータベースである。認証部11は、個人認証を行う場合、カメラ40で撮影した顔画像と、認証用DB31が記憶する顔画像A1〜Z1と、を順に比較する。そして、類似度が本人であると識別できる閾値以上の顔画像に対応付けられたユーザ名を特定する。なお、認証用DB31は、顔画像に代えて、SIFT(Scale-Invariant Feature Transform)などを用いてユーザ毎の顔特徴量を記憶しておき、カメラ40で撮影した顔画像から抽出した顔特徴量と比較することでユーザ名を特定してもよい。
一方、認証部11は、顔画像に加えて音声を用いて個人認証を行う。この場合、マイク41で収音した音声から求めた声紋(音声の周波数分布を示すサウンドスペクトログラム)と、認証用DB31が記憶する声紋A2〜Z2と、を順に比較して、最も類似する声紋に対応付けられたユーザ名を特定する。あるいは、声紋に代えて、ユーザ毎の音素(音の最小単位)を記憶しておき、収音した音声を音素に分解して、音素毎に比較してもよい。
認証部11は、このように音声(一例として声紋)又は顔画像の何れか一方を用いてユーザの個人認証を行う。認証部11は、個人認証ができると個人情報DB32から認証したユーザの個人情報を読み出す。個人情報DB32は、図4に示すように、ユーザ名毎に、個人情報(ニックネーム、プロフィール)を対応付けたデータベースである。ニックネームはユーザの呼び名であり、プロフィールはユーザと対話するにあたって有用な情報(例えば、誕生日や家族構成など)である。例えば、認証部11がユーザAを個人認証した場合、読み出されたユーザAの個人情報(Aさん、a)が対話に活用される。
図2に戻って、保持判定部12は、自機がユーザにより保持されていることを示す保持状態か否か判定する。ここで、保持とは、ユーザがロボット100(対話装置1)を抱える等していること意味する。保持状態か否かは加速度センサ45を用いて検出する。すなわち、ユーザがロボット100を保持していない状態において、静止中のロボット100の加速度は、水平方向(XY成分)は0G、垂直方向(Z成分)は1G(約9.8m/s)である。つまり、水平方向と垂直方向の加速度の平均値(XYZ成分の加速度の平均値)は約1Gとなる。
一方、ユーザがロボット100を保持した場合は、水平成分と垂直成分の加速度が変わって、加速度が揺らぐ。通常、この揺らぎの程度は、XYZ成分の加速度の平均値の場合1Gを超える。このため、1G以上の第1の閾値を予め設定しておき、この第1の閾値以上の加速度が所定期間継続して加速度センサ45から出力される場合、保持状態であるとする。つまり、保持判定部12は、加速度センサ45から出力される水平・垂直方向の加速度の平均値が第1の閾値以上であって、かつ、その第1の閾値以上の加速度が所定期間継続して加速度センサ45から出力される場合、保持状態であると判定する、
ここで、ロボット100の実際のユースケースにおいては、ユーザがロボット100を抱いた後、第三者がロボット100を抱く場合がある。この場合、通常、加速度の揺らぎが第1の閾値よりも大きくなる。このため、第1の閾値よりも大きい第2の閾値を設定しておき、この第2の閾値以上の加速度が所定期間継続して加速度センサ45から出力される場合、不安定保持状態であるとする。あるいは、第三者がロボット100をユーザに代わって抱く場合、ロボット100が反転等して加速度センサ45の軸が変わる可能性があるので、軸変化をモニタして不安定保持状態を検知してもよい。
このように、保持判定部12は、加速度センサ45を用いて、ユーザが自機を保持していない状態(未保持状態)、ユーザが自機を保持している保持状態(安定保持状態)、保持主体がユーザから第三者に交代した状態(不安定保持状態)、の3状態のうち何れか1つの状態を判定する。なお、安定保持状態とは加速度平均値が第1の閾値以上の場合を、不安定保持状態とは加速度平均値が第2の閾値以上の場合を、それぞれいう。
次に、発話促進部13は、認証部11が音声及び顔画像により個人認証ができない場合、ユーザの発話を促す。ここでは、ユーザが発話せず、かつ、ユーザの顔が画角に収まらないような場合に、発話促進部13は、ユーザの発話を促すために自発的に質問をする。この実施形態では、特に、発話促進部13は、認証部11がユーザを個人認証できず、かつ、保持判定部12がそのユーザによる安定保持状態であると判定した場合、そのユーザの発話を促すための質問を行う。ユーザがロボット100を抱えているにもかかわらず、個人認証ができないといった事態を防ぐためである。
ここで、自発的な質問は、図5に示す対話用DB33の質問テンプレートを用いて行う。すなわち、発話促進部13は、質問テンプレートの中からランダムに1つの質問文を選択して、質問文のテキストを音声合成しユーザに向けて質問をする。質問は、ユーザの応答音声から個人認証をするための疑問文であればよく、ユーザが「はい」又は「いいえ」で短く回答できるクローズドクエスチョンを除くことが好ましい。加えて、ユーザに個人認証ができていないことを悟られないように、不自然な質問(例えば、「あなたは誰ですか?」など)はあえて避けて、自然な質問をするとよい。例えば、図5に示すような、「今日の調子はどうですか?」「今日1日どうでしたか?」などの類いである。
次に、対話制御部14は、認証部11がユーザの個人認証をした場合そのユーザの個人情報を用いてそのユーザと対話を行う。一方で、対話制御部14は、認証部11がユーザの個人認証をできなかった場合そのユーザの個人情報を用いずにユーザと対話を行う。対話制御部14は、対話にあたって対話用DB33を用いる。対話用DB33は、上述した図5に示す質問テンプレートと、図6に示す応答テンプレートと、を含む。応答テンプレートは、ユーザからの発話に対して応答するためのテンプレートであって、入力テキストに対して、出力テキストと個人情報と感情表現用パラメータとが対応付けられたものである。
入力テキストとはユーザが発話した音声をテキスト化したものであり、出力テキストとは入力テキストに対する応答文であり、個人情報とは個人情報DB32から読み出された個人情報(ニックネーム、プロフィール)であり、感情表現用パラメータとは対話装置1がユーザと対話する際の感情の良好度合いを示すパラメータである。
個人認証ができて個人情報を用いる場合は、個人情報欄が認証したユーザ名(図6の例ではA)になり、一方で個人認証できない場合は個人情報欄が空欄となる。また、個人認証ができた場合は対話装置1の感情表現用パラメータは図6のように「良」となり、個人認証ができない場合は対話装置1の感情表現パラメータは「普通」となる。
対話制御部14は、個人認証できた場合は、出力テキストに個人情報を付加し、かつ、感情表現用パラメータを「良」にして、ユーザと対話する。例えば、入力テキストがあいさつの「おはよう。」であれば、対話制御部14は、それに対応する出力テキスト「おはようございます。」に個人情報であるニックネーム「Aさん」を付加し、声のトーンを「良」に対応するように上げて「Aさん、おはようございます。」と発話する。同時に、「良」に対応するように対話装置1の顔の表情を嬉しい表情に変化させてもよい。一方、個人認証できない場合は、対話制御部14は、個人情報を用いず、かつ、感情を変化させることなく、ユーザに対して「おはようございます。」と応答する。
なお、応答テンプレートは、あいさつなどのカテゴリ毎に複数の入力テキストが用意されており、会話が数ターン続く程度のバリエーションを持つ。また、入力テキストは全文一致である必要はなく、類似一致やユーザの発話に含まれる名詞などのキーワードであってもよい。また、個人情報の活用の仕方(ニックネームを文頭に付加する)は一例であって、出力テキストの内容に応じて、家族構成や誕生日などのプロフィールを加味した応答にしてもよいのはもちろんである。応答テンプレートを用いた対話の仕方は千差万別であり、実施形態は一例に過ぎないことを念のため付言する。
図2に戻って、リセット部15は、保持判定部12により第三者が自機を保持したと判定した場合、認証部11によるユーザの個人認証をリセットする。すなわち、リセット部15は、保持主体が交代して不安定保持状態になると個人認証をリセットする。例えば、保持主体がユーザAからユーザBに代わった際に不安定保持状態になるので、リセット部15は、個人認証したユーザAをリセットする。
以上、図3乃至図6を参照しながら対話装置1の各機能について説明した。以下では、図7を参照しながら対話処理について説明する。この処理は、ロボット100の対話機能がONしている間、継続して行う。また、ロボット100は、個人認証を行うためにカメラ40とマイク41をONにして、同時並行で音声と顔画像による個人認証を実施しているものとする。
まず、認証部11は、個人認証できたか否か判定する(ステップS11)。ここで、個人認証ができたとは、顔画像又は音声によりユーザを認証したことをいう。一方で、個人認証ができなかったとは、顔画像及び音声でユーザを認証できなかったことをいう。
ここで、個人認証できなかった場合(ステップS11;No)、保持判定部12は、安定保持状態か否か判定する(ステップS12)。安定保持状態でなければ(ステップS12;No)、すなわち未保持状態又は不安定保持状態であればステップS11に戻る。一方、安定保持状態であれば(ステップS12;Yes)、対話制御部14は、ユーザ音声を認識したか否か判定する(ステップS13)。ユーザ音声を認識した場合(ステップS13;Yes)、対話制御部14は、応答テンプレートを用いて個人情報を用いずにユーザに応答し(ステップS15)、ステップS11に戻る。この際、ユーザ音声から個人認証を行う。
一方で、ユーザ音声を認識しない場合(ステップS13;No)、発話促進部13は、質問テンプレートを用いてユーザに質問して(ステップS14)、ステップS11に戻る。この際、自発的な質問に対する応答で得られるユーザ音声から個人認証を行う。このように、個人認証ができない場合の安定保持状態においてユーザが発話しなければ、自発的に質問をしてユーザの発話を促す。
一方で、個人認証できた場合(ステップS11;Yes)、対話制御部14は、個人情報DB32から個人情報を読み出す(ステップS16)。次に、保持判定部12は、不安定保持状態か否か判定する(ステップS17)。不安定保持状態でなければ(ステップS17;No)、すなわち安定保持状態又は未保持状態であれば、対話制御部14は、ユーザ音声を認識したか否か判定する(ステップS18)。ユーザ音声を認識してなければ(ステップS18;No)、ステップS17に戻る。一方、ユーザ音声を認識した場合(ステップS18;Yes)、対話制御部14は、個人情報を用いてユーザに応答して(ステップS19)、ステップS17に戻る。
このように、個人認証ができた場合は、不安定保持状態にならない間は(ユーザが対話装置1を保持しているか、対話装置1が未保持状態で静止中である間は)、ユーザ音声があると応答するようにしている。これはユーザが対話装置1を保持した状態で何かしている(例えば、テレビを見る等)、あるいは未保持状態ではユーザの対話装置1に対する注目度が低いことを考慮したものである。ただし、ユーザ音声がない場合でも個人情報を用いて自発的に質問(例えば、「Aさん、今日一日どうでしたか?」などの質問)をしてもよい。
ここで、不安定保持状態になった場合(ステップS17;Yes)、すなわち保持主体が個人認証されたユーザから第三者に代わった場合、リセット部15は、個人認証をリセットして(ステップS20)、個人認証ができていない状態にする。その後、ステップS13において、ユーザ音声を認識しなければ(ステップS13;No)、すなわち第三者が発話しなければ、発話促進部13は、自発的に質問して(ステップS14)、第三者の個人認証を行う。第三者が発話すれば、対話制御部14は、個人情報を用いずにユーザに応答して(ステップS15)、第三者の個人認証を行う。
以上、この実施形態に係る対話装置1によれば、認証部11と発話促進部13を備えたことにより、音声・顔画像による認証ができない場合、自発的に質問をしてユーザの発話を促して、認証(特に、個人認証)を行うことができる。とりわけ、この実施形態においては、保持判定部12が安定保持状態であると判定した場合に個人認証ができてなければ、自発的に質問をするようにしている。このため、顔画像による個人認証のために画角内に音声誘導する場合と比較すると、ユーザは聞かれた質問に答えるだけなので、特段自身が認証されていることを意識することがない。したがって、ユーザは違和感を覚えることがなく、個人認証ができないような状況(特に、ユーザが対話装置1を保持することで双方の距離が近接しているのに個人認証できない状況)で自然な個人認証を行うことができる。
また、不安定保持状態の場合、すなわち認証したユーザと対話中に、そのユーザ以外の第三者が自機を保持した場合、ユーザの個人認証をリセットするようにしている。このため、保持主体が代わったにもかかわらず前のユーザの個人情報を用いて第三者と対話することがない。したがって、第三者は対話装置1との対話において違和感を感じることがない。加えて、第三者は、自ら話すか、又は質問に応答するかで個人認証されるので、スムーズに認証主体を切り替えることができる。
また、対話制御部14は、ユーザの個人認証をした場合、そのユーザの個人情報を用いて対話する。このため、ユーザは親近感がわくので、対話装置1との間の絆を深めることができる。
以上で実施形態の説明を終了するが、上記実施形態は一例であり、対話装置1の構成や対話処理の内容などが上記実施形態で説明したものに限られないことはもちろんである。
(変形例)
上述した実施形態においては、個人認証を例にとって説明したが、これに限られない。ユーザの年齢又は性別を認証するための年齢性別認証を行ってもよい。この年齢性別認証とは、ユーザの年齢又は性別のうち、少なくとも何れか一方を示す年齢性別情報を特定する認証である。
この変形例において、認証部11は、ユーザの年齢又は性別を示す年齢性別情報を特定する年齢性別認証を行う。年齢性別認証にあたっては、個人情報を特定するために個人毎の顔画像と声紋を予めデータベース化しておく個人認証と異なり、年齢又は性別を特定するに足りる情報をデータベース化しておけばよい。
例えば、性別であれば、男女で顕著に異なる声質(声のピッチの違いなど)、骨格や髪型などから判別することができる。あるいは年齢であれば、子供か老人かは上記と同様に声質、骨格、体格などから判別することができる。年齢を細かく推定する場合は(例えば、10代、20代・・・60代など年齢層で推定する場合は)、年代を特定するための情報(例えば、10代の音声のサンプリングデータなど)を記憶しておけばよい。総じて、年齢性別認証の場合、予め記憶しておく情報量が個人認証と比べて減るので記憶容量を削減することができる。
そして、対話制御部14は、認証部11がユーザの年齢性別認証をした場合、そのユーザの年齢性別情報を用いてそのユーザと対話を行う。例えば、ユーザが老人であれば敬語を使う、ユーザが子供であれば子供向きの対話を行う、などである。また、音声及び顔画像により年齢性別認証できない場合に行う自発的な質問は、年齢性別に応じて異ならせるとよい。例えば、老人用と子供用の質問テンプレートを用意しておき、老人用であれば発話促進部13は、「体の調子はどうですか。」と質問し、子供用であれば「今日は何して遊ぶ?」などと質問するとよい。
このように、この変形例によれば、対話相手となるユーザについて音声・顔画像により年齢性別認証できない場合、自発的に質問して自然に年齢性別認証をすることができる。加えて、年齢性別認証によりユーザを大まかに分類した上で、その年齢性別に応じてユーザと対話することができる。
上述した実施形態及び変形例においては、発話促進部13は、自発的に質問することによりユーザ音声を得て認証(個人認証又は年齢性別認証)するようにしたが、これに限らない。例えば、疑問系の質問に代えて、発話促進部13は、ユーザが興味を持つような発言をしてもよい。例えば、季節に応じた話題や最近のニュースなどを対話装置1がクラウドなどから取得して、それを読み上げるようにしてもよい。ユーザから声のリアクションが得られれば認証できるからである。あるいは、発話促進部13は、対話装置1の動作(ユーザの興味をそそるしぐさなど)又は表情を変える等してユーザからの発話を促進してもよい。要は、個人認証や年齢性別認証のためにユーザからの音声を得られればよく、そのための手段は問わない。
また、上述した実施形態においては、個人情報DB32は、個人情報としてニックネームとプロフィールを記憶するようにしたが、これに限らない。例えば、ユーザの趣味嗜好、好きな話題、過去の会話履歴や通算の対話時間など、対話に有用な情報を記憶するようにしてもよい。特に、過去の会話履歴からユーザの好む話題などの傾向分析をして自発的に質問する場合はその話題について質問してもよい。また、通算の対話時間が他のユーザに比べて極端に低い場合は、対話装置1のことを良く思っていないとして、個人認証しても感情表現パラメータを「良」にせず「普通」のままにしてもよい。
また、上述した実施形態の対話処理では、個人認証ができた場合と、個人認証ができなかった場合とで説明した。しかし、音声又は顔画像を取得できたものの、認証用DB31にユーザ名が登録されていない、つまり未登録ユーザを検知するような場合もある。このような未登録ユーザを検知した場合は、設計仕様にも依るが、不審者として対話を打ち切っても構わないし、知らない人物であっても対話を行ってもよい。対話を行う場合は、実施形態と同様に、対話用DB33の質問テンプレートと応答テンプレートを用いて個人情報を用いずに対話を行えばよい。
また、上述した実施形態においては、対話装置1が玩具用のロボット100に内蔵される場合を前提に説明したが、これに限らない。この対話装置1は、認証機能と対話機能を備えており、これらを用いるロボットであれば組み込むことができる。例えば、掃除ロボットや捜索ロボットなどに対話装置1を組み込んでもよい。
また、この発明の対話装置1の各機能は、通常のPC(Personal Computer)等のコンピュータによっても実施することができる。具体的には、上記実施形態では、対話装置1が行う測位処理のプログラムが、制御部10のROMに予め記憶されているものとして説明した。しかし、プログラムを、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)及びMO(Magneto Optical Disc)等のコンピュータ読み取り可能な記録媒体に格納して配布し、そのプログラムをコンピュータにインストールすることにより、上述の各機能を実現することができるコンピュータを構成してもよい。
以上、本発明の好ましい実施形態について説明したが、本発明は係る特定の実施形態に限定されるものではなく、本発明には、特許請求の範囲に記載された発明とその均等の範囲が含まれる。以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
(付記1)
ユーザの認証を行う認証手段と、
前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段と、
前記発話を促されたユーザの音声から前記認証手段が該ユーザを認証した場合、該認証したユーザに応じた対話を行う対話制御手段と、
を備えたことを特徴とする対話装置。
(付記2)
前記認証手段は、前記認証として、前記ユーザの個人情報を特定する個人認証を行い、
前記対話制御手段は、前記認証手段が前記ユーザの個人認証をした場合、該ユーザの個人情報を用いて該ユーザと対話を行う、
ことを特徴とする付記1に記載の対話装置。
(付記3)
前記認証手段は、前記認証として、前記ユーザの年齢又は性別を示す年齢性別情報を特定する年齢性別認証を行い、
前記対話制御手段は、前記認証手段が前記ユーザの年齢性別認証をした場合、該ユーザの年齢性別情報を用いて該ユーザと対話を行う、
ことを特徴とする付記1に記載の対話装置。
(付記4)
前記発話促進手段は、前記認証手段が音声及び画像により前記ユーザを認証できない場合、該ユーザに質問して発話を促し、
前記認証手段は、前記質問に対する前記ユーザの音声から、該ユーザの認証を行う、
ことを特徴とする付記1乃至3の何れか一つに記載の対話装置。
(付記5)
前記発話促進手段は、前記認証手段が音声及び画像により前記ユーザを認証できない場合、自機の動作又は表情を変えて、該ユーザの発話を促し、
前記認証手段は、前記動作又は表情に対する前記ユーザの音声から、該ユーザの認証を行う、
ことを特徴とする付記1乃至3の何れか一つに記載の対話装置。
(付記6)
自機がユーザにより保持されていることを示す保持状態か否か判定する保持判定手段を備え、
前記発話促進手段は、前記認証手段が前記ユーザを認証できず、かつ、前記保持判定手段が該ユーザによる保持状態であると判定した場合、該ユーザの発話を促す、
ことを特徴とする付記1乃至5の何れか一つに記載の対話装置。
(付記7)
前記対話制御手段により前記ユーザと対話中に、該ユーザ以外の第三者が自機を保持したか否か判定する第三者保持判定手段と、
前記第三者保持判定手段により前記第三者が自機を保持したと判定した場合、前記認証手段による前記ユーザの認証をリセットするリセット手段と、
を備えた、
ことを特徴とする付記6に記載の対話装置。
(付記8)
付記1乃至7の何れか一つに記載の対話装置を備えたロボット。
(付記9)
ユーザの認証を行う認証ステップと、
前記認証ステップにおいて認証できない場合、前記ユーザの発話を促す発話促進ステップと、
前記発話を促されたユーザの音声から前記認証ステップにおいて該ユーザを認証した場合、該認証したユーザに応じた対話を行う対話制御ステップと、
を備えたことを特徴とする対話方法。
(付記10)
コンピュータを、
ユーザの認証を行う認証手段、
前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段、
前記発話を促されたユーザの音声から前記認証手段が該ユーザを認証した場合、該認証したユーザに応じた対話を行う対話制御手段、
として機能させるためのプログラム。
1…対話装置、10…制御部、11…認証部、12…保持判定部、13…発話促進部、14…対話制御部、15…リセット部、30…記憶部、31…認証用DB、32…個人情報DB、33…対話用DB、40…カメラ、41…マイク、42…スピーカ、43…操作ボタン、44…電池、45…加速度センサ、100…ロボット

Claims (7)

  1. ユーザの顔を撮影する撮影手段と、
    音声を取得する取得手段と、
    前記撮影手段により撮影された前記ユーザの顔又は前記取得手段により取得された前記ユーザの音声に基づいて、前記ユーザの認証を行う認証手段と、
    前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段と、
    前記発話を促されたユーザの音声に基づいて前記認証手段が前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御手段と、
    自機が前記ユーザにより保持されていることを示す保持状態か否か判定する保持判定手段と、を備え、
    前記発話促進手段は、前記認証手段が前記ユーザを認証できず、前記保持判定手段が前記ユーザによる保持状態であると判定し、かつ、前記ユーザが前記撮影手段の画角に収まらない場合、前記ユーザの発話を促す、
    ことを特徴とする対話装置。
  2. ユーザの認証を行う認証手段と、
    前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段と、
    前記発話を促されたユーザの音声から前記認証手段が前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御手段と、
    前記対話制御手段により前記ユーザと対話中に、前記ユーザ以外の第三者が自機を保持したか否か判定する第三者保持判定手段と、
    前記第三者保持判定手段により前記第三者が自機を保持したと判定した場合、前記認証手段による前記ユーザの認証をリセットするリセット手段と、
    を備えた、
    ことを特徴とする対話装置。
  3. 請求項1又は2に記載の対話装置を備えたロボット。
  4. 対話装置の対話方法であって、
    ユーザの顔を撮影手段により撮影する撮影ステップと、
    音声を取得する取得ステップと、
    前記撮影ステップにより撮影された前記ユーザの顔又は前記取得ステップにより取得された前記ユーザの音声に基づいて、前記ユーザの認証を行う認証ステップと、
    前記認証ステップで認証できない場合、前記ユーザの発話を促す発話促進ステップと、
    前記発話を促されたユーザの音声に基づいて前記認証ステップで前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御ステップと、
    自機が前記ユーザにより保持されていることを示す保持状態か否か判定する保持判定ステップと、を備え、
    前記発話促進ステップでは、前記認証ステップで前記ユーザを認証できず、前記保持判定ステップで前記ユーザによる保持状態であると判定し、かつ、前記ユーザが前記撮影手段の画角に収まらない場合、前記ユーザの発話を促す、
    ことを特徴とする対話方法。
  5. 対話装置の対話方法であって、
    ユーザの認証を行う認証ステップと、
    前記認証ステップで認証できない場合、前記ユーザの発話を促す発話促進ステップと、
    前記発話を促されたユーザの音声から前記認証ステップで前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御ステップと、
    前記対話制御ステップにより前記ユーザと対話中に、前記ユーザ以外の第三者が自機を保持したか否か判定する第三者保持判定ステップと、
    前記第三者保持判定ステップにより前記第三者が自機を保持したと判定した場合、前記認証ステップによる前記ユーザの認証をリセットするリセットステップと、
    を備えた、
    ことを特徴とする対話方法。
  6. 対話装置のコンピュータを、
    撮影されたユーザの顔を撮影手段により撮影して取得する画像取得手段、
    音声を取得する音声取得手段、
    前記ユーザの顔又は前記ユーザの音声に基づいて、前記ユーザの認証を行う認証手段、
    前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段、
    前記発話を促されたユーザの音声に基づいて前記認証手段が前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御手段、
    自機が前記ユーザにより保持されていることを示す保持状態か否か判定する保持判定手段、として機能させ、
    前記発話促進手段は、前記認証手段が前記ユーザを認証できず、前記保持判定手段が前記ユーザによる保持状態であると判定し、かつ、前記ユーザが前記撮影手段の画角に収まらない場合、前記ユーザの発話を促す、
    ことを特徴とするプログラム。
  7. 対話装置のコンピュータを、
    ユーザの認証を行う認証手段、
    前記認証手段が認証できない場合、前記ユーザの発話を促す発話促進手段、
    前記発話を促されたユーザの音声から前記認証手段が前記ユーザを認証した場合、前記認証したユーザに応じた対話を行う対話制御手段、
    前記対話制御手段により前記ユーザと対話中に、前記ユーザ以外の第三者が自機を保持したか否か判定する第三者保持判定手段、
    前記第三者保持判定手段により前記第三者が自機を保持したと判定した場合、前記認証手段による前記ユーザの認証をリセットするリセット手段、
    として機能させるためのプログラム。
JP2015243001A 2015-12-14 2015-12-14 対話装置、ロボット、対話方法及びプログラム Active JP6693111B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015243001A JP6693111B2 (ja) 2015-12-14 2015-12-14 対話装置、ロボット、対話方法及びプログラム
US15/289,078 US10614203B2 (en) 2015-12-14 2016-10-07 Robot-human interactive device which performs control for authenticating a user, robot, interaction method, and recording medium storing program
CN201611019757.0A CN107053186B (zh) 2015-12-14 2016-11-17 对话装置、机器人、对话方法以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015243001A JP6693111B2 (ja) 2015-12-14 2015-12-14 対話装置、ロボット、対話方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017108767A JP2017108767A (ja) 2017-06-22
JP6693111B2 true JP6693111B2 (ja) 2020-05-13

Family

ID=59018726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015243001A Active JP6693111B2 (ja) 2015-12-14 2015-12-14 対話装置、ロボット、対話方法及びプログラム

Country Status (3)

Country Link
US (1) US10614203B2 (ja)
JP (1) JP6693111B2 (ja)
CN (1) CN107053186B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10275651B2 (en) * 2017-05-16 2019-04-30 Google Llc Resolving automated assistant requests that are based on image(s) and/or other sensor data
JP6942557B2 (ja) * 2017-08-17 2021-09-29 京セラ株式会社 対話型電子機器、コミュニケーションシステム、方法、およびプログラム
CN107393541B (zh) * 2017-08-29 2021-05-07 百度在线网络技术(北京)有限公司 信息验证方法和装置
CN111183322B (zh) * 2017-10-11 2021-12-10 三菱电机株式会社 空气调节用控制器
CN107808145B (zh) * 2017-11-13 2021-03-30 河南大学 基于多模态智能机器人的交互身份鉴别与跟踪方法及***
CN107863108B (zh) * 2017-11-16 2021-03-23 百度在线网络技术(北京)有限公司 信息输出方法和装置
JP2019175432A (ja) * 2018-03-26 2019-10-10 カシオ計算機株式会社 対話制御装置、対話システム、対話制御方法及びプログラム
CN108882032A (zh) * 2018-06-08 2018-11-23 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
JP7013331B2 (ja) * 2018-06-14 2022-01-31 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム
JP7107017B2 (ja) * 2018-06-21 2022-07-27 カシオ計算機株式会社 ロボット、ロボットの制御方法及びプログラム
JP7326707B2 (ja) * 2018-06-21 2023-08-16 カシオ計算機株式会社 ロボット、ロボットの制御方法及びプログラム
JP6909189B2 (ja) * 2018-08-27 2021-07-28 Kddi株式会社 ユーザ発話テキストに応じてエージェントを交代させるプログラム、サーバ及び方法
CN109262621A (zh) * 2018-09-26 2019-01-25 苏州米机器人有限公司 底盘、包括这种底盘的自助服务机器人及其自主寻人方法
KR20200045821A (ko) 2018-10-23 2020-05-06 삼성전자주식회사 전자의무기록에 기반하여 대화서비스를 제공하는 전자 장치 및 방법
JP7329457B2 (ja) * 2018-12-14 2023-08-18 株式会社ポケモン 着ぐるみ演出支援装置、着ぐるみ演出支援システムおよび着ぐるみ演出支援方法
JP6667878B1 (ja) * 2018-12-14 2020-03-18 株式会社ポケモン 着ぐるみ演出支援装置、着ぐるみ演出支援システムおよび着ぐるみ演出支援方法
CN109756342B (zh) * 2019-01-16 2022-06-07 中民乡邻投资控股有限公司 一种基于声纹的对话交流式的账号身份认证方法及装置
CN111326143B (zh) * 2020-02-28 2022-09-06 科大讯飞股份有限公司 语音处理方法、装置、设备及存储介质
CN113160826B (zh) * 2021-03-01 2022-09-02 特斯联科技集团有限公司 一种基于人脸识别的家庭成员通联方法和***

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4250635B2 (ja) * 1999-03-05 2009-04-08 株式会社バンダイナムコゲームス 仮想ペット装置及びその制御プログラム記録媒体
JP2002116792A (ja) * 2000-10-11 2002-04-19 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2002307354A (ja) * 2000-11-07 2002-10-23 Sega Toys:Kk 電子玩具
AU2003302558A1 (en) * 2002-12-02 2004-06-23 Sony Corporation Dialogue control device and method, and robot device
JP4048492B2 (ja) * 2003-07-03 2008-02-20 ソニー株式会社 音声対話装置及び方法並びにロボット装置
JP3879719B2 (ja) * 2003-08-22 2007-02-14 松下電器産業株式会社 画像入力装置およびそれを用いた認証装置
JP2006006586A (ja) * 2004-06-25 2006-01-12 Partners:Kk 玩具
US8255223B2 (en) * 2004-12-03 2012-08-28 Microsoft Corporation User authentication by combining speaker verification and reverse turing test
JP2006208964A (ja) * 2005-01-31 2006-08-10 Yec Co Ltd 会話装置
EP2281667B1 (en) * 2005-09-30 2013-04-17 iRobot Corporation Companion robot for personal interaction
JP2007152444A (ja) 2005-12-01 2007-06-21 Mitsubishi Heavy Ind Ltd 自走式ロボットおよび情報管理システム
JP2007156688A (ja) * 2005-12-02 2007-06-21 Mitsubishi Heavy Ind Ltd ユーザ認証装置およびその方法
TWI332179B (en) * 2007-04-13 2010-10-21 Univ Nat Taiwan Science Tech Robotic system and method for controlling the same
US20090083826A1 (en) * 2007-09-21 2009-03-26 Microsoft Corporation Unsolicited communication management via mobile device
JP2009178783A (ja) * 2008-01-29 2009-08-13 Toyota Motor Corp コミュニケーションロボット及びその制御方法
JP2010094799A (ja) * 2008-10-17 2010-04-30 Littleisland Inc 人型ロボット
EP2353125A4 (en) * 2008-11-03 2013-06-12 Veritrix Inc USER AUTHENTICATION FOR SOCIAL NETWORKS
JP2009151314A (ja) * 2008-12-25 2009-07-09 Sony Corp 情報処理装置及び情報処理方法
KR101041039B1 (ko) * 2009-02-27 2011-06-14 고려대학교 산학협력단 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치
CN202257700U (zh) * 2010-08-05 2012-05-30 北京海鑫智圣技术有限公司 多认证模式出入控制***
US9526006B2 (en) * 2010-11-29 2016-12-20 Biocatch Ltd. System, method, and device of detecting identity of a user of an electronic device
US8838988B2 (en) * 2011-04-12 2014-09-16 International Business Machines Corporation Verification of transactional integrity
US9548054B2 (en) * 2012-05-11 2017-01-17 Mediatek Inc. Speaker authentication methods and related methods of electronic devices using calendar data
WO2014100236A1 (en) * 2012-12-19 2014-06-26 Visa International Service Association System and method for voice authentication
CN203861914U (zh) 2014-01-07 2014-10-08 深圳市中科睿成智能科技有限公司 一种宠物机器人
CN103729193A (zh) * 2014-01-11 2014-04-16 苏州思必驰信息科技有限公司 一种人机交互方法及装置
US20160150124A1 (en) * 2014-11-24 2016-05-26 Kyocera Document Solutions Inc. Image Forming Apparatus with User Identification Capabilities
US20180165931A1 (en) * 2016-12-14 2018-06-14 Nanjing Avatarmind Robot Technology Co., Ltd. Robot security inspection method based on environment map and robot thereof

Also Published As

Publication number Publication date
JP2017108767A (ja) 2017-06-22
CN107053186A (zh) 2017-08-18
US20170169203A1 (en) 2017-06-15
US10614203B2 (en) 2020-04-07
CN107053186B (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
JP6693111B2 (ja) 対話装置、ロボット、対話方法及びプログラム
US20240054118A1 (en) Artificial intelligence platform with improved conversational ability and personality development
US20210034141A1 (en) Information processing system, client terminal, information processing method, and recording medium
US11386905B2 (en) Information processing method and device, multimedia device and storage medium
US11222632B2 (en) System and method for intelligent initiation of a man-machine dialogue based on multi-modal sensory inputs
JP6755304B2 (ja) 情報処理装置
US11074916B2 (en) Information processing system, and information processing method
JP7396396B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2005076258A1 (ja) ユーザ適応型装置およびその制御方法
JP2017049471A (ja) 対話制御装置、対話制御方法及びプログラム
JP6970413B2 (ja) 対話方法、対話システム、対話装置、およびプログラム
JP2004310034A (ja) 対話エージェントシステム
WO2018230345A1 (ja) 対話ロボットおよび対話システム、並びに対話プログラム
JP2016105142A (ja) 会話評価装置およびプログラム
JP7322374B2 (ja) ロボットの制御装置、ロボット、ロボットの制御方法およびプログラム
JP6787472B2 (ja) 対話制御装置、対話制御方法及びプログラム
WO2021064947A1 (ja) 対話方法、対話システム、対話装置、およびプログラム
EP4297018A1 (en) Techniques for presenting textual messages using a user-specific voice model
JP7474211B2 (ja) ユーザから発話された名詞を忘却する対話プログラム、装置及び方法
WO2020189340A1 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP7218312B2 (ja) 情報処理装置、方法及びプログラム
CN117275453A (zh) 使用用户特定的语音模型呈现文本消息的方法
JP2023053442A (ja) 対話システム、対話システムの制御方法、及びコンピュータプログラム
WO2021064948A1 (ja) 対話方法、対話システム、対話装置、およびプログラム
Ramadhani Speech Style Used by the Dolan Twins towards Family and Friends in Their YouTube Videos

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200210

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200330

R150 Certificate of patent or registration of utility model

Ref document number: 6693111

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150