CN106233378A - 控制装置和消息输出控制*** - Google Patents

控制装置和消息输出控制*** Download PDF

Info

Publication number
CN106233378A
CN106233378A CN201580021613.6A CN201580021613A CN106233378A CN 106233378 A CN106233378 A CN 106233378A CN 201580021613 A CN201580021613 A CN 201580021613A CN 106233378 A CN106233378 A CN 106233378A
Authority
CN
China
Prior art keywords
instructions
mentioned
message
orders
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580021613.6A
Other languages
English (en)
Other versions
CN106233378B (zh
Inventor
杉山树利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN106233378A publication Critical patent/CN106233378A/zh
Application granted granted Critical
Publication of CN106233378B publication Critical patent/CN106233378B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Toys (AREA)

Abstract

防止多个机器人对用户输出相同的消息。具备消息决定部(83),其判断使机器人(2)输出的消息是否与使机器人(1)输出的消息或者已使该机器人(1)输出的消息相同,在判断为相同的情况下,使机器人(2)输出与机器人(1)不同的消息,或者不使机器人(2)输出消息。

Description

控制装置和消息输出控制***
技术领域
本发明涉及控制输出装置对用户输出的消息的控制装置和消息输出控制***。
背景技术
以往已知通过用声音或文字等提示消息而与用户进行交流的对话型机器人。希望这种对话型机器人根据用户的提问等提示最佳的应答消息。因此,开发了使机器人的应答最佳化的各种技术。例如,在专利文献1中开发了对话型机器人取得用户的发话声音并将其发送到计算机,计算机将与用户的发话声音相应的应答文决定为对话型机器人的应答文的技术。
现有技术文献
专利文献
专利文献1:日本公开特许公报“特开2005-3747(公开日:2005年1月6日)”
发明内容
发明要解决的问题
在用户与多个机器人对话的情况下,在上述现有技术中,有可能所有机器人会对用户提示相同的消息。其原因是,各机器人所取得的声音是相同的用户发出的相同的声音,决定与该声音相应的应答文的计算机也是相同的。并且,当然不希望多个机器人对用户的发话进行相同的应答。此外,上述问题不限于对话型机器人,是对用户输出消息的输出装置普遍会产生的问题。
本发明是鉴于上述问题而完成的,其目的在于实现能够防止多个输出装置对用户输出相同的消息的控制装置和消息输出控制***。
用于解决问题的方案
为了解决上述问题,本发明的一方式的控制装置使包括第1输出装置和第2输出装置的多个输出装置输出消息,其特征在于,具备:判断部,其判断使上述第1输出装置输出的消息是否与使上述第2输出装置输出的消息或者已使该第2输出装置输出的消息相同;以及控制部,其在上述判断部判断为相同的情况下,使上述第1输出装置输出不同于上述第2输出装置的消息,或者不使上述第1输出装置输出消息。
发明效果
根据本发明的一方式,起到能够防止多个输出装置对用户输出相同的消息的效果。
附图说明
图1是表示本发明的实施方式1的机器人和服务器的主要部分构成的框图。
图2是表示本发明的实施方式1的消息提示***的概要的图。
图3是表示上述服务器在消息的决定中使用的消息表的数据结构的图。
图4是用时间序列表示上述机器人和上述服务器的信息的流向的序列图。
图5是表示上述服务器进行的消息决定处理的流程的流程图。
图6是表示本发明的实施方式2的消息输出控制***的概要的图。
具体实施方式
[实施方式1]
以下,参照图1~图5说明本发明的第1实施方式。首先,使用图2说明本实施方式的消息输出控制***100。图2是表示本实施方式的消息输出控制***100的概要的图。
《***的概要》
消息输出控制***100是多个机器人分别用于对用户提示与用户发话的内容(发话内容)相应的应答消息的***。如图所示,消息输出控制***100包括机器人(输出装置、第1输出装置、第2输出装置)1和2以及服务器(控制装置)3。此外,在本实施方式中说明机器人是2个的例子,但机器人只要是2个以上即可,其数量没有限定。在以后的实施方式中也是同样的。
机器人1和机器人2是具备用声音与用户对话的功能的装置,检测用户的发话,并用声音或者文字等对该发话输出(提示)应答消息。另外,服务器3是控制机器人1和机器人2的发言内容的装置。在消息输出控制***100中,机器人1和机器人2在检测出用户的发话时,将作为本装置用于决定要对该发话进行回答的应答消息的信息且作为与上述检测出的发话有关的信息的发话信息(输出信息)发送到服务器3。
服务器3在从机器人1或者机器人2接收到发话信息时,决定与发话信息相应的应答消息,并将其发送到发话信息的发送源的机器人。例如,在用户对机器人1进行了“告诉我明天的天气。”的发话的情况下,从机器人1对服务器3发送与上述发话有关的发话信息。在该情况下,服务器3根据发话信息所示的发话内容“告诉我明天的天气。”,将机器人1的应答消息决定为消息A(“晴间多云”这一台词),并向机器人1发送消息A。然后,机器人1输出接收到的消息A。即,机器人1对用户说“晴间多云”。
另外,服务器3在从多个机器人接收到的发话信息中存在多个消息相同的发话信息的情况下,例如在多个机器人检测出用户的相同的发话的情况下,为了不使这些机器人输出相同的应答消息,而将与发话内容相应的应答消息且与其它机器人不同的应答消息返回给发送源的机器人。例如在由机器人1和机器人2这两者检测出用户的发话的情况下,会从各机器人发送与用户的相同的发话有关的发话信息。例如在机器人2与上述机器人1均检测出“请告知告诉我明天的天气。”这一用户的发话的情况下,有时机器人2也会与机器人1几乎同时将发话信息发送到服务器3。在这种情况下,服务器3使机器人1输出消息A,并且使机器人2输出消息A’,消息A’是与用户的发话内容相应的应答消息且与消息A不同。例如,机器人2进行如“最高温度是24度”这种与机器人1不同的发言。这样,在消息输出控制***100中,在多个机器人检测出相同的发话的情况下,例如在用户朝向多个机器人(或者在多个机器人的附近)进行了发话的情况下,能够使多个机器人对用户返回不同的应答消息。
《机器人和服务器的主要部分构成》
接着,使用图1说明构成消息输出控制***100的机器人1、机器人2和服务器3的内部构成。图1是表示本实施方式的机器人1、机器人2和服务器3的主要部分构成的框图。此外,在本实施方式中,机器人2的内部的主要部分构成与机器人1是同样的。因此,关于机器人2的构成,省略图示和说明。
《机器人的主要部分构成》
机器人1具备装置控制部10、话筒20、照相机30、输出部40以及装置通信部50。话筒20将用户的发话转换为声音数据而取得声音信号。话筒20将取得的声音信号向后述的发话信息作成部11发送。照相机30以用户为被摄体进行拍摄。照相机30将拍摄图像(用户的图像)向后述的发话信息作成部11发送。此外,在后述的用户确定部13根据图像数据以外的数据来确定用户的情况下,也可以不设置照相机30。输出部40输出从装置控制部10接收到的消息。作为输出部40,例如只要使用扬声器等即可。装置通信部50用于与服务器3进行数据的发送接收。
装置控制部10综合控制机器人1。装置控制部10将由后述的发话信息作成部11生成的发话信息发送到服务器3。另外,装置控制部10从服务器3接收机器人1输出的消息,使输出部40输出该消息。更详细地说,装置控制部10包括发话信息作成部11、发话内容确定部12以及用户确定部13。另外,虽未图示,但装置控制部10具备计时部。计时部例如能通过装置控制部10的实时时钟来实现。
发话信息作成部11作成发话信息。此外,发话信息作成部11也可以将应答消息的请求与发话信息一起发送到服务器3。发话信息作成部11为了生成发话信息所包含的各种信息,而包括发话内容确定部12和用户确定部13。
发话内容确定部12确定用户的发话内容,并生成表示发话内容的信息(发话内容信息)。发话内容信息的形式没有特别限定,只要后述的服务器3的消息决定部83能够确定与该发话内容信息所示的发话内容相应的应答消息即可。在本实施方式中,发话内容确定部12从用户的发话声音的声音数据中确定和提取1个以上的关键字作为发话内容信息。此外,发话内容确定部12也可以将从话筒20接收到的声音数据本身或者从该声音数据提取出的用户的发话声音作为发话内容信息。
用户确定部13确定进行了发话的用户。用户的确定方法没有特别限定,例如只要从照相机30取得拍摄图像,并通过图像解析来确定在该拍摄图像中拍到的用户即可。另外,用户确定部13也可以通过对话筒20取得的声音数据所包含的声纹进行分析来确定用户。通过这样进行图像分析或者声纹分析,能够准确地(精度良好地)确定进行了发话的用户。
发话信息作成部11作成发话信息,上述发话信息包括发话信息作成时的时刻(发话时刻信息)、发话内容确定部12所生成的发话内容信息、以及表示用户确定部13所确定的用户的信息(用户确定信息)。即,发话信息作成部11作成包括表示“何时(时刻)、谁(用户确定信息)说了什么(发话内容)”的信息的发话信息。然后,发话信息作成部11将作成的发话信息经由装置通信部50发送到服务器3。
《服务器的主要部分构成》
服务器3具备服务器通信部70、服务器控制部80、临时存储部82和存储部90。服务器通信部70用于与机器人1及机器人2进行数据的发送接收。
临时存储部82临时存储发话信息。临时存储部82从消息决定部83接收发话信息和根据该发话信息决定的应答消息,将上述发话信息与上述应答消息相对应而存储规定的期间。此外,优选此处所说的“规定的期间”至少是比基于相同发话的发话信息能从其它机器人到达服务器3的期间(即,机器人之间的通信和处理的时滞)不短的期间。
存储部90保存后述的消息决定部83进行决定消息的处理(消息决定处理)时读出的消息表91。以下,使用图3说明消息表的构成。
《消息表的数据结构》
图3是表示消息表91的数据构成的图。此外,在图3中用表形式的数据结构示出消息表91作为一例,消息表91的数据结构不限于表形式。图3中示例的消息表91包括“发话内容”列、“消息”列和“优先度”列,“消息”列的信息与“发话内容”列的信息是相对应的。而且,“优先度”列的信息与“消息”列的信息是相对应的。
“发话内容”列保存表示用户的发话内容的信息。“发话内容”列的信息是以消息决定部83能与接收到的发话信息所包含的发话内容信息进行对照的形式保存的。例如在发话内容信息是从用户的发话提取出的关键字的情况下,作为“发话内容”列的数据,只要保存表示关键字(或者多个关键字的组合)的信息即可,该关键字(或者多个关键字的组合)表示发话内容。另外,在发话内容信息是发话的声音数据其本身的情况下,作为“发话内容”列的数据,只要保存能与上述声音数据匹配的声音数据即可。
“消息”列保存表示使机器人1和机器人2输出的应答消息的信息。此外,如图所示,消息表91使多个应答消息与1个“发话内容”列的信息相对应。
“优先度”列保存表示与“发话内容”列所示的1个发话内容对应的“消息”列的多个应答消息各自的优先顺序的信息。此外,该优先顺序的赋予方法没有特别限定。此外,“优先度”列的信息不是必须的。在不使用“优先度”列的信息的情况下,可以从与“发话内容”列对应的各应答消息随机地选择1个应答消息。
服务器控制部80综合地控制服务器3,包括发话信息接收部81和消息决定部(判断部、控制部、消息生成部)83。发话信息接收部81经由服务器通信部70取得机器人1和机器人2所发送的发话信息。发话信息接收部81将所取得的发话信息发送到消息决定部83。
消息决定部83决定应答消息。消息决定部83在从发话信息接收部81接收到发话信息时,读出保存于临时存储部82的其它发话信息(在上述发话信息之前接收到的发话信息)以及与该其它发话信息相对应的应答消息。此外,在以后的说明中,将发话信息接收部81接收到的发话信息即服务器3将要决定应答消息的发话信息称为“对象发话信息”。接着,消息决定部83在其它发话信息中检测与对象发话信息对应相同发话的发话信息。消息决定部83为了进行上述检测,而包括时刻判断部84、发话内容判断部85和用户判断部86。
时刻判断部84判断其它发话信息所包含的时刻与对象发话信息所包含的时刻的差是否是规定范围内。此外,时刻判断部84为了提高上述判断的精度,也可以不仅对发话信息所包含的时刻进行计时,还对服务器3接收到该发话信息的时刻进行计时,将其与发话信息一起预先存储。并且,也可以判断对象发话信息的接收时刻与其它发话信息的接收时刻的差是否是规定范围内。由此,即使是在例如机器人1所计时的时刻与机器人2所计时的时刻错开等情况下,也能精度良好地进行时刻的比较。发话内容判断部85判断其它发话信息的发话内容信息与对象发话信息的发话内容信息是否一致。用户判断部86判断对象发话信息的用户确定信息与其它发话信息的用户确定信息是否一致。
消息决定部83根据上述时刻判断部84、发话内容判断部85和用户判断部86的上述判断结果来检测与对象发话信息相比时刻的差是规定范围内、发话内容一致且用户确定信息一致的其它发话信息。以下将消息决定部83检测出的上述其它发话信息称为检测对象发话信息。在此,检测对象发话信息被推定为由于多个机器人大致同时检测出相同的用户的发话而作成的发话信息。换句话说,上述检测对象发话信息被推定为与对象发话信息对应同一发话而作成的发话信息。然后,消息决定部83检索存储部90的消息表91,确定与对象发话信息对应的应答消息。
在应答消息的确定中,消息决定部83使对象发话信息的应答消息不同于检测对象发话信息的应答消息。具体地说,确定与对象发话信息的发话内容信息对应的应答消息中的、与检测对象发话信息的应答消息不同且优先度最高的应答消息。此外,在不存在检测对象发话信息的情况下,确定与对象发话信息的发话内容信息对应的应答消息中的优先度最高的应答消息。然后,消息决定部83将对象发话信息与所确定的应答消息相对应而存储到临时存储部82。
此外,消息决定部83在决定了对象发话信息的应答消息后参照临时存储部82而检测出应答消息相同的其它发话信息的情况下,可以将所决定的应答消息变更为其它应答消息。即使是该构成,也能够防止多个机器人输出相同的应答消息。此外,在该构成中,也可以用检测出的其它发话信息和对象发话信息进行时刻判断部84、发话内容判断部85和用户判断部86的判断处理,在两个发话信息一致的情况下,将所决定的应答消息变更为其它应答消息。
《装置间的数据通信的流程》
接着,使用图4说明机器人1及机器人2与服务器3的数据交换。图4是用时间序列示出机器人1及机器人2与服务器3之间的数据通信的序列图。此外,图4的S300和S400所示的子程序表示图5所示的一连串的消息决定处理(S302~S310)。此外,在以后的说明中,将机器人1的发话信息所包含的时刻设为T1,将发话内容信息设为Q1,将用户确定信息设为U1,将包含它们的发话信息记载为发话信息(T1、Q1、U1)。另外,将机器人2的发话信息所包含的时刻设为T2,将发话内容信息设为Q2,将用户确定信息设为U2,将包含它们的发话信息记载为发话信息(T2、Q2、U2)。
当用户发话时,机器人1和机器人2用话筒20取得发话并将其向发话信息作成部11发送(S100和S200)。另外,此时用照相机30拍摄进行了发话的用户,向发话信息作成部11发送拍摄图像。发话信息作成部11的发话内容确定部12根据声音数据确定用户的发话所包含的关键字。另外,用户确定部13根据拍摄图像确定用户。然后,发话信息作成部11作成附加有所计时的时刻(发话信息作成时的时刻)、发话内容信息和用户确定信息的发话信息(S102和202),将其发送到服务器3。服务器3在从机器人1接收到发话信息(T1、Q1、U1)时,进行消息决定处理(S300)。在此,如图所示,机器人1的发话信息是服务器3首个接收到的(在其它发话信息未被服务器3的临时存储部82存储的状态下接收到的)发话信息,发话信息(T1、Q1、U1)是对象发话信息。因此,不存在检测对象发话信息,消息决定部83将与Q1对应的应答消息中的、优先度最高的应答消息决定为使机器人1输出的应答消息。然后,服务器3将所决定的消息A发送到机器人1。机器人1在接收到消息A时,从输出部40输出消息A(S104)。
接下来,服务器3针对从机器人2接收到的发话信息(T2、Q2、U2)进行消息决定处理(S400)。如上所述,由于之前已进行针对机器人1的发话信息(T1、Q1、U1)的消息决定处理,因此在服务器3的临时存储部82中保存有其它发话信息(发话信息(T1、Q1、U1)),在此,发话信息(T2、Q2、U2)成为对象发话信息。因而,消息决定部83通过时刻判断部84、发话内容判断部85和用户判断部86来判断对象发话信息(T2、Q2、U2)与其它发话信息(T1、Q1、U1)是否一致。并且,在判断为一致的情况下,发话信息(T1、Q1、U1)成为检测对象发话信息。在该情况下,服务器3决定不同于发话信息(T1、Q1、U1)所对应的应答消息A的消息A’,将消息A’发送到机器人2。另一方面,在发话信息(T1、Q1、U1)不是检测对象发话信息的情况下,服务器3不考虑应答消息A而根据Q2决定消息A’,并将消息A’发送到机器人2。机器人2在接收到消息A’时,将其从输出部40输出(S204)。
《消息决定处理》
接着,使用图5说明消息决定部83决定消息的处理(消息决定处理)流程的详细内容。此外,在此作为一例说明在图4的机器人2的决定应答消息时的消息决定处理(S400)。图5是表示消息决定处理的流程的流程图。此外,也可以调换图5的S302~306的处理顺序。
消息决定部83在接收到发话信息(T2、Q2、U2)时,通过进行S302~306的处理来检测其它发话信息中的与对象发话信息(在该例中为T2、Q2、U2)对应相同发话的发话信息。具体地说,消息决定部83所包含的时刻判断部84判断对象发话信息(T2、Q2、U2)的时刻T2与其它发话信息(在该例中为T1、Q1、U1)的时刻T1的差是否是规定范围内(S302)。在T2与T1的差是规定范围内的情况下(S302中为“是”),接着,发话内容判断部85判断Q2与Q1是否一致(S304)。在Q2与Q1一致的情况下(S304中为“是”),用户判断部86判断U2与U1是否一致(S306)。在U2与U1一致的情况下(S306中为“是”),消息决定部83将其它发话信息(T1、Q1、U1)检测为与对象发话信息(T2、Q2、U2)基于相同发话的发话信息(检测对象发话信息)。
然后,消息决定部83决定与Q2相应的消息。具体地说,消息决定部83通过将消息表91的“发话内容”列与Q2所示的发话内容进行对照来确定与Q2对应的应答消息。此外,此时,消息决定部83将不同于与检测对象发话信息(T1、Q1、U1)对应的应答消息即不同于与Q1对应的应答消息的消息中的、优先度最高的消息决定为对象发话信息的发送源的机器人要输出的消息(S308)。
另一方面,在T2与T1的差不是规定范围内的情况、Q2与Q1不同的情况或者U2与U1不同的情况下(S302~S306的其中一个为“否”),消息决定部83判断为不存在检测对象发话信息。此外,在存储有2个以上其它发话信息的情况下,针对每一个其它发话信息进行S302~306的处理。然后,消息决定部83通过参照消息表91,将与对象发话信息对应的应答消息中的、优先度最高的应答消息确定为对象发话信息的发送源的机器人要输出的应答消息(S310)。
[实施方式2]
在本发明中,机器人也可以不是与用户的发话对应地提示应答消息,而是朝向用户自发地输出消息。以下使用图6说明本发明的第2实施方式。以后将机器人自发地输出(发言)的消息称为“自发消息”。
图6是表示本实施方式的消息输出控制***200的概要的图。消息输出控制***200与消息输出控制***100同样地包括多个机器人(机器人(输出装置)1和机器人(输出装置)2)以及服务器(控制装置)4。服务器4的构成与服务器3(参照图1)相同,但服务器4将预先设定的事件(条件)作为触发而使机器人1和机器人2输出自发消息,在这一点上与服务器3不同。此外,上述“预先设定的事件(条件)”没有特别限定。在以后的说明中,作为一例,说明当机器人1和机器人2检测出用户的接近(用户进入机器人的检测范围)时输出自发消息的例子。
机器人1和机器人2在用户进入本装置的检测范围时,将这一情况通知服务器4。服务器4在接收到上述通知时,决定自发消息,并将其发送到该通知的发送源的机器人。例如服务器4在从机器人1接收到上述通知时,将机器人1的自发消息决定为自发消息B(“一起玩吧”这一台词),使机器人1输出该消息。
在此,在用户靠近了机器人1时,在用户的附近存在机器人2的情况下,在机器人2中也会检测出上述用户,并将这一情况通知服务器4。服务器4在这种情况下为了不使机器人2输出与机器人1相同的自发消息而决定机器人2的自发消息。例如,服务器4将与自发消息B不同的自发消息B’(“要帮忙吗?”这一台词)决定为机器人2的自发消息,使机器人2输出该消息。这样,在消息输出控制***200中,能够防止多个机器人在相同的定时对相同的用户输出相同的自发消息。
[实施方式3]
在上述各实施方式中,示出了通过声音发话对用户提示消息的例子,但不限于该例,消息的提示只要是以用户能够识别该消息的方式进行即可。例如,也可以通过在电子公告板等电子介质中登记面向用户的消息来提示消息。在该情况下,服务器3或者4也可以作为机器人1和机器人2的代理(以机器人1和机器人2的名字)来登录消息。
另外,在上述实施方式中,示出了服务器3生成针对用户的声音发话的应答消息的例子,但也可以生成与用户写入(发布于)电子介质的信息相应的消息。例如,考虑服务器3针对用户在短文发布网站上发布的评论而发布机器人1或者机器人2的消息的情况。在该情况下,服务器3可以在判断为两个机器人的消息相同时,通过仅发布其中一个机器人的消息或使各机器人的消息不同等来进行控制,以使得不会对1个评论发布相同的消息。此外,各机器人的消息的发布不限于用户的发布,也可以在满足规定的条件时(例如成为预先设定的日期和时间时)进行。
[变形例]
在上述实施方式的消息输出控制***100和200中,通过1个服务器3或者4实现了消息的决定和机器人的输出控制等功能,但这些功能也可以通过不同的服务器来实现。例如,即使是决定机器人1或者机器人2要输出的应答消息(或者自发消息)的消息决定服务器与使机器人输出该消息决定服务器所决定的消息的输出控制服务器的组合,也能够实现与消息输出控制***100和200同样的功能。
另外,用户确定部13也可以根据机器人1的位置信息确定对该机器人1进行了发话的用户。例如,在机器人1的位置信息表示的是该机器人在某用户的居室内的位置的情况下,能够将对机器人1进行了发话的用户确定为上述某用户。此外,也可以使用GPS(GlobalPositioning System:全球定位***)来取得位置信息。另外,在室内等GPS的接收灵敏度下降的情况下,也可以使用本装置所具有的无线通信功能来校正位置信息。另外,还可以使用例如IMES(Indoor MEssaging System:室内消息***)功能或者根据照相机30所取得的图像等来确定本装置的位置。
另外,在消息输出控制***100中,机器人1和机器人2也可以不在发话内容确定部12中确定发话内容,而是将话筒20所取得的声音数据本身设为发话内容信息。在该情况下,只要在服务器3侧进行表示发话内容的关键字的提取即可。在该情况下,也可以在服务器3侧通过进行声音数据的声纹认证来确定用户,由此,机器人1和机器人2无需发送用户确定信息。
另外,服务器3在从机器人1和机器人2接收到发话信息的情况下,也可以不是按到达先后顺序进行消息决定处理,而是在从其中一个机器人接收到发话信息后待机规定时间。然后,服务器3在待机过程中从另一机器人接收到发话信息的情况下,按照预先决定的顺序或者随机地分别进行针对上述接收到的发话信息的消息决定处理。更具体地说,服务器3既可以按照沿着各个发话信息的发送源的机器人所设定的优先度的顺序进行消息决定处理,也可以根据发话信息所包含的各种信息的内容(例如发话内容的确定精度等)来决定进行消息决定处理的顺序,即决定分配优先度高的消息的顺序。
另外,在上述各实施方式中,示出了使各机器人输出不同的消息的例子,但也可以设为使其中一个机器人不输出消息(不发送消息)的构成。通过该构成,也能够使多个机器人不会输出相同的消息。
[基于软件的实现例]
机器人1、机器人2、服务器3和服务器4的控制模块(特别是发话信息作成部11和消息决定部83)既可以通过形成于集成电路(IC芯片)等的逻辑电路(硬件)来实现,也可以使用CPU(Central Processing Unit:中央处理单元)通过软件来实现。
在后一情况下,机器人1、机器人2和服务器3具备:执行作为实现各功能的软件的程序的命令的CPU、以计算机(或者CPU)可读取的方式记录有上述程序和各种数据的ROM(Read Only Memory:只读存储器)或者存储装置(将它们称为“记录介质”)、展开上述程序的RAM(Random Access Memory:随机存取存储器)等。然后,计算机(或者CPU)从上述记录介质读取并执行上述程序从而达到本发明的目的。作为上述记录介质,能够使用“非临时性有形介质”、例如带、盘、卡、半导体存储器、可编程逻辑电路等。另外,上述程序可以经由能传送该程序的任意的传送介质(通信网络或广播波等)供应到上述计算机。此外,本发明也能够以通过电子传送使上述程序具体化的嵌入载波的数据信号的方式来实现。
[总结]
本发明的方式1的控制装置(服务器3和4)使包括第1输出装置和第2输出装置的多个输出装置(机器人1和机器人2)输出消息(应答消息或者自发消息),其特征在于,具备:判断部(消息决定部83),其判断使上述第1输出装置输出的消息是否与使上述第2输出装置输出的消息或者已使该第2输出装置输出的消息相同;以及控制部(消息决定部83),其在上述判断部判断为相同的情况下,使上述第1输出装置输出与上述第2输出装置不同的消息,或者不使上述第1输出装置输出消息。
根据上述构成,控制装置能够在使第1输出装置输出的消息与使第2输出装置输出的消息或者已经使第2输出装置输出的消息相同的情况下,使得第1输出装置不输出与第2输出装置相同的消息。因而,控制装置能够防止多个输出装置输出相同的消息。
本发明的方式2的控制装置可以是,在上述方式1中,具备消息生成部(消息决定部83),上述消息生成部从上述第1输出装置和上述第2输出装置分别接收表示对上述第1输出装置和上述第2输出装置进行了发话的用户的发话内容的发话内容信息,生成与各发话内容信息相应的消息,上述判断部在从上述第1输出装置和上述第2输出装置分别接收到的发话内容信息与同一发话对应的情况下,判断为使上述第1输出装置输出的消息与使上述第2输出装置输出的消息或者已使该第2输出装置输出的消息相同。
根据上述构成,控制装置在从第1输出装置和第2输出装置分别接收到的发话内容信息与同一发话对应的情况下,能够以使这些输出装置不输出相同的消息的方式控制输出装置。因而,在多个输出装置检测出相同的发话并应答(输出消息)的情况下,能够防止输出相同的消息。
本发明的方式3的控制装置可以是,在上述方式2中,上述判断部从上述第1输出装置和上述第2输出装置分别取得表示对上述第1输出装置和上述第2输出装置进行了发话的用户的用户确定信息,并且在上述发话内容信息所示的发话内容一致且上述用户确定信息所示的用户一致的情况下,判断为上述发话内容信息与同一发话对应。
根据上述构成,控制装置能够在第1输出装置对与第2输出装置相同的用户的相同的发话内容输出消息的情况下,以使其不输出与第2输出装置相同的消息的方式进行控制。因而,控制装置能够防止多个输出装置对相同的用户的相同的发话内容进行相同的发言。
本发明的方式4的控制装置可以是,在上述方式2或者3中,上述判断部针对上述第1输出装置和上述第2输出装置分别取得表示用户对上述第1输出装置和上述第2输出装置进行了发话的时刻的发话时刻信息,并且在上述发话内容信息所示的发话内容一致且上述发话时刻信息所示的时刻的差是规定范围内的情况下,判断为上述发话内容信息与同一发话对应。
在此,上述“规定范围”只要是在考虑到各输出装置的处理、通信的时滞的基础上,在用户进行了发话的时刻可推定为相同的范围内进行设定即可。另外,“用户进行了发话的时刻”只要与用户实际进行了发话的时刻大致一致即可,无需完全一致。例如,可以将输出装置检测出用户的发话的时刻或者控制装置接收到发话内容信息的时刻设为“用户进行了发话的时刻”。在前一情况下,控制装置只要从输出装置取得上述发话时刻信息即可,在后一情况下,只要通过控制装置所具备的计时部确定接收时刻即可。
根据上述构成,控制装置能够在第1输出装置和第2输出装置这两者对在相同的时刻(相同的定时)进行的发话输出消息的情况下,以使这些输出装置不输出相同的消息的方式进行控制。因而,控制装置能够防止多个输出装置对相同的用户的相同的发话内容进行相同的发言。
本发明的方式5的消息输出控制***(消息输出控制***100和消息输出控制***200)具备上述方式1至4中的任1方式所述的控制装置(服务器3和4)以及上述多个输出装置。
本发明的各方式的控制装置和输出装置也可以通过计算机来实现,在该情况下,通过使计算机作为上述控制装置或者上述输出装置所具备的各部进行工作从而用计算机实现上述控制装置或者上述输出装置的上述控制装置或者上述输出装置的控制程序以及记录有该控制程序的计算机可读取的记录介质也属于本发明的范畴。
本发明不限于上述各实施方式,能够在权利要求所示的范围内进行各种变更,将在不同的实施方式中分别公开的技术方案适当组合而得到的实施方式也包括在本发明的技术范围中。而且,通过将在各实施方式中分别公开的技术方案组合,能够形成新的技术特征。
工业上的可利用性
本发明能够适合用于对用户提示消息的输出装置、决定该输出装置要输出的消息的控制装置等。
附图标记说明
1和2:机器人(输出装置、第1输出装置、第2输出装置);3:服务器(控制装置);83:消息决定部(判断部、控制部、消息生成部);100和200:消息输出控制***。

Claims (5)

1.一种控制装置,使包括第1输出装置和第2输出装置的多个输出装置输出消息,其特征在于,具备:
判断部,其判断使上述第1输出装置输出的消息是否与使上述第2输出装置输出的消息或者已使该第2输出装置输出的消息相同;以及
控制部,其在上述判断部判断为相同的情况下,使上述第1输出装置输出与上述第2输出装置不同的消息,或者不使上述第1输出装置输出消息。
2.根据权利要求1所述的控制装置,其特征在于,
具备消息生成部,上述消息生成部从上述第1输出装置和上述第2输出装置分别接收表示对上述第1输出装置和上述第2输出装置进行了发话的用户的发话内容的发话内容信息,生成与各发话内容信息相应的消息,
上述判断部在从上述第1输出装置和上述第2输出装置分别接收到的发话内容信息与同一发话对应的情况下,判断为使上述第1输出装置输出的消息与使上述第2输出装置输出的消息或者已使该第2输出装置输出的消息相同。
3.根据权利要求2所述的控制装置,其特征在于,
上述判断部从上述第1输出装置和上述第2输出装置分别取得表示对上述第1输出装置和上述第2输出装置进行了发话的用户的用户确定信息,并且在上述发话内容信息所示的发话内容一致且上述用户确定信息所示的用户一致的情况下,判断为上述发话内容信息与同一发话对应。
4.根据权利要求2或3所述的控制装置,其特征在于,
上述判断部针对上述第1输出装置和上述第2输出装置分别取得表示用户对上述第1输出装置和上述第2输出装置进行了发话的时刻的发话时刻信息,并且在上述发话内容信息所示的发话内容一致且上述发话时刻信息所示的时刻的差是规定范围内的情况下,判断为上述发话内容信息与同一发话对应。
5.一种消息输出控制***,其特征在于,包括:
权利要求1至4中的任一项所述的控制装置;以及
上述多个输出装置。
CN201580021613.6A 2014-05-13 2015-04-08 控制装置和消息输出控制*** Expired - Fee Related CN106233378B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014-099730 2014-05-13
JP2014099730 2014-05-13
PCT/JP2015/060973 WO2015174172A1 (ja) 2014-05-13 2015-04-08 制御装置およびメッセージ出力制御システム

Publications (2)

Publication Number Publication Date
CN106233378A true CN106233378A (zh) 2016-12-14
CN106233378B CN106233378B (zh) 2019-10-25

Family

ID=54479716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580021613.6A Expired - Fee Related CN106233378B (zh) 2014-05-13 2015-04-08 控制装置和消息输出控制***

Country Status (4)

Country Link
US (1) US10127907B2 (zh)
JP (1) JP6276400B2 (zh)
CN (1) CN106233378B (zh)
WO (1) WO2015174172A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364164A (zh) * 2018-03-26 2019-10-22 卡西欧计算机株式会社 对话控制装置、对话***、对话控制方法以及存储介质
CN110503950A (zh) * 2018-05-18 2019-11-26 夏普株式会社 判定装置、电子设备、响应***、判定装置的控制方法
CN111191019A (zh) * 2019-12-31 2020-05-22 联想(北京)有限公司 一种信息处理方法、电子设备和信息处理***

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6585733B2 (ja) * 2015-11-17 2019-10-02 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置
WO2017200078A1 (ja) * 2016-05-20 2017-11-23 日本電信電話株式会社 対話方法、対話システム、対話装置、およびプログラム
JP6719747B2 (ja) * 2016-05-20 2020-07-08 日本電信電話株式会社 対話方法、対話システム、対話装置、およびプログラム
JP6699010B2 (ja) * 2016-05-20 2020-05-27 日本電信電話株式会社 対話方法、対話システム、対話装置、およびプログラム
WO2017200077A1 (ja) * 2016-05-20 2017-11-23 日本電信電話株式会社 対話方法、対話システム、対話装置、及びプログラム
JP6402748B2 (ja) * 2016-07-19 2018-10-10 トヨタ自動車株式会社 音声対話装置および発話制御方法
JP6767206B2 (ja) * 2016-08-30 2020-10-14 シャープ株式会社 応答システム
JP7112487B2 (ja) * 2018-05-11 2022-08-03 株式会社Nttドコモ 対話装置
JP7146933B2 (ja) * 2018-10-05 2022-10-04 株式会社Nttドコモ 情報提供装置
JP7077375B2 (ja) * 2020-09-17 2022-05-30 シャープ株式会社 応答システム
US20230178075A1 (en) * 2021-12-02 2023-06-08 Lenovo (Singapore) Pte. Ltd Methods and devices for preventing a sound activated response

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416381A (zh) * 2000-12-06 2003-05-07 索尼公司 机器人设备、用于控制机器人设备运动的方法以及用于控制机器人设备运动的***
US20070107039A1 (en) * 2005-11-10 2007-05-10 Sharp Kabushiki Kaisha Content presentation device communicating with another device through presented content
CN101187990A (zh) * 2007-12-14 2008-05-28 华南理工大学 一种会话机器人***
US20090305645A1 (en) * 2006-01-27 2009-12-10 Kyocera Corporation Radio Communication Device
CN102402405A (zh) * 2010-07-21 2012-04-04 精工爱普生株式会社 信息处理***、印刷装置以及信息处理方法
CN102917190A (zh) * 2011-08-01 2013-02-06 Lg电子株式会社 用于控制在电视机上的信息的显示的装置及方法
CN103369151A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 信息输出方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5750200A (en) * 1980-09-09 1982-03-24 Mitsubishi Electric Corp Outdoor loudspeaker system
JP2002287783A (ja) * 2001-03-23 2002-10-04 Ricoh Co Ltd 音声出力タイミング制御装置
JP2003204596A (ja) * 2002-01-04 2003-07-18 Matsushita Electric Ind Co Ltd 拡声放送システムおよび拡声放送装置
JP3958253B2 (ja) 2003-06-09 2007-08-15 株式会社シーエーアイメディア共同開発 対話システム
JP2009065562A (ja) * 2007-09-07 2009-03-26 Konica Minolta Business Technologies Inc 音出力装置およびこれを含む画像形成装置
JP2009265278A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 音声出力管理システムおよび音声出力装置
JP4764943B2 (ja) * 2009-12-29 2011-09-07 シャープ株式会社 動作制御装置、動作制御方法、ライセンス提供システム、動作制御プログラム、および記録媒体
JP5117599B1 (ja) * 2011-06-30 2013-01-16 株式会社東芝 制御端末およびネットワークシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416381A (zh) * 2000-12-06 2003-05-07 索尼公司 机器人设备、用于控制机器人设备运动的方法以及用于控制机器人设备运动的***
US20070107039A1 (en) * 2005-11-10 2007-05-10 Sharp Kabushiki Kaisha Content presentation device communicating with another device through presented content
US20090305645A1 (en) * 2006-01-27 2009-12-10 Kyocera Corporation Radio Communication Device
CN101187990A (zh) * 2007-12-14 2008-05-28 华南理工大学 一种会话机器人***
CN102402405A (zh) * 2010-07-21 2012-04-04 精工爱普生株式会社 信息处理***、印刷装置以及信息处理方法
CN102917190A (zh) * 2011-08-01 2013-02-06 Lg电子株式会社 用于控制在电视机上的信息的显示的装置及方法
CN103369151A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 信息输出方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364164A (zh) * 2018-03-26 2019-10-22 卡西欧计算机株式会社 对话控制装置、对话***、对话控制方法以及存储介质
CN110364164B (zh) * 2018-03-26 2023-12-05 卡西欧计算机株式会社 对话控制装置、对话***、对话控制方法以及存储介质
CN110503950A (zh) * 2018-05-18 2019-11-26 夏普株式会社 判定装置、电子设备、响应***、判定装置的控制方法
CN111191019A (zh) * 2019-12-31 2020-05-22 联想(北京)有限公司 一种信息处理方法、电子设备和信息处理***

Also Published As

Publication number Publication date
CN106233378B (zh) 2019-10-25
JPWO2015174172A1 (ja) 2017-04-20
WO2015174172A1 (ja) 2015-11-19
US20170125017A1 (en) 2017-05-04
JP6276400B2 (ja) 2018-02-07
US10127907B2 (en) 2018-11-13

Similar Documents

Publication Publication Date Title
CN106233378A (zh) 控制装置和消息输出控制***
CN107491282A (zh) 使用情境信号安全执行语音动作
US7266251B2 (en) Method and apparatus for generating models of individuals
US20200312315A1 (en) Acoustic environment aware stream selection for multi-stream speech recognition
US10516657B2 (en) Methods and apparatus to enhance security of authentication
US9313336B2 (en) Systems and methods for processing audio signals captured using microphones of multiple devices
US9210269B2 (en) Active speaker indicator for conference participants
US20130024196A1 (en) Systems and methods for using a mobile device to deliver speech with speaker identification
CN106030699A (zh) 多个设备上的热词检测
US10375465B2 (en) System and method for alerting a user of preference-based external sounds when listening to audio through headphones
CN105960674A (zh) 信息处理装置
JP2014518038A5 (zh)
CN108307659A (zh) 翻译装置的控制方法、翻译装置以及程序
CN107402628A (zh) 信息处理装置,信息处理***和信息处理方法
JPWO2019187521A1 (ja) 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ
EP3350790B1 (en) System and method for determining proximity of a controller to a media rendering device
CN109891501A (zh) 语音调整装置、控制程序、电子设备及语音调整装置的控制方法
US11350212B2 (en) Method and system for locating the origin of an audio signal within a defined space
CN114531425A (zh) 一种处理方法和处理装置
US20150296003A1 (en) Methods and Systems for Providing Data Between Electronic Devices
US20190371308A1 (en) Control device, interactive apparatus, and control method
JP2020053716A (ja) 制御端末、制御方法及び制御システム
JP2020135667A (ja) 報告書作成するための方法、システム、及び装置
CN112542178B (zh) 音频数据处理方法及装置
JP6491809B1 (ja) 情報処理システム、情報処理方法、コンピュータプログラムおよび情報処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191025