CN107146611B - 一种语音响应方法、装置及智能设备 - Google Patents

一种语音响应方法、装置及智能设备 Download PDF

Info

Publication number
CN107146611B
CN107146611B CN201710230096.4A CN201710230096A CN107146611B CN 107146611 B CN107146611 B CN 107146611B CN 201710230096 A CN201710230096 A CN 201710230096A CN 107146611 B CN107146611 B CN 107146611B
Authority
CN
China
Prior art keywords
voice
response
information
response mode
outputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710230096.4A
Other languages
English (en)
Other versions
CN107146611A (zh
Inventor
陈君宇
贾磊
刘媛媛
彭守业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orion Star Technology Co Ltd
Original Assignee
Beijing Orion Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orion Star Technology Co Ltd filed Critical Beijing Orion Star Technology Co Ltd
Priority to CN201710230096.4A priority Critical patent/CN107146611B/zh
Publication of CN107146611A publication Critical patent/CN107146611A/zh
Priority to EP18784958.3A priority patent/EP3611724A4/en
Priority to JP2019554883A priority patent/JP2020515913A/ja
Priority to PCT/CN2018/082508 priority patent/WO2018188587A1/zh
Priority to US16/499,978 priority patent/US20210280172A1/en
Application granted granted Critical
Publication of CN107146611B publication Critical patent/CN107146611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种语音响应方法、装置及智能设备,方法包括:接收用户发送的语音信息;判断所述语音信息中是否存在唤醒词;如果是,根据预设响应规则,输出响应语音。由此可见,当接收到的语音信息中存在唤醒词时,设备输出响应语音;也就是说,用户发送唤醒词后,设备便立即输出语音,对该唤醒词进行响应;这样,用户便可以直观地确定设备已经被唤醒,体验较好。

Description

一种语音响应方法、装置及智能设备
技术领域
本发明涉及智能设备技术领域,特别涉及一种语音响应方法、装置及智能设备。
背景技术
目前,智能设备的种类越来越多,应用也越来越广泛。智能设备通常包括:智能机器人、智能音箱等等。现有的智能设备已经可以针对用户发送的语音指令进行响应。举例来说,用户可以向智能设备发送“我要听‘红豆’”、或“播放‘红豆’”、或其他语音指令,以请求播放音频资源、或者视频资源、或者其他多媒体资源(“红豆”为音频资源);智能设备接收到语音指令后,可以播放用户所请求的多媒体资源。
一般来说,用户需要通过特定的唤醒词将智能设备唤醒,之后才能发送语音指令请求播放多媒体资源。在用户说出唤醒词与发送语音指令之间,通常存在时间间隔,在这段时间间隔内,智能设备不作出响应。这样,用户不能确定设备是否被唤醒,体验较差。
发明内容
本发明实施例的目的在于提供一种语音响应方法、装置及智能设备,使得用户能够确定设备是否被唤醒,以提高用户体验。
为达到上述目的,本发明实施例公开了一种语音响应方法,应用于智能设备,所述方法包括:
接收用户发送的语音信息;
判断所述语音信息中是否存在唤醒词;
如果是,根据预设响应规则,输出响应语音。
可选的,所述判断所述语音信息中是否存在唤醒词的步骤,可以包括:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;
根据识别结果,判断所述语音信息中是否存在唤醒词。
可选的,所述根据预设响应规则,输出响应语音的步骤,可以包括:
从预先设定的至少两种响应方式中,随机选择一种响应方式;
以所选择的响应方式输出响应语音;
或者,确定当前时刻;
从预先设定的时间段与响应方式的对应关系中,确定所述当前时刻对应的响应方式;
以所确定的响应方式输出响应语音。
可选的,所述方法还可以包括:
在输出响应语音之后,将所述响应语音对应的响应方式记录为上一次响应方式;
所述根据预设响应规则,输出响应语音的步骤,可以包括:
在预先存储的响应方式序列中,查找所述上一次响应方式;
根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式;
以所述本次响应方式,输出响应语音;
或者,
从预先设定的至少两种响应方式中,选择不同于所述上一次响应方式的目标响应方式;
以所述目标响应方式,输出响应语音。
可选的,所述方法还可以包括:
接收云端服务器发送的响应调整信息;
根据所述响应调整信息,对自身设定的响应方式进行调整。
可选的,所述根据预设响应规则,输出响应语音的步骤,可以包括:
确定当前时刻及所述当前时刻对应的资讯语音,所述资讯语音为云端服务器发送的;
输出响应语音和所述资讯语音。
可选的,所述根据预设响应规则,输出响应语音的步骤,可以包括:
检查当前时间段是否对应有标记事件的语音;
如果是,输出响应语音和所述标记事件的语音。
可选的,所述方法还可以包括:
接收云端服务器发送的更新信息,所述更新信息中包含时间段及对应的标记事件的语音;
根据所述更新信息,对自身存储的标记事件的语音进行调整。
可选的,在所述根据预设响应规则,输出响应语音的步骤之后,还可以包括:
在接收到所述响应语音后,将所述响应语音确定为自身噪声;
消除所述自身噪声。
可选的,在所述接收用户发送的语音信息的步骤之前,还可以包括:
采集周围环境中的环境声音信息;
在所述根据预设响应规则,输出响应语音的步骤之后,还可以包括:
接收用户发送的新的语音信息;
在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息;
将所述新的语音信息与所述目标环境声音信息进行拼接;
将拼接后的语音信息发送给云端服务器进行解析。
为达到上述目的,本发明实施例还公开了一种语音响应装置,应用于智能设备,所述装置包括:
第一接收模块,用于接收用户发送的语音信息;
判断模块,用于判断所述语音信息中是否存在唤醒词;如果是,触发输出模块;
输出模块,用于根据预设响应规则,输出响应语音。
可选的,所述判断模块,具体可以用于:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;根据识别结果,判断所述语音信息中是否存在唤醒词;如果存在,触发输出模块。
可选的,所述输出模块,具体可以用于:
从预先设定的至少两种响应方式中,随机选择一种响应方式;
以所选择的响应方式输出响应语音;
或者,确定当前时刻;
从预先设定的时间段与响应方式的对应关系中,确定所述当前时刻对应的响应方式;
以所确定的响应方式输出响应语音。
可选的,所述装置还可以包括:
记录模块,用于在输出响应语音之后,将所述响应语音对应的响应方式记录为上一次响应方式;
所述输出模块,具体可以用于:
在预先存储的响应方式序列中,查找所述上一次响应方式;
根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式;
以所述本次响应方式,输出响应语音;
或者,
从预先设定的至少两种响应方式中,选择不同于所述上一次响应方式的目标响应方式;
以所述目标响应方式,输出响应语音。
可选的,所述装置还可以包括:
第二接收模块,用于接收云端服务器发送的响应调整信息;
第一调整模块,用于根据所述响应调整信息,对自身设定的响应方式进行调整。
可选的,所述输出模块,具体可以用于:
确定当前时刻及所述当前时刻对应的资讯语音,所述资讯语音为云端服务器发送的;输出响应语音和所述资讯语音。
可选的,所述输出模块,具体可以用于:
检查当前时间段是否对应有标记事件的语音;
如果是,输出响应语音和所述标记事件的语音。
可选的,所述装置还可以包括:
第三接收模块,用于接收云端服务器发送的更新信息,所述更新信息中包含时间段及对应的标记事件的语音;
第二调整模块,用于根据所述更新信息,对自身存储的标记事件的语音进行调整。
可选的,所述装置还可以包括:
消噪模块,用于在接收到所述响应语音后,将所述响应语音确定为自身噪声;消除所述自身噪声。
可选的,所述装置还可以包括:
采集模块,用于在接收用户发送的语音信息前,采集周围环境中的环境声音信息;
第四接收模块,用于接收用户发送的新的语音信息;
确定模块,用于在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息;
拼接模块,用于将所述新的语音信息与所述目标环境声音信息进行拼接;
发送模块,用于将拼接后的语音信息发送给云端服务器进行解析。
为达到上述目的,本发明实施例还公开了一种智能设备,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为智能设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行上述的语音响应方法。
应用本发明实施例,当接收到的语音信息中存在唤醒词时,根据预设响应规则,输出响应语音;也就是说,用户发送唤醒词后,便立即输出语音,对该唤醒词进行响应;这样,用户便可以直观地确定设备已经被唤醒,体验较好。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音响应方法的第一种流程示意图;
图2为本发明实施例提供的语音响应方法的第二种流程示意图;
图3为本发明实施例提供的语音响应方法的第三种流程示意图;
图4为本发明实施例提供的一种语音响应装置的结构示意图;
图5为本发明实施例所提供的一种智能设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决上述技术问题,本发明实施例提供了一种语音响应方法、装置及智能设备,该方法及装置可以应用于各种智能设备,比如智能音箱、智能播放器、智能机器人等,具体不做限定。
下面首先对本发明实施例提供的一种语音响应方法进行详细说明。
图1为本发明实施例提供的语音响应方法的第一种流程示意图,包括:
S101:接收用户发送的语音信息。
S102:判断所述语音信息中是否存在唤醒词,如果是,执行S103。
S103:根据预设响应规则,输出响应语音。
作为一种实施方式,判断所述语音信息中是否存在唤醒词,可以包括:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;
根据识别结果,判断所述语音信息中是否存在唤醒词。
在本实施方式中,可以预先对唤醒词进行学习并建模。本领域技术人员可以理解,可以采集不同用户针对唤醒词的语音信息,利用机器学习算法对这些语音信息进行学习,进而建立针对唤醒词的模型。比如,可以利用唤醒词语音数据对深度神经网络进行训练建立语音识别模型,具体学习算法不做限定。
将S101中获取到的语音信息输入到该模型中进行识别,如果识别结果中包含该唤醒词,则表示该语音信息中包含该唤醒词。
应用这种实施方式,直接将语音信息输入到智能设备端本地存储的模型进行识别,相比于将语音信息发送至其他设备,由其他设备进行解析,进而判断是否存在唤醒词的方案,减少了设备通信耗费的时间,反应更灵敏。
S103的实施方式可以有多种,比如:
第一种,智能设备中设定了多种响应方式,比如,输出响应语音“唉”,或者输出“在呢”,或者输出“我在”,或者输出其他类似的响应语音。
当S102判断结果为是时,从这些响应方式中,随机选择一种响应方式,以所选择的响应方式输出响应语音。
在这种实施方式中,智能设备可以与云端服务器相连接,云端服务器可以每隔预设时间段,向智能设备下发响应调整信息,该响应调整信息中可以包含新的响应方式或其他信息;智能设备可以根据该响应调整信息,对自身设定的响应方式进行调整。
具体的调整方式有多种,比如,将响应调整信息中包含的新的响应方式添加至智能设备中;或者,将响应调整信息中包含的新的响应方式替换掉智能设备中原有的响应方式;或者,将响应调整信息中包含的信息与智能设备中原有的响应方式进行融合,形成新的响应方式,等等,具体不做限定。
举个简单的例子,智能设备中原有的响应方式包括:“唉”,“在呢”,“我在”;云端服务器采集到使用该智能设备的用户的昵称为“娜娜”,云端服务器针对该智能设备确定的响应调整信息可以为语音“娜娜”,云端服务器将该响应调整信息发送给智能设备;智能设备可以将语音“娜娜”与原有响应方式进行融合,形成的新的响应方式可以为:“唉,娜娜”,“在呢,娜娜”,“我在,娜娜”。
应用这种实施方式,用户可以根据设备的响应,确定设备是否被唤醒,体验较好;进一步的,设备可以根据云端服务器发送的响应调整信息,对自身设定的响应方式进行调整,也就是可以对响应方式进行更新,提高了响应方式的趣味性。
第二种,智能设备针对不同时间段设定了不同的响应方式,比如,“早上”这一时间段对应的响应方式可以为:输出响应语音“在呢,早上好”,或者“早上好”,或者“主人,早上好”,或者输出其他类似的响应语音。类似的,“下午”这一时间段对应的响应方式可以为:输出响应语音“在呢,下午好”,或者“下午”,或者“主人,下午好”,或者输出其他类似的响应语音。
当S102判断结果为是时,智能设备确定当前时刻,从预先设定的时间段与响应方式的对应关系中,确定当前时刻对应的响应方式;以所确定的响应方式输出响应语音。
比如,S102判断结果为是;智能设备确定当前时刻为早上8点,而且智能设备中设定早上6点—9点这一时间段对应的响应方式为“主人,早上好”;这种情况下,输出响应语音“主人,早上好”。
在这种实施方式中,智能设备可以与云端服务器相连接,云端服务器可以每隔预设时间段,向智能设备下发响应调整信息,该响应调整信息中可以包含新的响应方式或其他信息;智能设备可以根据该响应调整信息,对自身设定的响应方式进行调整。
具体的调整方式有多种,比如,将响应调整信息中包含的新的响应方式添加至智能设备中;或者,将响应调整信息中包含的新的响应方式替换掉智能设备中原有的响应方式;或者,将响应调整信息中包含的信息与智能设备中原有的响应方式进行融合,形成新的响应方式,等等,具体不做限定。
举个简单的例子,智能设备中原有的响应方式包括针对不同时间段设定的:“主人,早上好”,“主人,下午好”等等;云端服务器采集到使用该智能设备的用户的昵称为“娜娜”,云端服务器针对该智能设备确定的响应调整信息可以为语音“娜娜”,云端服务器将该响应调整信息发送给智能设备;智能设备可以将语音“娜娜”与原有响应方式进行融合,形成的新的响应方式可以为:“娜娜,早上好”,“娜娜,下午好”等等。
应用上述实施方式,第一方面,用户可以根据设备的响应,确定设备是否被唤醒,体验较好;第二方面,设备可以针对不同时间段,作出不同的响应,提高了响应方式的灵活性;第三方面,设备可以根据云端服务器发送的响应调整信息,对自身设定的响应方式进行调整,也就是可以对响应方式进行更新,提高了响应方式的趣味性。
第三种,在每次输出响应语音之后,智能设备将输出的响应语音对应的响应方式记录为上一次响应方式。下次再接收到用户发送的语音信息,且该语音信息中存在唤醒词的情况下,智能设备在预先存储的响应方式序列中,查找所述上一次响应方式;根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式;以所述本次响应方式,输出响应语音。
举例来说,智能设备预先存储的响应方式序列为中包含的响应方式依次为:“唉”、“在呢”、“我在”、“主人,您好”。上一次输出的响应语音为“在呢”,将“在呢”这种响应方式记录为“上一次响应方式”。
智能设备接收到用户发送的语音信息,且语音信息中存在唤醒词,这种情况下,可以根据序列中的顺序,将“我在”作为本次响应方式,输出响应语音“我在”。
在这种实施方式中,序列中的顺序可以理解为循环顺序,若上次响应方式为“主人,您好”,则“本次响应方式”可以为“唉”。
第四种,在每次输出响应语音之后,智能设备将输出的响应语音对应的响应方式记录为上一次响应方式。下次再接收到用户发送的语音信息,且该语音信息中存在唤醒词的情况下,智能设备从预先设定的至少两种响应方式中,选择不同于所述上一次响应方式的目标响应方式;以所述目标响应方式,输出响应语音。
举例来说,智能设备预先设定的响应方式包括:“唉”、“在呢”、“我在”、“主人,您好”。上一次输出的响应语音为“在呢”,将“在呢”这种响应方式记录为“上一次响应方式”。
智能设备接收到用户发送的语音信息,且语音信息中存在唤醒词,这种情况下,在除“在呢”之外的三种响应方式中选择目标响应方式,假设选择的目标响应方式为“主人,您好”,输出响应语音“主人,您好”。
在第三、四种实施方式中,智能设备也可以与云端服务器相连接,云端服务器可以每隔预设时间段,向智能设备下发响应调整信息,该响应调整信息中可以包含新的响应方式或其他信息;智能设备可以根据该响应调整信息,对自身设定的响应方式进行调整。
具体的调整方式有多种,比如,将响应调整信息中包含的新的响应方式添加至智能设备中;或者,将响应调整信息中包含的新的响应方式替换掉智能设备中原有的响应方式;或者,将响应调整信息中包含的信息与智能设备中原有的响应方式进行融合,形成新的响应方式,等等,具体不做限定。
第五种,云端服务器可以向智能设备发送资讯语音,比如,包含天气情况的语音(天气资讯),包含新闻信息的语音(新闻资讯)等等。云端服务器可以每隔预设周期,向智能设备发送资讯语音,或者,云端服务器可以在检查到资讯更新后,向智能设备发送最新的资讯语音,具体不做限定。
智能设备在判断用户发送了唤醒词(S102判断结果为是)后,确定当前时刻及当前时刻对应的资讯语音,输出响应语音和资讯语音。
以天气资讯为例进行说明,云端服务器可以每隔预设时间段,确定智能设备所在地的当前天气情况,并根据该天气情况,向智能设备发送资讯语音;智能设备存储该资讯语音,并在判断用户发送了唤醒词后,确定当前时刻及当前时刻对应的资讯语音,输出响应语音和资讯语音。
举例来说,智能设备所在地为“北京西城”,云端服务器可以每天确定“北京西城”当天的天气情况,假设2017年4月5日“北京西城”的天气情况为“晴,空气质量良”,云端服务器根据“晴,空气质量良”确定资讯语音为“天气真好”,并将这一资讯语音发送给智能设备。
智能设备存储该资讯语音,并在S102判断结果为是的情况下,智能设备确定当前时刻为2017年4月5日早上8点后,则输出响应语音和资讯语音“主人,早上好,天气真好”。
应用上述实施方式,第一方面,用户可以根据设备的响应,确定设备是否被唤醒,体验较好;第二方面,可以在响应方式中加入资讯信息,为用户带来了极大的便利。
第六种,智能设备中可以对一些时间段进行事件标记,并存储标记事件的语音。比如,可以将节假日所在的时间段进行标记,具体的,可以将1月1日标记为元旦,这一标记事件的语音可以为“元旦快乐”,可以将2月14日标记为情人节,这一标记事件的语音可以为“情人节快乐”,等等。
这样,在S102判断结果为是的情况下,智能设备检查当前时间段是否对应有标记事件的语音;如果当前时间段为1月1日,则检查到标记事件的语音为“元旦快乐”;输出响应语音和标记事件的语音,可以为“在呢,元旦快乐”。
或者,智能设备也可以从云端服务器中获得“时间段及对应的标记事件的语音”。可以理解,云端服务器可以获取用户信息,根据该用户信息,可以确定“时间段及对应的标记事件的语音”;云端服务器将“时间段及对应的标记事件的语音”发送给智能设备。
举例来说,该用户信息中可以包含用户的生日,云端服务器可以对“用户的生日”这一时间段进行事件标记,该标记事件的语音可以为“生日快乐”。云端服务器将这一时间段(“用户的生日”)及这一语音(“生日快乐”)发送给智能设备。
智能设备针对该时间段存储该标记事件的语音。在S102判断结果为是的情况下,智能设备如果检查到当前时间段对应有标记事件的语音“生日快乐”,则输出响应语音和标记事件的语音,可以为“在呢,生日快乐”。
或者,该用户信息中还可以包含用户亲友的生日,云端服务器可以对“用户亲友的生日”这一时间段进行事件标记,该标记事件的语音可以为“不要忘记给**过生日”或其他。云端服务器将这一时间段(“用户亲友的生日”)及这一语音(“不要忘记给**过生日”)发送给智能设备。
智能设备针对该时间段存储该标记事件的语音。在S102判断结果为是的情况下,智能设备如果检查当前时间段对应有标记事件的语音“不要忘记给**过生日”,则输出响应语音和标记事件的语音,可以为“在呢,不要忘记给**过生日”。
或者,该用户信息中也可以包含用户自己设置的提醒信息,比如,用户在自己使用的终端设备中设置2017年4月5日的提醒为:记得给客户A打电话;终端设备将这一提醒信息上传至云端服务器中。这样,云端服务器可以对“2017年4月5日”这一时间段进行事件标记,该标记事件的语音可以为“记得给客户A打电话”。云端服务器将这一时间段(“2017年4月5日”)及这一语音(“记得给客户A打电话”)发送给智能设备。
智能设备针对该时间段存储该标记事件的语音。在S102判断结果为是的情况下,智能设备如果检查到当前时间段对应有标记事件的语音“记得给客户A打电话”,则输出响应语音和标记事件的语音,可以为“在呢,记得给客户A打电话”。
在本实施方式中,云端服务器可以在检测到上述用户信息被更新后,或者也可以每隔预设周期,向用户发送更新信息,更新信息中包含“时间段及对应的标记事件的语音”。智能设备在接收到该更新信息后,根据该更新信息,对自身标记事件的语音进行调整。
举例来说,用户在自己使用的终端设备中,将针对2017年4月5日的提醒“记得给客户A打电话更改为“记得给客户B打电话”;终端设备将这一提醒信息上传至云端服务器中,云端服务器检查到用户信息被更新,确定更新信息为:“2017年4月5日”对应的标记事件的语音为“记得给客户B打电话”。云端服务器将这一更新信息发送给智能设备。
智能设备接收到该更新信息后,对自身存储的标记事件的语音进行调整,将2017年4月5日对应的标记事件的语音调整为“记得给客户B打电话”。
这样,在S102判断结果为是的情况下;智能设备如果确定当前时间段为2017年4月5日;并检查到这个时间段对应的标记事件的语音为“记得给客户B打电话”;可以输出响应语音“在呢,请给客户B打电话”。
应用上述实施方式,第一方面,用户可以根据设备的响应,确定设备是否被唤醒,体验较好;第二方面,设备可以在响应用户唤醒的同时,针对用户的标记事件进行提醒,用户体验更佳。
应用本发明图1所示实施例,当接收到的语音信息中存在唤醒词时,根据预设响应规则,输出响应语音;也就是说,用户发送唤醒词后,设备便立即输出语音,对该唤醒词进行响应;这样,用户便可以直观地确定设备已经被唤醒,体验较好。
图2为本发明实施例提供的语音响应方法的第二种流程示意图,图2在图1基础上,在S103之后,增加如下步骤:
S201:在接收到所述响应语音后,将所述响应语音确定为自身噪声。
S202:消除所述自身噪声。
本领域技术人员可以理解,智能设备输出响应语音后,该响应语音也会被智能设备采集到。对于智能设备来说,该响应语音会对用户发送的语音造成影响,因此,可以将该响应语音作为自身噪声进行消除。
应用本发明图2所示实施例,将输出的响应语音作为自身噪声进行消除,可以降低响应语音对用户发送语音的影响;这样,便可以更清楚地采集用户发送的语音,为用户提供更好的服务。
图3为本发明实施例提供的语音响应方法的第三种流程示意图,图3在图1基础上,在S101之前增加S301,在S103之后,增加S302、S303、S304和S305。
S301:采集周围环境中的环境声音信息。
在图3所示实施例中,在智能设备被唤醒之前,便采集周围环境中的环境声音信息。该“环境声音信息”可以包含采集到的全部声音信息,其中也包含用户发送的语音信息。
S302:接收用户发送的新的语音信息。
为了与S101中的语音信息进行区分,这里将S302中的语音信息称为“新的语音信息”。
可以理解,用户先说出唤醒词将智能设备唤醒,之后便可以向智能设备发送指令。S101中的语音信息可以理解为用户先说的唤醒词,S302中“新的语音信息”可以理解为用户发出的指令。
S303:在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息。
S304:将所述新的语音信息与所述目标环境声音信息进行拼接。
S305:将拼接后的语音信息发送给云端服务器进行解析。
如果用户在说出唤醒词与发出指令之间的时间间隔较短,该时间间隔小于S103中播放响应语音占用的时间,则可能造成智能设备不能采集到用户发送的全部语音。
可以理解,通常情况下,智能设备在输出响应语音后,再采集用户发送的“新的语音信息”,而如果这两个过程有时间重叠,智能设备则丢失了重叠部分用户发送的语音信息。
这种情况下,应用本发明图3所示实施例,智能设备在被唤醒之前就进行声音采集,而且持续进行声音采集;智能设备被唤醒后,接收到用户发送的“新的语音信息”后,在环境声音信息中,确定与“新的语音信息”的时间间隔在预设范围内的“目标环境声音信息”;将“新的语音信息”与“目标环境声音信息”进行拼接,这样,便不会丢失用户的语音信息。将拼接后的语音信息,也就是完整的语音信息发送给云端服务器进行解析,能够获得更好的解析结果。
可以理解,上述情况中丢失的用户的语音信息与S302中接收到的“新的语音信息”时间间隔很小(二者组成一条完整的语音信息)。而持续采集的“环境声音信息”则可以包括很长时间的声音信息,这种情况下,可以在“环境声音信息”中选取出与“新的语音信息”的时间间隔较小(在预设范围内)的目标环境声音信息,仅将选取出的目标环境声音信息与“新的语音信息”进行拼接,便可以得到较完整的语音信息。
与上述方法实施例相对应,本发明实施例还提供一种语音响应装置。
图4为本发明实施例提供的一种语音响应装置的结构示意图,包括:
第一接收模块401,用于接收用户发送的语音信息;
判断模块402,用于判断所述语音信息中是否存在唤醒词;如果是,触发输出模块;
输出模块403,用于根据预设响应规则,输出响应语音。
作为一种实施方式,判断模块402,具体可以用于:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;根据识别结果,判断所述语音信息中是否存在唤醒词;如果存在,触发输出模块403。
作为一种实施方式,输出模块403,具体可以用于:
从预先设定的至少两种响应方式中,随机选择一种响应方式;
以所选择的响应方式输出响应语音;
或者,确定当前时刻;
从预先设定的时间段与响应方式的对应关系中,确定所述当前时刻对应的响应方式;
以所确定的响应方式输出响应语音。
作为一种实施方式,所述装置还可以包括:
记录模块(图中未示出),用于在输出响应语音之后,将所述响应语音对应的响应方式记录为上一次响应方式;
输出模块403,具体可以用于:
在预先存储的响应方式序列中,查找所述上一次响应方式;
根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式;
以所述本次响应方式,输出响应语音;
或者,
从预先设定的至少两种响应方式中,选择不同于所述上一次响应方式的目标响应方式;
以所述目标响应方式,输出响应语音。
作为一种实施方式,所述装置还可以包括:第二接收模块和第一调整模块(图中未示出),其中,
第二接收模块,用于接收云端服务器发送的响应调整信息;
第一调整模块,用于根据所述响应调整信息,对自身设定的响应方式进行调整。
作为一种实施方式,输出模块403,具体可以用于:
确定当前时刻及所述当前时刻对应的资讯语音,所述资讯语音为云端服务器发送的;输出响应语音和所述资讯语音。
作为一种实施方式,输出模块403,具体可以用于:
检查当前时间段是否对应有标记事件的语音;
如果是,输出响应语音和所述标记事件的语音。
作为一种实施方式,所述装置还可以包括:第三接收模块和第二调整模块(图中未示出),其中,
第三接收模块,用于接收云端服务器发送的更新信息,所述更新信息中包含时间段及对应的标记事件的语音;
第二调整模块,用于根据所述更新信息,对自身存储的标记事件的语音进行调整。
作为一种实施方式,所述装置还可以包括:
消噪模块(图中未示出),用于在接收到所述响应语音后,将所述响应语音确定为自身噪声;消除所述自身噪声。
作为一种实施方式,所述装置还可以包括:采集模块、第四接收模块、确定模块、拼接模块和发送模块(图中未示出),其中,
采集模块,用于在接收用户发送的语音信息前,采集周围环境中的环境声音信息;
第四接收模块,用于接收用户发送的新的语音信息;
确定模块,用于在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息;
拼接模块,用于将所述新的语音信息与所述目标环境声音信息进行拼接;
发送模块,用于将拼接后的语音信息发送给云端服务器进行解析。
应用本发明图4所示实施例,当接收到的语音信息中存在唤醒词时,根据预设响应规则,输出响应语音;也就是说,用户发送唤醒词后,便立即输出语音,对该唤醒词进行响应;这样,用户便可以直观地确定设备已经被唤醒,体验较好。
本发明实施例还提供了一种智能设备,如图5所示,包括:壳体501、处理器502、存储器503、电路板504和电源电路505,其中,电路板504安置在壳体501围成的空间内部,处理器502和存储器503设置在电路板504上;电源电路505,用于为智能设备的各个电路或器件供电;存储器503用于存储可执行程序代码;处理器502通过读取存储器503中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行所述语音响应方法,方法包括:
接收用户发送的语音信息;
判断所述语音信息中是否存在唤醒词;
如果是,根据预设响应规则,输出响应语音。
该智能设备可以为智能音箱、智能播放器、智能机器人等,具体不做限定。
应用本发明图5所示实施例,当接收到的语音信息中存在唤醒词时,根据预设响应规则,输出响应语音;也就是说,用户发送唤醒词后,便立即输出语音,对该唤醒词进行响应;这样,用户便可以直观地确定设备已经被唤醒,体验较好。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (17)

1.一种语音响应方法,其特征在于,应用于智能设备,所述方法包括:
接收用户发送的语音信息;
判断所述语音信息中是否存在唤醒词;
如果是,根据预设响应规则,输出响应语音;
其中,所述根据预设响应规则,输出响应语音的步骤,包括:
从预先设定的至少两种响应方式中,随机选择一种响应方式,以所选择的响应方式输出响应语音;或者
确定当前时刻,从预先设定的时间段与响应方式的对应关系中,确定所述当前时刻对应的响应方式,以所确定的响应方式输出响应语音;或者
在预先存储的响应方式序列中,查找上一次响应方式,根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式,以所述本次响应方式,输出响应语音,其中,所述上一次响应方式为在上一次输出响应语音之后所记录的该响应语音对应的响应方式;或者
从预先设定的至少两种响应方式中,选择不同于上一次响应方式的目标响应方式,以所述目标响应方式,输出响应语音,其中,所述上一次响应方式为在上一次输出响应语音之后所记录的该响应语音对应的响应方式。
2.根据权利要求1所述的方法,其特征在于,所述判断所述语音信息中是否存在唤醒词的步骤,包括:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;
根据识别结果,判断所述语音信息中是否存在唤醒词。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收云端服务器发送的响应调整信息;
根据所述响应调整信息,对自身设定的响应方式进行调整。
4.根据权利要求1所述的方法,其特征在于,所述根据预设响应规则,输出响应语音的步骤,包括:
确定当前时刻及所述当前时刻对应的资讯语音,所述资讯语音为云端服务器发送的;
输出响应语音和所述资讯语音。
5.根据权利要求1所述的方法,其特征在于,所述根据预设响应规则,输出响应语音的步骤,包括:
检查当前时间段是否对应有标记事件的语音;
如果是,输出响应语音和所述标记事件的语音。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
接收云端服务器发送的更新信息,所述更新信息中包含时间段及对应的标记事件的语音;
根据所述更新信息,对自身存储的标记事件的语音进行调整。
7.根据权利要求1所述的方法,其特征在于,在所述根据预设响应规则,输出响应语音的步骤之后,还包括:
在接收到所述响应语音后,将所述响应语音确定为自身噪声;
消除所述自身噪声。
8.根据权利要求1所述的方法,其特征在于,在所述接收用户发送的语音信息的步骤之前,还包括:
采集周围环境中的环境声音信息;
在所述根据预设响应规则,输出响应语音的步骤之后,还包括:
接收用户发送的新的语音信息;
在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息;
将所述新的语音信息与所述目标环境声音信息进行拼接;
将拼接后的语音信息发送给云端服务器进行解析。
9.一种语音响应装置,其特征在于,应用于智能设备,所述装置包括:
第一接收模块,用于接收用户发送的语音信息;
判断模块,用于判断所述语音信息中是否存在唤醒词;如果是,触发输出模块;
输出模块,用于根据预设响应规则,输出响应语音;
其中,所述输出模块具体用于:
从预先设定的至少两种响应方式中,随机选择一种响应方式,以所选择的响应方式输出响应语音;或者
确定当前时刻,从预先设定的时间段与响应方式的对应关系中,确定所述当前时刻对应的响应方式,以所确定的响应方式输出响应语音;或者
在预先存储的响应方式序列中,查找上一次响应方式,根据所述序列中的顺序,将位于所述上一次响应方式之后的响应方式作为本次响应方式,以所述本次响应方式,输出响应语音,其中,所述上一次响应方式为在上一次输出响应语音之后所记录的该响应语音对应的响应方式;或者
从预先设定的至少两种响应方式中,选择不同于上一次响应方式的目标响应方式,以所述目标响应方式,输出响应语音,其中,所述上一次响应方式为在上一次输出响应语音之后所记录的该响应语音对应的响应方式。
10.根据权利要求9所述的装置,其特征在于,所述判断模块,具体用于:
将所述语音信息输入到预先存储的模型中进行识别,所述模型为:对所述唤醒词进行学习得到的;
根据识别结果,判断所述语音信息中是否存在唤醒词;如果存在,触发输出模块。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二接收模块,用于接收云端服务器发送的响应调整信息;
第一调整模块,用于根据所述响应调整信息,对自身设定的响应方式进行调整。
12.根据权利要求9所述的装置,其特征在于,所述输出模块,具体用于:
确定当前时刻及所述当前时刻对应的资讯语音,所述资讯语音为云端服务器发送的;输出响应语音和所述资讯语音。
13.根据权利要求9所述的装置,其特征在于,所述输出模块,具体用于:
检查当前时间段是否对应有标记事件的语音;
如果是,输出响应语音和所述标记事件的语音。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第三接收模块,用于接收云端服务器发送的更新信息,所述更新信息中包含时间段及对应的标记事件的语音;
第二调整模块,用于根据所述更新信息,对自身存储的标记事件的语音进行调整。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
消噪模块,用于在接收到所述响应语音后,将所述响应语音确定为自身噪声;消除所述自身噪声。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
采集模块,用于在接收用户发送的语音信息前,采集周围环境中的环境声音信息;
第四接收模块,用于接收用户发送的新的语音信息;
确定模块,用于在所述环境声音信息中,确定与所述新的语音信息的时间间隔在预设范围内的目标环境声音信息;
拼接模块,用于将所述新的语音信息与所述目标环境声音信息进行拼接;
发送模块,用于将拼接后的语音信息发送给云端服务器进行解析。
17.一种智能设备,其特征在于,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为智能设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行权利要求1-8任一项所述的语音响应方法。
CN201710230096.4A 2017-04-10 2017-04-10 一种语音响应方法、装置及智能设备 Active CN107146611B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201710230096.4A CN107146611B (zh) 2017-04-10 2017-04-10 一种语音响应方法、装置及智能设备
EP18784958.3A EP3611724A4 (en) 2017-04-10 2018-04-10 VOICE RESPONSE METHOD, DEVICE, AND INTELLIGENT DEVICE
JP2019554883A JP2020515913A (ja) 2017-04-10 2018-04-10 音声応答方法、装置及びスマートデバイス
PCT/CN2018/082508 WO2018188587A1 (zh) 2017-04-10 2018-04-10 一种语音响应方法、装置及智能设备
US16/499,978 US20210280172A1 (en) 2017-04-10 2018-04-10 Voice Response Method and Device, and Smart Device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710230096.4A CN107146611B (zh) 2017-04-10 2017-04-10 一种语音响应方法、装置及智能设备

Publications (2)

Publication Number Publication Date
CN107146611A CN107146611A (zh) 2017-09-08
CN107146611B true CN107146611B (zh) 2020-04-17

Family

ID=59775234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710230096.4A Active CN107146611B (zh) 2017-04-10 2017-04-10 一种语音响应方法、装置及智能设备

Country Status (5)

Country Link
US (1) US20210280172A1 (zh)
EP (1) EP3611724A4 (zh)
JP (1) JP2020515913A (zh)
CN (1) CN107146611B (zh)
WO (1) WO2018188587A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146611B (zh) * 2017-04-10 2020-04-17 北京猎户星空科技有限公司 一种语音响应方法、装置及智能设备
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质
CN110275691A (zh) * 2018-03-15 2019-09-24 阿拉的(深圳)人工智能有限公司 智能语音唤醒的自动回复方法、装置、终端及存储介质
CN108665895B (zh) * 2018-05-03 2021-05-25 百度在线网络技术(北京)有限公司 用于处理信息的方法、装置和***
CN108766420B (zh) * 2018-05-31 2021-04-02 中国联合网络通信集团有限公司 语音交互设备唤醒词生成方法及装置
CN109830232A (zh) * 2019-01-11 2019-05-31 北京猎户星空科技有限公司 人机交互方法、装置和存储介质
CN109859757A (zh) * 2019-03-19 2019-06-07 百度在线网络技术(北京)有限公司 一种语音设备控制方法、装置和终端
CN110209429A (zh) * 2019-06-10 2019-09-06 百度在线网络技术(北京)有限公司 信息提取方法、装置及存储介质
CN110797023A (zh) * 2019-11-05 2020-02-14 出门问问信息科技有限公司 一种语音速记方法及设备
CN111654782B (zh) * 2020-06-05 2022-01-18 百度在线网络技术(北京)有限公司 一种智能音箱及信号处理方法
CN112420043A (zh) * 2020-12-03 2021-02-26 深圳市欧瑞博科技股份有限公司 基于语音的智能唤醒方法、装置、电子设备及存储介质
CN114465837B (zh) * 2022-01-30 2024-03-08 云知声智能科技股份有限公司 一种智能语音设备协同唤醒处理方法及装置
CN115001890B (zh) * 2022-05-31 2023-10-31 四川虹美智能科技有限公司 基于免应答的智能家电控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
EP3067884A1 (en) * 2015-03-13 2016-09-14 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
CN106200411A (zh) * 2016-09-09 2016-12-07 微鲸科技有限公司 智能家居控制***和控制方法
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的***及方法
CN106469040A (zh) * 2015-08-19 2017-03-01 华为终端(东莞)有限公司 通信方法、服务器及设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3398401B2 (ja) * 1992-03-16 2003-04-21 株式会社東芝 音声認識方法及び音声対話装置
JP2001356796A (ja) * 2000-06-12 2001-12-26 Atr Onsei Gengo Tsushin Kenkyusho:Kk サービス予約システムおよびサービスを予約する情報端末
JP4209247B2 (ja) * 2003-05-02 2009-01-14 アルパイン株式会社 音声認識装置および方法
US9355092B2 (en) * 2006-02-01 2016-05-31 i-COMMAND LTD Human-like response emulator
JP2014092777A (ja) * 2012-11-06 2014-05-19 Magic Hand:Kk モバイル通信機器の音声による起動
JP6411017B2 (ja) * 2013-09-27 2018-10-24 クラリオン株式会社 サーバ、及び、情報処理方法
JP5882972B2 (ja) * 2013-10-11 2016-03-09 Necパーソナルコンピュータ株式会社 情報処理装置、及びプログラム
US9953632B2 (en) * 2014-04-17 2018-04-24 Qualcomm Incorporated Keyword model generation for detecting user-defined keyword
US10770075B2 (en) * 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input
US10276180B2 (en) * 2014-07-21 2019-04-30 Honeywell International Inc. Audio command adaptive processing system and method
US9812128B2 (en) * 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
CN107146611B (zh) * 2017-04-10 2020-04-17 北京猎户星空科技有限公司 一种语音响应方法、装置及智能设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067884A1 (en) * 2015-03-13 2016-09-14 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
CN106469040A (zh) * 2015-08-19 2017-03-01 华为终端(东莞)有限公司 通信方法、服务器及设备
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN106200411A (zh) * 2016-09-09 2016-12-07 微鲸科技有限公司 智能家居控制***和控制方法
CN106448664A (zh) * 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的***及方法

Also Published As

Publication number Publication date
JP2020515913A (ja) 2020-05-28
US20210280172A1 (en) 2021-09-09
EP3611724A1 (en) 2020-02-19
CN107146611A (zh) 2017-09-08
EP3611724A4 (en) 2020-04-29
WO2018188587A1 (zh) 2018-10-18

Similar Documents

Publication Publication Date Title
CN107146611B (zh) 一种语音响应方法、装置及智能设备
US20190362252A1 (en) Learning user preferences in a conversational system
CN106201424B (zh) 一种信息交互方法、装置及电子设备
CN104394491B (zh) 一种智能耳机、云服务器以及音量调节方法和***
US20170277993A1 (en) Virtual assistant escalation
CN107025906A (zh) 扩展语音识别的周期的方法和产品以及信息处理设备
US20170178048A1 (en) Identification and presentation of tasks based on predicted periods of user availability
CN109243431A (zh) 一种处理方法、控制方法、识别方法及其装置和电子设备
US20110106736A1 (en) System and method for intuitive user interaction
KR20170094306A (ko) 디지털 어시스턴트 알람 시스템
CN108351870A (zh) 根据活动模式的计算机语音识别和语义理解
CN108628921A (zh) 将非请求内容主动并入到人机对话中
KR102343084B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
US10891959B1 (en) Voice message capturing system
CN102263858A (zh) 一种天气预报提示方法、***及移动终端
CN110720100A (zh) 信息处理设备、信息处理方法和程序
CN107241506A (zh) 一种控制智能终端的闹钟响铃的方法以及装置
WO2012032714A1 (en) User device, server, and operating conditions setting system
CN112052316A (zh) 模型评估方法、装置、存储介质及电子设备
US11907822B2 (en) Controlling conversational digital assistant interactivity
CN111339881A (zh) 基于情绪识别的宝宝成长监护方法及***
US11455178B2 (en) Method for providing routine to determine a state of an electronic device and electronic device supporting same
CN113848747A (zh) 智能家居设备控制方法及装置
CN111314561B (zh) 智能提醒方法、终端及存储介质
EP3654194A1 (en) Information processing device, information processing method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant