CN105654950A - 自适应语音反馈方法和装置 - Google Patents

自适应语音反馈方法和装置 Download PDF

Info

Publication number
CN105654950A
CN105654950A CN201610060206.2A CN201610060206A CN105654950A CN 105654950 A CN105654950 A CN 105654950A CN 201610060206 A CN201610060206 A CN 201610060206A CN 105654950 A CN105654950 A CN 105654950A
Authority
CN
China
Prior art keywords
information
voice feedback
voice
mentioned
word speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610060206.2A
Other languages
English (en)
Other versions
CN105654950B (zh
Inventor
李丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610060206.2A priority Critical patent/CN105654950B/zh
Publication of CN105654950A publication Critical patent/CN105654950A/zh
Application granted granted Critical
Publication of CN105654950B publication Critical patent/CN105654950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了自适应语音反馈方法和装置。所述方法的一具体实施方式包括:获取输入信息;识别所述输入信息的场景信息;解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。该实施方式实现了自适应反馈语音,提高了语音反馈的针对性和有效性。

Description

自适应语音反馈方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及自适应语音反馈方法和装置。
背景技术
随着计算机技术尤其是互联网技术的发展,终端设备的客户端应用的功能越来越多样化。语音助手是一类可以通过语音交互来实现或替代部分我们在手机上的查询与操作的应用,当然,实现语音助手功能的还包括具有语音助手功能的应用或者具有语音助手功能的网站。通过此类应用或网站,可以大大提高操作终端设备的便利性。然而,现有的上述应用或网站与人的交互还仅仅停留在如何正确的理解人的语音输入,并尽快给予回答问题,执行某些操作(如查询、展示、应用操作等),功能较为单一,针对性不强。
发明内容
本申请的目的在于提出一种改进的自适应语音反馈方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种自适应语音反馈方法,所述方法包括:获取输入信息;识别所述输入信息的场景信息;解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。
在一些实施例中,所述交流方式信息还包括:语速信息、组句方式信息或昵语类别信息;以及,所述使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈包括:根据所述语速信息、所述组句方式信息或所述昵语类别信息调整所述语音反馈样式;使用经过调整的语音反馈样式进行反馈。
在一些实施例中,所述根据所述语速信息、所述组句方式信息或所述昵语类别信息在调整所述语音反馈样式包括:将所述语音反馈样式的语速调整到与所述语速信息对应的语速;将所述语音反馈样式的组句方式调整到与所述组句方式信息一致;获取预先建立的与所述昵语类别信息一致的昵语集合,其中,所述昵语集合包括正常用语和与所述正常用语对应的昵语;将所述语音反馈样式中的词句与所述昵语集合中的正常用语进行比对;如果所述词句与所述正常用语相同,则用与所述正常用语对应的昵语替换所述词句。
在一些实施例中,所述输入信息包括:语音信息和/或视频信息;以及,解析所述输入信息得到用户情绪信息包括:解析所述语音信息得到语速信息、语调信息或频谱信息中的至少一项;将所述语速信息、语调信息与语速阈值、语调阈值进行比较,得到语音情绪结果;解析所述视频信息得到视频情绪结果;基于所述语音情绪结果和所述视频情绪结果得出用户情绪信息。
在一些实施例中,所述方法还包括:根据从预先设立的推荐内容集合中选取与所述场景信息、所述用户情绪信息、所述主题内容信息相关联的推荐内容;生成推荐内容执行请求;向客户端发送所述推荐内容执行请求,以供客户端选择是否许可所述执行所述推荐内容;如果所述客户端对所述推荐内容执行请求发出许可,则执行所述推荐内容。
在一些实施例中,所述场景信息包括以下至少一项:时间信息、地点信息或终端应用类别信息。
第二方面,本申请提供了一种自适应语音反馈装置,所述装置包括:获取模块,配置用于获取输入信息;识别模块,配置用于识别所述输入信息的场景信息;解析模块,配置用于解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;生成模块,配置用于根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;匹配模块,配置用于将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;反馈模块,配置用于使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。
在一些实施例中,所述交流方式信息还包括:语速信息、组句方式信息或昵语类别信息;以及,所述反馈模块包括调整子模块,所述调整子模块配置用于:根据所述语速信息、所述组句方式信息或所述昵语类别信息调整所述语音反馈样式;使用经过调整的语音反馈样式进行反馈。
在一些实施例中,所述根据所述语速信息、所述组句方式信息或所述昵语类别信息在调整所述语音反馈样式包括:将所述语音反馈样式的语速调整到与所述语速信息对应的语速;将所述语音反馈样式的组句方式调整到与所述组句方式信息一致;获取预先建立的与所述昵语类别信息一致的昵语集合,其中,所述昵语集合包括正常用语和与所述正常用语对应的昵语;将所述语音反馈样式中的词句与所述昵语集合中的正常用语进行比对;如果所述词句与所述正常用语相同,则用与所述正常用语对应的昵语替换所述词句。
在一些实施例中,所述输入信息包括:语音信息和/或视频信息;以及,解析所述输入信息得到用户情绪信息包括:解析所述语音信息得到语速信息、语调信息或频谱信息中的至少一项;将所述语速信息、语调信息与语速阈值、语调阈值进行比较,得到语音情绪结果;解析所述视频信息得到视频情绪结果;基于所述语音情绪结果和所述视频情绪结果得出用户情绪信息。
在一些实施例中,所述装置还包括推荐模块,所述推荐模块配置用于:根据从预先设立的推荐内容集合中选取与所述场景信息、所述用户情绪信息、所述主题内容信息相关联的推荐内容;生成推荐内容执行请求;向客户端发送所述推荐内容执行请求,以供客户端选择是否许可所述执行所述推荐内容;如果所述客户端对所述推荐内容执行请求发出许可,则执行所述推荐内容。
在一些实施例中,所述场景信息包括以下至少一项:时间信息、地点信息或终端应用类别信息。
本申请提供的自适应语音反馈方法和装置,通过获取输入信息;识别输入信息的场景信息,解析输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,再根据用户情绪信息、所述语言类别信息、主题内容信息中的至少一项和场景信息生成用户属性标签,然后将用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度,最后使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈,实现了自适应反馈语音,提高了语音反馈的针对性和有效性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是可以应用本申请的自适应语音反馈方法或自适应语音反馈装置的实施例的示例性***架构;
图2是根据本申请的自适应语音反馈方法的一个实施例的流程图;
图3是根据本申请的自适应语音反馈方法的又一个实施例的流程图;
图4是图3所示实施例的一个应用场景的数据流向示意图;
图5是根据本申请的自适应语音反馈装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的自适应语音反馈方法或自适应语音反馈装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105反馈,以接收或发送消息(例如语音信息)等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音助手类应用、文档管理类应用、搜索类应用、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的语音助手类应用等提供支持的后台语音处理服务器。上述后台语音处理服务器可以对从终端设备接收到的语音进行存储、分析等处理,并将处理结果反馈给上述终端设备和执行相应的操作。
如图1所示,通过在终端设备101、102、103上安装相应的语音助手类应用,或者通过在终端设备101、102、103上具有语音助手功能的通信类应用,或者通过在终端设备101、102、103上浏览具有语音助手功能的通信类网站,这些终端设备可以用语音消息的形式向服务器105发出物件配送请求,之后可以由服务器105来执行上述自适应语音反馈方法。相应地,自适应语音反馈装置可以设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的自适应语音反馈方法的一个实施例的流程200。上述的自适应语音反馈方法,包括以下步骤:
步骤201,获取输入信息。
在本实施例中,自适应语音反馈方法运行于其上的电子设备(例如图1所示的服务器)可以从本地或者远程获取用户的输入信息。当输入信息已保存在电子设备的存储器中时,上述电子设备可以直接从本地的存储器获取上述输入信息。或者,当上述电子设备是对终端设备上的语音助手类应用进行支持的后台服务器时,其可以通过有线连接方式或者无线连接方式从上述终端设备获取输入信息。上述无线连接方式包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。
在本实施例中,输入信息包括但不限于语音信息、视频信息、图像信息或文字信息。
步骤202,识别输入信息的场景信息。
在本实施例中,输入信息的场景信息是指用户发送此输入信息时所处的场景,上述场景信息可以包括但不限于时间信息、地点信息或终端应用类别信息。在这里,时间信息是指用户发送上述输入信息的时间。地点信息是指用户发送上述输入信息的地点,上述地点可以是具体的地址,比如x省x市x区x街道;上述地址也可以是所处场所,比如家、公司、医院。在这里,终端应用类别信息可以是用户指示操作何种终端应用的信息,例如如果用户通过语音指示打开地图类应用,那么终端应用类别信息就是此地图类应用;可选地,终端应用类别信息还可以是用户输入并发送的上述输入信息所使用的是何种终端应用的信息,例如用户使用通信类应用发送文字信息、视频信息、图像信息中的一种或多种,那么终端应用类别信息就是此通信类应用。
在本实施例一些可选的实现方式中,可以通过位置服务(LBS,LocationBasedServices,又称定位服务)识别地点信息。
在本实施例一些可选的实现方式中,可以根据历史的统计数据,建立若干个场景信息模型,例如“晚上-家-外卖”、“上午-公司会议-度秘”、“周日-户外-地图”、“默认”。将获取的输入信息的场景信息与场景信息模型匹配,判断与当前输入信息的场景信息匹配度最高的场景信息模型,如果此场景信息模型满足预定匹配度阈值,那么将此场景信息模型作为场景信息。如果场景信息模型与识别的场景信息的匹配度都不能达到预定的匹配度阈值,则以识别的场景信息作为输入信息的场景信息;或者,以场景信息模型的“默认”模型作为输入信息的场景信息。
步骤203,解析输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项。
在本实施例中,用户的情绪信息是指用户输入上述输入信息时的情绪状态信息,例如愉悦、伤心、累、精力充足等。
在本实施例一些可选的实现方式中,解析上述语音信息得到用户情绪信息可以通过以下方式实现:解析上述语音信息得到语速值、语调值或频谱信息中的至少一项;将上述语速值、语调值与语速阈值、语调阈值进行比较,得到语音情绪结果;解析上述视频信息得到视频情绪结果;基于上述语音情绪结果和上述视频情绪结果得出用户情绪信息。
在本实施例中,上述交流方式信息包括但不限于语言类别信息,上述语言类别信息可以是语种类别信息,例如汉语、英语、日语;上述语言类别信息也可以是同种语言不同的方言种类信息,例如粤语、宁波话、普通话,再例如美式英语、英式英语。
在本实施例中,上述主题内容信息是指上述输入信息所传递的语义信息,例如,输入信息是“我要订外卖”,在一些可选的实现方式中,经过切词处理和语义识别处理,得出主题内容信息可以是“订”“外卖”。
在本实施例一些可选的实现方式中,主要采用语音识别技术识别语音信息的主题内容信息。例如用户的语音信息经识别为购物、查询、XX广场、优衣库,那么将主题内容信息表示为一系列主题关键词{购物、查询、XX广场、优衣库}。
在本实施例一些可选的实现方式中,根据主题内容信息执行相应的操作,例如,输入信息是“我要订外卖”,那么执行打开具有订外卖功能的终端应用的操作,然后向用户推荐外卖订购信息。
步骤204,根据用户情绪信息、语言类别信息、主题内容信息中的至少一项和场景信息生成用户属性标签。
在本实施例中,用户属性标签用于表征与用户的情绪、所使用的语言、当前所处场景等相关的情况,例如,一位女性用户晚上9点在家时,通过方言定外卖,情绪沮丧,那么用户属性标签可以是{晚上,家,女声,沮丧,上海话}。
步骤205,将上述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度。
在本实施例中,预先训练语音若干个语音反馈样式,上述语音反馈样式包括特征标签和适用标签,其中,上述特征标签用于表征此语音反馈样式的特征,例如,语音反馈样式的特征标签是{女声,林志玲,普通话,80后};上述适用标签用于表征此语音反馈样式适合用于哪些情况,例如特征标签是语音反馈样式的适用标签是{场景1,场景2,情绪1,情绪2,方言1,昵语1,昵语2,主题1,主题2}。
步骤206,使用与上述用户属性匹配度最高的语音反馈样式进行语音反馈。
在本实施例中,基于上述步骤205,通过上述用户属性标签与上述适用标签匹配,获取匹配度最高的语音反馈样式并进行反馈,例如用户在开车心情好时的普通话输入,***将获取{女声,林志玲,普通话,80后}这个语音反馈样式进行语音反馈。
本申请的上述实施例提供的方法通过获取输入信息;识别输入信息的场景信息,解析输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,再根据用户情绪信息、所述语言类别信息、主题内容信息中的至少一项和场景信息生成用户属性标签,然后将用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度,最后使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈,实现了自适应反馈语音,提高了语音反馈的针对性和有效性。
进一步参考图3,其示出了自适应语音反馈方法的又一个实施例的流程300。该自适应语音反馈方法的流程300,包括以下步骤:
步骤301,获取输入信息。
在本实施例中,自适应语音反馈方法运行于其上的电子设备(例如图1所示的服务器)可以从本地或者远程获取用户的输入信息。
在本实施例中,输入信息可以包括但不限于语音信息、视频信息、图像信息或文字信息。
步骤302,识别输入信息的场景信息。
在本实施例中,输入信息的场景信息是指用户发送此输入信息时所处的场景,上述场景信息可以包括但不限于时间信息、地点信息或终端应用类别信息。
在本实施例一些可选的实现方式中,可以根据历史的统计数据,建立若干个场景信息模型,例如“晚上-家-外卖”、“上午-公司会议-度秘”、“周日-户外-地图”、“默认”。将获取的输入信息的场景信息与场景信息模型匹配,判断与当前输入信息的场景信息匹配度最高的场景信息模型,如果此场景信息模型满足预定匹配度阈值,那么将此场景信息模型作为场景信息。如果场景信息模型与识别的场景信息的匹配度都不能达到预定的匹配度阈值,则以识别的场景信息作为输入信息的场景信息;或者,以场景信息模型的“默认”模型作为输入信息的场景信息。
步骤303,解析输入信息得到用户情绪信息、交流方式信息、主题内容信息。
在本实施例中,用户的情绪信息是指用户输入上述输入信息时的情绪状态信息,例如愉悦、伤心、累、精力充足等。
在本实施例中,解析上述语音信息得到用户情绪信息可以通过以下方式实现:解析上述语音信息得到语速值、语调值;将上述语速值、语调值与语速阈值、语调阈值进行比较,得到语音情绪结果;解析上述视频信息得到视频情绪结果;基于上述语音情绪结果和上述视频情绪结果得出用户情绪信息。可以理解的是,上述语速阈值、语调阈值根据用户的不同而有所不同。
在本实施例一些可选的实现方式中,如果上述语速值低于语速阈值,且语调值低于语调阈值,那么判定语音情绪结果为负面。如果上述语速值高于语速阈值,且语调值高于语调阈值,那么判定语音情绪结果为正面。如果上述语速值、语调值只有一个高于其阈值,那么判定语音情绪结果为中立。
在本实施例一些可选的实现方式中,解析上述视频信息得到视频情绪结果可以通过视频动态识别或抽样图像识别的方式实现。
在本实施例一些可选的实现方式中,当语音情绪结果和视频情绪结果都为正面或负面时,情绪结果信息才为正面或负面;如果语音情绪结果和视频情绪结果不一致时,判定情绪结果信息为中立。
在本实施例一些可选的实现方式中,可以为上述语音情绪结果和上述视频情绪结果设立不同的权重,例如当语音输入质量较好而视频输入质量较差时,为语音情绪结果设立较高权重。将正面、负面、中立设置分别数值为1、-1、0,将语音情绪结果与视频情绪结果的权重与正面、负面、中立对应的数值运算,得出情绪结果值,判断情绪结果值处于哪种情绪的数值区间,得出情绪结果信息。
在本实施例一些可选的实现方式中,上述交流方式信息包括:语言类别信息、语速值、组句方式信息或昵语类别信息。
上述主题内容信息是指上述输入信息所传递的语义信息,例如,输入信息是“我要订外卖”,在一些可选的实现方式中,经过切词处理和语义识别处理,得出主题内容信息可以是“订”“外卖”。
在本实施例一些可选的实现方式中,主要采用语音识别技术识别语音信息的主题内容信息。例如用户的语音信息经识别为购物、查询、XX广场、优衣库,那么将主题内容信息表示为一系列主题关键词{购物、查询、XX广场、优衣库}。
在本实施例一些可选的实现方式中,根据主题内容信息执行相应的操作,例如,输入信息是“我要订外卖”,那么执行打开具有订外卖功能的终端应用的操作,然后向用户推荐外卖订购信息。
步骤304,根据上述用户情绪信息、上述语言类别信息、上述主题内容信息和上述场景信息生成用户属性标签。
在本实施例中,用户属性标签用于表征与用户的情绪、所使用的语言、用户所表达的主题内容和当前所处场景等相关的情况,例如,一位女性用户晚上9点在家时,通过方言定外卖,情绪沮丧,那么用户属性标签可以是{晚上,家,女声,沮丧,上海话,订外卖}。
步骤305,将上述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度。
在本实施例中,预先训练语音若干个语音反馈样式,上述语音反馈样式包括特征标签和适用标签,其中,上述特征标签用于表征此语音反馈样式的特征,例如,语音反馈样式的特征标签是{女声,林志玲,普通话,80后};上述适用标签用于表征此语音反馈样式适合用于哪些情况,例如特征标签是语音反馈样式的适用标签是{场景1,场景2,情绪1,情绪2,方言1,昵语1,昵语2,主题1,主题2}。
步骤306,根据语速信息、组句方式信息或昵语类别信息调整上述语音反馈样式。
在本实施例的一些可选的实现方式中,根据上述语速信息调整上述语音反馈样式可以通过以下方式实现:将上述语音反馈样式的语速调整到与上述语速信息对应的语速,在这里,语速信息是一个在用户输入语速值数值附近的范围值。例如,用户使用较慢的舒缓的语音,那么也将语音反馈样式的语速也调整为较慢的舒缓的语音,即将语音反馈样式的语速调到此范围值内。再例如,将上述语音反馈样式的语速调整到与上述语速信息不同的范围内,例如用户使用较快的语音,可能用户处于一个急躁的状态,那么将语音反馈样式的语速为较慢的舒缓的语音。
在本实施例的一些可选的实现方式中,可以通过调整语音反馈样式中语音的词与词之间、句子与句子之间的间隔调整语音反馈样式的语速。
在本实施例的一些可选的实现方式中,根据上述组句方式信息调整上述语音反馈样式可以通过以下方式实现:将上述语音反馈样式的组句方式调整到与上述组句方式信息一致;通过语音识别技术得到上述组句方式信息,例如识别得到用户的组句方式习惯为{谓语,主语,宾语},那么调整语音反馈样式的组句方式为{谓语,主语,宾语}。再例如,如果用户的组句方式习惯为{吃饭,先},如正常反馈可能是“先走”,根据此处可能根据调整为“走,先”。
在本实施例的一些可选的实现方式中,根据昵语类别信息调整上述语音反馈样式可以通过以下方式实现:获取上述昵语类别信息一致的昵语集合,其中,上述昵语集合包括正常用语和与上述正常用语对应的昵语;将上述语音反馈样式中的词句与上述昵语集合中的正常用语进行比对;如果上述词句与上述正常用语相同,则用与上述正常用语对应的昵语替换上述词句。
步骤307,使用经过调整的语音反馈样式进行反馈。
在本实施例中,基于上述步骤306,使用经过调整的语音反馈样式进行语音反馈。
在本实施例的一些可选的实现方式中,上述自适应语音反馈方法的流程300还可以包括步骤308,在反馈语音后,执行推荐内容;上述执行推荐内容可以通过以下步骤实现:根据从预先设立的推荐内容集合中选取与上述场景信息、上述用户情绪信息、上述主题内容信息相关联的推荐内容;生成推荐内容执行请求;向客户端发送上述推荐内容执行请求,以供客户端选择是否许可上述执行上述推荐内容;如果上述客户端对上述推荐内容执行请求发出许可,则执行上述推荐内容。例如,识别结果为在早上在户外(场景信息)愉快(用户情绪信息)的锻炼(主题内容信息),那么会推荐播放一首小清新的歌曲,如果用户许可,则执行播放推荐歌曲的操作。再例如,一位女性用户晚上9点在家时,通过方言定外卖,通过用户进行语音输入时的语音和视频识别,判断用户很累很饿很沮丧,则在迅速执行定外卖的同时,会用舒缓的同性方言声音,询问用户是否需要播放喜欢的音乐,或拨打常用闺蜜的电话,如果得到许可,则播放用户喜欢的音乐或拨打常用闺蜜的电话。
在本实施例中,上述实现流程中的步骤301、步骤302、步骤303、步骤304和步骤305分别与前述实施例中的步骤201、步骤202、步骤203、步骤204和步骤205基本相同,在此不再赘述。
从图3中可以看出,与图2对应的实施例主要的不同点是,本实施例中的自适应语音反馈方法的流程300多出了根据语速信息、组句方式信息或昵语类别信息调整上述语音反馈样式的步骤306和在反馈语音后执行推荐内容的步骤308。通过增加的步骤306和308,本实施例描述的方案可以更加有效的反馈预先信息,提高反馈的针对性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种自适应语音反馈装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例上述的自适应语音反馈装置500包括:获取模块501,配置用于获取输入信息;识别模块502,配置用于识别上述输入信息的场景信息;解析模块503,配置用于解析上述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,上述交流方式信息包括语言类别信息;生成模块504,配置用于根据上述用户情绪信息、上述语言类别信息、上述主题内容信息中的至少一项和上述场景信息生成用户属性标签;匹配模块505,配置用于将上述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;反馈模块506,配置用于使用与上述用户属性匹配度最高的语音反馈样式进行语音反馈。
在本实施例的一个可选实施方式中,上述交流方式信息还包括:语速信息、组句方式信息或昵语类别信息;以及,上述反馈模块包括调整子模块,上述调整子模块配置用于:根据上述语速信息、上述组句方式信息或上述昵语类别信息调整上述语音反馈样式;使用经过调整的语音反馈样式进行反馈。
在本实施例的一个可选实施方式中,上述根据上述语速信息、上述组句方式信息或上述昵语类别信息在调整上述语音反馈样式包括:将上述语音反馈样式的语速调整到与上述语速信息对应的语速;将上述语音反馈样式的组句方式调整到与上述组句方式信息一致;获取预先建立的与上述昵语类别信息一致的昵语集合,其中,上述昵语集合包括正常用语和与上述正常用语对应的昵语;将上述语音反馈样式中的词句与上述昵语集合中的正常用语进行比对;如果上述词句与上述正常用语相同,则用与上述正常用语对应的昵语替换上述词句。
在本实施例的一个可选实施方式中,上述输入信息包括:语音信息和/或视频信息;以及,解析上述输入信息得到用户情绪信息包括:解析上述语音信息得到语速信息、语调信息或频谱信息中的至少一项;将上述语速信息、语调信息与语速阈值、语调阈值进行比较,得到语音情绪结果;解析上述视频信息得到视频情绪结果;基于上述语音情绪结果和上述视频情绪结果得出用户情绪信息。
在本实施例的一个可选实施方式中,上述装置500还包括推荐模块507,上述推荐模块配置用于:根据从预先设立的推荐内容集合中选取与上述场景信息、上述用户情绪信息、上述主题内容信息相关联的推荐内容;生成推荐内容执行请求;向客户端发送上述推荐内容执行请求,以供客户端选择是否许可上述执行上述推荐内容;如果上述客户端对上述推荐内容执行请求发出许可,则执行上述推荐内容。
在本实施例的一个可选实施方式中,上述场景信息包括以下至少一项:时间信息、地点信息或终端应用类别信息。
本领域技术人员可以理解,上述自适应语音反馈装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机***600的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分605;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“用于获取输入信息的模块”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:获取输入信息;识别所述输入信息的场景信息;解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种自适应语音反馈方法,其特征在于,所述方法包括:
获取输入信息;
识别所述输入信息的场景信息;
解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;
根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;
将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;
使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。
2.根据权利要求1所述的方法,其特征在于,所述交流方式信息还包括:语速信息、组句方式信息或昵语类别信息;以及,
所述使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈包括:
根据所述语速信息、所述组句方式信息或所述昵语类别信息调整所述语音反馈样式;
使用经过调整的语音反馈样式进行反馈。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语速信息、所述组句方式信息或所述昵语类别信息在调整所述语音反馈样式包括:
将所述语音反馈样式的语速调整到与所述语速信息对应的语速;
将所述语音反馈样式的组句方式调整到与所述组句方式信息一致;
获取预先建立的与所述昵语类别信息一致的昵语集合,其中,所述昵语集合包括正常用语和与所述正常用语对应的昵语;将所述语音反馈样式中的词句与所述昵语集合中的正常用语进行比对;如果所述词句与所述正常用语相同,则用与所述正常用语对应的昵语替换所述词句。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述输入信息包括:语音信息和/或视频信息;以及,
解析所述输入信息得到用户情绪信息包括:
解析所述语音信息得到语速信息、语调信息或频谱信息中的至少一项;
将所述语速信息、语调信息与语速阈值、语调阈值进行比较,得到语音情绪结果;
解析所述视频信息得到视频情绪结果;
基于所述语音情绪结果和所述视频情绪结果得出用户情绪信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据从预先设立的推荐内容集合中选取与所述场景信息、所述用户情绪信息、所述主题内容信息相关联的推荐内容;
生成推荐内容执行请求;
向客户端发送所述推荐内容执行请求,以供客户端选择是否许可所述执行所述推荐内容;
如果所述客户端对所述推荐内容执行请求发出许可,则执行所述推荐内容。
6.根据权利要求5所述的方法,其特征在于,所述场景信息包括以下至少一项:时间信息、地点信息或终端应用类别信息。
7.一种自适应语音反馈装置,其特征在于,所述装置包括:
获取模块,配置用于获取输入信息;
识别模块,配置用于识别所述输入信息的场景信息;
解析模块,配置用于解析所述输入信息得到用户情绪信息、交流方式信息、主题内容信息中的至少一项,其中,所述交流方式信息包括语言类别信息;
生成模块,配置用于根据所述用户情绪信息、所述语言类别信息、所述主题内容信息中的至少一项和所述场景信息生成用户属性标签;
匹配模块,配置用于将所述用户属性标签与预先训练的语音反馈样式的适用标签进行匹配,并得到匹配度;
反馈模块,配置用于使用与所述用户属性匹配度最高的语音反馈样式进行语音反馈。
8.根据权利要求7所述的装置,其特征在于,所述交流方式信息还包括:语速信息、组句方式信息或昵语类别信息;以及,
所述反馈模块包括调整子模块,所述调整子模块配置用于:
根据所述语速信息、所述组句方式信息或所述昵语类别信息调整所述语音反馈样式;
使用经过调整的语音反馈样式进行反馈。
9.根据权利要求8所述的装置,其特征在于,所述根据所述语速信息、所述组句方式信息或所述昵语类别信息在调整所述语音反馈样式包括:
将所述语音反馈样式的语速调整到与所述语速信息对应的语速;
将所述语音反馈样式的组句方式调整到与所述组句方式信息一致;
获取预先建立的与所述昵语类别信息一致的昵语集合,其中,所述昵语集合包括正常用语和与所述正常用语对应的昵语;将所述语音反馈样式中的词句与所述昵语集合中的正常用语进行比对;如果所述词句与所述正常用语相同,则用与所述正常用语对应的昵语替换所述词句。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述输入信息包括:语音信息和/或视频信息;以及,
解析所述输入信息得到用户情绪信息包括:
解析所述语音信息得到语速信息、语调信息或频谱信息中的至少一项;
将所述语速信息、语调信息与语速阈值、语调阈值进行比较,得到语音情绪结果;
解析所述视频信息得到视频情绪结果;
基于所述语音情绪结果和所述视频情绪结果得出用户情绪信息。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括推荐模块,所述推荐模块配置用于:
根据从预先设立的推荐内容集合中选取与所述场景信息、所述用户情绪信息、所述主题内容信息相关联的推荐内容;
生成推荐内容执行请求;
向客户端发送所述推荐内容执行请求,以供客户端选择是否许可所述执行所述推荐内容;
如果所述客户端对所述推荐内容执行请求发出许可,则执行所述推荐内容。
12.根据权利要求11所述的装置,其特征在于,所述场景信息包括以下至少一项:时间信息、地点信息或终端应用类别信息。
CN201610060206.2A 2016-01-28 2016-01-28 自适应语音反馈方法和装置 Active CN105654950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610060206.2A CN105654950B (zh) 2016-01-28 2016-01-28 自适应语音反馈方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610060206.2A CN105654950B (zh) 2016-01-28 2016-01-28 自适应语音反馈方法和装置

Publications (2)

Publication Number Publication Date
CN105654950A true CN105654950A (zh) 2016-06-08
CN105654950B CN105654950B (zh) 2019-07-16

Family

ID=56488908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610060206.2A Active CN105654950B (zh) 2016-01-28 2016-01-28 自适应语音反馈方法和装置

Country Status (1)

Country Link
CN (1) CN105654950B (zh)

Cited By (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106297789A (zh) * 2016-08-19 2017-01-04 北京光年无限科技有限公司 智能机器人的个性化交互方法及交互***
CN106486111A (zh) * 2016-10-14 2017-03-08 北京光年无限科技有限公司 基于智能机器人的多tts引擎输出语速调节方法及***
CN106504743A (zh) * 2016-11-14 2017-03-15 北京光年无限科技有限公司 一种用于智能机器人的语音交互输出方法及机器人
CN106531162A (zh) * 2016-10-28 2017-03-22 北京光年无限科技有限公司 一种用于智能机器人的人机交互方法及装置
CN106657543A (zh) * 2016-10-31 2017-05-10 北京小米移动软件有限公司 语音信息处理方法及装置
CN106782544A (zh) * 2017-03-29 2017-05-31 联想(北京)有限公司 语音交互设备及其输出方法
CN106782521A (zh) * 2017-03-22 2017-05-31 海南职业技术学院 一种语音识别***
CN106782540A (zh) * 2017-01-17 2017-05-31 联想(北京)有限公司 语音设备及包括所述语音设备的语音交互***
CN106815321A (zh) * 2016-12-27 2017-06-09 深圳前海勇艺达机器人有限公司 基于智能聊天机器人的聊天方法及装置
CN106992012A (zh) * 2017-03-24 2017-07-28 联想(北京)有限公司 语音处理方法及电子设备
CN107146610A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户意图的确定方法及装置
CN107274900A (zh) * 2017-08-10 2017-10-20 北京灵隆科技有限公司 用于控制终端的信息处理方法及其***
CN107291900A (zh) * 2017-06-22 2017-10-24 美味不用等(上海)信息科技股份有限公司 信息反馈与跟踪***
CN107316641A (zh) * 2017-06-30 2017-11-03 联想(北京)有限公司 一种语音控制方法及电子设备
CN107331388A (zh) * 2017-06-15 2017-11-07 重庆柚瓣科技有限公司 一种基于养老机器人的方言收集***
CN107393530A (zh) * 2017-07-18 2017-11-24 国网山东省电力公司青岛市黄岛区供电公司 服务引导方法及装置
CN107545029A (zh) * 2017-07-17 2018-01-05 百度在线网络技术(北京)有限公司 智能设备的语音反馈方法、设备及可读介质
CN107657017A (zh) * 2017-09-26 2018-02-02 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107818787A (zh) * 2017-10-31 2018-03-20 努比亚技术有限公司 一种语音信息的处理方法、终端及计算机可读存储介质
CN107871500A (zh) * 2017-11-16 2018-04-03 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
CN108091324A (zh) * 2017-12-22 2018-05-29 北京百度网讯科技有限公司 语气识别方法、装置、电子设备和计算机可读存储介质
CN108121721A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 意图识别方法及装置
CN108205526A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种确定综合语义信息的方法与装置
CN108231070A (zh) * 2016-12-14 2018-06-29 松下知识产权经营株式会社 语音对话装置、语音对话方法、语音对话程序以及机器人
CN108257596A (zh) * 2017-12-22 2018-07-06 北京小蓦机器人技术有限公司 一种用于提供目标呈现信息的方法与设备
CN108257037A (zh) * 2018-01-18 2018-07-06 封玉涛 一种以社交场景化为切入点的多应用融合方法及装置
CN108281141A (zh) * 2017-12-22 2018-07-13 北京小蓦机器人技术有限公司 一种用于提供语音响应信息的方法与设备
CN108319485A (zh) * 2018-01-29 2018-07-24 出门问问信息科技有限公司 信息交互方法、装置、设备及存储介质
CN108605076A (zh) * 2016-12-30 2018-09-28 谷歌有限责任公司 用于数据传输的反馈控制器
CN109036405A (zh) * 2018-07-27 2018-12-18 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及存储介质
US10157607B2 (en) 2016-10-20 2018-12-18 International Business Machines Corporation Real time speech output speed adjustment
CN109240488A (zh) * 2018-07-27 2019-01-18 重庆柚瓣家科技有限公司 一种ai场景定位引擎的实现方法
CN109346076A (zh) * 2018-10-25 2019-02-15 三星电子(中国)研发中心 语音交互、语音处理方法、装置和***
CN109377979A (zh) * 2018-12-07 2019-02-22 苏州思必驰信息科技有限公司 更新欢迎语的方法和***
CN109672724A (zh) * 2018-11-01 2019-04-23 百度在线网络技术(北京)有限公司 信息推送方法、装置及设备
CN109686362A (zh) * 2019-01-02 2019-04-26 百度在线网络技术(北京)有限公司 语音播报方法、装置和计算机可读存储介质
CN109697290A (zh) * 2018-12-29 2019-04-30 咪咕数字传媒有限公司 一种信息处理方法、设备及计算机存储介质
CN109741744A (zh) * 2019-01-14 2019-05-10 博拉网络股份有限公司 基于大数据搜索的ai机器人对话控制方法和***
CN110347817A (zh) * 2019-07-15 2019-10-18 网易(杭州)网络有限公司 智能应答方法及装置、存储介质、电子设备
CN110827797A (zh) * 2019-11-06 2020-02-21 北京沃东天骏信息技术有限公司 语音应答事件分类处理方法和装置
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN110930998A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN111179903A (zh) * 2019-12-30 2020-05-19 珠海格力电器股份有限公司 一种语音识别方法、装置、存储介质及电器
CN111241822A (zh) * 2020-01-03 2020-06-05 北京搜狗科技发展有限公司 输入场景下情绪发现与疏导方法及装置
CN111292737A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN111310009A (zh) * 2020-01-16 2020-06-19 珠海格力电器股份有限公司 用户分类方法、装置、存储介质、计算机设备
CN111354350A (zh) * 2019-12-26 2020-06-30 阿里巴巴集团控股有限公司 语音处理方法及装置、语音处理设备、电子设备
CN111724774A (zh) * 2019-03-22 2020-09-29 阿里巴巴集团控股有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN111724173A (zh) * 2020-06-18 2020-09-29 中国银行股份有限公司 机器人自调节的方法、装置、设备及计算机存储介质
CN112017646A (zh) * 2020-08-21 2020-12-01 博泰车联网(南京)有限公司 一种语音处理方法、装置及计算机存储介质
US10893088B2 (en) 2016-12-30 2021-01-12 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
US10956485B2 (en) 2011-08-31 2021-03-23 Google Llc Retargeting in a search environment
CN108335700B (zh) * 2018-01-30 2021-07-06 重庆与展微电子有限公司 语音调节方法、装置、语音交互设备及存储介质
US11093686B2 (en) 2013-09-30 2021-08-17 Google Llc Resource size-based content item selection
US11120194B2 (en) 2013-09-30 2021-09-14 Google Llc Automatically determining a size for a content item for a web page
CN113435962A (zh) * 2021-06-07 2021-09-24 布瑞克农业大数据科技集团有限公司 一种农产品线上集购方法、***及其存储介质
CN114356276A (zh) * 2021-12-22 2022-04-15 科大讯飞股份有限公司 一种语音交互方法以及相关装置
WO2022222841A1 (zh) * 2021-04-20 2022-10-27 北京沃东天骏信息技术有限公司 信息展示方法、装置、电子设备和计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090234655A1 (en) * 2008-03-13 2009-09-17 Jason Kwon Mobile electronic device with active speech recognition
CN103577544A (zh) * 2013-10-11 2014-02-12 北京百度网讯科技有限公司 一种用于提供待发送信息的方法及装置
CN104038836A (zh) * 2014-06-03 2014-09-10 四川长虹电器股份有限公司 电视节目智能推送的方法
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
CN104881108A (zh) * 2014-02-27 2015-09-02 青岛海尔机器人有限公司 一种智能人机交互方法及装置
CN105206269A (zh) * 2015-08-14 2015-12-30 百度在线网络技术(北京)有限公司 一种语音处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090234655A1 (en) * 2008-03-13 2009-09-17 Jason Kwon Mobile electronic device with active speech recognition
CN103577544A (zh) * 2013-10-11 2014-02-12 北京百度网讯科技有限公司 一种用于提供待发送信息的方法及装置
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
CN104881108A (zh) * 2014-02-27 2015-09-02 青岛海尔机器人有限公司 一种智能人机交互方法及装置
CN104038836A (zh) * 2014-06-03 2014-09-10 四川长虹电器股份有限公司 电视节目智能推送的方法
CN105206269A (zh) * 2015-08-14 2015-12-30 百度在线网络技术(北京)有限公司 一种语音处理方法和装置

Cited By (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10956485B2 (en) 2011-08-31 2021-03-23 Google Llc Retargeting in a search environment
US11120195B2 (en) 2013-09-30 2021-09-14 Google Llc Resource size-based content item selection
US11586801B2 (en) 2013-09-30 2023-02-21 Google Llc Automatically determining a size for a content item for a web page
US11610045B2 (en) 2013-09-30 2023-03-21 Google Llc Resource size-based content item selection
US11093686B2 (en) 2013-09-30 2021-08-17 Google Llc Resource size-based content item selection
US11120194B2 (en) 2013-09-30 2021-09-14 Google Llc Automatically determining a size for a content item for a web page
CN106297789A (zh) * 2016-08-19 2017-01-04 北京光年无限科技有限公司 智能机器人的个性化交互方法及交互***
CN106297789B (zh) * 2016-08-19 2020-01-14 北京光年无限科技有限公司 智能机器人的个性化交互方法及交互***
CN106486111A (zh) * 2016-10-14 2017-03-08 北京光年无限科技有限公司 基于智能机器人的多tts引擎输出语速调节方法及***
US10157607B2 (en) 2016-10-20 2018-12-18 International Business Machines Corporation Real time speech output speed adjustment
CN106531162A (zh) * 2016-10-28 2017-03-22 北京光年无限科技有限公司 一种用于智能机器人的人机交互方法及装置
CN106657543A (zh) * 2016-10-31 2017-05-10 北京小米移动软件有限公司 语音信息处理方法及装置
CN106504743A (zh) * 2016-11-14 2017-03-15 北京光年无限科技有限公司 一种用于智能机器人的语音交互输出方法及机器人
CN108121721A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 意图识别方法及装置
CN108231070B (zh) * 2016-12-14 2023-04-18 松下知识产权经营株式会社 语音对话装置、语音对话方法、记录介质以及机器人
CN108231070A (zh) * 2016-12-14 2018-06-29 松下知识产权经营株式会社 语音对话装置、语音对话方法、语音对话程序以及机器人
CN108205526A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种确定综合语义信息的方法与装置
CN106815321A (zh) * 2016-12-27 2017-06-09 深圳前海勇艺达机器人有限公司 基于智能聊天机器人的聊天方法及装置
US10893088B2 (en) 2016-12-30 2021-01-12 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
CN108605076A (zh) * 2016-12-30 2018-09-28 谷歌有限责任公司 用于数据传输的反馈控制器
CN112967716A (zh) * 2016-12-30 2021-06-15 谷歌有限责任公司 用于数据传输的反馈控制器
US11475886B2 (en) 2016-12-30 2022-10-18 Google Llc Feedback controller for data transmissions
CN106782540A (zh) * 2017-01-17 2017-05-31 联想(北京)有限公司 语音设备及包括所述语音设备的语音交互***
CN106782521A (zh) * 2017-03-22 2017-05-31 海南职业技术学院 一种语音识别***
US10796689B2 (en) 2017-03-24 2020-10-06 Lenovo (Beijing) Co., Ltd. Voice processing methods and electronic devices
CN106992012A (zh) * 2017-03-24 2017-07-28 联想(北京)有限公司 语音处理方法及电子设备
CN106782544A (zh) * 2017-03-29 2017-05-31 联想(北京)有限公司 语音交互设备及其输出方法
CN107146610A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户意图的确定方法及装置
CN107331388A (zh) * 2017-06-15 2017-11-07 重庆柚瓣科技有限公司 一种基于养老机器人的方言收集***
CN107291900B (zh) * 2017-06-22 2020-06-05 美味不用等(上海)信息科技股份有限公司 信息反馈与跟踪***
CN107291900A (zh) * 2017-06-22 2017-10-24 美味不用等(上海)信息科技股份有限公司 信息反馈与跟踪***
CN107316641A (zh) * 2017-06-30 2017-11-03 联想(北京)有限公司 一种语音控制方法及电子设备
CN107545029A (zh) * 2017-07-17 2018-01-05 百度在线网络技术(北京)有限公司 智能设备的语音反馈方法、设备及可读介质
CN107393530A (zh) * 2017-07-18 2017-11-24 国网山东省电力公司青岛市黄岛区供电公司 服务引导方法及装置
CN107274900A (zh) * 2017-08-10 2017-10-20 北京灵隆科技有限公司 用于控制终端的信息处理方法及其***
CN107274900B (zh) * 2017-08-10 2020-09-18 北京京东尚科信息技术有限公司 用于控制终端的信息处理方法及其***
CN107657017A (zh) * 2017-09-26 2018-02-02 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107657017B (zh) * 2017-09-26 2020-11-13 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107818787A (zh) * 2017-10-31 2018-03-20 努比亚技术有限公司 一种语音信息的处理方法、终端及计算机可读存储介质
CN107871500A (zh) * 2017-11-16 2018-04-03 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
CN107871500B (zh) * 2017-11-16 2021-07-20 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
US10964338B2 (en) 2017-12-22 2021-03-30 Beijing Baidu Netcom Science And Technology Co., Ltd. Mood recognition method, electronic device and computer-readable storage medium
CN108281141A (zh) * 2017-12-22 2018-07-13 北京小蓦机器人技术有限公司 一种用于提供语音响应信息的方法与设备
CN108091324B (zh) * 2017-12-22 2021-08-17 北京百度网讯科技有限公司 语气识别方法、装置、电子设备和计算机可读存储介质
CN108257596B (zh) * 2017-12-22 2021-07-23 北京小蓦机器人技术有限公司 一种用于提供目标呈现信息的方法与设备
CN108091324A (zh) * 2017-12-22 2018-05-29 北京百度网讯科技有限公司 语气识别方法、装置、电子设备和计算机可读存储介质
CN108257596A (zh) * 2017-12-22 2018-07-06 北京小蓦机器人技术有限公司 一种用于提供目标呈现信息的方法与设备
CN108257037A (zh) * 2018-01-18 2018-07-06 封玉涛 一种以社交场景化为切入点的多应用融合方法及装置
CN108319485A (zh) * 2018-01-29 2018-07-24 出门问问信息科技有限公司 信息交互方法、装置、设备及存储介质
CN108335700B (zh) * 2018-01-30 2021-07-06 重庆与展微电子有限公司 语音调节方法、装置、语音交互设备及存储介质
CN109036405A (zh) * 2018-07-27 2018-12-18 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及存储介质
CN109240488A (zh) * 2018-07-27 2019-01-18 重庆柚瓣家科技有限公司 一种ai场景定位引擎的实现方法
CN110930998A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN109346076A (zh) * 2018-10-25 2019-02-15 三星电子(中国)研发中心 语音交互、语音处理方法、装置和***
CN109672724A (zh) * 2018-11-01 2019-04-23 百度在线网络技术(北京)有限公司 信息推送方法、装置及设备
CN109672724B (zh) * 2018-11-01 2022-07-29 百度在线网络技术(北京)有限公司 信息推送方法、装置及设备
CN109377979A (zh) * 2018-12-07 2019-02-22 苏州思必驰信息科技有限公司 更新欢迎语的方法和***
CN111292737A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN109377979B (zh) * 2018-12-07 2021-09-24 思必驰科技股份有限公司 更新欢迎语的方法和***
CN109697290A (zh) * 2018-12-29 2019-04-30 咪咕数字传媒有限公司 一种信息处理方法、设备及计算机存储介质
CN109686362A (zh) * 2019-01-02 2019-04-26 百度在线网络技术(北京)有限公司 语音播报方法、装置和计算机可读存储介质
CN109741744B (zh) * 2019-01-14 2021-03-09 博拉网络股份有限公司 基于大数据搜索的ai机器人对话控制方法和***
CN109741744A (zh) * 2019-01-14 2019-05-10 博拉网络股份有限公司 基于大数据搜索的ai机器人对话控制方法和***
CN111724774A (zh) * 2019-03-22 2020-09-29 阿里巴巴集团控股有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN111724774B (zh) * 2019-03-22 2024-05-17 斑马智行网络(香港)有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN110347817B (zh) * 2019-07-15 2022-03-18 网易(杭州)网络有限公司 智能应答方法及装置、存储介质、电子设备
CN110347817A (zh) * 2019-07-15 2019-10-18 网易(杭州)网络有限公司 智能应答方法及装置、存储介质、电子设备
CN110827797A (zh) * 2019-11-06 2020-02-21 北京沃东天骏信息技术有限公司 语音应答事件分类处理方法和装置
CN110827797B (zh) * 2019-11-06 2022-04-12 北京沃东天骏信息技术有限公司 语音应答事件分类处理方法和装置
CN111354350A (zh) * 2019-12-26 2020-06-30 阿里巴巴集团控股有限公司 语音处理方法及装置、语音处理设备、电子设备
CN111354350B (zh) * 2019-12-26 2024-04-05 阿里巴巴集团控股有限公司 语音处理方法及装置、语音处理设备、电子设备
CN111179903A (zh) * 2019-12-30 2020-05-19 珠海格力电器股份有限公司 一种语音识别方法、装置、存储介质及电器
CN111241822A (zh) * 2020-01-03 2020-06-05 北京搜狗科技发展有限公司 输入场景下情绪发现与疏导方法及装置
CN111310009A (zh) * 2020-01-16 2020-06-19 珠海格力电器股份有限公司 用户分类方法、装置、存储介质、计算机设备
CN111724173A (zh) * 2020-06-18 2020-09-29 中国银行股份有限公司 机器人自调节的方法、装置、设备及计算机存储介质
CN112017646A (zh) * 2020-08-21 2020-12-01 博泰车联网(南京)有限公司 一种语音处理方法、装置及计算机存储介质
WO2022222841A1 (zh) * 2021-04-20 2022-10-27 北京沃东天骏信息技术有限公司 信息展示方法、装置、电子设备和计算机可读介质
CN113435962A (zh) * 2021-06-07 2021-09-24 布瑞克农业大数据科技集团有限公司 一种农产品线上集购方法、***及其存储介质
CN114356276A (zh) * 2021-12-22 2022-04-15 科大讯飞股份有限公司 一种语音交互方法以及相关装置

Also Published As

Publication number Publication date
CN105654950B (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN105654950A (zh) 自适应语音反馈方法和装置
US20210232761A1 (en) Methods and systems for improving machine learning performance
US20210081611A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
KR101909807B1 (ko) 메시지 입력 방법 및 장치
CN109829039B (zh) 智能聊天方法、装置、计算机设备及存储介质
CN109308357B (zh) 一种用于获得答案信息的方法、装置和设备
CN111930940B (zh) 一种文本情感分类方法、装置、电子设备及存储介质
CN107491534A (zh) 信息处理方法和装置
CN105701088A (zh) 从机器对话切换到人工对话的方法和装置
CN106407425A (zh) 基于人工智能的推送信息的方法和装置
CN105810189A (zh) 设备的语音控制方法、装置及***
CN106227786A (zh) 用于推送信息的方法和装置
WO2017186050A1 (zh) 人机智能问答***的断句识别方法和装置
CN106383875A (zh) 基于人工智能的人机交互方法和装置
CN104462064A (zh) 一种移动终端信息通讯提示输入内容的方法和***
CN108268450B (zh) 用于生成信息的方法和装置
CN105786969A (zh) 信息展示方法和装置
CN110554782A (zh) 一种表情输入的图像合成方法和***
US11361759B2 (en) Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media
CN111538818B (zh) 数据查询方法、装置、电子设备及存储介质
CN111767431A (zh) 用于视频配乐的方法和装置
CN117332072B (zh) 对话处理、语音摘要提取以及目标对话模型训练方法
WO2023005968A1 (zh) 文本类别识别方法、装置、电子设备和存储介质
US10217455B2 (en) Linguistic model database for linguistic recognition, linguistic recognition device and linguistic recognition method, and linguistic recognition system
CN105740900A (zh) 信息识别的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant