CN110111767A - 多语言语音辅助支持 - Google Patents
多语言语音辅助支持 Download PDFInfo
- Publication number
- CN110111767A CN110111767A CN201910007798.5A CN201910007798A CN110111767A CN 110111767 A CN110111767 A CN 110111767A CN 201910007798 A CN201910007798 A CN 201910007798A CN 110111767 A CN110111767 A CN 110111767A
- Authority
- CN
- China
- Prior art keywords
- word
- language
- wake
- assistant
- voice assistant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000002618 waking effect Effects 0.000 claims abstract description 28
- 238000004891 communication Methods 0.000 claims abstract description 17
- 238000003860 storage Methods 0.000 claims description 31
- 241001672694 Citrus reticulata Species 0.000 claims description 5
- 238000004590 computer program Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 241000238558 Eucarida Species 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000003502 gasoline Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000264877 Hippospongia communis Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Abstract
一个总体方面包括一种方法,包括:经由传感器从用户获得唤醒词;经由存储器获得与唤醒词的相应语言有关的唤醒词语言数据;经由处理器识别唤醒词的语言;基于唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于唤醒词的语言技能的所选语音助理;并且促进与所选语音助理的通信,从而根据唤醒词提供语言辅助。本方面的其他实施例包括对应的计算机***、装置和记录在一个或多个计算机存储设备上的计算机程序,每一者都配置成执行方法的动作。
Description
引言
响应于用户请求,许多车辆、智能电话、计算机和/或其他***和设备都利用语音助理来提供信息或其他服务。但是,在某些情况下,可能需要对用户请求的处理和/或辅助加以改进。
因此,需要提供利用语音助理以语言形式提供信息或其他服务的方法和***,其中所述语言代表了用户在特定用户请求开始时说出的唤醒词。此外,结合附图,通过随后对示例性实施例的详细描述以及所附权利要求,其他期望特征和特点将变得显而易见。
发明内容
一个或多个计算机的***可以配置成通过在***上安装软件、固件、硬件或其组合来执行特定操作或动作,所述软件、固件、硬件或其组合在操作中促使***执行动作。一个或多个计算机程序可以配置成通过包括指令来执行特定操作或动作,所述指令在由数据处理装置执行时促使装置执行动作。一个总体方面包括一种方法,包括:经由传感器从用户获得唤醒词;经由存储器获得与唤醒词的相应语言有关的唤醒词语言数据;经由处理器识别唤醒词的语言;基于唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于唤醒词的语言技能的所选语音助理;并且促进与所选语音助理的通信,从而根据唤醒词提供语言辅助。本方面的其他实施例包括对应的计算机***、装置和记录在一个或多个计算机存储设备上的计算机程序,每一者都配置成执行方法的动作。
实施方式可以包括以下特征中的一个或多个特征。在该方法中:用户设置在车辆内;并且处理器设置在车辆内,并在车辆内识别唤醒词的语言和所选语音助理。在该方法中:用户设置在车辆内;并且处理器设置在远离车辆的远程服务器内,并从远程服务器识别唤醒词的语言和所选语音助理。在该方法中,多个不同的语音助理来自包括以下的组:英语语音助理、法语语音助理、西班牙语语音助理、德语语音助理和普通话语音助理。在该方法中,所选语音助理包括作为计算机***的一部分的自动语音助理。在该方法中,唤醒词是后续包括一个或多个请求的用户输入的一部分。该方法进一步包括:经由处理器确定唤醒词是否与当前语音助理语言设置匹配。该方法还可以包括其中,识别所选语音助理的步骤包括还至少部分地基于唤醒词是否与当前语音助理语言设置匹配来识别所选语音助理。该方法进一步包括基于所选语音助理的语言来更新用户语言历史。在该方法中,唤醒词语言数据包含在唤醒词语言查找表中,该唤醒词语言查找表包括各种类型的各种语言形式的示例性唤醒词。上述技术的实施方式可以包括硬件、方法或过程、或者计算机可访问介质上的计算机软件。
一个总体方面包括一种***,包括:配置成从用户获得唤醒词的传感器;配置成存储与唤醒词的相应语言有关的唤醒词语言数据的存储器;以及处理器,该处理器配置成至少促进:识别唤醒词的语言;基于唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于唤醒词的语言技能的所选语音助理;并且促进与所选语音助理的通信,从而根据唤醒词提供语言辅助。本方面的其他实施例包括对应的计算机***、装置和记录在一个或多个计算机存储设备上的计算机程序,每一者都配置成执行方法的动作。
实施方式可以包括以下特征中的一个或多个特征。在该***中:用户设置在车辆内;并且处理器设置在车辆内,并在车辆内识别唤醒词的语言和所选语音助理。在该***中:用户设置在车辆内;并且处理器设置在远离车辆的远程服务器内,并从远程服务器识别唤醒词的语言和所选语音助理。在该***中,多个不同的语音助理来自包括以下的组:英语语音助理、法语语音助理、西班牙语语音助理、德语语音助理和普通话语音助理。在该***中,所选语音助理包括作为计算机***的一部分的自动语音助理。在该***中,唤醒词是后续包括一个或多个请求的用户输入的一部分。在该***中,处理器进一步配置成确定唤醒词是否与当前语音助理语言设置匹配。该***还可以包括,处理器进一步配置成至少促进:还至少部分地基于唤醒词是否与当前语音助理语言设置匹配来识别所选语音助理。在该***中,处理器进一步配置成至少促进基于所选语音助理的语言来更新用户语言历史。在该***中,唤醒词语言数据包含在唤醒词语言查找表中,该唤醒词语言查找表包括各种类型的各种语言形式的示例性唤醒词。上述技术的实施方式可以包括硬件、方法或过程、或者计算机可访问介质上的计算机软件。
一个总体方面包括一种车辆,包括:用户的乘客舱;配置成从用户获得唤醒词的传感器;配置成存储与唤醒词的相应语言有关的唤醒词语言数据的存储器;以及处理器,该处理器配置成至少促进:识别唤醒词的语言;基于唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于唤醒词的语言技能的所选语音助理;并且促进与所选语音助理的通信,从而根据唤醒词提供语言辅助。本方面的其他实施例包括对应的计算机***、装置和记录在一个或多个计算机存储设备上的计算机程序,每一者都配置成执行方法的动作。
实施方式可以包括以下特征中的一个或多个特征。在该车辆中,所选语音助理包括作为计算机***的一部分的自动语音助理。上述技术的实施方式可以包括硬件、方法或过程、或者计算机可访问介质上的计算机软件。
附图说明
在下文中将结合以下附图来描述本公开,其中相同的附图标记表示相同的元件,并且其中:
图1是根据示例性实施例的包括车辆、远程服务器、各种语音助理和控制***的***的功能框图,其中响应于用户请求,该控制***利用语音助理来提供信息或其他服务;以及
图2是根据示例性实施例的过程的流程图,其中响应于用户请求,该过程利用语音助理以所选语言提供信息或其他服务。
具体实施方式
以下详细描述在本质上仅是示例性的,并不旨在限制本公开或其应用和用途。此外,无意受到前述背景技术或以下详细描述中提出的任何理论的约束。
图1示出了***100,其包括车辆102、远程服务器104和各种语音助理174(A)-174(N)。在各种实施例中,如图1所示,车辆102包括一个或多个车辆语音助理170,并且远程服务器104包括一个或多个远程服务器语音助理174(N)。在某些实施例中,车辆语音助理为用户提供与车辆102的一个或多个***有关的信息(例如,与车辆巡航控制***、照明、信息娱乐***气候控制***等***的操作有关的信息)。同样在某些实施例中,远程服务器语音助理为用户提供与导航有关的信息(例如,与旅行期间车辆102的旅行和/或兴趣点有关的信息)。
同样在某些实施例中,各种语音助理174可以以特定给定语言提供信息,例如,一个或多个英语语音助理174(A)(例如,提供北美或英国英语方言的信息);法语语音助理174(B)(例如,提供巴黎法语方言的信息);西班牙语语音助理174(C)(例如,提供欧洲或拉丁美洲西班牙语方言的信息);普通话语音助理174(D);德语语音助理174(E);和/或任何数量的其他特定语言语音助理174(N)(例如,涉及包括区域性方言在内的任何数量的其他语言)。
将会理解,语音助理(包括附加语音助理174)的数量和/或类型在不同的实施例中可以有所不同(例如,对于附加语音助理174,使用字母A…N可以表示任何数量的语音助理)。
在各种实施例中,语音助理174(A)-174(N)中的每一个与具有处理器和存储器的一个或多个计算机***相关联。同样在各种实施例中,语音助理174(A)-174(N)中的每一个可以包括自动语音助理和/或人类语音助理。在各种实施例中,在自动语音助理的情况下,相关联的计算机***进行各种确定并代表自动语音助理满足用户请求。同样在各种实施例中,在人类语音助理(例如,远程服务器104的人类语音助理146,如图1所示)的情况下,相关联的计算机***提供可以由人类在进行各种确定并代表人类语音助理满足用户的请求时使用的信息。
如图1所示,在各种实施例中,车辆102、远程服务器104和各种语音助理174(A)-174(N)经由一个或多个通信网络106(例如在各种实施例中,一个或多个蜂窝、卫星和/或其他无线网络)进行通信。在各种实施例中,***100包括一个或多个语音助理控制***119,响应于用户请求,用于利用语音助理来提供信息或其他服务。
在各种实施例中,车辆102包括车身101、设置在车身101内的乘客舱(即,舱室)103、一个或多个车轮105、驱动***108、显示器110、一个或多个其他车辆***111以及车辆控制***112。在各种实施例中,根据示例性实施例,车辆102的车辆控制***112包括或者是语音助理控制***119的一部分,响应于用户请求,该语音助理控制***用于利用语音助理来提供信息或其他服务。在各种实施例中,语音助理控制***119和/或其部件也可以是远程服务器104的一部分。
在各种实施例中,车辆102包括汽车。车辆102可以是多种不同类型的汽车中的任何一种(例如,轿车、货车、卡车或运动型多用途车(SUV)),并且在某些实施例中可以是两轮驱动(2WD)(即,后轮驱动或前轮驱动)、四轮驱动(4WD)或全轮驱动(AWD)和/或各种其他类型的车辆。在某些实施例中,语音助理控制***119可以结合一种或多种不同类型的车辆来实现和/或结合一种或多种不同类型的***和/或设备来实现,例如,计算机、平板电脑、智能电话等,和/或软件和/或其应用程序,和/或在任何语音助理174(A)-174(N)的或与其相关联的一个或多个计算机***中。
在各种实施例中,驱动***108安装在底盘上(图1中未示出)并驱动车轮109。在各种实施例中,驱动***108包括推进***。在某些示例性实施例中,驱动***108包括与其变速器联接的内燃机和/或电动机/发电机。在某些实施例中,驱动***108可以有所不同,和/或可以使用两个或多个驱动***108。举例而言,车辆102还可以包含多种不同类型的推进***中的任何一种或其组合,例如,汽油或柴油燃料的燃烧发动机、“柔性燃料车”(FFV)发动机(即,使用汽油与酒精的混合物)、气体化合物(例如,氢气和/或天然气)燃料的发动机、燃烧/电动马达混合动力发动机以及电动马达。
在各种实施例中,显示器110包括显示屏、扬声器和/或一个或多个相关联的装置、设备和/或***,用于为用户提供视觉和/或音频信息,例如地图和导航信息。在各种实施例中,显示器110包括触摸屏。同样在各种实施例中,显示器110包括车辆102的导航***和/或作为其一部分和/或与其联接。同样在各种实施例中,显示器110定位在车辆102的前仪表板处或附近,例如,在车辆102的前排乘客座椅之间。在某些实施例中,显示器110可以是车辆102内的一个或多个其他设备和/或***的一部分。在某些其他实施例中,显示器110可以是一个或多个单独的设备和/或***(例如,与车辆分开或不同)的一部分,例如,智能电话、计算机、平板电脑和/或其他设备和/或***和/或其他导航和地图相关应用程序。
同样在各种实施例中,一个或多个其他车辆***111包括车辆102的用户可以向其请求信息或请求服务的一个或多个***(例如,车辆巡航控制***、照明、信息娱乐***、气候控制***等)。
在各种实施例中,车辆控制***112包括一个或多个收发器114、传感器116和控制器118。如上所述,在各种实施例中,根据示例性实施例,车辆102的车辆控制***112包括或者是语音助理控制***119的一部分,响应于用户请求,该语音助理控制***用于利用语音助理来提供信息或其他服务。另外,类似于上面的讨论,虽然在某些实施例中语音助理控制***119(和/或其部件)是车辆102的一部分,但在某些其他实施例中,语音助理控制***119可以是远程服务器104的一部分和/或可以是一个或多个其他单独的设备和/或***(例如,与车辆和远程服务器分开或不同)的一部分,例如,智能电话、计算机等,和/或任何语音助理174(A)-174(N)等。
在各种实施例中,一个或多个收发器114用于与远程服务器104和语音助理174(A)-174(N)进行通信。在各种实施例中,一个或多个收发器114经由一个或多个通信网络106与远程服务器104的一个或多个相应收发器144和/或附加语音助理174的相应收发器(未示出)进行通信。
同样如图1所示,传感器116包括一个或多个麦克风120、其他输入传感器122、摄像头123和一个或多个附加传感器124。在各种实施例中,麦克风120接收来自用户的输入,这些输入包括来自用户的请求(例如,来自用户的关于待提供的信息和/或关于待执行的一个或多个其他服务的请求)。同样在各种实施例中,其他输入传感器122从用户接收其他输入,例如,经由显示器110的触摸屏或键盘(例如在某些实施例中,涉及到与请求有关的附加细节)。在某些实施例中,利用一个或多个摄像头123来获得与兴趣点和/或用户感兴趣的其他类型的信息和/或服务有关的数据和/或信息,例如,通过扫描快速响应(QR)码来获得与用户所请求的兴趣点和/或信息和/或服务有关的名称和/或其他信息(例如,通过扫描推荐餐馆、商店等的优惠券,和/或扫描车辆102中或周围的其他材料,和/或在语音和多模态交互对话中智能地利用摄像头123),等等。
另外,在各种实施例中,附加传感器124获得与驱动***108有关(例如,与其操作有关)的数据和/或与用户可能正在向其请求信息或请求服务的一个或多个其他车辆***111(例如,车辆巡航控制***、照明、信息娱乐***、气候控制***等)有关的数据。
在各种实施例中,控制器118联接到收发器114和传感器116。在某些实施例中,控制器118还联接到显示器110和/或联接到驱动***108和/或其他车辆***111。同样在各种实施例中,控制器118控制收发器和传感器116的操作,并且在某些实施例中还整体地或部分地控制驱动***108、显示器110和/或其他车辆***111。
在各种实施例中,控制器118接收来自用户的输入,这些输入包括来自用户的对信息和/或对一个或多个其他服务的提供的请求。同样在各种实施例中,控制器118确定适当的语音助理(例如,来自各种语音助理174(A)-174(N)),以便最佳地处理请求并将请求传送到适当的语音助理以满足请求。同样在各种实施例中,控制器118根据下面结合图2进一步描述的过程200的步骤以自动方式执行这些任务。在某些实施例中,代替车辆控制器118或作为其补充,这些任务中的一些或全部任务也可以由一个或多个其他控制器整体地或部分地执行,例如,远程服务器控制器148(下面进一步讨论)和/或附加语音助理174的一个或多个控制器(未示出)。
控制器118包括计算机***。在某些实施例中,控制器118还可以包括一个或多个收发器114、传感器116、其他车辆***和/或设备和/或其部件。另外,将会理解的是,控制器118可以在其他方面不同于图1中所示的实施例。例如,控制器118可以耦合至或者可以采取其他方式利用一个或多个远程计算机***和/或其他控制***,例如,作为上述车辆102设备和***中的一个或多个的一部分,和/或远程服务器104和/或其一个或多个部件,和/或附加语音助理174的或与其相关联的一个或多个设备和/或***。
在所描绘的实施例中,控制器118的计算机***包括处理器126、存储器128、接口130、存储设备132和总线134。处理器126执行控制器118的计算和控制功能,并且可以包括任意类型的一个处理器或多个处理器、单一集成电路(例如微处理器)或者协同工作以实现处理单元功能的任意合适数量的集成电路设备和/或电路板。在操作期间,处理器126执行存储器128内包含的一个或多个程序136并由此控制控制器118以及控制器118的计算机***的一般性操作,所述一般性操作大体上是执行本文所述的过程,例如以下结合图2进一步描述的过程200。
存储器128可以是任意类型的合适存储器。例如,存储器128可以包括各种类型的动态随机存取存储器(DRAM)(例如SDRAM)、各种类型的静态RAM(SRAM)和各种类型的非易失性存储器(PROM、EPROM和闪存)。在某些示例中,存储器128位于和/或共同位于与处理器126相同的计算机芯片上。在所描绘的实施例中,存储器128存储上述程序136以及一个或多个存储值138(例如,在各种实施例中,与不同的语音助理174(A)-174(N)中的每一个相关联的特定技能的数据库)。
总线134用于在控制器118的计算机***的各部件之间传输程序、数据、状态和其他信息。接口130允许例如从***驱动器和/或另一个计算机***到控制器118的计算机***的通信,并且可以采用任意合适的方法和装置来实现该接口。在一个实施例中,接口130从收发器114、传感器116、驱动***108、显示器110和/或其他车辆***111获得各种数据,并且处理器126基于数据来提供对用户请求的处理的控制。在各种实施例中,接口130可以包括与其他***或部件通信的一个或多个网络接口。接口130还可以包括与技术人员通信的一个或多个网络接口和/或用于连接至存储装置(例如,存储设备132)的一个或多个存储接口。
存储设备132可以是任意合适类型的存储装置,包括直接存取存储设备,例如硬盘驱动器、闪存***、软盘驱动器和光盘驱动器。在一个示例性实施例中,存储设备132包括程序产品,存储器128可以从中接收执行本公开的一个或多个过程的一个或多个实施例的程序136,例如以下结合图2进一步描述的过程200(及其任何子过程)的步骤。在另一个示例性实施例中,程序产品可以直接存储在存储器128和/或磁盘(例如,磁盘140)中或者以其他方式由其存取,例如下面所描述的那些。
总线134可以是任意合适的连接计算机***和部件的物理或逻辑装置。这包括但不限于直接的硬线连接、光纤、红外和无线总线技术。在操作期间,程序136存储在存储器128中并且由处理器126执行。
将会理解的是,尽管是在全功能计算机***的背景下介绍了该示例性实施例,但是本领域技术人员应意识到,本公开的机制能够通过一种或多种类型的非瞬时性计算机可读取信号承载介质以程序产品的形式分配,所述介质用于存储程序和其指令并执行它们的分配,例如承载程序并包含存储在其中的用于促使计算机处理器(例如处理器126)执行和运行该程序的计算机指令的非瞬时性计算机可读取介质。这样的程序产品可以采用多种形式,并且无论将什么特定类型的计算机可读取信号承载介质用于实现分配,本公开都可以等同地应用。信号承载介质的示例包括:可记录介质,例如软盘、硬盘驱动器、存储卡和光盘;以及传输介质,例如数字和模拟通信连接。将会理解,在某些实施例中也可以采用基于云的存储和/或其他技术。类似地,将会意识到的是,控制器118中的计算机***也可以在其他方面不同于图1所示的实施例,例如控制器118中的计算机***可以耦合至或者可以采取其他方式利用一种或多种远程计算机***和/或其他控制***。
同样如图1所示,在各种实施例中,远程服务器104包括收发器144、一个或多个人类语音助理146和远程服务器控制器148。在各种实施例中,收发器144使用一个或多个通信网络106经由其收发器114与车辆控制***112进行通信。
另外,如图1所示,在各种实施例中,远程服务器104包括与远程服务器104的一个或多个计算机***(例如,控制器148)相关联的语音助理174(N)。在某些实施例中,远程服务器104包括导航语音助理174(N),其为用户提供导航信息及服务(例如,与用户在旅行期间可能会访问的餐馆、服务站、旅游目的地和/或用户的其他兴趣点有关的信息和服务)。在某些实施例中,远程服务器104包括经由控制器148为用户提供自动信息和服务的自动语音助理174(N)。在某些其他实施例中,远程服务器104包括人类语音助理146,其通过人向用户提供信息和服务,这也可以经由联接到人类语音助理146的和/或由其利用的控制器148所提供的信息和/或确定来促进。
同样在各种实施例中,远程服务器控制器148有助于促进请求的处理以及人类语音助理146的启用和参与,和/或可以充当自动语音助理。如在本申请全文中所使用的,术语“语音助理”指的是在请求时向用户提供信息的任何数量的不同类型的语音助理、语音代理、虚拟语音助理等。例如,在各种实施例中,远程服务器控制器148可以整体地或部分地包括语音助理控制***119(例如在某些实施例中,单独地或者与车辆控制***112和/或用户的智能电话、计算机或其他电子设备的类似***相结合)。在某些实施例中,远程服务器控制器148可以执行以下结合车辆102的控制器118(单独地或与车辆102的控制器118相结合)讨论和/或结合图2的过程200讨论的一些或所有处理步骤。
另外,在各种实施例中,类似于车辆102的控制器118,远程服务器控制器148包括处理器150、具有一个或多个程序160的存储器152和存储在其中的存储值162、接口154、存储设备156、总线158和/或磁盘164(和/或其他存储装置)。同样在各种实施例中,远程服务器控制器148的处理器150、存储器152、程序160、存储值162、接口154、存储设备156、总线158、磁盘164和/或其他存储装置在结构和功能上类似于车辆102的控制器118的相应处理器126、存储器128、程序136、存储值138、接口130、存储设备132、总线134、磁盘140和/或其他存储装置,例如如上所述。
如上所述,在各种实施例中,各种语音助理174(A)-174(N)可以以特定给定语言提供信息,例如,一个或多个英语语音助理174(A)(例如,提供北美或英国英语方言的信息);法语语音助理174(B)(例如,提供巴黎法语方言的信息);西班牙语语音助理174(C)(例如,提供欧洲或拉丁美洲西班牙语方言的信息);普通话语音助理174(D);德语语音助理174(E);和/或任何数量的其他特定语言语音助理174(N)(例如,涉及任何数量的其他语言并且可以包括区域性方言)。
还将会理解的是,在各种实施例中,每个附加语音助理174可以包括,可以联接到和/或关联到,和/或可以利用与结合车辆102和远程服务器104进行描述的设备和***相似的各种相应的设备和***,例如,包括相应的收发器、控制器/计算机***、处理器、存储器、总线、接口、存储设备、程序、存储值、人类语音助理等,在各种实施例中,这些相应的设备和***具有与车辆102和/或远程服务器104中提出的那些设备和***相似的结构和/或功能。此外,还将会理解的是,在某些实施例中,这样的设备和/或***可以整体地或部分地包括语音助理控制***119(例如在某些实施例中,单独地或者与车辆控制***112、远程服务器控制器148和/或用户的智能电话、计算机或其他电子设备的类似***相结合),和/或可以执行结合车辆102的控制器118、远程服务器控制器148和/或结合图2的过程200讨论的一些或所有处理步骤。
图2是根据示例性实施例的过程的流程图,其中响应于用户输入开始时发出的识别唤醒词,该过程利用语音助理以指定语言提供信息或其他服务。根据示例性实施例,过程200可以结合车辆102和远程服务器104及其各种部件(包括但不限于控制***和控制器及其部件)来实现。
参考图2,过程200开始于步骤202。在某些实施例中,过程200在车辆行驶或点火循环开始时开始,例如,当驾驶员接近或进入车辆102时,或者当驾驶员启动车辆和/或其点火装置时(例如,通过转动钥匙,启用钥匙扣或启动按钮等)。在某些实施例中,过程200在车辆控制***112(例如,包括麦克风120或其其他输入传感器122)和/或智能电话、计算机和/或其他***和/或设备的控制***被激活时开始。在某些实施例中,在车辆(和/或其他***和/或设备)的操作期间连续地执行过程200的步骤。
在各种实施例中,记录语音助理数据(步骤204)。在各种实施例中,例如,经由由一个或多个处理器(例如,车辆处理器126、远程服务器处理器150和/或与任何语音助理174(A)-174(N)相关联的一个或多个其他处理器)提供的指令来获得不同的语音助理174(A)-174(N)的相应语言。同样在各种实施例中,不同的语音助理174(A)-174(N)的相应语言作为语音助理语言数据存储在存储器中(例如,作为存储值138存储在车辆存储器128中,作为存储值162存储在远程服务器存储器152和/或与任何语音助理174(A)-174(N)相关联的一个或多个其他存储器设备中)。
在各种实施例中,获得用户输入(步骤206)。用户输入可以包括唤醒词,后面直接或间接地紧跟针对信息和/或其他服务的用户请求。例如,唤醒词是由用户给出的语音命令,此语音命令允许语音助理实现激活(即,在睡眠模式下唤醒***)。例如,在各种实施例中,当唤醒词是英语时,唤醒词可以是“HELLO SIRI”,或者更具体地是单词“HELLO”。在另一种语言中,在使用法语时,唤醒词可以是“BONJOUR SIRI”,在使用德语时,唤醒词可以是“HALLO SIRI”,或者在使用西班牙语时,唤醒词可以是“HOLA SIRI”。同样在各种实施例中,这种输入是经由麦克风120自动获得的(例如,如果是口头请求的话)。在某些实施例中,经由一个或多个其他输入传感器122(例如,经由触摸屏、键盘等)自动地获得输入。
另外,例如在各种实施例中,后续用户请求可以被包括在输入中,并且可以涉及针对与以下内容有关的信息的请求:特定兴趣点(例如,餐馆、旅馆、服务站、旅游景点等)、天气报告、交通报告、打电话、发送消息、控制一个或多个车辆功能、获取家庭相关信息或服务、获取音频相关信息或服务、获取移动电话相关信息或服务、获取购物相关信息或服务、获取网络浏览器相关信息或服务和/或获取一种或多种其他类型的信息或服务。
在某些实施例中,获得其他传感器数据。例如,在某些实施例中,附加传感器124从各种车辆***自动地收集数据或者自动地收集与各种车辆***有关的数据,其中用户可以向各种车辆***寻求信息或者用户可能希望控制各种车辆***,例如,车辆102的一个或多个发动机、娱乐***、气候控制***、车窗***等。
在各种实施例中,对唤醒词语言查找表(“唤醒词语言数据库”)进行检索(步骤208)。在各种实施例中,唤醒词语言数据库包括各种类型的示例性唤醒词,例如但不限于等同于以下内容的那些唤醒词:“HELLO”、“GREETINGS”、“BEGIN”、“START“,和“QUESTION“。此外,在各种实施例中,唤醒词语言数据库包括各种语言形式的示例性唤醒词,例如但不限于,西班牙语(例如,“HOLA”、“SALUDOS”、“COMENZAR”、“INICIAR”“和”PREGUNTA“)、法语(例如”BONJOUR“、”SALUTATIONS“、”COMMENCER“、和”QU ESTION“)以及任意数量的其他语言(例如,德语、***语、中文、俄语等)。同样在各种实施例中,唤醒词语言数据库作为其存储值存储在存储器128(和/或存储器152和/或一个或多个其他存储器设备)中,并在步骤206期间由处理器126(和/或由处理器150和/或一个或多个其他处理器)自动检索。在某些实施例中,唤醒词语言数据库包括与用户的先前使用的语言/语言音素(用户语言历史)有关的数据和/或信息,例如,基于建立在用户使用历史这一基础上的最高使用频率,等等。
基于唤醒词语言数据库的唤醒词语言数据,识别用户唤醒词的语言(步骤210)。在各种实施例中,唤醒词语言由处理器126(和/或由处理器150和/或一个或多个其他处理器)自动地确定,从而试图确定唤醒词是否与当前语音助理语言设置匹配。例如,在各种示例性实施例中,处理器126可以试图确定用户是否正在试图在不手动地改变任何语言设置(例如,经由输入传感器122)的情况下改变其语音辅助的相应语言。在某些实施例中,处理器126利用自动语音识别技术来自动解释由用户说出/发出的作为输入的一部分的唤醒词语言。同样在各种实施例中,处理器126利用来自步骤208的先前使用的语言/语言音素来解释请求(例如,在该请求具有与用户的先前请求相似和/或一致的一个或多个词的情况下)。如果在各种实施例中处理器126确定唤醒词与当前语音助理语言设置匹配,则处理器将会仅选择先前使用的语音助理,并且过程200将会终止。
同样在各种实施例中,相对于各种语音助理,获得语音助理数据(步骤212)。例如,在各种实施例中,根据由一个或多个处理器提供的指令,从存储器中检索语音助理174(A)-174(N)中每一个的特定相应语言(例如,如在步骤204中记录的)。在某些实施例中,处理器126,150中的一个或多个(和/或与语音助理174(A)-174(N)相关联的一个或多个其他处理器)提供用于检索语音助理数据的指令,该语音助理数据包括来自车辆存储器128的存储值138和/或远程服务器存储器152(和/或与一个或多个语音助理174(A)-174(N)相关联的一个或多个其他存储器设备)的存储值162的相应语言。
基于特定的识别唤醒词,确定选择各种语音助理中的哪一个语音助理作为最合适的语音助理(步骤214)。在各种实施例中,在步骤214期间,语音助理174(A)-174(N)的所选语音助理被确定为具备似乎是最适合的语言技能(与其他语音助理相比),考虑到来自步骤208的唤醒词语言数据库的信息,所选语音助理与步骤206的特定唤醒词相一致。例如,处理器126,150将所接收的唤醒词与在查找表中填充的唤醒词进行比较。
在各种实施例中,在步骤214期间,由处理器自动选择最适合的语音助理。同样在各种实施例中,通过处理器126,150中的一个或多个和/或与语音助理174(A)-174(N)相关联的一个或多个其他处理器来作出选择。在某些实施例中,可以选择作为计算机***的一部分的自动语音助理。在某些实施例中,语音助理包括与一个或多个计算机***相关联的利用人工智能的虚拟语音助理。在某些其他实施例中,可以选择利用计算机***的信息来满足请求的人类语音助理。
然后,将用户说出/发出的输入(即,请求部分)的剩余信息提供给所选语音助理(步骤216)。具体地,在各种实施例中,促进用户与步骤214的所选语音助理之间的通信。在某些实施例中,将用户的请求以其特定语言的形式转发到所选语音助理,并且使用户与所选语音助理直接通信(例如,经由电话、视频会议、电子邮件、在线聊天和/或用户与所选语音助理之间的其他通信)。在各种实施例中,通过通信网络106,经由由一个或多个处理器(例如,由处理器126,150中的一个或多个,和/或与语音助理174(A)-174(N)相关联的一个或多个其他处理器)提供的指令,执行对该通信的促进。
在各种实施例中,满足用户的请求(步骤218)。在各种实施例中,所选语音助理为用户提供所请求的信息和/或服务。另外,在某些实施例中,提供与请求的满足有关的信息和/或细节(例如,提供给处理器126,150中的一个或多个,和/或与语音助理174(A)-174(N)相关联的一个或多个其他处理器),以便用于更新步骤204的语音助理数据和步骤206的用户语言历史。
同样在各种实施例中,更新语音助理数据(步骤220)。在各种实施例中,基于所选语音助理的语言,更新步骤204的语音助理数据。在某些实施例中,获得关于语音助理的语言的用户反馈(例如,与用户对语音助理的选择和/或对语音助理掌握所使用的语言技能的程度的满意度有关的用户反馈),并且可以基于此反馈相应地更新语音助理数据。在各种实施例中,语音助理数据以这种方式由一个或多个处理器(例如,处理器126,150中的一个或多个,和/或与语音助理174(A)-174(N)相关联的一个或多个其他处理器)更新,并且相应的更新信息存储在存储器(例如,存储器128,152和/或与语音助理174(A)-174(N)相关联的一个或多个其他存储器设备)中。
此外,同样在各种实施例中,还对用户语言历史数据进行更新(步骤222)。在各种实施例中,可以基于所选语音助理的识别、所选语音助理的辅助提供或这两者来进一步更新步骤210的用户语言历史。
在各种实施例中,过程200随后结束(步骤224),例如,直到车辆102重新启动为止和/或直到用户做出另一个请求为止。
类似于上面的讨论,在各种实施例中,过程200的一些或所有步骤(或其部分)可以由车辆控制***112、远程服务器控制器148和/或一个或多个其他控制***和/或语音助理174(A)-174(N)的或与其相关联的控制器执行。类似地,还将会理解的是,过程200的各个步骤可以由车辆和/或远程服务器和/或由一个或多个其他计算机***(例如,用于用户的智能电话、计算机、平板电脑等的计算机***)执行、在其上执行或在其内执行。类似地将会理解的是,***和/或***100的各部件可以在其他实施例中有所不同,并且,图2的过程200的各步骤也可以与图2所描绘的和/或如上与其相结合地讨论的不同(和/或可以以不同的顺序执行)。
因此,本文描述的***、车辆和方法向例如车辆的用户提供了潜在得到改进的用户请求处理。基于对用户请求的性质的识别以及与多个不同类型的语音助理的各种相应技能的比较,将用户的请求传送到最适合的语音助理。
因此,***、车辆和方法为用户提供了潜在得到改进和/或有效的体验,使得用户的请求能够由适合特定用户请求的且最准确和/或最有效的语音助理进行处理。如上所述,在某些实施例中,上述技术可以用于车辆中。同样如上所述,在某些其他实施例中,上述技术还可以结合用户的智能电话、平板电脑、计算机、其他电子设备和***来使用。
虽然在前述详细描述中呈现了至少一个示例性实施例,但是应理解的是,仍存在有大量变型。还应理解,一个示例性实施例或多个示例性实施例仅是示例,并不意欲以任何方式限制本公开的范围、适用性或配置。相反,前述详细描述将为本领域技术人员提供用于实施一个示例性实施例或多个示例性实施例的便利指引。应理解,在不脱离如所附权利要求及其法律等效物所阐述的本公开范围的情况下,可以对元件的功能和布置作出各种改变。
Claims (10)
1.一种方法,包括:
经由传感器从用户获得唤醒词;
经由存储器获得与所述唤醒词的相应语言有关的唤醒词语言数据;
经由处理器识别所述唤醒词的所述语言;
基于所述唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于所述唤醒词的语言技能的所选语音助理;并且
促进与所述所选语音助理的通信,从而根据所述唤醒词提供所述语言的辅助。
2.根据权利要求1所述的方法,其中:
所述用户设置在车辆内;并且
所述处理器设置在所述车辆内,并在所述车辆内识别所述唤醒词的所述语言和所述所选语音助理。
3.根据权利要求1所述的方法,还包括
经由所述处理器确定所述唤醒词是否与当前语音助理语言设置匹配;并且
其中所述识别所述所选语音助理的步骤包括还至少部分地基于所述唤醒词是否与所述当前语音助理语言设置匹配来识别所述所选语音助理。
4.根据权利要求1所述的方法,其中所述唤醒词语言数据包含在唤醒词语言查找表中,所述唤醒词语言查找表包括各种类型的各种语言形式的示例性唤醒词。
5.一种***,包括:
配置成从用户获得唤醒词的传感器;
配置成存储与所述唤醒词的相应语言有关的唤醒词语言数据的存储器;以及
处理器,所述处理器配置成至少促进:
识别所述唤醒词的语言;
基于所述唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于所述唤醒词的语言技能的所选语音助理;并且
促进与所述所选语音助理的通信,从而根据所述唤醒词提供所述语言的辅助。
6.根据权利要求5所述的***,其中所述多个不同的语音助理来自包括以下的组:英语语音助理、法语语音助理、西班牙语语音助理、德语语音助理和普通话语音助理。
7.根据权利要求5所述的***,其中所述唤醒词是后续包括一个或多个请求的用户输入的一部分。
8.根据权利要求5所述的***,其中:
所述处理器进一步配置成确定所述唤醒词是否与当前语音助理语言设置匹配;并且
所述处理器进一步配置成至少促进:还至少部分地基于所述唤醒词是否与所述当前语音助理语言设置匹配来识别所述所选语音助理。
9.一种车辆,包括:
用户的乘客舱;
配置成从用户获得唤醒词的传感器;
配置成存储与所述唤醒词的相应语言有关的唤醒词语言数据的存储器;以及
处理器,所述处理器配置成至少促进:
识别所述唤醒词的语言;
基于所述唤醒词语言数据,从多个不同的语音助理中识别出具备最适合于所述唤醒词的语言技能的所选语音助理;以及
促进与所述所选语音助理的通信,从而根据所述唤醒词提供所述语言的辅助。
10.根据权利要求9所述的车辆,其中所述所选语音助理包括作为计算机***的一部分的自动语音助理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/885077 | 2018-01-31 | ||
US15/885,077 US20190237069A1 (en) | 2018-01-31 | 2018-01-31 | Multilingual voice assistance support |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110111767A true CN110111767A (zh) | 2019-08-09 |
Family
ID=67224433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910007798.5A Pending CN110111767A (zh) | 2018-01-31 | 2019-01-04 | 多语言语音辅助支持 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20190237069A1 (zh) |
CN (1) | CN110111767A (zh) |
DE (1) | DE102019101785A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111261160A (zh) * | 2020-01-20 | 2020-06-09 | 联想(北京)有限公司 | 一种信号处理方法及装置 |
CN111512364A (zh) * | 2019-12-31 | 2020-08-07 | 江苏树实科技有限公司 | 智能音箱、多语音助手控制方法以及智能家居*** |
CN112466300A (zh) * | 2019-09-09 | 2021-03-09 | 百度在线网络技术(北京)有限公司 | 交互方法、电子设备、智能设备及可读存储介质 |
CN112908330A (zh) * | 2021-03-04 | 2021-06-04 | 深圳市云希谷科技有限公司 | 终端设备的语音唤醒方法、装置及计算机可读存储介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11900928B2 (en) | 2017-12-23 | 2024-02-13 | Soundhound Ai Ip, Llc | System and method for adapted interactive experiences |
US10997975B2 (en) * | 2018-02-20 | 2021-05-04 | Dsp Group Ltd. | Enhanced vehicle key |
US11014532B2 (en) * | 2018-05-14 | 2021-05-25 | Gentex Corporation | Vehicle control module for smart home control system |
US11258671B1 (en) * | 2018-09-18 | 2022-02-22 | Amazon Technologies, Inc. | Functionality management for devices |
US11096101B2 (en) * | 2019-03-12 | 2021-08-17 | Samsung Electronics Co., Ltd. | Method of UL access in a cell supporting supplementary uplink |
EP3866157B1 (de) * | 2020-02-13 | 2024-04-03 | Deutsche Telekom AG | Elektronische assistenzvorrichtung und betriebsverfahren |
CN113284502A (zh) * | 2021-05-08 | 2021-08-20 | 埃顿能源科技(四川)有限公司 | 一种智能客服语音交互方法及*** |
US20230126052A1 (en) * | 2021-10-27 | 2023-04-27 | Soundhound, Inc. | System and method for analysis of spoken natural language to detect promotion phrases for providing follow-up content |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1418570A1 (en) * | 2002-11-06 | 2004-05-12 | Swisscom Fixnet AG | Cross-lingual speech recognition method |
CN1991976A (zh) * | 2005-12-31 | 2007-07-04 | 潘建强 | 基于音素的语音识别方法与*** |
CN101415259A (zh) * | 2007-10-18 | 2009-04-22 | 三星电子株式会社 | 嵌入式设备上基于双语语音查询的信息检索***及方法 |
CN103971678A (zh) * | 2013-01-29 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 关键词检测方法和装置 |
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
CN106997762A (zh) * | 2017-03-08 | 2017-08-01 | 广东美的制冷设备有限公司 | 家用电器的语音控制方法以及装置 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US6912499B1 (en) * | 1999-08-31 | 2005-06-28 | Nortel Networks Limited | Method and apparatus for training a multilingual speech model set |
CN1174332C (zh) * | 2000-03-10 | 2004-11-03 | 松下电器产业株式会社 | 转换表达方式的方法和装置 |
AU2002314933A1 (en) * | 2001-05-30 | 2002-12-09 | Cameronsound, Inc. | Language independent and voice operated information management system |
US7216001B2 (en) * | 2003-01-22 | 2007-05-08 | Medtronic Xomed, Inc. | Apparatus for intraoperative neural monitoring |
US10032452B1 (en) * | 2016-12-30 | 2018-07-24 | Google Llc | Multimodal transmission of packetized data |
US7885390B2 (en) * | 2005-07-01 | 2011-02-08 | Soleo Communications, Inc. | System and method for multi-modal personal communication services |
US20090265175A1 (en) * | 2008-04-16 | 2009-10-22 | Broadcom Coropration | Method and system for providing a translation service for a voice channel |
US8255225B2 (en) * | 2008-08-07 | 2012-08-28 | Vocollect Healthcare Systems, Inc. | Voice assistant system |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US9634855B2 (en) * | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US9117449B2 (en) * | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US8917861B2 (en) * | 2012-06-05 | 2014-12-23 | Symbol Technologies, Inc. | Automated voice connection to a best-determined target |
US9536528B2 (en) * | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US9218806B1 (en) * | 2013-05-10 | 2015-12-22 | Amazon Technologies, Inc. | Generation and use of multiple speech processing transforms |
WO2014196984A1 (en) * | 2013-06-07 | 2014-12-11 | Nuance Communications, Inc. | Speech-based search using descriptive features of surrounding objects |
TW201505023A (zh) * | 2013-07-19 | 2015-02-01 | Richplay Information Co Ltd | 個人化語音助理之方法 |
FR3011375B1 (fr) * | 2013-10-01 | 2017-01-27 | Aldebaran Robotics | Procede de dialogue entre une machine, telle qu'un robot humanoide, et un interlocuteur humain, produit programme d'ordinateur et robot humanoide pour la mise en œuvre d'un tel procede |
US9373321B2 (en) * | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8768712B1 (en) * | 2013-12-04 | 2014-07-01 | Google Inc. | Initiating actions based on partial hotwords |
US9613140B2 (en) * | 2014-05-16 | 2017-04-04 | International Business Machines Corporation | Real-time audio dictionary updating system |
US9633004B2 (en) * | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9263042B1 (en) * | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US10672391B2 (en) * | 2014-09-26 | 2020-06-02 | Nuance Communications, Inc. | Improving automatic speech recognition of multilingual named entities |
WO2016115716A1 (zh) * | 2015-01-23 | 2016-07-28 | 华为技术有限公司 | 一种语音播放方法和语音播放设备 |
TWI525532B (zh) * | 2015-03-30 | 2016-03-11 | Yu-Wei Chen | Set the name of the person to wake up the name for voice manipulation |
WO2016200381A1 (en) * | 2015-06-10 | 2016-12-15 | Nuance Communications, Inc. | Motion adaptive speech recognition for enhanced voice destination entry |
US9996316B2 (en) * | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US9621984B1 (en) * | 2015-10-14 | 2017-04-11 | Amazon Technologies, Inc. | Methods to process direction data of an audio input device using azimuth values |
TW201717655A (zh) * | 2015-11-05 | 2017-05-16 | 宏碁股份有限公司 | 語音控制方法及語音控制系統 |
US10891946B2 (en) * | 2016-07-28 | 2021-01-12 | Red Hat, Inc. | Voice-controlled assistant volume control |
US10331795B2 (en) * | 2016-09-28 | 2019-06-25 | Panasonic Intellectual Property Corporation Of America | Method for recognizing speech sound, mobile terminal, and recording medium |
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN106611597B (zh) * | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106653022B (zh) * | 2016-12-29 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US11164570B2 (en) * | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10373402B2 (en) * | 2017-04-25 | 2019-08-06 | TrueLite Trace, Inc. | Commercial driver electronic logging rule compliance and vehicle inspection voice assistant system |
CN107134279B (zh) * | 2017-06-30 | 2020-06-19 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
US10204624B1 (en) * | 2017-08-14 | 2019-02-12 | Lenovo (Singapore) Pte. Ltd. | False positive wake word |
US11282528B2 (en) * | 2017-08-14 | 2022-03-22 | Lenovo (Singapore) Pte. Ltd. | Digital assistant activation based on wake word association |
US10964318B2 (en) * | 2017-08-18 | 2021-03-30 | Blackberry Limited | Dialogue management |
US11062702B2 (en) * | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US10614811B2 (en) * | 2017-12-29 | 2020-04-07 | Intel Corporation | Hierarchical speech recognition resolution |
-
2018
- 2018-01-31 US US15/885,077 patent/US20190237069A1/en not_active Abandoned
-
2019
- 2019-01-04 CN CN201910007798.5A patent/CN110111767A/zh active Pending
- 2019-01-24 DE DE102019101785.8A patent/DE102019101785A1/de not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1418570A1 (en) * | 2002-11-06 | 2004-05-12 | Swisscom Fixnet AG | Cross-lingual speech recognition method |
CN1991976A (zh) * | 2005-12-31 | 2007-07-04 | 潘建强 | 基于音素的语音识别方法与*** |
CN101415259A (zh) * | 2007-10-18 | 2009-04-22 | 三星电子株式会社 | 嵌入式设备上基于双语语音查询的信息检索***及方法 |
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
CN103971678A (zh) * | 2013-01-29 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 关键词检测方法和装置 |
CN106997762A (zh) * | 2017-03-08 | 2017-08-01 | 广东美的制冷设备有限公司 | 家用电器的语音控制方法以及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112466300A (zh) * | 2019-09-09 | 2021-03-09 | 百度在线网络技术(北京)有限公司 | 交互方法、电子设备、智能设备及可读存储介质 |
CN111512364A (zh) * | 2019-12-31 | 2020-08-07 | 江苏树实科技有限公司 | 智能音箱、多语音助手控制方法以及智能家居*** |
WO2021134461A1 (zh) * | 2019-12-31 | 2021-07-08 | 江苏树实科技有限公司 | 智能音箱、多语音助手控制方法以及智能家居*** |
CN111512364B (zh) * | 2019-12-31 | 2024-05-31 | 江苏树实科技有限公司 | 智能音箱、多语音助手控制方法以及智能家居*** |
CN111261160A (zh) * | 2020-01-20 | 2020-06-09 | 联想(北京)有限公司 | 一种信号处理方法及装置 |
CN111261160B (zh) * | 2020-01-20 | 2023-09-19 | 联想(北京)有限公司 | 一种信号处理方法及装置 |
CN112908330A (zh) * | 2021-03-04 | 2021-06-04 | 深圳市云希谷科技有限公司 | 终端设备的语音唤醒方法、装置及计算机可读存储介质 |
CN112908330B (zh) * | 2021-03-04 | 2022-08-09 | 深圳市云希谷科技有限公司 | 终端设备的语音唤醒方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
DE102019101785A1 (de) | 2019-08-01 |
US20190237069A1 (en) | 2019-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110111767A (zh) | 多语言语音辅助支持 | |
CN109878434A (zh) | 外部信息呈现 | |
US11837231B2 (en) | Methods and vehicles for capturing emotion of a human driver and customizing vehicle response | |
US20240105176A1 (en) | Methods and vehicles for capturing emotion of a human driver and customizing vehicle response | |
CN108346430A (zh) | 对话***、具有对话***的车辆以及对话处理方法 | |
CN107481719A (zh) | 个人助理模块的非确定性任务发起 | |
Williams et al. | Towards leveraging the driver's mobile device for an intelligent, sociable in-car robotic assistant | |
JP2015118709A (ja) | 音声認識問い合わせ応答システム | |
JP6327637B2 (ja) | 移動体による地域情報発見システム及びその方法 | |
CN107430855A (zh) | 在支持语音的电子设备中对语音转文本模型的场境敏感动态更新 | |
CN102039898A (zh) | 情绪咨询*** | |
CN110389744A (zh) | 基于人脸识别的多媒体音乐处理方法和*** | |
CN109562740A (zh) | 用于远程访问车辆的个人功能简档的指纹装置和方法 | |
US20210334069A1 (en) | System and method for managing multiple applications in a display-limited environment | |
CN114013445A (zh) | 车辆用户辅助***、车辆用户辅助装置以及车辆用户辅助服务器 | |
CN111724798B (zh) | 车载设备控制***、车载设备控制装置、车载设备控制方法及存储介质 | |
WO2020225918A1 (ja) | エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム | |
CN112193255A (zh) | 车机***的人机交互方法、装置、设备以及存储介质 | |
US20190362218A1 (en) | Always listening and active voice assistant and vehicle operation | |
JP2004054883A (ja) | 車載用エージェントシステム及び対話型操作制御システム | |
CN109889676A (zh) | 顾问无缝连接 | |
CN111661065B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN115214696A (zh) | 一种车机虚拟形象交互方法、***、车辆及存储介质 | |
JP7245695B2 (ja) | サーバ装置、情報提供システム、および情報提供方法 | |
JP6819529B2 (ja) | 情報処理装置、情報処理システム、及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190809 |