CN110073326A - 基于仲裁的语音识别 - Google Patents
基于仲裁的语音识别 Download PDFInfo
- Publication number
- CN110073326A CN110073326A CN201780077204.7A CN201780077204A CN110073326A CN 110073326 A CN110073326 A CN 110073326A CN 201780077204 A CN201780077204 A CN 201780077204A CN 110073326 A CN110073326 A CN 110073326A
- Authority
- CN
- China
- Prior art keywords
- nmd
- voice
- audio
- equipment
- confidence level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 63
- 230000004044 response Effects 0.000 claims description 61
- 238000004891 communication Methods 0.000 claims description 47
- 230000002618 waking effect Effects 0.000 claims description 43
- 230000015654 memory Effects 0.000 claims description 24
- 238000007689 inspection Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 33
- 238000001514 detection method Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000006855 networking Effects 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000003990 capacitor Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000272201 Columbiformes Species 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/003—Digital PA systems using, e.g. LAN or internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/005—Audio distribution systems for home, i.e. multi-room use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Computer And Data Communications (AREA)
Abstract
检测第一语音输入,并确定与第一语音输入相关联的第一置信度。接收消息,该消息包括与网络设备检测到第一语音输入相关联的第二置信度。确定第一置信度是否大于第二置信度。基于确定第一置信度大于第二置信度,将第二语音输入发送给服务器。
Description
相关申请的交叉引用
本申请要求2016年10月19日提交的标题为“基于仲裁的语音识别(Arbitration-Based Voice Recognition)”的美国专利申请第15/297,627号的优先权,其内容整体以引用方式并入本文中用于所有目的。
技术领域
本发明涉及消费品,并且更具体地,涉及针对媒体播放或其一些方面的方法、***、产品、特征、服务和其他元素。
背景技术
在大声的环境中访问和收听数字音频的选项有限,直到2003年SONOS公司提交其首批专利申请中标题为“多个联网设备之间同步音频播放的方法(Method forSynchronizing Audio Playback between Multiple Networked Devices)”的一个申请,并开始提供2005年出售的媒体播放***。Sonos无线高保真***使人们可以经由一个或多个联网播放设备体验来自多个来源的音乐。通过安装在智能手机、平板电脑或计算机上的软件控制应用,可以在任何具有联网播放设备的房间中播放他或她想要的内容。另外,例如使用控制器,可以使用播放设备将不同的歌曲流式传输到每个房间,可以将房间组合在一起以进行同步播放,或者可以在所有房间中同步地收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发消费者可访问的技术以进一步增强收听体验。
发明内容
附图说明
关于以下具体实施方式、所附权利要求和附图,可以更好地理解本发明技术的特征、方面和优点,其中:
图1示出了可以实践某些实施例的示例媒体播放***配置;
图2示出了示例播放设备的功能框图;
图3示出了示例控制设备的功能框图;
图4示出了示例控制器接口;
图5示出了多个示例网络设备;
图6示出了示例网络麦克风设备的功能框图;
图7示出了与网络麦克风设备之间的仲裁相关联的功能的简化流程图;
图8示出了示例仲裁消息;
图9示出了根据第一实施例的与网络麦克风设备之间的仲裁相关联的功能的详细流程图;
图10示出了根据第二实施例的与网络麦克风设备之间的仲裁相关联的功能的详细流程图;
图11示出了仲裁功能的流程图;以及
图12示出了与网络麦克风设备和服务器之间的语音识别相关联的流程图。
附图是为了说明示例实施例的目的,但是应该理解,本发明不限于附图中所示的布置和工具。
具体实施方式
I.概述
收听大声媒体内容是涉及家人、朋友和客人的社交活动。媒体内容可以包括例如谈话电台、书籍、来自电视的音频、存储在本地驱动器上的音乐、来自媒体源的音乐(例如,Radio、 Radio、Google PlayTM、iTunes Radio)和其他声音材料。例如,人们可以在聚会和其他社交聚会上大声播放音乐。此外,音乐可以同时在一个收听区或多个收听区中播放,使得每个收听区中的音乐可以同步,而没有可听见的回声或瑕疵。
当语音输入用于控制音频播放设备或***以及其他设备(例如,灯)时,可以丰富音乐体验。例如,用户可能希望更改正在播放的音频内容、播放列表、播放队列或收听区,将音乐曲目添加到播放列表或播放队列,或者更改播放设置(例如,播放、暂停、下一曲目、上一曲目、播放音量和EQ设置等)。用户可以提供与音频播放设备以及其他设备的控制相关联的语音输入,语音输入由联网麦克风设备(NMD)接收。NMD可以包括用于检测语音输入的麦克风。NMD可以是例如能够经由麦克风接收语音输入以控制音频播放设备或***以及其他设备的播放设备、服务器或***。另外或替代地,NMD可以是例如能够经由麦克风接收语音输入以控制音频播放设备或***以及其他设备的设备、服务器或***。标题为“默认播放设备指定(Default Playback Device Designation)”的美国申请第15/098,867号提供了支持语音的家庭体系结构的示例,其内容以引用方式并入本文中。
来自用户的语音输入可以由唤醒字后跟语音命令组成。唤醒字可以向NMD指示后跟呈语音命令形式的语音输入。唤醒字可以是口头语音输入,诸如“Alexa”、“OK Google”、“Hey Sonos”或“Hey Siri”以及其他示例。语音命令可以是口头语音输入,其向NMD指示请求***体播放设备或***以及其他设备。示例语音命令可以包括用于修改任何媒体播放播放设置的命令,诸如播放音量、播放传输控制、音乐源选择和分组以及其它可能性。或者,语音命令可以是请求诸如“音量设置是多少?”或“播放列表中有哪些歌曲?”之类的信息的口头语音输入。收听范围内的多个NMD可以检测唤醒字并接收跟随唤醒字的语音命令。
本文描述的实施例涉及用于仲裁多个NMD中哪个NMD可以向基于云的计算设备(例如,服务器)发送语音输入(例如,语音命令或唤醒字和语音命令)的方法和***。NMD可以将语音输入发送给基于云的计算设备,使得基于云的计算设备可以对语音输入执行语音识别。语音识别允许识别所请求的控制或信息。例如,仲裁过程避免让多个NMD向基于云的计算设备发送相同的语音命令,从而避免可能浪费的带宽,而该带宽可用于其他活动,诸如播放音乐。
仲裁过程可以从NMD检测到唤醒字开始。NMD可以识别唤醒字,例如,唤醒字是“Alexa”、“OK Google”、“Hey Sonos”还是“Hey Siri”,并且还确定与检测到唤醒字的程度相关联的置信度。当检测到唤醒字时,NMD还可以播放音频内容。在这种情况下,NMD还可以调整NMD正在播放的音频,以便可以通过正在播放的音频清楚地接收跟随唤醒字的语音命令。可以以各种方式调整音频,包括暂停正在播放的音频或者调低正在播放的音频的音量。
在一些实施例中,NMD可以定义指示NMD在确定是否将语音命令发送给基于云的计算设备之前可以等待多久的时间间隔。时间间隔可以是静态参数或动态参数。可以选择时间间隔以平衡提供足够的时间来完成下面更详细描述的仲裁和解决延迟问题的需要。
在一些实施例中,NMD可以生成在本文也称为仲裁消息的消息,该消息被发送给例如家庭中的其他NMD。仲裁消息可以包括由NMD接收的唤醒字的标识符中的一个或多个,检测到唤醒字的程度的置信度以及时间间隔。检测到唤醒字的其他NMD中的每一个可以将与检测到的唤醒字相关联的类似仲裁消息发送给其他NMD。
如果NMD从另一NMD接收到仲裁消息,则NMD可以确定它是否赢得与另一NMD的仲裁。如果如由接收到的仲裁消息指示,由NMD检测到的唤醒字的置信度大于由其他NMD检测到的置信度,则NMD可以赢得仲裁。具有与检测到的唤醒字相关联的更大置信度的NMD可以处于更好的位置以清楚地接收跟随唤醒字的语音命令。
如果NMD输掉仲裁,则NMD可以恢复NMD正在播放的音频。例如,NMD可以取消降低音频音量或取消暂停音频。或者,可以不调整音频,直到音频接到赢得仲裁的NMD,与NMD的绑定区域中的另一NMD或基于云的计算设备的通知。
如果NMD建立时间间隔,则NMD可以从其他NMD接收附加仲裁消息,直到该时间间隔到期为止。NMD可以对这些附加仲裁消息执行仲裁。如果NMD继续赢得仲裁,则NMD可以在时间间隔到期时将所接收的语音命令发送给基于云的计算设备。基于云的计算设备可以对语音命令执行语音识别。例如,基于云的计算设备可以将语音命令转换为文本,解释文本,然后基于文本来制定响应。如果语音命令是对信息的请求,则响应可以是以文本形式发送给NMD的请求的信息,并且转换为由NMD可听地播放的语音响应。另外或替代地,如果语音命令与媒体播放***或设备的控制相关联,则响应可以是与媒体播放设备或***的控制相关联的命令,诸如播放某些音乐内容或更改播放设备的设置。服务器可以将命令发送给NMD,并且NMD可以执行命令或指示另一网络设备执行该命令。
在一些实施例中,仲裁可以由集中式设备执行,而不是在每个NMD处本地执行。集中式设备可以是局域网上指定的NMD或其他网络设备。集中式设备可以被布置为确定检测到唤醒字的一个或多个NMD中哪个NMD应该将跟随唤醒字的语音命令发送给基于云的计算设备。就此而言,集中式设备可以从一个或多个NMD接收仲裁消息,并且基于与仲裁消息相关联的置信度来识别哪个NMD应该将其接收到的语音命令发送给基于云的计算设备。例如,集中式设备可以确定哪个NMD检测到具有最大置信度的唤醒字。然后,集中式设备可以使所识别的NMD将其接收到的语音命令发送给基于云的计算设备。
从以上说明继续,示例实施例包括第一网络设备,该第一网络设备包括处理器;存储器;以及计算机指令,该计算机指令存储在存储器中并且可由处理器执行以使处理器:检测第一语音输入;确定与第一语音输入相关联的第一置信度;接收消息,其中该消息包括与由第二网络设备检测到的第一语音输入相关联的第二置信度;确定第一置信度是否大于第二置信度;并且基于确定第一置信度大于第二置信度,将第二语音输入发送给服务器。第一网络设备还可以包括用于响应于检测到第一语音输入而调整音频播放音量的计算机指令。第一网络设备还可以包括用于确定音频播放是音乐播放的计算机指令,并且其中响应于检测到第一语音输入而调整音频播放的音量包括调低音乐播放的音量。第一网络设备还可以包括用于确定音频播放是音频书的播放的计算机指令,并且其中响应于检测到第一语音输入而调整音频播放的音量包括暂停音频书的播放。第一网络设备还可以包括用于在调整之前接收将音频播放的音量返回到音量设置的通知的计算机指令。该消息可以是第一消息。第一网络设备还可以包括用于将第二消息发送给第二网络设备的计算机指令,该第二消息包括与检测到的第一语音输入相关联的第一置信度。第一网络设备还可以包括用于在将第二语音输入发送给服务器之前等待计时器到期的计算机指令。响应可以是语音响应。第一网络设备还可以包括用于可听地播放语音响应的计算机指令。第一语音输入可以是唤醒字,而第二语音输入可以是语音命令。第一语音输入可以与第二语音输入相同。
另一示例实施例可以包括一种方法,包括:检测第一语音输入;确定与第一语音输入相关联的第一置信度;接收消息,其中该消息包括与由网络设备检测到的第一语音输入相关联的第二置信度;确定第一置信度是否大于第二置信度;并且基于确定第一置信度大于第二置信度,将第二语音输入发送给服务器。该方法还可以包括响应于检测到语音输入而调整音频播放的音量。该方法还可以包括确定音频播放是音乐播放,并且其中响应于检测到语音输入而调整音频播放的音量包括调低音乐播放的音量。该方法还可以包括确定音频播放是音频书的播放,并且其中响应于检测到语音输入而调整音频播放的音量包括暂停播放音频书。该方法还可以包括在调整之前接收将音频播放的音量返回到音量设置的通知。该方法还可以包括在将第二语音输入发送给服务器之前等待计时器到期。该方法还可以包括可听地播放语音响应。该消息可以是第一消息。该方法还可以包括将第二消息发送给网络设备,该第二消息包括与检测到的第一语音输入相关联的第一置信度。第一语音输入可以是唤醒字,而第二语音输入可以是语音命令。
又一示例实施例可以包括有形非暂时性计算机可读存储介质,其包括用于由处理器执行的指令,所述指令在被执行时使得处理器实现包括以下步骤的方法:检测第一语音输入;确定与第一语音输入相关联的第一置信度;接收消息,其中该消息包括与由网络设备检测到的第一语音输入相关联的第二置信度;确定第一置信度是否大于第二置信度;并且基于确定第一置信度大于第二置信度,将第二语音输入发送给服务器。
虽然本文描述的一些示例可以指代由诸如“用户”和/或其他实体的给定参与者执行的功能,但是应该理解,这仅用于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者采取行动。本领域普通技术人员将理解,本发明包括许多其他实施例。此外,本文描述的示例可以扩展到通过以任何合适的方式组合示例特征而形成的多个实施例。
II.示例操作环境
图1示出了媒体播放***100的示例配置,其中可以实践或实现本文公开的一个或多个实施例。如图所示的媒体播放***100与具有若干房间和空间的示例家庭环境相关联,诸如例如主卧室、书房、餐厅和起居室。如图1的示例中所示,媒体播放***100包括播放设备102-124、控制设备126和128,以及有线或无线网络路由器130。
可以在以下部分中找到关于示例媒体播放***100的不同组件以及不同组件如何交互以向用户提供媒体体验的进一步讨论。虽然本文中的讨论通常可以指示例性媒体播放***100,但是本文描述的技术不限于如图1所示的家庭环境等内的应用。例如,本文描述的技术可用于其中可能需要多区域音频的环境,诸如例如餐馆、商场或机场之类的商业设施,如运动型多功能车(SUV)、公共汽车或汽车、船舶或船只、飞机等的运输工具。
a.示例播放设备
图2示出了示例播放设备200的功能框图,该示例播放设备可以被配置成图1的媒体播放***100的播放设备102-124中的一个或多个。播放设备200可以包括处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、包括无线接口216和有线接口218的网络接口214,以及麦克风220。在一种情况下,播放设备200可以不包括扬声器212,而是包括用于将播放设备200连接到外部扬声器的扬声器接口。在另一种情况下,播放设备200既不包括扬声器212也不包括音频放大器210,而是包括用于将播放设备200连接到外部音频放大器或视听接收器的音频接口。
在一个示例中,处理器202可以是时钟驱动的计算组件,其被配置成根据存储在存储器206中的指令来处理输入数据。存储器206可以是有形的计算机可读介质,其被配置成存储可由处理器202执行的指令。例如,存储器206可以是数据存储器,其可以加载有可由处理器202执行以实现某些功能的一个或多个软件组件204。在一个示例中,功能可以涉及播放设备200从音频源或另一播放设备检索音频数据。在另一示例中,功能可以涉及播放设备200将音频数据发送给网络上的另一设备或播放设备。在又一示例中,功能可以涉及将播放设备200与一个或多个播放设备配对以创建多声道音频环境。
某些功能可以涉及播放设备200使音频内容的播放与一个或多个其他播放设备同步。在同步播放期间,收听者将优选地不能感知由播放设备200和一个或多个其他播放设备播放音频内容之间的时间延迟差。标题为“用于在多个独立时钟数字数据处理设备之间同步操作的***和方法(System and method for synchronizing operations among aplurality of independently clocked digital data processing devices)”的美国专利第8,234,395号更详细地提供了一些用于播放设备之间的音频播放同步的示例,将其以引用方式并入本文中。
存储器206还可以被配置成存储与播放设备200相关联的数据,诸如播放设备200所属的一个或多个区域和/或区域组,播放设备200可访问的音频源,或播放设备200(或一些其他播放设备)可以与之相关联的播放队列。数据可以被存储为一个或多个状态变量,这些状态变量被周期性地更新并用于描述播放设备200的状态。存储器206还可以包括与媒体***的其他设备的状态相关联并且在设备中不时地共享的数据,使得一个或多个设备具有与***相关联的最新数据。其他实施例也是可能的。
音频处理组件208可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施例中,音频处理组件208中的一个或多个可以是处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地更改音频内容以产生音频信号。然后可以将产生的音频信号提供给音频放大器210,以通过扬声器212进行放大和播放。具体地,音频放大器210可以包括被配置成将音频信号放大到用于驱动一个扬声器212的电平的设备。扬声器212可以包括单个换能器(例如,“驱动器”)或包括具有一个或多个驱动器的外壳的完整扬声器***。扬声器212的特定驱动器可以包括例如低音炮(例如,用于低频)、中档驱动器(例如,用于中频)和/或高音扬声器(例如,用于高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210中单独对应的音频放大器来驱动。除了产生用于由播放设备200播放的模拟信号之外,音频处理组件208可以被配置成处理要发送给一个或多个其他播放设备以进行播放的音频内容。
可以诸如经由音频线路输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由播放设备200处理和/或播放的音频内容。
网络接口214可以被配置成利于播放设备200与数据网络上的一个或多个其他设备之间的数据流。这样,播放设备200可以被配置成通过数据网络从以下设备接收音频内容:与播放设备200通信的一个或多个其他播放设备、局域网内的网络设备或通过诸如互联网的广域网的音频内容源。在一个示例中,由播放设备200发送和接收的音频内容和其他信号可以以数字分组数据的形式进行传输,该数字分组数据包含基于互联网协议(IP)的源地址和基于IP的目的地地址。在这种情况下,网络接口214可以被配置成解析数字分组数据,使得目的地为播放设备200的数据被播放设备200正确地接收和处理。
如图所示,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为播放设备200提供网络接口功能以根据通信协议(例如,任何无线标准包括IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备无线通信(例如,播放设备200与之相关联的数据网络内的其他播放设备、扬声器、接收器、网络设备、控制设备)。有线接口218可以为播放设备200提供网络接口功能,以根据通信协议(例如,IEEE 802.3)通过与其他设备的有线连接进行通信。虽然图2中所示的网络接口214包括无线接口216和有线接口218,但是在一些实施例中,网络接口214可以仅包括无线接口或仅包括有线接口。
麦克风220可以被布置为检测播放设备200的环境中的声音。例如,麦克风可以安装在播放设备的壳体的外壁上。麦克风可以是现在已知或以后开发的任何类型的麦克风,诸如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对扬声器220的频率范围的一部分敏感。一个或多个扬声器220可以与麦克风220相反地操作。在一些方面,播放设备200可能不包括麦克风220。
在一个示例中,播放设备200和另一播放设备可以配对以播放音频内容的两个单独的音频分量。例如,播放设备200可以被配置成播放左声道音频分量,而另一播放设备可以被配置成播放右声道音频分量,从而产生或增强音频内容的立体声效果。配对的播放设备(也称为“绑定的播放设备”)还可以与其他播放设备同步播放音频内容。
在另一示例中,播放设备200可以与一个或多个其他播放设备声音合并以形成单个合并的播放设备。合并的播放设备可以被配置成与未合并的播放设备或配对的播放设备不同地处理和再现声音,这是因为合并的播放设备可以具有可以通过其呈现音频内容的附加扬声器驱动器。例如,如果播放设备200是被设计为呈现低频范围音频内容的播放设备(即,低音炮),则播放设备200可以与被设计为呈现全频范围音频内容的播放设备合并。在这种情况下,当与低频播放设备200合并时,全频范围播放设备可以被配置成仅渲染音频内容的中频和高频分量,而低频范围播放设备200渲染音频内容的低频分量。合并的播放设备还可以与单个播放设备或另一个合并的播放设备配对。
作为说明,SONOS公司目前提供(或已经提供)出售某些播放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”和“SUB”。可以附加地或替代地使用任何其他过去、现在和/或将来的播放设备来实现本文公开的示例实施例的播放设备。另外,应理解,播放设备不限于图2中所示的示例或SONOS产品。例如,播放设备可以包括有线或无线耳机。在另一示例中,播放设备可以包括用于个人移动媒体播放设备的扩展坞或与之交互。在又一个示例中,播放设备可以与诸如电视、照明设备的另一设备或组件或在室内或室外使用的一些其他设备集成在一起。
b.示例播放区配置
返回参考图1的媒体播放***100,环境可以具有一个或多个播放区,每个播放区具有一个或多个播放设备。媒体播放***100可以建立有一个或多个播放区,之后可以添加或移除一个或多个区以达到图1所示的示例配置。可以根据不同的房间或诸如书房、浴室、主卧室、卧室、厨房、餐厅、起居室和/或阳台之类的空间给每个区命名。在一种情况下,单个播放区可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个播放区。
如图1中所示,阳台、餐厅、厨房、浴室、书房和卧室区各有一个播放设备,而起居室和主卧室区各有多个播放设备。在起居室区中,播放设备104、106、108和110可以被配置成作为单独的播放设备,作为一个或多个绑定的播放设备,作为一个或多个合并的播放设备,或其任何组合来同步播放音频内容。类似地,在主卧室的情况下,播放设备122和124可以被配置成作为单独的播放设备,作为绑定的播放设备,或者作为合并的播放设备来同步播放音频内容。
在一个示例中,图1的环境中的一个或多个播放区可以各自播放不同的音频内容。例如,用户可以在阳台区中烧烤并且收听由播放设备102播放的嘻哈音乐,而另一个用户可能正在厨房区中准备食物并且收听由播放设备114播放的古典音乐。在另一示例中,播放区可以与另一个播放区同步播放相同的音频内容。例如,用户可能处于办公区,其中播放设备118正在播放由阳台区中的播放设备102正在播放的相同摇滚音乐。在这种情况下,播放设备102和118可以同步播放摇滚音乐,使得用户在不同播放区之间移动时可以无缝地(或至少基本上无缝地)享受正在大声播放的音频内容。可以以类似于如先前引用的美国专利第8,234,395号中所述的播放设备之间的同步的方式实现播放区之间的同步。
如上所述,可以动态地修改媒体播放***100的区域配置,并且在一些实施例中,媒体播放***100支持多种配置。例如,如果用户将一个或多个播放设备物理地移动到区域或从区域移动,则可以重新配置媒体播放***100以适应这些更改。例如,如果用户将播放设备102从阳台区物理地移动到办公区,则办公区现在可以包括播放设备118和播放设备102。播放设备102可以与书房配对或成组,并且/或者如果需要,则经由诸如控制设备126和128之类的控制设备重新命名。另一方面,如果一个或多个播放设备被移动到家庭环境中不是播放区的特定区域,则可以为特定区域创建新的播放区。
此外,媒体播放***100的不同播放区可以动态地组合成区域组或者分成单独的播放区。例如,餐厅区和厨房区114可以组合成用于晚餐聚会的区域组,使得播放设备112和114可以同步地呈现音频内容。另一方面,如果用户希望在起居室空间中听音乐而另一个用户希望看电视,则起居室区可以被分成包括播放设备104的电视区和包括播放设备106、108和110的收听区。
c.示例控制设备
图3示出了示例控制设备300的功能框图,该示例控制设备可以被配置成媒体播放***100的控制设备126和128中的一个或两个。如图所示,控制设备300可以包括处理器302、存储器304、网络接口306、用户接口308、麦克风310和软件组件312。在一个示例中,控制设备300可以是用于媒体播放***100的专用控制器。在另一个示例中,控制设备300可以是可以在其上安装媒体播放***控制器应用软件的网络设备,诸如例如iPhoneTM,iPadTM或任何其他智能电话、平板电脑或网络设备(例如,联网计算机,诸如PC或MacTM)。
处理器302可以被配置成执行与利于媒体播放***100的用户访问、控制和配置相关的功能。存储器304可以是可以加载可由处理器302执行以执行那些功能的一个或多个软件组件的数据存储。存储器304还可以被配置成存储媒体播放***控制器应用软件和与媒体播放***100和用户相关联的其他数据。
在一个示例中,网络接口306可以基于行业标准(例如,包括IEEE802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15的无线标准、4G移动通信标准等)。网络接口306可以提供用于控制设备300与媒体播放***100中的其他设备通信的装置。在一个示例中,可以在控制设备300和其他设备之间经由网络接口306传送数据和信息(例如,诸如状态变量)。例如,媒体播放***100中的播放区和区域组配置可以由控制设备300从播放设备或另一网络设备接收,或者由控制设备300传输到另一播放设备或者经由网络接口306传输到网络设备。在一些情况下,另一网络设备可以是另一控制设备。
诸如音量控制和音频播放控制之类的播放设备控制命令也可以经由网络接口306从控制设备300传送到播放设备。如上所述,对媒体播放***100的配置的更改也可以是由用户使用控制设备300执行。配置更改可以包括向/从区域添加/移除一个或多个播放设备,向/从区域组添加/移除一个或多个区域,形成绑定或合并的播放器,将一个或多个播放设备与绑定或合并的播放器分开等。因此,无论控制设备300是专用控制器还是其上安装有媒体播放***控制器应用软件的网络设备,控制设备300有时可以被称为控制器。
控制设备300可以包括麦克风310。麦克风310可以被布置为检测控制设备300的环境中的声音。麦克风310可以是现在已知或以后开发的任何类型的麦克风,诸如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可能对频率范围的一部分敏感。两个或更多个麦克风310可以被布置为捕获音频源(例如,语音、可听见的声音)的位置信息和/或帮助过滤背景噪声。
控制设备300的用户界面308可以被配置成通过提供诸如图4中所示的控制器接口400之类的控制器接口来利于用户访问和***体播放***100。控制器接口400包括播放控制区域410、播放区区域420、播放状态区域430、播放队列区域440和音频内容源区域450。所示的用户界面400仅是用户界面的一个示例,该用户界面可以在诸如图3的控制设备300(和/或图1的控制设备126和128)之类的网络设备上提供并且由用户访问以控制诸如媒体播放***100之类的媒体播放***。不同格式、样式和交互序列的其他用户界面可以替代地在一个或多个网络设备上实现,以提供对媒体播放***的可比较的控制访问。
播放控制区域410可以包括可选择的(例如,通过触摸或通过使用光标)图标以使所选播放区或区域组中的播放设备播放或暂停、快进、倒退、跳到下一个、跳到上一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式。播放控制区域410还可以包括可选择的图标,以修改均衡设置和播放音量,以及其他可能性。
播放区区域420可以包括媒体播放***100内的播放区的表示。在一些实施例中,播放区的图形表示可以是可选择的,以带来额外的可选图标以管理或配置媒体播放***中的播放区,诸如绑定区的创建、区域组的创建、区域组的分离以及区域组的重命名,以及其他可能性。
例如,如图所示,可以在播放区的每个图形表示内提供“组”图标。在特定区域的图形表示内提供的“组”图标可以是可选择的,以提出选项来选择媒体播放***中的一个或多个其他区域以与特定区域成组。一旦成组,则已经与特定区域成组的区域中的播放设备将被配置成与特定区域中的播放设备同步地播放音频内容。类似地,可以在区域组的图形表示内提供“组”图标。在这种情况下,“组”图标可以是可选择的以提出选项来取消选择区域组中的一个或多个区域以从区域组中移除。用于经由诸如用户界面400的用户界面对区域进行分组和取消分组的其他交互和实现方式也是可能的。当播放区或区域组配置被修改时,可以动态地更新播放区区域420中的播放区的表示。
播放状态区域430可以包括在所选播放区或区域组中当前正在播放、先前播放或安排成下一个播放的音频内容的图形表示。可以在用户界面上在视觉上区分所选择的播放区或区域组,诸如在播放区区域420和/或播放状态区域430内。图形表示可以包括曲目标题、艺术家姓名、专辑名称、专辑年份、曲目长度和其他可能对用户有用的相关信息,以便知道何时经由用户界面400***体播放***。
播放队列区域440可以包括与所选播放区或区域组相关联的播放队列中的音频内容的图形表示。在一些实施例中,每个播放区或区域组可以与播放队列相关联,该播放队列包含对应于零个或多个音频项的信息,以供播放区或区域组播放。例如,播放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其可以由播放区或区域组中的播放设备使用以从本地音频内容源或联网音频内容源查找和/或检索音频项而可能供播放设备播放。
在一个示例中,可以将播放列表添加到播放队列,在这种情况下,可以将对应于播放列表中的每个音频项的信息添加到播放队列。在另一示例中,播放队列中的音频项可以被保存为播放列表。在另一示例中,当播放区或区域组正在连续播放流式传输音频内容(诸如可以连续播放直到另外停止的互联网电台)而不是具有播放持续时间的离散音频项时,播放队列可以是空的,或者***但“未使用”。在替代实施例中,播放队列可以包括互联网电台和/或其他流式传输音频内容项,并且当播放区或区域组正在播放那些项时呈“正在使用”。其他示例也是可能的。
当播放区或区域组被“成组”或“未成组”时,可以清除或重新关联与受影响的播放区或区域组相关联的播放队列。例如,如果包括第一播放队列的第一播放区与包括第二播放队列的第二播放区成组,则建立的区域组可以具有最初为空的关联播放队列,其包含来自第一播放队列的音频项(诸如在第二播放区被添加到第一播放区的情况下),其包含来自第二播放队列的音频项(诸如在第一播放区被添加到第二播放区的情况下),或者来自第一和第二播放队列的音频项的组合。随后,如果建立的区域组未成组,则所得第一播放区可以与先前的第一播放队列重新关联,或者与空的新播放队列相关联,或者包含在所建立的区域组未成组之前来自与所建立的区域组相关联的播放队列的音频项。类似地,所得第二播放区可以与先前的第二播放队列重新关联,或者与空的新播放队列相关联,或者包含在所建立的区域组未成组之前来自与所建立的区域组相关联的播放队列的音频项。其他示例也是可能的。
返回参考图4的用户界面400,播放队列区域440中的音频内容的图形表示可以包括曲目标题、艺术家姓名、曲目长度以及与播放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以提出额外的可选图标来管理和/或操纵播放队列中表示的播放队列和/或音频内容。例如,表示的音频内容可以从播放队列中移除,移动到播放队列内的不同位置,或者被选择立即播放,或者在任何当前播放的音频内容之后播放,以及其他可能性。与播放区或区域组相关联的播放队列可以存储在播放区或区域组中的一个或多个播放设备上的、不在播放区或区域组中的播放设备上的,和/或一些其他指定设备的存储器中。
音频内容源区域450可以包括可选音频内容源的图形表示,音频内容可以从该可选音频内容源中检索并由所选择的播放区或区域组播放。有关音频内容源的讨论可在以下部分中找到。
d.示例音频内容源
如前所述,区域或区域组中的一个或多个播放设备可以被配置成从各种可用音频内容源检索播放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,音频内容可以由播放设备直接从对应的音频内容源(例如,线路输入连接)检索。在另一示例中,音频内容可以经由一个或多个其他播放设备或网络设备通过网络提供给播放设备。
示例音频内容源可以包括媒体播放***(诸如图1的媒体播放***100)中的一个或多个播放设备的存储器、一个或多个网络设备(诸如控制设备、支持网络的个人计算机,或者例如网络附加存储(NAS))上的本地音乐库、经由互联网(例如,云)提供音频内容的流式传输音频服务,或经由播放设备或网络设备上的线路输入连接而连接到媒体播放***的音频源,以及其他可能性。
在一些实施例中,可以从诸如图1的媒体播放***100的媒体播放***定期添加或移除音频内容源。在一个示例中,可以在添加、删除或更新一个或多个音频内容源时执行音频项的索引。音频项的索引可以涉及扫描通过媒体播放***中的播放设备可访问的网络所共享的所有文件夹/目录中的可识别音频项,以及生成或更新包含元数据的音频内容数据库(例如,标题、艺术家、专辑、曲目长度等)以及其他相关信息,诸如找到的每个可识别音频项的URI或URL。用于管理和维护音频内容源的其他示例也是可能的。
以上关于播放设备、控制器设备、播放区配置和媒体内容源的讨论仅提供了可以在其中实现下面描述的功能和方法的操作环境的一些示例。本文未明确描述的媒体播放***、播放设备和网络设备的其他操作环境和配置也可以适用并且适合于功能和方法的实现。
e.示例多个联网设备
图5示出了示例性多个设备500,其可以被配置成基于语音控制来提供音频播放体验。本领域普通技术人员将理解,图5中所示的设备仅用于说明目的,并且可能有包括不同和/或附加设备的变体。如图所示,多个设备500包括计算设备504、506和508;网络麦克风设备(NMD)512、514和516;播放设备(PBD)532、534、536和538;以及控制器设备(CR)522。
多个设备500中的每一个可以是支持网络的设备,其可以根据一个或多个网络协议(诸如NFC、蓝牙、以太网和IEEE 802.11以及其他示例)通过一种或多种类型的网络(诸如广域网(WAN)、局域网(LAN)和个人局域网(PAN)以及其他可能性)与多个设备中的一个或多个其他设备建立通信。
如图所示,计算设备504、506和508可以是云网络502的一部分。云网络502可以包括另外的计算设备。在一个示例中,计算设备504、506和508可以是不同的服务器。在另一示例中,计算设备504、506和508中的两个或更多个可以是单个服务器的模块。类似地,计算设备504、506和508中的每一个可以包括一个或多个模块或服务器。本文为了便于说明目的,计算设备504、506和508中的每一个可以被配置成执行云网络502内的特定功能。例如,计算设备508可以是用于流式传输音乐服务的音频内容源。
如图所示,计算设备504可以被配置成经由通信路径542与NMD512、514和516连接。NMD 512、514和516可以是一个或多个“智能家庭”***的组件。在一种情况下,NMD 512、514和516可以物理地分布在整个家庭中,类似于图1中所示的设备的分布。在另一种情况下,NMD 512、514和516中的两个或更多个可以物理地定位在彼此相对接近的范围内。通信路径542可以包括一种或多种类型的网络,诸如包括互联网的WAN、LAN和/或PAN,以及其他可能性。
在一个示例中,NMD 512、514和516中的一个或多个可以是主要配置用于音频检测的设备。在另一示例中,NMD 512、514和516中的一个或多个可以是具有各种主要实用工具的设备的组件。例如,如上面结合图2和图3所讨论,NMD 512、514和516中的一个或多个可以是播放设备200的麦克风220或网络设备300的麦克风310。另外,在一些情况下,NMD 512、514和516中的一个或多个可以是播放设备200或网络设备300。在示例中,NMD 512、514和/或516中的一个或多个可以包括呈麦克风阵列布置的多个麦克风。
如图所示,计算设备506可以被配置成经由通信路径544与CR 522和PBD 532、534、536和538进行接口连接。在一个示例中,CR 522可以是诸如图2的网络设备200之类的网络设备。因此,CR 522可以被配置成提供图4的控制器接口400。类似地,PBD 532、534、536和538可以是诸如图3的播放设备300的播放设备。因此,如图1中所示,PBD 532、534、536和538可以物理地分布在整个家庭中。为了说明的目的,PBD 536和538可以是绑定区530的一部分,而PBD 532和534可以是它们各自区的一部分。如上所述,PBD 532、534、536和538可以动态地绑定、成组、解除绑定和取消成组。通信路径544可以包括一种或多种类型的网络,诸如包括互联网的WAN、LAN和/或PAN,以及其他可能性。
在一个示例中,与NMD 512、514和516一样,CR 522和PBD 532、534、536和538也可以是一个或多个“智能家庭”***的组件。在一种情况下,PBD 532、534、536和538可以与NMD512、514和516分布在同一家庭中。此外,如上所述,PBD 532、534、536和538中的一个或多个可以是NMD 512、514和516中的一个或多个。
NMD 512、514和516可以是局域网的一部分,并且通信路径542可以包括通过WAN(通信路径未显示)将NMD 512、514和516的局域网链接到计算设备504的接入点。同样地,NMD 512、514和516中的每一个可以经由这样的接入点彼此通信。
类似地,CR 522和PBD 532、534、536和538可以是如先前部分中讨论的局域网和/或本地播放网络的一部分,并且通信路径544可以包括通过WAN将CR 522和PBD 532、534、536和538的局域网和/或本地播放网络链接到计算设备506的接入点。这样,CR 522以及PBD532、534、536和538中的每一个也可以通过这样的接入点彼此进行通信。
在一个示例中,单个接入点可以包括通信路径542和544。在示例中,NMD 512、514和516、CR 522以及PBD 532、534、536和538中的每一个可以经由家庭的相同接入点访问云网络502。
如图5中所示,NMD 512、514和516、CR 522和PBD 532、534、536和538中的每一个还可以经由通信装置546与一个或多个其他设备直接通信。如本文所述的通信装置546可以涉及设备之间根据一个或多个网络协议通过一种或多种类型的网络进行的一种或多种形式的通信,和/或可以涉及经由一个或多个其他网络设备进行的通信。例如,通信装置546可以包括例如蓝牙TM(IEEE 802.15)、NFC、无线直连和/或专有无线中的一个或多个,以及其他可能性。
在一个示例中,CR 522可以通过蓝牙TM与NMD 512通信,并且通过另一局域网与PBD534通信。在另一示例中,NMD 514可以通过另一局域网与CR 522通信,并且通过蓝牙与PBD536通信。在另一示例中,PBD 532、534、536和538中的每一个可以根据生成树协议通过本地播放网络彼此通信,而每个通过不同于本地播放网络的局域网与CR 522通信。其他示例也是可能的。
在一些情况下,NMD 512、514和516、CR 522和PBD 532、534、536和538之间的通信装置可以根据设备之间的通信类型、网络状况和/或延迟要求而更改。例如,当NMD 516首先被引入具有PBD 532、534、536和538的家庭时,可以使用通信装置546。在一种情况下,NMD516可以经由NFC将对应于NMD 516的识别信息传输到PBD 538,并且作为响应,PBD 538可以经由NFC(或一些其他形式的通信)将局域网信息传输给NMD 516。然而,一旦在家庭内配置了NMD 516,NMD 516与PBD 538之间的通信手段可能会更改。例如,NMD 516可以随后经由通信路径542、云网络502和通信路径544与PBD 538通信。在另一示例中,NMD和PBD可能永远不会经由本地通信装置546进行通信。在另一示例中,NMD和PBD可以主要经由本地通信装置546进行通信。其他示例也是可能的。
在说明性示例中,NMD 512、514和516可以被配置成接收语音输入以控制PBD 532、534、536和538。可用控制命令可以包括先前讨论的任何媒体播放***控制,诸如播放音量控制、播放传输控制、音乐源选择和分组等。在一个实例中,NMD 512可以接收语音输入以控制PBD 532、534、536和538中的一个或多个。响应于接收到语音输入,NMD 512可以经由通信路径542将语音输入传输给计算设备504进行处理。在一个示例中,计算设备504可以将语音输入转换为等效文本命令,并解析文本命令以识别命令。然后,计算设备504可以随后将文本命令传输给计算设备506。在另一个示例中,计算设备504可以将语音输入转换为等效文本命令,然后将文本命令传输给计算设备506。然后,计算设备506可以解析文本命令以识别一个或多个播放命令。
例如,如果文本命令是“播放来自‘区1’中的‘流式传输服务1’的‘艺术家1’的'曲目1'”,则计算设备506可以识别(i)可从“流式传输服务1”获得的“艺术家1”的“曲目1”的URL,以及(ii)“区1”中的至少一个播放设备。在该示例中,来自“流式传输服务1”的“艺术家1”的“曲目1”的URL可以是指向计算设备508的URL,并且“区1”可以是绑定区530。因此,在识别出URL以及PBD 536和538中的一个或两个时,计算设备506可以经由通信路径544向PBD536和538中的一个或两个传输所识别的用于播放的URL。PBD 536和538中的一个或两个可以根据接收到的URL作为响应地从计算设备508检索音频内容,并且开始播放来自“流式传输服务1”的“艺术家1”的“曲目1”。
本领域普通技术人员将理解,以上仅是一个说明性示例,并且其他实现也是可能的。在一种情况下,如上所述,由多个设备500中的一个或多个执行的操作可以由多个设备500中的一个或多个其他设备执行。例如,从语音输入到文本命令的转换可以替代地、部分地或完全地由另一个或多个设备执行,诸如NMD 512、计算设备506、PBD 536和/或PBD 538。类似地,URL的识别可以替代地、部分地或完全地由另一个或多个设备执行,诸如NMD 512、计算设备504、PBD 536和/或PBD 538。
f.示例网络麦克风设备
图6示出了示例网络麦克风设备600的功能框图,该示例网络麦克风设备可以被配置成图5的NMD 512、514和516中的一个或多个。如图所示,网络麦克风设备600包括处理器602、存储器604、麦克风阵列606、网络接口608、用户接口610、软件组件612和扬声器614。本领域普通技术人员将理解,其他网络麦克风设备配置和布置也是可能的。例如,网络麦克风设备可以替代地排除扬声器614或者具有单个麦克风而不是麦克风阵列606。
处理器602可以包括一个或多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,处理单元602可以包括微处理器、微控制器、专用集成电路、数字信号处理器等。存储器604可以是数据存储装置,其可以加载有可由处理器602执行以执行那些功能的一个或多个软件组件。因此,存储器604可以包括一个或多个非暂时性计算机可读存储介质,其示例可以包括易失性存储介质,诸如随机存取存储器、寄存器、高速缓存等,以及非易失性存储介质,诸如只读存储器、硬盘驱动器、固态驱动器、闪存和/或光存储设备,以及其他可能性。
麦克风阵列606可以是布置成检测网络麦克风装置600的环境中的声音的多个麦克风。麦克风阵列606可以包括现在已知或以后开发的任何类型的麦克风,诸如电容式麦克风、驻极体电容式麦克风或动态麦克风,以及其他可能性。在一个示例中,麦克风阵列可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风阵列606可以对频率范围的一部分敏感。在一个示例中,麦克风阵列606的第一子集可以对第一频率范围敏感,而麦克风阵列的第二子集可以对第二频率范围敏感。麦克风阵列606还可以被布置为捕获音频源的位置信息(例如,语音、可听到的声音)和/或帮助过滤背景噪声。应注意,在一些实施例中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
网络接口608可以被配置成利于各种网络设备之间的无线和/或有线通信,诸如参考图5的CR 522、PBD 532-538、云网络502中的计算设备504-508和其他网络麦克风设备,以及其他可能性。这样,网络接口608可以采用任何合适的形式来执行这些功能,其示例可以包括以太网接口、串行总线接口(例如,火线、USB 2.0等)、适于利于无线通信的天线和芯片组,和/或提供有线和/或无线通信的任何其他接口。在一个示例中,网络接口608可以基于行业标准(例如,包括IEEE 802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15的无线标准,4G移动通信标准等)。
网络麦克风设备600的用户界面610可以被配置成利于用户与网络麦克风设备的交互。在一个示例中,用户界面608可以包括物理按钮、设置在触敏屏幕和/或表面上的图形界面中的一个或多个以及其他可能性而使用户直接向网络麦克风提供输入。用户界面610还可以包括灯和扬声器614中的一个或多个,以向用户提供视觉和/或音频反馈。在一个示例中,网络麦克风设备600还可以被配置成经由扬声器614播放音频内容。在这种情况下,NMD 600还可以包括与播放设备200相关联的功能和特征。
III.用于基于仲裁的语音识别的示例***和方法
多个NMD可以经由通信装置546通信地耦合。多个NMD中的一个或多个可以检测与说话者所说出的语音命令相关联的唤醒字。语音命令可以是对诸如“音量设置是什么?”或“播放列表中有哪些歌曲?”之类的信息的请求。或者,语音命令可以包括修改任何媒体播放播放设置(诸如播放音量、播放传输控制、音乐源选择和分组以及其他可能性)的命令。随着更多的家用设备变得“智能”(例如,通过结合网络接口),语音命令可用于控制除媒体播放设备之外的家用设备。语音命令也可以采用其他形式。
本文描述的实施例涉及用于仲裁多个NMD的哪个NMD可以向基于云的计算设备(例如,服务器)发送语音输入(例如,语音命令或唤醒字和语音命令)的方法和***。NMD可以将语音输入发送给基于云的计算设备,使得基于云的计算设备可以对语音输入执行语音识别。语音识别允许识别所请求的控制或信息。例如,仲裁过程避免让多个NMD向基于云的计算设备发送相同的语音命令,从而避免可能浪费带宽,而该带宽本可用于其他活动,诸如播放音乐。
通常,应当理解,本文描述的一个或多个功能可以由NMD单独执行或与计算设备504-506、PBD 532-538、NMD 512-516、CR 522或本文所述的任何其他装置组合执行。
图7中所示的实现方式700呈现了本文描述的示例技术的实施例。简而言之,在702处,可以检测语音输入。在704处,可以确定语音输入的置信度。在706处,可以执行仲裁过程。仲裁过程可以包括确定NMD是否要将接收到的语音命令或接收到的语音命令以及语音输入发送给服务器以进行语音识别。家庭中的多个NMD可以执行图7中描述的功能。
实现方式700可以在包括或涉及例如图5中所示的配置中的一个或多个NMD 512-516的操作环境中实现。框702-706中的一个或多个可以包括一个或多个操作、功能或动作。尽管以连续顺序示出了框,但是这些框也可以并行执行,和/或以与本文描述的顺序不同的顺序执行。而且,可以将各种框组合成更少的框,划分成附加的框,和/或基于期望的实现方式来移除。
另外,对于本文公开的实现方式700和其他过程和方法,该流程图示出了一些实施例的一种可能实现方式的功能和操作。就此而言,每个框可以表示模块、部段或程序代码的一部分,该程序代码包括可由处理器执行的一个或多个指令,用于实现该过程中的特定逻辑功能或步骤。程序代码可以存储在任何类型的计算机可读介质上,例如,诸如包括磁盘或硬盘驱动器的存储设备上。计算机可读介质可以包括非暂时性计算机可读介质,例如,诸如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)之类的短时间存储数据的有形非暂时性计算机可读介质。计算机可读介质还可以包括非暂时性介质,诸如例如只读存储器(ROM)、光盘或磁盘、光盘只读存储器(CD-ROM)之类的二级或持久性长期存储装置。计算机可读介质还可以是任何其他易失性或非易失性存储***。计算机可读介质可以被认为是计算机可读存储介质,例如有形存储设备。另外,对于本文公开的实现方式700和其他过程和方法,图7中的每个框可以表示被有线连接以执行过程中的特定逻辑功能的电路。
返回参考图7,在702处,可以检测语音输入。例如,NMD可以具有一个或多个麦克风来接收语音输入。在一些实施例中,语音输入可以采用唤醒字的形式。唤醒字可以是口头语音输入,例如“Alexa”、“OK Google”、“Hey Sonos”或“Hey Siri”以及其他示例。
唤醒字可以是NMD“唤醒”并开始接收跟随唤醒字的语音输入的指示。语音输入可以是由NMD接收的语音命令。当接收到语音命令时,NMD可以将所接收的语音命令的语音记录存储在例如环形或循环缓冲区中。就此而言,除非NMD将所接收的语音命令发送给服务器以进行处理,否则可以丢弃语音记录。环形或循环缓冲区可以通过本文描述的任何设备或服务器进行本地和/或远程存储。
在一些情况下,NMD还可以调整由NMD播放的音频,以便清楚地接收跟随唤醒字的语音命令。可以以各种方式调整音频。在一个实施例中,可以调低音频的音量。调低音量可能涉及降低音频的音量,例如降低到与检测到的唤醒字的音量成比例的音量。在另一实施例中,可以暂停音频。音频是否被调低音量或暂停可取决于音频的类型和期望的用户体验。NMD可以基于与音频相关联的指示符来确定音频的类型。例如,NMD可以调低呈音乐形式的音频的音量,并且NMD可以暂停呈音频书或播客形式的音频。在另一示例中,并且如下面进一步解释,取决于NMD的可用处理能力,可以调低音频的音量或暂停音频。其他布置也是可能的。
NMD可以调整音频本身。另外或替代地,NMD可以调整由具有NMD的绑定区域中的音频播放设备(例如,以立体声播放音频的设备)播放的音频。例如,可以将通知发送给绑定的音频播放设备。在一些情况下,通知可以采用通用即插即用(UPnP)控制请求的形式。
在一些实施例中,语音输入的检测还可以触发指示NMD在将所接收的语音命令发送给服务器之前等待多久的时间间隔的开始。在一个极端下,一旦检测到唤醒字,NMD就可以发送语音命令。引入了语音识别中的最小延迟,但是服务器可能需要在发送语音命令的两个或更多个NMD之间执行仲裁。在另一个极端下,NMD可以在长时间间隔(例如,100ms)之后发送语音命令。长时间间隔可以允许足够的时间进行仲裁,但是在语音识别中引起了显著的延迟。因此,时间间隔的选择可以平衡提供足够的时间来执行仲裁和最小化语音识别中的延迟的兴趣。
在一些实施例中,所有NMD的时间间隔可以相同。在其他实施例中,可以在本地确定时间间隔。例如,时间间隔可以基于连接到通信装置546的NMD的数量。如果有较多的NMD连接到通信装置546,则时间间隔可以设置得较长,并且如果连接到通信的NMD较少,则设置得较短。较多的NMD可能意味着NMD彼此进行通信以执行仲裁需要较长的时间,而较少的NMD可能意味着NMD彼此进行通信以执行仲裁需要较少的时间。
例如,可以基于NMD彼此的接近度来设置时间间隔。NMD彼此越接近,时间间隔越短。相反,NMD越远,时间间隔就越长。较接近的NMD可能意味着NMD彼此进行通信以执行仲裁需要较少的时间,而间隔较远的NMD可能意味着NMD彼此进行通信以执行仲裁需要较长的时间。
例如,可以基于NMD是有线连接还是无线连接来设置时间间隔。有线连接可能导致设置较短的时间间隔来执行仲裁,因为有线连接可能更可靠并且需要较少的重传。无线连接可能导致设置较长的时间间隔来执行仲裁,因为无线连接可能不太可靠并且需要较多的重传。
例如,可以基于将NMD彼此连接的网络类型(例如,WiFi网络或诸如SonosNet的专有网络)来设置时间间隔。NMD之间具有较少跳数的网络可能导致设置较短的时间间隔来执行仲裁。相反,NMD之间具有较大跳数的网络可能导致设置较长的时间间隔来执行仲裁。较少的跳跃可能意味着NMD彼此进行通信需要较少的时间,而较多的跳跃可能意味着NMD彼此进行通信需要较多的时间。
在一些实施例中,时间间隔可以是静态值。在其他实施例中,时间间隔可以是动态值。例如,可以基于学***衡了提供足够的时间来执行仲裁和解决延迟问题的需要。学习算法可以最初选择指示NMD在决定是否将所接收的语音命令发送给服务器之前将等待多久的时间间隔(例如,20ms)。然后,如果服务器检测到“错误”,则可以增加时间间隔(例如,增加到40ms)。错误可能是两个或更多个NMD分别将跟随唤醒字的语音命令发送给服务器。在这种情况下,服务器可以通知NMD增加其时间间隔。学习算法可以应用于家庭、一组NMD或单个NMD。
在704处,可以针对检测到的语音输入确定置信度。置信度可以表明检测到唤醒字的程度。NMD可以确定与检测到的唤醒字相关联的特性。在一个示例中,特性可以采用唤醒字的音频包络的形式。音频包络可以定义时域中的唤醒字的幅值和/或持续时间。在另一示例中,特性可以采用唤醒字的频谱的形式。频谱可以定义频域中的唤醒字的频率内容。NMD可以存储和/或从计算设备504-508接收NMD可能接收的每个唤醒字的理想特性。当不存在噪声时,理想的特性可以是例如唤醒字的音频包络、持续时间或频谱。可以将检测到的唤醒字的特性与对应的理想特性进行比较。检测到的唤醒字的特性与理想特性之间的高度相关性可指示检测到的唤醒字可能是与理想特性相关联的唤醒字。NMD可以识别具有最高相关度的唤醒字。
在一些实施例中,置信度可以指示该相关性。例如,置信度可以是从0到1或0到100的数字。例如,没有背景噪声的检测可以接收值1(在0到1范围内),该值指示检测到特定唤醒字的高置信度,而在大量失真或噪声下的检测可能接收0.1(在0到1范围内),该值指示检测到特定唤醒字的低置信度。例如,没有背景噪声的检测可以接收值100(在0到100范围内),该值指示检测到特定唤醒字的高置信度,而在大量失真或噪声下的检测可能接收10(在0到100范围内),该值指示检测到特定唤醒字的低置信度。例如,没有背景噪声的检测可以接收10的值(在0到100范围内),该值指示检测到特定唤醒字的高置信度,而在大量失真或噪声下的检测可能接收100(在0到100范围内),该值指示检测到特定唤醒字的低置信度。例如,没有背景噪声的检测可以接收值0.1(在0到1范围内),该值指示检测到特定唤醒字的高置信度,而在大量失真或噪声下的检测可能接收1(在0到1范围内),该值检测到特定唤醒字的低置信度。在一些情况下,置信度可以与NMD和说话者之间的相对距离相关。其他布置也是可能的。
在一些实施例中,NMD可以生成仲裁消息,该仲裁消息被发送给例如在家庭中的通信装置546上的其他NMD。家庭中还检测到唤醒字的每个NMD可以向家庭中的其他NMD发送仲裁消息。通常,检测到唤醒字的NMD可以在语音输入的可听范围内。
图8示出了仲裁消息800的示例。仲裁消息800可以识别唤醒字标识符802、语音标识符804、置信度806、时间间隔808和时间戳810中的一个或多个。仲裁消息被示为一个消息,但是可以采用多个消息的形式并且包括比802-810表示的更多或更少的标识符。
家庭可能支持多个唤醒字。唤醒字标识符802可以指示NMD检测到哪个唤醒字。例如,唤醒字标识符可以指示NMD是否检测到唤醒字“Alexa”、“OK Google”、“Hey Sonos”或“Hey Siri”。唤醒字也可以采用其他形式。
可选地,仲裁消息800可以包括语音标识符804。语音标识符可以标识唤醒字的说话者。所述标识可以是谁说出唤醒字,例如,Mary或Tom,说话者是男性还是女性,和/或说话者是老年人还是年轻人。NMD可以在配置过程期间学习或者由诸如服务器的网络设备提供可以使用NMD的每个说话者的特性。该特性可以帮助识别该说话者是否说出了唤醒字。例如,该特性可以是说话者的语音频谱。然后,当NMD接收到唤醒字时,NMD可以确定唤醒字是否具有说话者的特性。如果唤醒字具有该特性,则语音标识符可以识别与该特性相关联的说话者,例如,是Mary还是Tom说出唤醒字和/或是男性还是女性说出唤醒字。
另外或替代地,仲裁消息800可以包括针对检测到的唤醒字的置信度806。仲裁消息还可以识别与在将语音记录发送给服务器之前NMD将等待多久相关联的时间间隔808。在仲裁消息中包括时间间隔可以允许一个NMD了解另一NMD正在使用的时间间隔。例如,一个NMD可以基于另一NMD的时间间隔来更改其时间间隔。另外,仲裁消息可以识别与仲裁消息相关联的时间戳810。除其他原因外,时间戳可用于识别仲裁消息的重传。
在706处,可以执行基于唤醒字和语音命令中的一个或多个的仲裁过程,以确定语音输入(例如,跟随唤醒字的语音命令或唤醒字和语音命令)是否应该被发送给计算设备504-508中的一个或多个,例如服务器。例如,NMD可以基于检测到的唤醒字的置信度来确定是否将语音命令发送给一个或多个计算设备。例如,NMD可以基于所接收的语音命令(或其部分)和所检测的唤醒字的置信度来确定是否将语音命令发送给一个或多个计算设备。如果NMD没有发送语音命令,则处理可以结束。如果NMD将语音命令发送给服务器,则NMD可以从服务器接收响应。该响应可以是对要由NMD或另一播放设备播放的语音命令的语音响应。例如,响应于语音命令“播放队列中的下一首歌是什么?”,语音响应可以是“下一首歌将是Purple Rain”。NMD可以播放语音响应。此外,如果由NMD播放的音频被调低音量或将被调低音量,则NMD可以将音频与语音响应混合以在音频被调低音量时进行播放。就此而言,如果NMD具有足够的处理能力来执行混合,则NMD可以响应于检测到唤醒字而调低音频的音量,而如果其没有足够的处理能力来执行混合,则暂停音频。另外或替代地,该响应可以是与媒体播放设备或***的控制相关联的命令。示例可以包括播放诸如在语音命令中指示的“Prince的When Doves Cry”的某些音乐内容,或者设置播放音量。
图9示出了根据第一实施例的与一个或多个NMD之间的仲裁相关联的功能的详细流程图900。第一实施例基于从另一NMD接收的仲裁消息和基于所接收的仲裁消息发送给服务器的语音命令。所描述的功能可以由NMD单独执行或者与计算设备504-506、PBD 532-538、NMD 512-516、CR 522或本文描述的任何其他设备组合执行。
在902处,可以检测第一语音输入。第一语音输入可以是例如唤醒字。在一些实施例中,检测可以触发时间间隔的开始。在904处,可以确定与第一语音输入相关联的第一置信度。置信度可以是检测到唤醒字的程度。第一置信度可以由NMD本身决定。另外或替代地,NMD可以将语音输入发送给计算设备504-508或其他网络设备,并从计算设备504-508或其他网络设备接收置信度。
在906处,可以接收消息。该消息可以是从检测到相同唤醒字的NMD发送的仲裁消息。该消息可以包括与检测到第一语音输入相关联的第二置信度。
在一些实施例中,NMD还可以将包括与第一语音输入相关联的第一置信度仲裁消息发送给其他NMD。例如,NMD可以将仲裁消息发送给耦合到通信装置546的另一NMD。这样,例如家庭中的其他NMD也可以基于NMD检测到的唤醒字来执行仲裁。
在908处,确定第一置信度是否大于第二置信度。如果第一置信度大于第二置信度值,则NMD可以赢得仲裁。较大的置信度表明NMD可能处于较好的位置以清楚地接收跟随唤醒字的语音命令。
NMD可以在时间间隔期间从多个NMD接收多个仲裁消息。NMD可以继续将每个仲裁消息中的置信度和与检测到的第一语音输入相关联的置信度进行比较,直到例如时间间隔到期为止。只要检测到的第一语音输入的置信度大于任何接收到的仲裁消息中的置信度,则NMD可以继续赢得仲裁。
在一些实施例中,NMD可以在执行任何仲裁之前等待时间间隔的到期。在时间间隔到期时,NMD可以将与其检测到的唤醒字相关联的置信度与在该时间间隔期间接收的仲裁消息中指示的置信度进行比较。NMD可以确定与其检测到的唤醒字相关联的置信度是否最高。基于该确定,NMD可以在时间间隔到期时将第二语音输入发送给计算设备504-508中的一个或多个。
在910处,可以基于确定第一置信度大于第二置信度值,将第二语音输入发送给计算设备504-508中的一个或多个,例如服务器。在一些实施例中,第二语音输入可以是跟随第一语音输入的语音命令,例如唤醒字。在其他实施例中,第二语音输入可以与第一语音输入相同,达到第一语音输入指示唤醒字以及语音命令的程度。在其他实施例中,第一语音输入还可以与第二语音输入一起发送给一个或多个计算设备。服务器可以使用第一语音输入来在两个或更多个NMD之间“在云中”仲裁,该NMD将与相同唤醒字相关联的语音命令发送给服务器。然后,服务器可以确定哪个发送的语音命令用于语音识别。
然后,服务器可以向第二语音输入发送响应。该响应可以是由NMD或其他网络设备播放的语音响应,或者与媒体播放设备或***的控制(诸如播放某些音乐内容或更改播放设备的设置)相关联的命令。
图10示出了根据第二实施例的与网络麦克风设备之间的仲裁相关联的功能的详细流程图1000。第二实施例示出了在时间间隔期间没有从任何其他NMD接收到与唤醒字的检测相关联的仲裁消息并且在时间间隔到期之后将跟随唤醒字的语音命令发送给服务器的情况。同样,所描述的功能可以由NMD单独执行或与计算设备504-506、PBD532-538、NMD512-516、CR 522或本文描述的任何其他设备组合执行。
在1002处,可以检测第一语音输入。第一语音输入可以是例如唤醒字。检测可以触发时间间隔的开始。在1004处,可确定与第一语音输入相关联的置信度。置信度可以由NMD本身确定。另外或替代地,NMD可以将语音输入发送给计算设备504-508或其他网络设备,然后从计算设备504-508或其他网络设备接收置信度。
在一些实施例中,可以发送消息,例如仲裁消息,其包括与第一语音输入相关联的第一置信度。例如,NMD可以将仲裁消息发送给例如家庭中耦合到通信装置546的其他NMD。在1006处,可以确定在该时间间隔中没有接收到与另一NMD检测到第一输入相关联的消息。例如,NMD可以确定它没有从通信装置546上的任何其他NMD接收到仲裁消息。在1008处,基于确定没有接收到消息,可以将第二语音输入发送给计算设备504-508中的一个或多个,例如,服务器。第二语音输入可以是NMD接收并且以唤醒字的形式跟随语音输入的语音命令。
服务器可以发送对第二语音输入的响应。例如,发送第二语音输入的NMD可以接收对第二语音输入的响应。该响应可以是对NMD或其他网络设备播放的信息请求的语音响应。另外或替代地,该响应可以是与媒体播放设备或***的控制(诸如播放某些音乐内容或更改播放设备的设置)相关联的命令。NMD或另一网络设备可以执行由该响应定义的命令。
图11是流程图1100,其更详细地描述了与图7的706处的仲裁过程相关联的功能。所描述的功能可以由NMD单独地执行或与计算设备504-506、PBD 532-538、NMD 512-516、CR522或本文描述的任何其他设备组合执行。
在1102处,NMD可以为仲裁计时器建立时间间隔。仲裁计时器可以是基于时钟的计时器。仲裁计时器可以初始设置为指示NMD在将跟随唤醒字的语音命令发送给一个或多个计算设备(例如,服务器)之前应该等待多久的时间间隔。时间长度可以是可配置参数,诸如0到100ms。可以以某种方式设置时间间隔,以便在NMD之间快速仲裁,而不会给语音识别增加很多延迟。
在1104处,确定仲裁计时器是否已到期。如果仲裁计时器尚未到期,则处理在1106继续以确定是否接收到仲裁消息。仲裁消息可以是来自检测到相同唤醒字的另一NMD的消息。如果没有接收到仲裁消息,则处理可以返回到1104以确定仲裁计时器是否到期。如果接收到仲裁消息,则在1108处,NMD可以将其检测到的语音输入(例如,唤醒字)的特性与发送仲裁消息的NMD检测到的唤醒字的特性进行比较。
例如,NMD可以将其检测到的唤醒字的置信度与其接收到的仲裁消息中的置信度进行比较。例如,NMD可以将其检测到的唤醒字的语音标识符与其接收到的仲裁消息中的语音标识符进行比较。例如,NMD可以将其检测到的唤醒字的唤醒字标识符与其接收到的仲裁消息中的唤醒字指示符进行比较。
NMD可以基于该比较来确定其是否“赢得”或“输掉”与其他NMD的仲裁。
NMD可以基于以下一个或多个确定来赢得仲裁:(i)由NMD确定的置信度大于与接收到的仲裁消息相关联的置信度;(ii)由NMD确定的语音标识符和与接收到的仲裁消息相关联的语音标识符不同;(ii)由NMD检测到的唤醒字与接收到的仲裁消息中识别的唤醒字不同。NMD也可以根据其他标准而赢得。
如果由NMD确定的置信度小于与针对相同检测到的唤醒字的接收到的仲裁消息相关联的置信度,则NMD可能输掉仲裁。如果NMD支持语音识别并且仲裁消息也指示语音标识符,则如果由NMD确定的置信度小于与针对相同语音标识符和相同检测到的唤醒字的接收到的仲裁消息相关联的置信度,则NMD可能输掉仲裁。NMD也可能基于其他标准而输掉仲裁。
如果NMD赢得仲裁,则处理可以返回到1104。如果NMD输掉仲裁,则在1108处,可以终止仲裁。当检测到唤醒字时,NMD播放的音频可能已经被调整,例如,调低音量或暂停,以便更好地接收跟随唤醒字的语音命令。如果NMD输掉仲裁,则NMD可以在检测到唤醒字并调整音频之前将音频调整回音频所在的位置。例如,如果音频被暂停,则音频可以是未中止的,例如,音频播放可以从停止的地方继续。例如,如果音频音量被调低,则可以取消调低音频音量,例如,可以增加音频的音量。例如,如果音频音量被调低,则音频可能会在调低音量之前返回到音频中的某个点。NMD可以存储音频中音频音量被调低的位置,例如时间戳。在输掉仲裁时,音频可以在音频中音频音量被调低的位置(例如,时间戳)开始播放。其他布置也是可能的。
在又一个实施例中,如果NMD输掉仲裁,则NMD可以不将其音频调整到一定水平,例如其在调整之前的音量,直到它接收到通知为止。在第一示例中,通知可以采取来自赢得仲裁的NMD的消息的形式。在第二示例中,通知可以采取来自与NMD一起处于绑定区域中的另一播放设备(或NMD)的消息的形式。另一播放设备可以与NMD同步播放音频,赢得仲裁,向服务器提供语音命令,然后在语音识别完成时将通知发送给NMD以调整音频。在第三示例中,通知可以采取存在或不存在由可能已经赢得仲裁的NMD传输的信号的形式。NMD可以经由扬声器输出信号。例如,信号可以在音乐的频率范围之外,例如,在20Hz至20KHz频率范围之外,但仍然在NMD的麦克风可听见的范围内。该信号的存在可以指示NMD应该将音频调整到检测到唤醒字之前的水平。或者,不存在该信号可以指示NMD应该将音频调整到检测到唤醒字之前的水平。通知也可以采取其他形式,诸如通用即插即用(UPnP)控制请求。
如果在1104处,时间间隔到期,则在1110处,NMD可以将所接收的语音命令发送给服务器。如果NMD继续赢得仲裁,则时间间隔可能会到期。或者,如果NMD在时间间隔到期之前没有从任何其他NMD接收到与检测到唤醒字相关联的任何仲裁消息,则时间间隔可能到期。在实施例中,可以通过将语音命令流式传输给服务器来将语音命令发送给服务器。
图12是与网络麦克风设备和计算设备(例如,服务器)之间的语音命令的语音识别相关联的流程图。所描述的功能可以由NMD结合计算设备504-506、PBD 532-538、NMD 512-516、CR 522或本文描述的任何其他设备来执行。
在1202处,可以建立识别计时器。识别计时器可以是基于时钟的计时器,其定义NMD可以将NMD接收到的语音命令发送(例如,流式传输)给服务器的持续时间。例如,持续时间可以设置为5-10秒,并用于在服务器未通知NMD停止发送语音命令的范围内进行恢复。由于通信装置546上的通信问题或者如果服务器未能通知NMD服务器决定处理由另一NMD接收到的语音命令,服务器可能不通知NMD停止发送。在1204处,确定识别计时器是否到期。如果识别计时器到期,则语音命令的流式传输终止。在一些实施例中,如果服务器发送中止消息以终止语音命令流式传输,则语音命令的流式传输也可以终止。中止消息可以指示另一NMD赢得仲裁。
如果恢复计时器没有到期,则在1206处,NMD可以确定服务器是否发送了停止语音命令的流式传输的指示。如果服务器没有发送停止语音命令流式传输的指示,则处理可以返回到1204以确定识别计时器是否到期。如果服务器发送停止语音命令流式传输的指示,则在1208处,NMD可以建立忙碌计时器。忙碌计时器可以指示服务器在NMD发送语音命令之后向跟随唤醒字的语音命令发送响应的持续时间。
服务器可以是基于云的服务器***。服务器可以对语音命令执行语音识别。例如,服务器可以将语音命令转换为文本,解释文本,然后基于文本制定响应。在1210处,检查忙碌计时器的到期。如果忙碌计时器未到期,则在1212处,NMD检查以查看是否接收到响应。该响应可采取多种形式。
在一个示例中,如果语音命令是对信息的请求,则该响应可以是语音响应。语音响应可以是所请求的信息,其以文本的形式发送给NMD并且被转换为由NMD可听地播放的语音响应。例如,响应于查询“天气如何?”的语音命令,语音响应可以是“天气晴朗”。此外,在NMD还在播放音频的情况下,语音响应可以与NMD正在播放的音频混合。如果音频暂停,则可以单独播放语音响应。
在另一示例中,语音响应可以是不理解语音命令的指示。例如,语音响应可能是“我不理解命令。”语音响应也可以采取其他形式。
另外或替代地,该响应可以是与媒体播放设备或***的控制(诸如播放某些音乐内容或更改播放设备的设置)相关联的命令。服务器可以将命令发送给NMD,并且NMD可以执行该命令或指示另一网络设备执行该命令。例如,该命令可以用于NMD播放某些音频内容或更改播放设备的设置。如果接收到命令,则NMD可以执行该命令或指示另一网络设备执行该命令。
该响应也可以采取其他形式,包括以控制设备300上显示的文本形式的响应。其他布置也是可能的。
在1214处,执行与响应相关联的动作,例如,播放语音响应或执行命令。如果没有从服务器接收到响应,则处理返回到1210。如果忙碌计时器到期而没有接收到响应,则该处理可以终止。
当服务器正在处理语音命令时,NMD可以不被布置为检测任何附加的唤醒字。然而,由于播放语音响应,NMD可以接收附加语音输入。服务器可以向NMD提供语音响应将导致附加语音输入的指示。NMD可以建立等待附加语音输入的计时器。例如,附加语音输入可以是具有超过阈值水平的平均幅值的音频信号。如果NMD检测到高于阈值水平的音频信号,则NMD可以接收附加语音输入并将语音输入流式传输到服务器,此时,服务器可以向NMD提供响应。可以以本文描述的方式将该响应处理为语音命令。如果在计时器到期之前没有接收到附加语音输入,则NMD可以停止接收语音输入并终止处理。
在一些实施例中,仲裁可以由集中式设备执行,而不是在每个NMD处本地执行。集中式设备可以是设计的NMD或例如家庭中连接到通信装置546的网络设备,其确定检测到唤醒字的哪个NMD应该将跟随唤醒字的语音命令发送给服务器。就此而言,集中式设备可以从一个或多个NMD接收仲裁消息,并且基于与仲裁消息相关联的置信度来识别哪个NMD应该将其接收到的语音命令发送给基于云的计算设备。例如,集中式设备可以确定哪个NMD检测到具有最高置信度的唤醒字。然后,集中式设备可以使所识别的NMD将其接收到的语音命令发送给计算设备。
NMD可能已经接收到具有足够高置信度的语音命令,其向计算设备提供语音命令将有助于执行可靠的语音识别。因此,在一些实施例中,还可以将未赢得仲裁的NMD接收的语音命令发送给计算设备,以提高语音命令的语音识别的可靠性。所发送的接收到的语音命令可以是具有超过阈值水平的置信度的那些命令。如果置信度超过阈值水平,则赢得仲裁的NMD可以通知那些NMD将其接收到的语音命令发送给服务器。多个版本的语音命令可以利于可靠的语音识别。
IV.结论
以上描述尤其公开了各种示例***、方法、装置和制品,包括在硬件上执行的固件和/或软件以及其他组件。应理解,这些示例仅是说明性的,并且不应视为限制性的。例如,预期固件、硬件和/或软件方面或组件中的任何一个或全部可以专门以硬件,专门以软件,专门以固件或以硬件、软件和/或固件的任何组合来具体实施。因此,所提供的示例不是实现这类***、方法、装置和/或制品的唯一方式。
另外,本文对“实施例”的引用意味着结合该实施例描述的特定特征、结构或特性可以包括在本发明的至少一个示例实施例中。在说明书中各处出现的该短语不一定都指同一实施例,也不是与其他实施例互斥的单独或替代实施例。这样,本领域技术人员明确地且隐含地理解的本文所述的实施例可以与其他实施例组合。
本说明书主要根据说明性环境、***、过程、步骤、逻辑块、处理和直接或间接类似于耦合到网络的数据处理设备的操作的其他符号表示来呈现。本领域技术人员通常使用这些过程描述和表示来最有效地将其工作的实质传达给本领域其他技术人员。阐述了许多具体细节以提供对本发明的全面理解。然而,本领域技术人员应理解,可以在没有特定具体细节的情况下实践本发明的某些实施例。在其他情况下,没有详细描述公知的方法、过程、组件和电路,以避免不必要地模糊实施例的各方面。因此,本发明的范围由所附权利要求限定,而不是由前述实施例的描述限定。
当阅读任何所附权利要求以涵盖纯粹的软件和/或固件实现方式时,至少一个示例中的至少一个元件在此明确地定义为包括用来存储软件和/或固件的有形非暂时性介质,诸如存储器、DVD、CD、蓝光等。
Claims (21)
1.一种用于第一网络设备(600)的方法,所述方法包括:
检测第一语音输入;
确定第一置信度(806),所述第一置信度指示所述第一网络设备(600)检测到所述第一语音输入的程度;
接收消息(800),所述消息包括第二置信度(806),所述第二置信度指示第二网络设备(600)检测到所述第一语音输入的程度;
检测所述第一语音输入之后的第二语音输入;
当确定所述第一置信度(806)大于所述第二置信度(806)时,由所述第一网络设备(600)将所述第二语音输入发送给服务器。
2.根据任一前述权利要求所述的方法,其中所述第一语音输入是唤醒字。
3.根据任一前述权利要求所述的方法,其中所述第二语音输入是以下中的一项:
对信息的请求;以及
用于修改媒体播放***的播放设置的命令。
4.根据任一前述权利要求所述的方法,其中,当所述第一置信度(806)不大于所述第二置信度(806)时,所述第一网络设备(600)丢弃所接收的第二语音命令的记录。
5.根据任一前述权利要求所述的方法,其中多个网络设备(600)经由通信装置(546)通信地耦合,所述多个网络设备(600)包括至少所述第一网络设备(600)和第二网络设备(600)。
6.根据权利要求5所述的方法,还包括由所述第一网络设备(600)向耦合到所述通信装置(546)的所述多个网络设备(600)发送包括所述第一置信度(806)的第二消息(800)。
7.根据任一前述权利要求所述的方法,其中所述一个或多个消息(800)还包括以下中的至少一项:
对应于所述第一语音输入的唤醒字的标识符(802);
标识所述唤醒字的说话者的语音标识符(804);以及
指示所述第二网络设备(600)在确定是否将所述第二语音输入发送给所述服务器之前将等待多久的时间间隔(808)。
8.根据任一前述权利要求所述的方法,还包括在将所述第二语音输入发送给所述服务器之前等待时间间隔(808)的到期,其中检测到所述第一语音输入将触发所述时间间隔(808)的开始。
9.根据权利要求8所述的方法,还包括:
在时间间隔(808)到期之前,接收包括相应置信度(806)的一个或多个附加消息(800);以及
确定所述第一置信度(806)是否大于在所述时间间隔(808)到期之前接收的消息(800)的所有置信度(806);并且
当所述第一置信度(806)是所接收的置信度(806)中的最大值时,在所述时间间隔(808)到期时将所述第二语音输入发送给所述服务器。
10.根据权利要求8或9并结合权利要求5所述的方法,其中根据连接到所述通信装置(546)的网络设备(600)的数量设置所述时间间隔(808)的持续时间,使得当连接较少的网络设备(600)时,所述时间间隔(808)较短,而当连接较多的网络设备(600)时,所述时间间隔(808)设置为较长。
11.根据权利要求8至10中任一项所述的方法,其中基于所述网络设备(600)彼此的接近度来设置所述时间间隔(808)的所述持续时间,使得所述网络设备(600)彼此之间越近,则所述时间间隔(808)越短。
12.根据权利要求8至11中任一项所述的方法,其中在两个网络设备(600)没有将所述第二语音输入发送给所述服务器的情况下,基于旨在最小化所述时间间隔(808)的学习算法来调整所述时间间隔(808)。
13.根据任一前述权利要求所述的方法,还包括:
从所述服务器接收对所述第二语音输入的语音响应;以及
可听见地播放所述语音响应。
14.根据任一前述权利要求所述的方法,还包括响应于检测到所述第一语音输入来调整音频播放的音量。
15.根据任一前述权利要求所述的方法,还包括另外使得正在播放所述音频的另一网络设备(600)的音频播放音量与所述第一网络设备(600)同步。
16.根据权利要求4所述的方法,还包括确定所述音频播放是音乐播放,其中响应于检测到所述语音输入而调整所述音频播放的所述音量包括:调低所述音乐播放的音量。
17.根据权利要求4所述的方法,还包括确定所述音频播放是音频书的播放,其中响应于检测到所述语音输入而调整所述音频播放的所述音量包括:暂停所述音频书的所述播放。
18.根据任一前述权利要求所述的方法,还包括在调整之前,接收要将所述音频播放的所述音量返回到音量设置的通知。
19.根据权利要求1至13中任一项所述的方法,其中,当所述第一置信度不大于所述第二置信度时,所述第一网络设备响应于检测到所述第一语音输入而不调整音频播放音量;以及
当所述第一置信度大于所述第二置信度时,所述第一网络设备响应于检测到所述第一语音输入而调整音频播放音量。
20.一种有形非暂时性计算机可读存储介质,包括由处理器执行的指令,所述指令在被执行时使所述处理器实现根据任一前述权利要求所述的方法。
21.一种第一网络设备(600),包括:
处理器(602);
存储器(604);
一个或多个麦克风(606),被配置用于检测所述第一语音输入和第二语音输入;
以及计算机指令,存储在所述存储器(604)中并且可由所述处理器(602)执行以使所述处理器(602)执行根据任一前述权利要求所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/297,627 US10181323B2 (en) | 2016-10-19 | 2016-10-19 | Arbitration-based voice recognition |
US15/297,627 | 2016-10-19 | ||
PCT/US2017/057220 WO2018075660A1 (en) | 2016-10-19 | 2017-10-18 | Arbitration-based voice recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110073326A true CN110073326A (zh) | 2019-07-30 |
CN110073326B CN110073326B (zh) | 2022-07-29 |
Family
ID=60201696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780077204.7A Active CN110073326B (zh) | 2016-10-19 | 2017-10-18 | 基于仲裁的语音识别 |
Country Status (5)
Country | Link |
---|---|
US (5) | US10181323B2 (zh) |
EP (2) | EP4235650A3 (zh) |
JP (3) | JP6668555B2 (zh) |
CN (1) | CN110073326B (zh) |
WO (1) | WO2018075660A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112260860A (zh) * | 2020-10-09 | 2021-01-22 | 北京小米松果电子有限公司 | 设备调试方法及装置、电子设备及存储介质 |
EP3982249A1 (en) * | 2020-10-09 | 2022-04-13 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Delay adjustment method and device, electronic device and storage medium |
Families Citing this family (161)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9820039B2 (en) | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US20170330563A1 (en) * | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing Speech from Distributed Microphones |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US11188289B2 (en) * | 2016-07-29 | 2021-11-30 | Hewlett-Packard Development Company, L.P. | Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US20180190306A1 (en) | 2017-01-04 | 2018-07-05 | 2236008 Ontario Inc. | Voice interface and vocal entertainment system |
US10839795B2 (en) * | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US9990926B1 (en) * | 2017-03-13 | 2018-06-05 | Intel Corporation | Passive enrollment method for speaker identification systems |
WO2018174443A1 (en) | 2017-03-23 | 2018-09-27 | Samsung Electronics Co., Ltd. | Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10529327B1 (en) * | 2017-03-29 | 2020-01-07 | Parallels International Gmbh | System and method for enabling voice recognition for operating system |
US10643609B1 (en) * | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
US10825471B2 (en) * | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
CN107147618B (zh) * | 2017-04-10 | 2020-05-15 | 易视星空科技无锡有限公司 | 一种用户注册方法、装置及电子设备 |
KR102298947B1 (ko) * | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10983753B2 (en) * | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US11489691B2 (en) | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10930276B2 (en) * | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US20190028806A1 (en) * | 2017-07-19 | 2019-01-24 | Origin Acoustics, LLC | Amplifier with Voice Activated Audio Override |
US11567726B2 (en) * | 2017-07-21 | 2023-01-31 | Google Llc | Methods, systems, and media for providing information relating to detected events |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
KR102384643B1 (ko) * | 2017-08-17 | 2022-04-08 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10083006B1 (en) * | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
JP2019053165A (ja) * | 2017-09-14 | 2019-04-04 | 株式会社東芝 | 音声認識装置 |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10665234B2 (en) * | 2017-10-18 | 2020-05-26 | Motorola Mobility Llc | Detecting audio trigger phrases for a voice recognition session |
CN107895573B (zh) * | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
EP3920179A1 (en) | 2017-12-08 | 2021-12-08 | Google LLC | Detection of duplicate packetized data transmission |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) * | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US10536288B1 (en) | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10536286B1 (en) | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10536287B1 (en) * | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10157042B1 (en) * | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US10425781B1 (en) * | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US10616726B1 (en) | 2018-02-22 | 2020-04-07 | Amazon Technologies, Inc. | Outputing notifications using device groups |
US10425780B1 (en) * | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US10762900B2 (en) * | 2018-03-07 | 2020-09-01 | Microsoft Technology Licensing, Llc | Identification and processing of commands by digital assistants in group device environments |
TWI672690B (zh) * | 2018-03-21 | 2019-09-21 | 塞席爾商元鼎音訊股份有限公司 | 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置 |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
EP3583481B1 (en) * | 2018-05-07 | 2021-02-17 | Google LLC | Methods, systems, and apparatus for providing composite graphical assistant interfaces for controlling connected devices |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US11127395B1 (en) * | 2018-05-23 | 2021-09-21 | Amazon Technologies, Inc. | Device-specific skill processing |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10979242B2 (en) * | 2018-06-05 | 2021-04-13 | Sap Se | Intelligent personal assistant controller where a voice command specifies a target appliance based on a confidence score without requiring uttering of a wake-word |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10825451B1 (en) | 2018-06-25 | 2020-11-03 | Amazon Technologies, Inc. | Wakeword detection |
US10811009B2 (en) * | 2018-06-27 | 2020-10-20 | International Business Machines Corporation | Automatic skill routing in conversational computing frameworks |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
EP3739576B1 (en) | 2018-06-29 | 2023-10-04 | Google LLC | Audio processing in a low-bandwidth networked system |
KR20200015267A (ko) * | 2018-08-03 | 2020-02-12 | 삼성전자주식회사 | 음성 인식을 수행할 전자 장치를 결정하는 전자 장치 및 전자 장치의 동작 방법 |
JP7018850B2 (ja) * | 2018-08-20 | 2022-02-14 | ヤフー株式会社 | 端末装置、決定方法、決定プログラム及び決定装置 |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
CN109377987B (zh) | 2018-08-31 | 2020-07-28 | 百度在线网络技术(北京)有限公司 | 智能语音设备间的交互方法、装置、设备及存储介质 |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11423920B2 (en) * | 2018-09-28 | 2022-08-23 | Rovi Guides, Inc. | Methods and systems for suppressing vocal tracks |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11316709B2 (en) | 2018-10-08 | 2022-04-26 | Google Llc | Multi-source smart-home device control |
US10985936B2 (en) * | 2018-10-08 | 2021-04-20 | Google Llc | Customized interface based on vocal input |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US20200135191A1 (en) * | 2018-10-30 | 2020-04-30 | Bby Solutions, Inc. | Digital Voice Butler |
US11166102B2 (en) * | 2018-11-09 | 2021-11-02 | Juke Audio Inc. | Digital multi-zone audio system |
US10908883B2 (en) * | 2018-11-13 | 2021-02-02 | Adobe Inc. | Voice interaction development tool |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US10847156B2 (en) | 2018-11-28 | 2020-11-24 | Adobe Inc. | Assembled voice interaction |
US11037550B2 (en) | 2018-11-30 | 2021-06-15 | Dish Network L.L.C. | Audio-based link generation |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11232788B2 (en) * | 2018-12-10 | 2022-01-25 | Amazon Technologies, Inc. | Wakeword detection |
US11132989B2 (en) * | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11211061B2 (en) | 2019-01-07 | 2021-12-28 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
US11017771B2 (en) | 2019-01-18 | 2021-05-25 | Adobe Inc. | Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets |
US10964322B2 (en) | 2019-01-23 | 2021-03-30 | Adobe Inc. | Voice interaction tool for voice-assisted application prototypes |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11120804B2 (en) * | 2019-04-01 | 2021-09-14 | Google Llc | Adaptive management of casting requests and/or user inputs at a rechargeable device |
CN111862988B (zh) * | 2019-04-26 | 2023-03-03 | 广东美的白色家电技术创新中心有限公司 | 语音识别设备及其唤醒响应方法、计算机存储介质 |
US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
JP7335979B2 (ja) * | 2019-05-24 | 2023-08-30 | エルジー エレクトロニクス インコーポレイティド | 音声認識を用いて装置を制御する方法、及びこれを具現する装置 |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
CN110413250B (zh) * | 2019-06-14 | 2021-06-01 | 华为技术有限公司 | 一种语音交互方法、装置及*** |
WO2021021814A2 (en) * | 2019-07-30 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Acoustic zoning with distributed microphones |
US20220270601A1 (en) * | 2019-07-30 | 2022-08-25 | Dolby Laboratories Licensing Corporation | Multi-modal smart audio device system attentiveness expression |
MX2022001162A (es) | 2019-07-30 | 2022-02-22 | Dolby Laboratories Licensing Corp | Coordinacion de dispositivos de audio. |
EP4004907B1 (en) * | 2019-07-30 | 2023-07-12 | Dolby Laboratories Licensing Corporation | Multi-device wakeword detection |
US11176939B1 (en) * | 2019-07-30 | 2021-11-16 | Suki AI, Inc. | Systems, methods, and storage media for performing actions based on utterance of a command |
US10871943B1 (en) * | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
IT201900015506A1 (it) | 2019-09-03 | 2021-03-03 | St Microelectronics Srl | Procedimento di elaborazione di un segnale elettrico trasdotto da un segnale vocale, dispositivo elettronico, rete connessa di dispositivi elettronici e prodotto informatico corrispondenti |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
CN110992940B (zh) * | 2019-11-25 | 2021-06-15 | 百度在线网络技术(北京)有限公司 | 语音交互的方法、装置、设备和计算机可读存储介质 |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN111276139B (zh) * | 2020-01-07 | 2023-09-19 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
CN112732623A (zh) * | 2020-05-11 | 2021-04-30 | 苹果公司 | 数字助理硬件抽象 |
US11183193B1 (en) * | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
CN111768783B (zh) | 2020-06-30 | 2024-04-02 | 北京百度网讯科技有限公司 | 语音交互控制方法、装置、电子设备、存储介质和*** |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
CN111968642A (zh) * | 2020-08-27 | 2020-11-20 | 北京百度网讯科技有限公司 | 语音数据处理方法、装置及智能车辆 |
US20220148575A1 (en) * | 2020-11-12 | 2022-05-12 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
US20220284883A1 (en) * | 2021-03-05 | 2022-09-08 | Comcast Cable Communications, Llc | Keyword Detection |
US11978431B1 (en) * | 2021-05-21 | 2024-05-07 | Amazon Technologies, Inc. | Synthetic speech processing by representing text by phonemes exhibiting predicted volume and pitch using neural networks |
CN113362845B (zh) * | 2021-05-28 | 2022-12-23 | 阿波罗智联(北京)科技有限公司 | 声音数据降噪方法、装置、设备、存储介质及程序产品 |
US20230197072A1 (en) * | 2021-12-17 | 2023-06-22 | Google Llc | Warm word arbitration between automated assistant devices |
WO2023114087A1 (en) * | 2021-12-17 | 2023-06-22 | Google Llc | Warm word arbitration between automated assistant devices |
US11838582B1 (en) * | 2022-12-12 | 2023-12-05 | Google Llc | Media arbitration |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0883091A (ja) * | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
CN1323435A (zh) * | 1998-10-02 | 2001-11-21 | 国际商业机器公司 | 提供网络协同会话服务的***和方法 |
CN1633817A (zh) * | 2001-09-13 | 2005-06-29 | 诺基亚公司 | 响应用户请求的动态内容递送 |
CN104115224A (zh) * | 2011-10-14 | 2014-10-22 | 搜诺思公司 | 控制音频回放设备的***、方法、装置和制品 |
CN104282305A (zh) * | 2013-07-12 | 2015-01-14 | 通用汽车环球科技运作有限责任公司 | 语音对话***中用于结果仲裁的***和方法 |
US20150170665A1 (en) * | 2013-12-16 | 2015-06-18 | Rawles Llc | Attribute-based audio channel arbitration |
WO2016057268A1 (en) * | 2014-10-09 | 2016-04-14 | Google Inc. | Hotword detection on multiple devices |
CN105679318A (zh) * | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示***和空调 |
US20160299737A1 (en) * | 2015-04-10 | 2016-10-13 | Sonos, Inc. | Identification of Audio Content Facilitated by Playback Device |
Family Cites Families (1129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPS63301998A (ja) | 1987-06-02 | 1988-12-08 | 日本電気株式会社 | 音声認識応答装置 |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
DE69220342T2 (de) | 1991-12-20 | 1997-11-20 | Matsushita Electric Ind Co Ltd | Lautsprecherapparat zur Basswiedergabe |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
FR2739736B1 (fr) | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
ES2277419T3 (es) | 1999-12-03 | 2007-07-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Un metodo para producir simultaneamente ficheros de audio en dos telefonos. |
KR20010054622A (ko) | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
WO2001053963A1 (en) | 2000-01-24 | 2001-07-26 | Zapmedia, Inc. | System and method for the distribution and sharing of media assets between media players devices |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
AU2001240986A1 (en) | 2000-02-18 | 2001-08-27 | Bridgeco Ag | Multi-portal bridge for providing network connectivity |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
AU4219601A (en) | 2000-03-31 | 2001-10-15 | Classwave Wireless Inc. | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
WO2002023389A1 (en) | 2000-09-15 | 2002-03-21 | Robert Fish | Systems and methods for translating an item of information using a distal computer |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020054685A1 (en) | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US20020072816A1 (en) | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
US7391791B2 (en) | 2001-12-17 | 2008-06-24 | Implicit Networks, Inc. | Method and system for synchronization of content rendering |
DE10163213A1 (de) | 2001-12-21 | 2003-07-10 | Philips Intellectual Property | Verfahren zum Betrieb eines Spracherkennungssystems |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) * | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2005518734A (ja) | 2002-02-20 | 2005-06-23 | メシュネットワークス、インコーポレイテッド | チャンネル間で802.11データトラフィックをルーティングしてアドホックネットワーク容量を増大するシステムおよび方法 |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
JP4555072B2 (ja) | 2002-05-06 | 2010-09-29 | シンクロネイション インコーポレイテッド | ローカライズされたオーディオ・ネットワークおよび関連するディジタル・アクセサリ |
EP1504367A4 (en) | 2002-05-09 | 2009-04-08 | Netstreams Llc | AUDIO NETWORK DISTRIBUTION SYSTEM |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
EP1389853B1 (en) | 2002-08-14 | 2006-03-29 | Sony Deutschland GmbH | Bandwidth oriented reconfiguration of wireless ad hoc networks |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
CN100392723C (zh) | 2002-12-11 | 2008-06-04 | 索夫塔马克斯公司 | 在稳定性约束下使用独立分量分析的语音处理***和方法 |
US7076428B2 (en) | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US6823050B2 (en) | 2003-02-13 | 2004-11-23 | International Business Machines Corporation | System and method for interfacing with a personal telephony recorder |
EP1602051A2 (en) | 2003-03-03 | 2005-12-07 | America Online, Inc. | Source audio identifiers for digital communications |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
JP2004354721A (ja) | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US9207905B2 (en) | 2003-07-28 | 2015-12-08 | Sonos, Inc. | Method and apparatus for providing synchrony group status information |
US8234395B2 (en) | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
US20070071255A1 (en) | 2003-10-24 | 2007-03-29 | Koninklijke Philips Electronics N.V. | Adaptive Sound Reproduction |
DE602004021716D1 (de) | 2003-11-12 | 2009-08-06 | Honda Motor Co Ltd | Spracherkennungssystem |
US7705565B2 (en) | 2003-12-31 | 2010-04-27 | Motorola, Inc. | Method and system for wireless charging |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
CA2594670C (en) | 2005-01-21 | 2014-12-23 | Certicom Corp. | Elliptic curve random number generation |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
WO2006111370A1 (en) | 2005-04-19 | 2006-10-26 | Epfl (Ecole Polytechnique Federale De Lausanne) | A method and device for removing echo in a multi-channel audio signal |
EP1715669A1 (en) | 2005-04-19 | 2006-10-25 | Ecole Polytechnique Federale De Lausanne (Epfl) | A method for removing echo in an audio signal |
US7720684B2 (en) | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
CN101233783B (zh) | 2005-07-29 | 2011-12-21 | 松下电器产业株式会社 | 扬声器装置 |
CN1909625A (zh) | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
US20090076821A1 (en) | 2005-08-19 | 2009-03-19 | Gracenote, Inc. | Method and apparatus to control operation of a playback device |
US20070060054A1 (en) | 2005-09-15 | 2007-03-15 | Sony Ericsson Mobile Communications Ab | Wireless home communication system method and apparatus |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
CN101427154A (zh) | 2005-09-21 | 2009-05-06 | 皇家飞利浦电子股份有限公司 | 使用远程位置麦克风进行语音激活控制的超声成像*** |
US8270957B2 (en) | 2005-11-07 | 2012-09-18 | Telecom Italia S.P.A. | Method for managing a conference call in a telephone network |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
CA2629801C (en) | 2005-11-15 | 2011-02-01 | Yamaha Corporation | Remote conference apparatus and sound emitting/collecting apparatus |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
JP4422692B2 (ja) | 2006-03-03 | 2010-02-24 | 日本電信電話株式会社 | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
US8284982B2 (en) | 2006-03-06 | 2012-10-09 | Induction Speaker Technology, Llc | Positionally sequenced loudspeaker system |
EP2005319B1 (en) | 2006-04-04 | 2017-01-11 | Johnson Controls Technology Company | System and method for extraction of meta data from a digital media storage device for media selection in a vehicle |
DE602006005228D1 (de) | 2006-04-18 | 2009-04-02 | Harman Becker Automotive Sys | System und Verfahren zur Mehrkanal-Echokompensation |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
DE602006007685D1 (de) | 2006-05-10 | 2009-08-20 | Harman Becker Automotive Sys | Kompensation von Mehrkanalechos durch Dekorrelation |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US8041057B2 (en) | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP4984683B2 (ja) | 2006-06-29 | 2012-07-25 | ヤマハ株式会社 | 放収音装置 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US8189765B2 (en) | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
WO2008018099A1 (en) | 2006-08-10 | 2008-02-14 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
AU2007312942A1 (en) | 2006-10-17 | 2008-04-24 | Altec Lansing Australia Pty Ltd | Unification of multimedia devices |
US8391501B2 (en) | 2006-12-13 | 2013-03-05 | Motorola Mobility Llc | Method and apparatus for mixing priority and non-priority audio signals |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
US7973857B2 (en) | 2006-12-27 | 2011-07-05 | Nokia Corporation | Teleconference group formation using context information |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
WO2008096414A1 (ja) | 2007-02-06 | 2008-08-14 | Pioneer Corporation | コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体 |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
US8996379B2 (en) | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
US8374636B2 (en) | 2007-05-18 | 2013-02-12 | Shorthand Mobile, Inc. | System and method for enhanced communications via small data rate communication systems |
US20080291916A1 (en) | 2007-05-22 | 2008-11-27 | Bo Xiong | Systems and methods for dynamic quality of service |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
WO2009020617A1 (en) | 2007-08-06 | 2009-02-12 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US20090046866A1 (en) | 2007-08-15 | 2009-02-19 | Fortemedia, Inc. | Apparatus capable of performing acoustic echo cancellation and a method thereof |
US8073125B2 (en) | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US7844724B2 (en) | 2007-10-24 | 2010-11-30 | Social Communications Company | Automated real-time data stream switching in a shared virtual area communication environment |
US8639214B1 (en) | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
JP5441710B2 (ja) | 2007-11-20 | 2014-03-12 | パナソニック株式会社 | スピーカ、映像機器、および携帯型情報処理装置 |
US9247346B2 (en) | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US20090153289A1 (en) * | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
WO2009086599A1 (en) | 2008-01-07 | 2009-07-16 | Avega Systems Pty Ltd | A user interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
DE102008039330A1 (de) | 2008-01-31 | 2009-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8213598B2 (en) | 2008-02-26 | 2012-07-03 | Microsoft Corporation | Harmonic distortion residual echo suppression |
US8638908B2 (en) | 2008-02-28 | 2014-01-28 | Computer Products Introductions, Corp | Contextual conversation processing in telecommunication applications |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
US20090249222A1 (en) | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
CN101562671A (zh) | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
JP5423670B2 (ja) | 2008-04-30 | 2014-02-19 | 日本電気株式会社 | 音響モデル学習装置および音声認識装置 |
US8831948B2 (en) * | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8325909B2 (en) | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8781833B2 (en) | 2008-07-17 | 2014-07-15 | Nuance Communications, Inc. | Speech recognition semantic classification training |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
US8325938B2 (en) | 2008-08-12 | 2012-12-04 | Sony Corporation | Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20180019752A (ko) | 2008-11-10 | 2018-02-26 | 구글 엘엘씨 | 멀티센서 음성 검출 |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
JP5347472B2 (ja) | 2008-12-12 | 2013-11-20 | ヤマハ株式会社 | 遠隔制御装置および遠隔制御システム |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US8351617B2 (en) | 2009-01-13 | 2013-01-08 | Fortemedia, Inc. | Method for phase mismatch calibration for an array microphone and phase calibration module for the same |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
US8243949B2 (en) | 2009-04-14 | 2012-08-14 | Plantronics, Inc. | Network addressible loudspeaker and audio play |
JP5384721B2 (ja) | 2009-04-15 | 2014-01-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音響エコー抑制ユニットと会議開催フロントエンド |
US8483398B2 (en) | 2009-04-30 | 2013-07-09 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses |
JP5550456B2 (ja) | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US20100332236A1 (en) | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
US8478982B2 (en) * | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
JP5440053B2 (ja) | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
JP5342005B2 (ja) | 2009-09-17 | 2013-11-13 | 株式会社日立メディコ | 超音波探触子及び超音波撮像装置 |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
KR101301535B1 (ko) | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US20110145581A1 (en) | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
NO332437B1 (no) | 2010-01-18 | 2012-09-17 | Cisco Systems Int Sarl | Apparat og fremgangsmate for a supprimere et akustisk ekko |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
JP5572445B2 (ja) | 2010-04-30 | 2014-08-13 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
CN102959544B (zh) | 2010-05-04 | 2016-06-08 | 沙扎姆娱乐有限公司 | 用于同步媒体的方法和*** |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
EP2567554B1 (en) | 2010-05-06 | 2016-03-23 | Dolby Laboratories Licensing Corporation | Determination and use of corrective filters for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US20110289506A1 (en) * | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US9349368B1 (en) | 2010-08-05 | 2016-05-24 | Google Inc. | Generating an audio notification based on detection of a triggering event |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
JP5819965B2 (ja) | 2010-08-27 | 2015-11-24 | インテル・コーポレーション | システム及び装置 |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
JP5259020B2 (ja) | 2010-10-01 | 2013-08-07 | 三菱電機株式会社 | 音声認識装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
WO2012046582A1 (ja) | 2010-10-08 | 2012-04-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
WO2012054872A2 (en) | 2010-10-22 | 2012-04-26 | Phorus Llc | Media distribution architecture |
EP2444967A1 (en) | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
EP2456199A3 (en) | 2010-11-22 | 2014-07-16 | DDS Newco Inc. | Method and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
JP6012621B2 (ja) | 2010-12-15 | 2016-10-25 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | リモートノイズ検知器を使用したノイズ削減システム |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
US8489398B1 (en) * | 2011-01-14 | 2013-07-16 | Google Inc. | Disambiguation of spoken proper names |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
KR20120100514A (ko) | 2011-03-04 | 2012-09-12 | 삼성전자주식회사 | 디바이스 그룹핑 방법 및 이를 적용한 서버 |
US8804977B2 (en) | 2011-03-18 | 2014-08-12 | Dolby Laboratories Licensing Corporation | Nonlinear reference signal processing for echo suppression |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
KR20120128542A (ko) | 2011-05-11 | 2012-11-27 | 삼성전자주식회사 | 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치 |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
US8320577B1 (en) | 2011-05-20 | 2012-11-27 | Google Inc. | Method and apparatus for multi-channel audio processing using single-channel components |
EP2715972B1 (en) | 2011-05-31 | 2016-02-24 | Google, Inc. | Muting participants in a communication session |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9226088B2 (en) | 2011-06-11 | 2015-12-29 | Clearone Communications, Inc. | Methods and apparatuses for multiple configurations of beamforming microphone arrays |
US9762967B2 (en) | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US20130018659A1 (en) | 2011-07-12 | 2013-01-17 | Google Inc. | Systems and Methods for Speech Command Processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
EP2555598A1 (en) | 2011-08-05 | 2013-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and device for generating optical radiation by means of electrically operated pulsed discharges |
US20130039527A1 (en) | 2011-08-08 | 2013-02-14 | Bang & Olufsen A/S | Modular, configurable speaker and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US8750677B2 (en) | 2011-08-23 | 2014-06-10 | Microsoft Corporation | Method for transferring media playback from a different device |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US9729631B2 (en) | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
GB201118784D0 (en) | 2011-10-31 | 2011-12-14 | Omnifone Ltd | Djml |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
KR101649499B1 (ko) | 2011-12-13 | 2016-08-19 | 인텔 코포레이션 | 연결된 미디어 장치들에서의 키워드 선택을 통한 채널 네비게이션 |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
US9431980B2 (en) | 2012-01-30 | 2016-08-30 | Echostar Ukraine Llc | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
EP2632141B1 (en) | 2012-02-22 | 2014-10-15 | Dialog Semiconductor B.V. | Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9198204B2 (en) | 2012-04-11 | 2015-11-24 | Google Inc. | Apparatus and method for seamless commissioning of wireless devices |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
WO2013166080A1 (en) | 2012-04-30 | 2013-11-07 | Creative Technology Ltd | A universal reconfigurable echo cancellation system |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US20130294611A1 (en) | 2012-05-04 | 2013-11-07 | Sony Computer Entertainment Inc. | Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
EP2856690B1 (en) | 2012-06-01 | 2020-12-02 | BlackBerry Limited | Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
US9997069B2 (en) * | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9031255B2 (en) | 2012-06-15 | 2015-05-12 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to provide low-latency audio |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
KR101972955B1 (ko) | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
KR20230048452A (ko) | 2012-08-03 | 2023-04-11 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 장치 및 조명 장치 |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
DK3190587T3 (en) | 2012-08-24 | 2019-01-21 | Oticon As | Noise estimation for noise reduction and echo suppression in personal communication |
US9532153B2 (en) | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US9088336B2 (en) | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US8725125B2 (en) | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
US9107001B2 (en) | 2012-10-02 | 2015-08-11 | Mh Acoustics, Llc | Earphones having configurable microphone arrays |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
CN102902253B (zh) | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制*** |
US20140108010A1 (en) | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
CN105074452B (zh) | 2012-10-15 | 2018-12-04 | Msi蒂法特公司 | 半混响外壳中的直接场声学测试 |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
WO2014064531A1 (en) | 2012-10-22 | 2014-05-01 | Spotify Ab | Systems and methods for pre-fetching media content |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
US20150228274A1 (en) | 2012-10-26 | 2015-08-13 | Nokia Technologies Oy | Multi-Device Speech Recognition |
KR20140054643A (ko) | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381001B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US8761349B2 (en) | 2012-10-31 | 2014-06-24 | Citrix Systems, Inc. | Systems and methods of monitoring performance of acoustic echo cancellation |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
CN102999161B (zh) | 2012-11-13 | 2016-03-02 | 科大讯飞股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US20140149118A1 (en) | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9124966B2 (en) | 2012-11-28 | 2015-09-01 | Qualcomm Incorporated | Image generation for collaborative sound systems |
US9875741B2 (en) | 2013-03-15 | 2018-01-23 | Google Llc | Selective speech recognition for chat and digital personal assistant systems |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
US9171092B2 (en) | 2012-12-07 | 2015-10-27 | Empire Technology Development Llc | Personal assistant context building |
US20140161263A1 (en) | 2012-12-10 | 2014-06-12 | Microsoft Corporation | Facilitating recognition of real-time content |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
US9607046B2 (en) | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
US9978260B2 (en) | 2012-12-18 | 2018-05-22 | Samsung Electronics Co., Ltd. | Method and apparatus for controlling a home device remotely in a home network system |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
WO2014102722A1 (en) * | 2012-12-26 | 2014-07-03 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
US9318125B2 (en) | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
KR102516577B1 (ko) * | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
TWI593294B (zh) | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9237384B2 (en) * | 2013-02-14 | 2016-01-12 | Sonos, Inc. | Automatic configuration of household playback devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
BR112015020150B1 (pt) | 2013-02-26 | 2021-08-17 | Mediatek Inc. | Aparelho para gerar um sinal de fala, e, método para gerar um sinal de fala |
US9195432B2 (en) | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音***与相关方法 |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
EP2952012B1 (en) | 2013-03-07 | 2018-07-18 | Apple Inc. | Room and program responsive loudspeaker system |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
US9763008B2 (en) | 2013-03-11 | 2017-09-12 | Apple Inc. | Timbre constancy across a range of directivities for a loudspeaker |
KR20140111859A (ko) | 2013-03-12 | 2014-09-22 | 삼성전자주식회사 | 콘텐트 공유 방법 및 이를 위한 디바이스 |
US9542947B2 (en) * | 2013-03-12 | 2017-01-10 | Google Technology Holdings LLC | Method and apparatus including parallell processes for voice recognition |
WO2014159581A1 (en) | 2013-03-12 | 2014-10-02 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
WO2014165032A1 (en) | 2013-03-12 | 2014-10-09 | Aawtend, Inc. | Integrated sensor-array processor |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9060052B2 (en) | 2013-03-13 | 2015-06-16 | Accusonus S.A. | Single channel, binaural and multi-channel dereverberation |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
AU2014243797B2 (en) | 2013-03-14 | 2016-05-19 | Apple Inc. | Adaptive room equalization using a speaker and a handheld listening device |
JP6013951B2 (ja) | 2013-03-14 | 2016-10-25 | 本田技研工業株式会社 | 環境音検索装置、環境音検索方法 |
US20140278933A1 (en) | 2013-03-15 | 2014-09-18 | F. Gavin McMillan | Methods and apparatus to measure audience engagement with media |
US9854081B2 (en) | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
US9626436B2 (en) | 2013-03-15 | 2017-04-18 | Spotify Ab | Systems, methods, and computer readable medium for generating playlists |
EP2976897B8 (en) | 2013-03-21 | 2020-07-01 | Cerence Operating Company | System and method for identifying suboptimal microphone performance |
KR102233619B1 (ko) | 2013-03-26 | 2021-03-30 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기, 및 조명 장치 |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
CA2897539C (en) | 2013-04-04 | 2016-05-17 | James S. RAND | Unified communications system and method |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
US20140310614A1 (en) | 2013-04-15 | 2014-10-16 | Chacha Search, Inc | Method and system of increasing user interaction |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
USRE48569E1 (en) | 2013-04-19 | 2021-05-25 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
US9936290B2 (en) | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
US20140358535A1 (en) | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9654073B2 (en) | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN105284168B (zh) | 2013-06-09 | 2019-06-14 | 苹果公司 | 蓝牙警示通知服务 |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US20140368737A1 (en) | 2013-06-17 | 2014-12-18 | Spotify Ab | System and method for playing media during navigation between media streams |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
US10255930B2 (en) | 2013-06-28 | 2019-04-09 | Harman International Industries, Incorporated | Wireless control of linked devices |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
CN110096253B (zh) | 2013-07-11 | 2022-08-30 | 英特尔公司 | 利用相同的音频输入的设备唤醒和说话者验证 |
WO2015009748A1 (en) | 2013-07-15 | 2015-01-22 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9445196B2 (en) | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9772994B2 (en) | 2013-07-25 | 2017-09-26 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US10186262B2 (en) | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
WO2015026933A2 (en) | 2013-08-21 | 2015-02-26 | Honeywell International Inc. | Devices and methods for interacting with an hvac controller |
EP2862164B1 (en) | 2013-08-23 | 2017-05-31 | Nuance Communications, Inc. | Multiple pass automatic speech recognition |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
WO2015027480A1 (zh) | 2013-08-30 | 2015-03-05 | 华为技术有限公司 | 一种多终端协同播放多媒体文件的方法和相关装置及*** |
WO2015037396A1 (ja) | 2013-09-11 | 2015-03-19 | 株式会社デンソー | 音声出力制御装置、プログラムおよび記録媒体 |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
CN103546616A (zh) | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
KR102114219B1 (ko) | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9300268B2 (en) * | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
US10229256B2 (en) | 2013-10-25 | 2019-03-12 | Intel Corporation | Techniques for preventing voice replay attacks |
EP2869599B1 (en) | 2013-11-05 | 2020-10-21 | Oticon A/s | A binaural hearing assistance system comprising a database of head related transfer functions |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US9378651B2 (en) * | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
US10224056B1 (en) | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9443516B2 (en) | 2014-01-09 | 2016-09-13 | Honeywell International Inc. | Far-field speech recognition systems and methods |
EP3092824B1 (en) | 2014-01-10 | 2017-11-01 | Dolby Laboratories Licensing Corporation | Calibration of virtual height speakers using programmable portable devices |
US9300647B2 (en) | 2014-01-15 | 2016-03-29 | Sonos, Inc. | Software application and zones |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
WO2015112137A1 (en) | 2014-01-22 | 2015-07-30 | Pearl Capital Developments Llc | Coordinated hand-off of audio data transmission |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9652532B2 (en) | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
WO2015118426A2 (en) | 2014-02-06 | 2015-08-13 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
TWI658597B (zh) | 2014-02-07 | 2019-05-01 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
US9408008B2 (en) | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
EP3115905A4 (en) | 2014-03-03 | 2017-10-25 | Sony Corporation | Information processing apparatus, information processing method, and program |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US10514747B2 (en) | 2014-03-24 | 2019-12-24 | Silicon Laboratories Inc. | Low-power communication apparatus with wakeup detection and associated methods |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9916839B1 (en) | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
US9431021B1 (en) | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
KR102146462B1 (ko) | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US8874448B1 (en) | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US9560437B2 (en) | 2014-04-08 | 2017-01-31 | Doppler Labs, Inc. | Time heuristic audio control |
US9510094B2 (en) | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) * | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
WO2015178562A1 (en) | 2014-05-23 | 2015-11-26 | Samsung Electronics Co., Ltd. | Method and apparatus for providing notification |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
TWI729649B (zh) | 2014-05-30 | 2021-06-01 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US20150355818A1 (en) | 2014-06-04 | 2015-12-10 | Sonos, Inc. | Continuous Playback Queue |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9766702B2 (en) | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9368105B1 (en) | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9335819B1 (en) * | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9398392B2 (en) | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9779307B2 (en) | 2014-07-07 | 2017-10-03 | Google Inc. | Method and system for non-causal zone search in video monitoring |
US11330100B2 (en) | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US9467737B2 (en) | 2014-07-14 | 2016-10-11 | Sonos, Inc. | Zone group control |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9671997B2 (en) | 2014-07-23 | 2017-06-06 | Sonos, Inc. | Zone grouping |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
JP6118838B2 (ja) | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、***和非瞬时计算机可读存储介质 |
KR20160026317A (ko) | 2014-08-29 | 2016-03-09 | 삼성전자주식회사 | 음성 녹음 방법 및 장치 |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9354687B2 (en) | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
JP6624368B2 (ja) | 2014-09-30 | 2019-12-25 | パナソニックIpマネジメント株式会社 | 接客モニタリングシステム及び接客モニタリング方法 |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
WO2016054230A1 (en) | 2014-10-01 | 2016-04-07 | XBrain, Inc. | Voice and connection platform |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
KR102287943B1 (ko) | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9560409B2 (en) | 2014-10-30 | 2017-01-31 | Verizon Patent And Licensing Inc. | Media service personalization systems and methods |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10368121B2 (en) | 2014-11-07 | 2019-07-30 | Roku, Inc. | System and method for collecting data |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
JP2016095383A (ja) | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
CN107211218B (zh) | 2014-11-28 | 2021-05-18 | 奥德拉声学公司 | 高位移声学换能器*** |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
EP3230824A4 (en) | 2014-12-11 | 2018-08-08 | Microsoft Technology Licensing, LLC | Virtual assistant system to enable actionable messaging |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制***与方法 |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104575504A (zh) | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN104635539A (zh) | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其*** |
DE112016000287T5 (de) | 2015-01-07 | 2017-10-05 | Knowles Electronics, Llc | Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
KR102351366B1 (ko) | 2015-01-26 | 2022-01-14 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN104572009B (zh) | 2015-01-28 | 2018-01-09 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
US9633661B1 (en) | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
JPWO2016136062A1 (ja) | 2015-02-27 | 2017-12-07 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
US10198242B2 (en) | 2015-04-14 | 2019-02-05 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
CN104853405B (zh) | 2015-05-12 | 2018-11-30 | 浙江生辉照明有限公司 | 智能联网方法及智能设备 |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
EP3096277A1 (en) | 2015-05-19 | 2016-11-23 | ResearchGate GmbH | Enhanced online user-interaction tracking |
CN110571341B (zh) | 2015-05-21 | 2022-04-12 | 株式会社半导体能源研究所 | 发光装置、电子设备及照明装置 |
TWI757234B (zh) | 2015-05-21 | 2022-03-11 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
JP2016218852A (ja) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US9706320B2 (en) | 2015-05-29 | 2017-07-11 | Sound United, LLC | System and method for providing user location-based multi-zone media |
US10657949B2 (en) | 2015-05-29 | 2020-05-19 | Sound United, LLC | System and method for integrating a home media system and other home systems |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
US20160373909A1 (en) | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
WO2016203350A1 (en) | 2015-06-17 | 2016-12-22 | Semiconductor Energy Laboratory Co., Ltd. | Iridium complex, light-emitting element, display device, electronic device, and lighting device |
JP6739907B2 (ja) * | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US10025447B1 (en) | 2015-06-19 | 2018-07-17 | Amazon Technologies, Inc. | Multi-device user interface |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US20160378747A1 (en) * | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
CA2990888A1 (en) | 2015-06-30 | 2017-01-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and device for generating a database |
KR20240035638A (ko) | 2015-07-08 | 2024-03-15 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 장치, 및 조명 장치 |
WO2017013526A1 (en) | 2015-07-21 | 2017-01-26 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, display device, electronic device, and lighting device |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
CN111129325B (zh) | 2015-07-23 | 2023-06-09 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子装置及照明装置 |
US20170034263A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized Playback of Streamed Audio Content by Multiple Internet-Capable Portable Devices |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US9691361B2 (en) | 2015-08-03 | 2017-06-27 | International Business Machines Corporation | Adjusting presentation of content on a display |
KR102402512B1 (ko) | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制***及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
KR102386854B1 (ko) | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2017039632A1 (en) | 2015-08-31 | 2017-03-09 | Nunntawi Dynamics Llc | Passive self-localization of microphone arrays |
US10031719B2 (en) | 2015-09-02 | 2018-07-24 | Harman International Industries, Incorporated | Audio system with multi-screen application |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
US10026399B2 (en) | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
KR20170032096A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체 |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US10706873B2 (en) * | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
US10289734B2 (en) | 2015-09-18 | 2019-05-14 | Samsung Electronics Co., Ltd. | Entity-type search system |
US9875081B2 (en) * | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
CN105162886B (zh) | 2015-09-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种声音控制方法及装置 |
US10186276B2 (en) | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
EP3357252B1 (en) | 2015-09-28 | 2023-09-06 | Google LLC | Time-synchronized, multizone media streaming |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US10241754B1 (en) | 2015-09-29 | 2019-03-26 | Amazon Technologies, Inc. | Systems and methods for providing supplemental information with a response to a command |
CN111341927B (zh) | 2015-09-30 | 2023-06-09 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备及照明装置 |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
US9754580B2 (en) | 2015-10-12 | 2017-09-05 | Technologies For Voice Interface | System and method for extracting and using prosody features |
CN107925818B (zh) | 2015-10-15 | 2020-10-16 | 华为技术有限公司 | 用于声音处理节点装置的声音处理节点 |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105427861B (zh) | 2015-11-03 | 2019-02-15 | 胡旻波 | 智能家居协同麦克风语音控制的***及其控制方法 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US20170140750A1 (en) | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
CN105472191B (zh) | 2015-11-18 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
JP6570651B2 (ja) | 2015-11-25 | 2019-09-04 | 三菱電機株式会社 | 音声対話装置および音声対話方法 |
US10040423B2 (en) | 2015-11-27 | 2018-08-07 | Bragi GmbH | Vehicle with wearable for identifying one or more vehicle occupants |
US9484030B1 (en) | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9699597B2 (en) | 2015-12-07 | 2017-07-04 | Google Inc. | Wireless signal forwarding |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
CN105632486B (zh) | 2015-12-23 | 2019-12-17 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US9992642B1 (en) | 2015-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated messaging |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
US9997151B1 (en) | 2016-01-20 | 2018-06-12 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation for wireless applications |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
CN105741838B (zh) | 2016-01-20 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
KR20170091913A (ko) | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
EP3414759B1 (en) | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9898250B1 (en) | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9858927B2 (en) * | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9820039B2 (en) | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US10133612B2 (en) | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US10332508B1 (en) | 2016-03-31 | 2019-06-25 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
US9952827B2 (en) | 2016-04-13 | 2018-04-24 | Comcast Cable Communications, Llc | Dynamic adjustment of equalization settings of audio components via a sound device profile |
KR102297394B1 (ko) | 2016-04-18 | 2021-09-02 | 구글 엘엘씨 | 적절한 에이전트의 자동화된 어시스턴트 호출 |
US10318236B1 (en) | 2016-05-05 | 2019-06-11 | Amazon Technologies, Inc. | Refining media playback |
US10447748B2 (en) | 2016-05-12 | 2019-10-15 | Apple Inc. | Sharing media information between applications on client devices |
US20170329397A1 (en) | 2016-05-12 | 2017-11-16 | Rovi Guides, Inc. | Systems and methods for navigating a media guidance application using gaze control |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
US20170330563A1 (en) | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing Speech from Distributed Microphones |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
DK179034B1 (en) | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
US20170364371A1 (en) | 2016-06-15 | 2017-12-21 | Microsoft Technology Licensing, Llc | Context-Dependent Digital Action-Assistance Tool |
KR20170142001A (ko) | 2016-06-16 | 2017-12-27 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9875740B1 (en) | 2016-06-20 | 2018-01-23 | A9.Com, Inc. | Using voice information to influence importance of search result categories |
US9749738B1 (en) | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US10091545B1 (en) | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
WO2018013564A1 (en) | 2016-07-12 | 2018-01-18 | Bose Corporation | Combining gesture and voice user interfaces |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US9979680B2 (en) | 2016-07-21 | 2018-05-22 | Fujitsu Limited | Smart notification scheduling and modality selection |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10026403B2 (en) * | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9967382B2 (en) | 2016-08-19 | 2018-05-08 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
CN107767863B (zh) | 2016-08-22 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法、***及智能终端 |
WO2018039045A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10461953B2 (en) | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
JP6577159B1 (ja) | 2016-09-06 | 2019-09-18 | ディープマインド テクノロジーズ リミテッド | ニューラルネットワークを使用したオーディオの生成 |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10283138B2 (en) | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
WO2018067402A1 (en) | 2016-10-03 | 2018-04-12 | Google Inc. | Selection of computational agent for task performance |
EP3507798A1 (en) | 2016-10-03 | 2019-07-10 | Google LLC | Processing voice commands based on device topology |
CN107919116B (zh) | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
KR102241970B1 (ko) | 2016-11-07 | 2021-04-20 | 구글 엘엘씨 | 기록된 미디어 핫워드 트리거 억제 |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
US10382806B2 (en) | 2016-11-14 | 2019-08-13 | DISH Technologies L.L.C. | Apparatus, systems and methods for controlling presentation of content using a multi-media table |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10079015B1 (en) | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10134396B2 (en) | 2016-12-07 | 2018-11-20 | Google Llc | Preventing of audio attacks |
US10255032B2 (en) | 2016-12-13 | 2019-04-09 | EVA Automation, Inc. | Wireless coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制***及控制方法 |
US10339957B1 (en) | 2016-12-20 | 2019-07-02 | Amazon Technologies, Inc. | Ending communications session based on presence data |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
CN106910500B (zh) | 2016-12-23 | 2020-04-17 | 北京小鸟听听科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
DE112017006486T5 (de) | 2016-12-23 | 2019-09-12 | Synaptics Incorporated | Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen |
US10546578B2 (en) | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
US10593328B1 (en) | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
US10580405B1 (en) | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10186266B1 (en) | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10831366B2 (en) | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
US10224031B2 (en) | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
KR102412202B1 (ko) | 2017-01-03 | 2022-06-27 | 삼성전자주식회사 | 냉장고 및 이의 정보 표시 방법 |
US10248613B2 (en) | 2017-01-10 | 2019-04-02 | Qualcomm Incorporated | Data bus activation in an electronic device |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
KR20180085931A (ko) | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR20180090586A (ko) | 2017-02-03 | 2018-08-13 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
CA3155437C (en) | 2017-02-07 | 2024-01-09 | Lutron Technology Company Llc | Audio-based load control system |
US10762891B2 (en) | 2017-02-10 | 2020-09-01 | Synaptics Incorporated | Binary and multi-class classification systems and methods using connectionist temporal classification |
CN108446281B (zh) | 2017-02-13 | 2021-03-12 | 北京嘀嘀无限科技发展有限公司 | 确定用户亲密度的方法、装置及存储介质 |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US20180293221A1 (en) | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10431217B2 (en) | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
CN106921560B (zh) | 2017-02-28 | 2020-06-02 | 北京小米移动软件有限公司 | 语音通信方法、装置及*** |
US10706843B1 (en) | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US10089981B1 (en) | 2017-03-09 | 2018-10-02 | Amazon Technologies, Inc. | Messaging account disambiguation |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10540961B2 (en) | 2017-03-13 | 2020-01-21 | Baidu Usa Llc | Convolutional recurrent neural networks for small-footprint keyword spotting |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10600406B1 (en) | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10643609B1 (en) | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
US10825471B2 (en) | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US10748531B2 (en) | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
CN107122158A (zh) | 2017-04-14 | 2017-09-01 | 北京小米移动软件有限公司 | 播放信息提示音频的方法及装置、电子设备 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10311870B2 (en) | 2017-05-10 | 2019-06-04 | Ecobee Inc. | Computerized device with voice command input capability |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US10028069B1 (en) | 2017-06-22 | 2018-07-17 | Sonos, Inc. | Immersive audio in a media playback system |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US11189273B2 (en) | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
EP3646161A1 (en) | 2017-06-30 | 2020-05-06 | Google LLC | Methods, systems, and media for voice-based call operations |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10304475B1 (en) | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US10515625B1 (en) | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
US10847149B1 (en) | 2017-09-01 | 2020-11-24 | Amazon Technologies, Inc. | Speech-based attention span for voice user interface |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
KR102338376B1 (ko) | 2017-09-13 | 2021-12-13 | 삼성전자주식회사 | 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법 |
US11314214B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Geographic analysis of water conditions |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
KR102543693B1 (ko) | 2017-10-17 | 2023-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR102421255B1 (ko) | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107832837B (zh) | 2017-11-28 | 2021-09-28 | 南京大学 | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10445365B2 (en) | 2017-12-04 | 2019-10-15 | Amazon Technologies, Inc. | Streaming radio with personalized content integration |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10777189B1 (en) | 2017-12-05 | 2020-09-15 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
EP3958112A1 (en) | 2017-12-06 | 2022-02-23 | Google LLC | Ducking and erasing audio from nearby devices |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10663313B2 (en) | 2017-12-15 | 2020-05-26 | Google Llc | Providing traffic warnings to a user based on return journey |
US10540971B2 (en) | 2017-12-15 | 2020-01-21 | Blue Jeans Network, Inc. | System and methods for in-meeting group assistance using a virtual assistant |
US11409816B2 (en) | 2017-12-19 | 2022-08-09 | Motorola Solutions, Inc. | Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information |
DE112018002857T5 (de) | 2017-12-26 | 2020-02-27 | Robert Bosch Gmbh | Sprecheridentifikation mit ultrakurzen Sprachsegmenten für Fern- und Nahfeld-Sprachunterstützungsanwendungen |
EP3732626A4 (en) | 2017-12-28 | 2021-09-15 | Syntiant | ALWAYS ACTIVE KEYWORD DETECTOR |
CN111512365B (zh) | 2017-12-31 | 2023-06-13 | 美的集团股份有限公司 | 对多个家庭装置进行控制的方法和*** |
CN111357048A (zh) | 2017-12-31 | 2020-06-30 | 美的集团股份有限公司 | 用于控制家庭助手装置的方法和*** |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US10795332B2 (en) | 2018-01-16 | 2020-10-06 | Resilience Magnum IP, LLC | Facilitating automating home control |
CN108198548B (zh) | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其*** |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US11024307B2 (en) | 2018-02-08 | 2021-06-01 | Computime Ltd. | Method and apparatus to provide comprehensive smart assistant services |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US11127405B1 (en) | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10749828B2 (en) | 2018-03-14 | 2020-08-18 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications |
US10491962B2 (en) | 2018-03-14 | 2019-11-26 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10685669B1 (en) | 2018-03-20 | 2020-06-16 | Amazon Technologies, Inc. | Device selection from audio data |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
CN108520741B (zh) | 2018-04-12 | 2021-05-04 | 科大讯飞股份有限公司 | 一种耳语音恢复方法、装置、设备及可读存储介质 |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
JP2019204025A (ja) | 2018-05-24 | 2019-11-28 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、及びプログラム |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10777195B2 (en) | 2018-05-31 | 2020-09-15 | International Business Machines Corporation | Wake command nullification for digital assistance and voice recognition technologies |
EP3756087A4 (en) | 2018-06-05 | 2021-04-21 | Samsung Electronics Co., Ltd. | PASSIVE WAKE-UP PROCESSES AND SYSTEMS OF A USER INTERACTION DEVICE |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
NL2021308B1 (en) | 2018-07-16 | 2020-01-24 | Hazelebach & Van Der Ven Holding B V | Methods for a voice processing system |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
GB2576016B (en) | 2018-08-01 | 2021-06-23 | Arm Ip Ltd | Voice assistant devices |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
KR102225984B1 (ko) | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US20200090647A1 (en) | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
US10650807B2 (en) | 2018-09-18 | 2020-05-12 | Intel Corporation | Method and system of neural network keyphrase detection |
US10861444B2 (en) | 2018-09-24 | 2020-12-08 | Rovi Guides, Inc. | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US10950249B2 (en) | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
KR102606789B1 (ko) | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US20200110571A1 (en) | 2018-10-05 | 2020-04-09 | Sonos, Inc. | Systems and methods for media content selection |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10943599B2 (en) | 2018-10-26 | 2021-03-09 | Spotify Ab | Audio cancellation for voice recognition |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
KR102570384B1 (ko) | 2018-12-27 | 2023-08-25 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
JP2020112692A (ja) | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
CN109712626B (zh) | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
US10964314B2 (en) | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US10984783B2 (en) | 2019-03-27 | 2021-04-20 | Intel Corporation | Spoken keyword detection based utterance-level wake on intent system |
US20200310751A1 (en) | 2019-03-29 | 2020-10-01 | Qualcomm Incorporated | System and method of managing device sound level |
EP4184949A1 (en) | 2019-04-17 | 2023-05-24 | Oticon A/s | A hearing device comprising a transmitter |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US20200409926A1 (en) | 2019-06-28 | 2020-12-31 | Rovi Guides, Inc. | Automated contact creation based on content communications |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
JP7191793B2 (ja) | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11172328B2 (en) | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210066647A (ko) | 2019-11-28 | 2021-06-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
US11445301B2 (en) | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
US11206052B1 (en) | 2020-06-18 | 2021-12-21 | HAJEN Co., Ltd | Smart speaker |
US20220050585A1 (en) | 2020-08-14 | 2022-02-17 | Apple Inc. | Audio media playback user interface |
-
2016
- 2016-10-19 US US15/297,627 patent/US10181323B2/en active Active
-
2017
- 2017-10-18 EP EP23172783.5A patent/EP4235650A3/en active Pending
- 2017-10-18 WO PCT/US2017/057220 patent/WO2018075660A1/en unknown
- 2017-10-18 EP EP17792272.1A patent/EP3529692B1/en active Active
- 2017-10-18 CN CN201780077204.7A patent/CN110073326B/zh active Active
- 2017-10-18 JP JP2019521032A patent/JP6668555B2/ja active Active
-
2018
- 2018-11-01 US US16/178,122 patent/US10614807B2/en active Active
-
2020
- 2020-02-26 JP JP2020030804A patent/JP6884245B2/ja active Active
- 2020-04-06 US US16/841,116 patent/US11308961B2/en active Active
-
2021
- 2021-05-11 JP JP2021080364A patent/JP7108084B2/ja active Active
-
2022
- 2022-04-18 US US17/722,438 patent/US11727933B2/en active Active
-
2023
- 2023-08-14 US US18/449,254 patent/US20240079006A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0883091A (ja) * | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
CN1323435A (zh) * | 1998-10-02 | 2001-11-21 | 国际商业机器公司 | 提供网络协同会话服务的***和方法 |
CN1633817A (zh) * | 2001-09-13 | 2005-06-29 | 诺基亚公司 | 响应用户请求的动态内容递送 |
CN104115224A (zh) * | 2011-10-14 | 2014-10-22 | 搜诺思公司 | 控制音频回放设备的***、方法、装置和制品 |
CN104282305A (zh) * | 2013-07-12 | 2015-01-14 | 通用汽车环球科技运作有限责任公司 | 语音对话***中用于结果仲裁的***和方法 |
US20150170665A1 (en) * | 2013-12-16 | 2015-06-18 | Rawles Llc | Attribute-based audio channel arbitration |
WO2016057268A1 (en) * | 2014-10-09 | 2016-04-14 | Google Inc. | Hotword detection on multiple devices |
US20160299737A1 (en) * | 2015-04-10 | 2016-10-13 | Sonos, Inc. | Identification of Audio Content Facilitated by Playback Device |
CN105679318A (zh) * | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示***和空调 |
Non-Patent Citations (3)
Title |
---|
CARLOS MOLINA; NESTOR BECERRA YOMA等: ""Maximum Entropy-Based Reinforcement Learning Using a Confidence Measure in Speech Recognition for Telephone Speech"", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 * |
梁汉泉等: "基于语音控制的人机交互智能***研究", 《新技术新工艺》 * |
王朋: ""语音关键词检测中的置信度研究"", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112260860A (zh) * | 2020-10-09 | 2021-01-22 | 北京小米松果电子有限公司 | 设备调试方法及装置、电子设备及存储介质 |
EP3982249A1 (en) * | 2020-10-09 | 2022-04-13 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Delay adjustment method and device, electronic device and storage medium |
US11737022B2 (en) | 2020-10-09 | 2023-08-22 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Delay adjustment method and device, electronic device and storage medium |
CN112260860B (zh) * | 2020-10-09 | 2024-03-29 | 北京小米松果电子有限公司 | 设备调试方法及装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180108351A1 (en) | 2018-04-19 |
EP4235650A3 (en) | 2023-10-25 |
US20220351725A1 (en) | 2022-11-03 |
WO2018075660A1 (en) | 2018-04-26 |
US20200234708A1 (en) | 2020-07-23 |
JP2020502555A (ja) | 2020-01-23 |
EP4235650A2 (en) | 2023-08-30 |
US11727933B2 (en) | 2023-08-15 |
EP3529692B1 (en) | 2023-12-27 |
US20190074008A1 (en) | 2019-03-07 |
EP3529692A1 (en) | 2019-08-28 |
JP6884245B2 (ja) | 2021-06-09 |
US20240079006A1 (en) | 2024-03-07 |
CN110073326B (zh) | 2022-07-29 |
JP6668555B2 (ja) | 2020-03-18 |
US10181323B2 (en) | 2019-01-15 |
US10614807B2 (en) | 2020-04-07 |
US11308961B2 (en) | 2022-04-19 |
JP7108084B2 (ja) | 2022-07-27 |
JP2020098364A (ja) | 2020-06-25 |
JP2021119414A (ja) | 2021-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110073326A (zh) | 基于仲裁的语音识别 | |
US11641559B2 (en) | Audio playback settings for voice interaction | |
US11947870B2 (en) | Audio response playback | |
US11830495B2 (en) | Networked devices, systems, and methods for intelligently deactivating wake-word engines | |
US11736860B2 (en) | Voice control of a media playback system | |
CN109716429A (zh) | 由多个设备进行的语音检测 | |
CN109690672A (zh) | 对语音输入进行上下文化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |