CN106448678A - 用于在电子装置中执行语音命令的方法和设备 - Google Patents

用于在电子装置中执行语音命令的方法和设备 Download PDF

Info

Publication number
CN106448678A
CN106448678A CN201611027587.0A CN201611027587A CN106448678A CN 106448678 A CN106448678 A CN 106448678A CN 201611027587 A CN201611027587 A CN 201611027587A CN 106448678 A CN106448678 A CN 106448678A
Authority
CN
China
Prior art keywords
voice
signal
command
voice command
wake
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611027587.0A
Other languages
English (en)
Other versions
CN106448678B (zh
Inventor
萨博豪吉特·查克拉德
李相勋
金凞云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN106448678A publication Critical patent/CN106448678A/zh
Application granted granted Critical
Publication of CN106448678B publication Critical patent/CN106448678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)

Abstract

提供一种用于在电子装置中执行语音命令的方法和设备。在示例性实施例中,检测语音信号并识别语音信号的言语。当识别的言语包含唤醒命令时,语音命令模式被激活,并且至少包含检测到的语音信号的一部分的信号被发送到服务器。服务器产生与语音命令相应的控制信号或结果信号,并将所述控制信号和结果信号发送到电子装置。所述装置接收和处理控制信号或结果信号,并被唤醒。从而,在不需要用户物理地触摸电子装置的情况下执行语音命令。

Description

用于在电子装置中执行语音命令的方法和设备
本申请是申请日为2013年05月29日,申请号为“201310205259.5”,发明名称为“用于在电子装置中执行语音命令的方法和设备”的发明专利申请的分案申请。
技术领域
本公开总体涉及一种电子装置。更具体地讲,本公开涉及一种用于在电子装置中执行语音命令的设备和方法。
背景技术
近来,随着多媒体技术已发展,具有多功能的电子装置已激增。这样的多功能装置的示例包括便携式终端(例如,智能电话、平板PC、智能相机)以及固定的基于家庭的装置(例如,与家用厨房电器集成的电子装置)。电子装置大多包括组合多个功能的汇聚功能。
便携式终端设计者努力实现先进的性能以及汇聚功能,以及装置的纤薄和审美设计作为一体。终端制造者竞争来呈现大致相同或先进的性能,并设计比先前的设计更小和更薄的新的模型。
在可用的各种功能中,最近商业化的装置提供相对高的精确度的语音识别功能。这样的语音识别功能精确地识别用户的语音以在没有按压分离的按钮或触摸键或触摸屏的情况下容易地执行装置的相应功能。
例如,语音识别功能允许用户在便携式终端(例如,智能电话)中无需单独的操纵而做出呼叫或编写文本消息,以发送产生的消息,并容易地设置各种功能(例如,路线规划、互联网搜索和闹铃)。
为了执行语音识别功能,现有技术驱动相应的语音识别应用,激活语音识别功能,随后执行相应的功能。
然而,为了执行语音识别,响应于分离的键或触摸屏上的触摸输入命令,语音识别应用被初始启动。此操作违背用于促进数据输入(而没有触摸)的语音识别的独特功能。另外,开始语音识别应用需要在包括各种应用对象的显示屏上找出语音识别应用,这在特定情况下可能会困难并且费时。
发明内容
公开了一种用于在一种电子装置中执行语音命令的设备和方法的实施例。在示例性实施例中,检测语音信号并识别语音信号的言语。当识别的言语包含唤醒命令时,激活语音命令模式,并且至少包含检测到的语音信号的一部分的信号被发送到服务器。服务器产生与语音命令相应的控制信号或结果信号,并将所述与语音命令相应的控制信号或结果信号发送回电子装置。电子装置接收并处理控制信号或结果信号,并被唤醒。从而,在不需要用户物理地触摸电子装置的情况下执行语音命令。
在各种实施例中:
语音信号可包括唤醒命令,其中,唤醒命令紧接着语音命令。
唤醒命令还可包括语音命令。
可在在唤醒命令和语音命令之间确定沉默持续时间。
处理控制信号或结果信号的步骤可包括执行电子装置的特定应用。
处理控制信号或结果信号的步骤可包括显示与所述结果信号相应的数据。
一旦激活语音命令模式,就可在指示语音命令模式被激活的显示器上激活对象。
当在言语中的唤醒命令被识别之前屏幕被锁定时,可响应于识别的唤醒命令对屏幕进行解锁。
只要语音信号的预定说话者被识别,言语可被识别为包含预定唤醒命令。当预定说话者的语音被识别时,可自动检测唤醒命令。
可选择地,当识别预定说话者的语音并且在预定说话者的言语之内识别预定唤醒命令时,可检测到唤醒命令。在另一实施例中,一种用于在电子装置中执行语音命令的方法,包括:检测包含唤醒命令和语音命令中的至少一个的语音信号;将所述语音信号发送到服务器;在接收指示服务器检测到语音信号中的唤醒命令的结果信号时,唤醒电子装置;从服务器接收与语音命令相应的控制信号或结果信号;处理所述与语音命令相应的控制信号或结果信号。
在实施例中,一种可在用于支持电子装置的语音命令的服务器中进行操作的方法,包括:从电子装置接收至少包含语音命令的发送的语音信号;通过识别和分析所述语音命令来产生与所述语音命令相应的控制信号或结果信号;将与第一语音命令相应的控制信号或结果信号发送到电子装置。
在实施例中,一种电子装置包括:一个或多个处理器;存储器;存储在存储器中并被配置为被一个或多个处理器执行的一个或多个程序,其中,所述程序包括用于检测语音信号并识别语音信号的言语的指令;当所述言语被识别为包含唤醒命令时,激活语音命令模式并将至少包含检测到的语音信号的部分的发送信号发送到服务器;响应于由服务器识别的发送信号之内的语音命令,接收并处理由服务器产生和发送的控制信号或结果信号。
根据本发明的另一方面,通过下面结合附图公开本发明的示例性实施例的详细描述,本发明的其他方面、优点和突出特点对本领域的技术人员会变得清楚。
附图说明
从以下结合附图进行的描述,本发明的特定示例性实施例的上述和其它方面、特点和优点将会变得更加清楚,其中:
图1A是根据本发明的示例性实施例的用于执行语音命令的电子装置的框图;
图1B是根据实施例的用于执行语音命令的***的示图;
图2是根据本发明的一个示例性实施例的用于在电子装置中执行唤醒命令和语音命令的方法的流程图;
图3是根据本发明的一个示例性实施例的可在服务器中进行操作的方法的流程图;
图4是根据本发明的另一示例性实施例的用于在电子装置中执行语音命令的方法的流程图;
图5是根据本发明的另一示例性实施例的可在服务器中进行操作的另一方法的流程图;
图6是根据本发明的另一示例性实施例的用于在电子装置中执行语音命令的方法的流程图;
图7示出根据本发明的实施例的包括可检测到和识别的唤醒命令和语音命令的语音信号;
图8A、图8B和图8C示出根据本发明的示例性实施例的基于包括唤醒命令和语音命令的语音信号的拨号;
图9A和图9B描绘根据本发明的示例性实施例的用于示出通过唤醒命令检测解锁的屏幕的屏幕截图。
贯穿附图,相同的标号将被理解为指示相同的部件、组件和结构。
具体实施方式
提供以下参照附图进行的描述以帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。所述描述包括各种特定细节来帮助理解,但是这些细节将被认为仅仅是示例性的。因此,本领域的普通技术人员将认识到,在不脱离本发明的范围和精神的情况下,可对在此描述的实施例进行各种改变和修改。另外,为了清楚和简明,可省略对公知功能和构造的描述。
以下描述和权利要求中使用的术语和词语不限于书面含义,而是仅被发明人使用以使得能够清楚和一致地理解本发明。因此,本领域的技术人员应清楚,提供下面对本发明的示例性实施例的描述仅是为了说明目的,而不是为了限制由所附权利要求及其等同物限定的本发明的目的。
应该理解,除非上下文清楚地另有指示,否则单数形式包括复数指示物。因此,例如,提到“组件表面”包括提到一个或多个这样的表面。
对于术语“大体上”,它意味着叙述的特征、参数或值不需要精确达到,而是,包括例如公差、测量误差、测量精度限制和对本领域技术人员已知的其他因素的偏差或变化可以以不妨碍所述特征意图提供的效果的量而发生。
本发明的示例性实施例提供一种用于在电子装置和服务器中执行语音命令的设备和方法。
图1A描绘根据本发明的示例性实施例的用于执行语音命令的电子装置100。电子装置100可以是各种固定或便携式装置中的任意一个。便携式装置可以是便携式终端、移动终端、移动平板电脑、移动播放器、平板计算机、智能电话、笔记本/台式计算机、个人数字助理(PDA)、智能相机等。电子装置可以是组合这些装置的两个或多个功能的便携式电子装置。固定电子装置的示例是连接到家用电器(例如,厨房电器)的电子显示装置。
电子装置100可包括控制器110、扬声器/麦克风112、相机120、全球定位***(GPS)接收器130、射频(RF)单元140、传感器模块150、触摸屏160、触摸屏控制器165和外部存储器170。
简单地说,根据本发明的实施例,装置100检测语音信号并识别言语。当所述言语被识别为包含唤醒命令时,装置100激活语音命令模式。在语音命令模式下,装置100能够响应于随后的语音命令。因此,如果装置处于锁屏状态或空闲状态(或条件允许的情况下处于这两种状态),则装置100可通过唤醒命令识别被唤醒,而不需要用户物理地触摸装置100上的键或触摸屏。一旦检测到唤醒命令,就执行言语识别处理以辨别是否已发出语音命令。如果识别出语音命令,则装置100可随后执行与所述命令相关的操作。
在一个实施例中,在装置100中执行唤醒命令检测和语音命令检测两者。在另一个实施例中,在装置100中执行唤醒命令检测,并在服务器中执行语音命令识别,接着将来自装置100的语音信号的一部分发送到服务器。在另一个实施例中,在服务器中执行唤醒命令检测和语音命令识别两者。
控制器100可包括接口101、一个或多个处理器102和103以及内部存储器104。在一些情况下,整个控制器110可被称为处理器。接口101、应用处理器102、通信处理器103和内部存储器104可以是单独的组件或被集成在一个或多个集成电路上。
应用处理器102通过运行各种软件程序来执行用于电子装置的各种功能,通信处理器103处理并控制语音通信和数据通信。除这些典型的功能之外,处理器102和103还执行存储在外部存储器170或内部存储器104中的特定的软件模块(指令集),并进行与所述模块相应的特定功能。即,处理器102和103执行与存储在外部存储器170或内部存储器104中的软件模块相关的本发明的方法。
根据本发明的一个示例性实施例(与图2的方法相应),应用处理器102通过麦克风110从用户接收包括唤醒命令和随后的语音命令的语音信号,并对所述语音信号执行言语识别,以检测唤醒命令的存在。当检测到唤醒命令时,应用处理器102可检测在语音信号中的唤醒命令和随后的语音命令之间的沉默持续时间。因此,应用处理器102确定与语音命令相应的语音信号的一部分是否开始,当确定与语音命令相应的语音信号的一部分开始时,应用处理器102将所述语音信号的一部分发送到服务器。接下来,应用处理器102从服务器接收与所述语音命令相应的语音识别结果,并基于此结果执行相应的操作。
根据本发明的另一示例性实施例(与图4的方法相应),应用处理器102将包括唤醒命令部分和语音命令部分的所有语音信号发送到服务器,并从服务器接收与唤醒命令相应的说话者验证结果。当所述结果指示检测到唤醒命令时,应用处理器102激活***。接下来,应用处理器102接收与语音命令相应的语音识别结果,并基于所述语音识别结果执行操作。
根据本发明的另一示例性实施例(与图6的方法相应),应用处理器102通过麦克风110从用户接收包括唤醒命令和语音命令的语音信号,并使用言语识别执行唤醒命令检测。当检测到唤醒命令时,应用处理器102使用语音识别算法识别语音信号的随后的部分中的语音命令,并基于识别的语音命令执行相应的操作。
一个或多个语音识别处理器和说话者验证处理器可以是应用处理器102的一部分,或可被提供为单独的处理器。语音识别处理器和说话者验证处理器可被统一,并包括根据其实施方式用于不同的功能的多个处理器。接口101将电子装置100的触摸屏控制器165与外部存储器170或内部存储器104相互连接。
传感器模块150被连接到接口101以允许各种功能。例如,运动传感器和光学传感器可被连接到接口101以检测电子装置的运动或检测来自外部的光。除了这些之外,其它传感器(例如,位置确定***、温度传感器或生物识别传感器)可被连接到接口101以进行相关的功能。
相机120通过接口101被连接到传感器150以执行相机功能(例如,拍摄和视频剪辑录制)。
可包括至少一个处理器的RF单元140执行通信功能。例如,在通信处理器103的控制下,RF单元140将RF信号转换为基带信号,并将基带信号提供给通信处理器103,或者将从通信处理器103输出的基带信号转换为RF信号,并通过天线ANT发送RF信号。这里,通信处理器103根据各种通信方案处理基带信号。例如,通信方案可包括但不限于:全球移动通信***(GSM)通信方案、增强型数据GSM环境(EDGE)通信方案、码分多址(CDMA)通信方案、W-CDMA通信方案、长期演进(LTE)通信方案、正交频分多址(OFDMA)通信方案、无线保真(Wi-Fi)通信方案、WiMax通信方案和/或蓝牙通信方案。
扬声器/麦克风110可输入和输出用于诸如语音识别(在训练处理期间使用以训练装置100识别特定说话者和/或唤醒命令和/或语音命令)、语音再现、数字记录和电话功能之一的语音信号。即,扬声器/麦克风110将语音信号转换为电子信号或者将电子信号转换为语音信号。可连接的和可拆卸的耳机、头戴受话器或头戴式耳机(未示出)可通过外部端口连接到电子装置。
触摸屏控制器165可被连接到触摸屏160。触摸屏160和触摸屏控制器165可使用但不限于用于确定与触摸屏160的一个或多个触摸点的电容式、电阻式、红外线和表面声波技术和包括各种接近传感器阵列或其它元素的多点触摸检测技术,来检测触摸和运动或触摸和运动的停止。
触摸屏160提供电子装置和用户之间的输入/输出接口。即,触摸屏160将用户的触摸输入转发到电子装置100。触摸屏160还将装置100的输出呈现给用户。即,触摸屏160将视觉输出呈现给用户。即,视觉输出可被表示为文本、图像、视频以及它们的组合。
触摸屏160可采用各种显示器,所述各种显示器的示例包括但不限于:液晶显示器(LCD)、发光二极管(LED)、发光聚合物显示器(LPD)、有机LED(OLED)、有源矩阵OLED(AMOLED)或柔性LED(FLED)。
GPS接收器130将从“人造”卫星接收的信号转换为诸如位置、速度或时间的信息。例如,卫星和GPS接收器130之间的距离可通过将光的速度乘以信号到达时间来计算,并通过获取三个卫星的准确位置和距离使用公知的三角测量法来测量电子装置的位置。
外部存储器170或内部存储器104可包括快速随机存取存储器(例如,一个或多个磁盘存储装置)和/或非易失性存储器、一个或多个光学存储装置、和/或闪速存储器(例如,NAND和NOR)。
外部存储器170或内部存储器104存储软件。软件组件包括操作***软件模块、通信软件模块、图形软件模块、用户界面软件模块、MPEG模块、相机软件模块以及一个或多个应用软件模块。用于作为软件组件的模块可以是一组指令,因此所述模块可被称为指令组。所述模块可被称为程序。
操作***软件包括用于控制一般***操作的各种软件组件。一般***操作的控制包括:例如,存储器管理和控制、存储器硬件(装置)控制和管理以及电力控制和管理。操作***软件可对各种硬件装置和软件组件(模块)之间的正常通信进行处理。
通信软件模块允许通过RF单元140与其它电子装置(例如,计算机、服务器、和/或便携式终端)进行通信。以相应的通信方案的协议构架配置通信软件模块。
图形软件模块包括用于在触摸屏160上提供和显示图形的各种软件组件。术语“图形”包含文本、网页、图标、数字图像、视频、动画等。
用户界面软件模块包括与用户界面相关的各种软件组件。用户界面软件模块涉及用户界面的状态改变和用户界面状态改变的条件。
相机软件模块包括允许相机相关处理和功能的相机相关软件组件。应用模块包括:浏览器、电子邮件、即时消息、词语处理、键盘仿真、地址簿、触摸列表、窗口小部件、数字版权管理(DRM)、语音识别、语音再现、位置确定功能、基于位置的服务等。除上述的模块之外,存储器170和104可包括附加的模块(指令)。可选择地,如果需要,则可不使用一些模块(指令)。
在此,应用模块包括用于执行说话者识别功能或言语识别功能和语音命令执行功能的指令。根据本发明的示例性实施例的指令与用于执行图2、图4和图6中所示的操作的指令相应。
以上提及和将被解释的电子装置100的各种功能可在包括一个或多个信号处理和/或专用集成电路(ASIC)的硬件和/或软件和/或他们的组合中被执行。
图1B中示出根据本发明的实施例的用于执行语音命令的***195。***195包括通过网络180与服务器190进行通信的便携式终端100。服务器190可以是例如家庭网络服务器或通过大型网络(例如,互联网)访问的远程服务器。可选择地,服务器190可以是能够对发送到服务器190的语音信号执行言语/语言/说话者识别和分析功能的第三方便携式电子装置。服务器190最少包括至少一个处理器192和存储器194,以执行操作的主机。下文中将结合电子装置100描述服务器190的示例性操作。
图2是根据本发明的一个示例性实施例的用于在电子装置100中执行唤醒命令和语音命令的方法200的流程图。
在步骤201,电子装置100通过麦克风110从用户检测可包含唤醒命令和语音命令的语音信号。唤醒命令激活***的语音命令模式,其中,为了接收和分析语音命令,不需要与触摸屏或键的触摸接触。在接收此语音信号之前,装置100可处于空闲模式或锁屏模式。在一些实施例中,在接收语音信号之前,装置100可处于这样的应用执行模式,其中,没有执行用于语音命令的收听或响应于语音命令的操作。
在以下描述中,将假设唤醒命令一般独立于临时跟随在唤醒命令之后的语音命令。然而,在下面另外讨论的一些“说话者依赖”实施例中,由预定的说话者说出的被检测的语音信号可用作唤醒命令。在一些其它实施例中(说话者依赖或说话者独立),唤醒命令还包含固有的语音命令。在后者的情况下,唤醒命令激活语音命令模式并且是装置100执行附加的预定任务(例如,运行由用户设置的预定义应用)的催化剂。
例如,唤醒命令可命令切换到用于输入语音命令的模式(“语音命令模式”)和/或对屏幕进行解锁。语音命令执行由电子装置100提供的各种功能。例如,语音命令执行拨号、拍摄、MP3播放等。在各种实施方式中,语音命令可请求服务器190搜索地图并计划路线。
在步骤202,电子装置100对语音信号执行言语识别,以辨别语音信号是否包含预定的唤醒命令。此言语识别可包括在一个实施例中的说话者依赖识别方案或在另一实施例中的说话者独立识别方案。另外的方案是可行的,其中,多个不同的唤醒命令被预定,其中,一个或多个预定命令是说话者依赖唤醒命令,一个或多个其他命令是说话者独立命令。
根据说话者依赖识别方案,特定说话者或用户需要提前以他/她自己的语音训练识别器。在此情况下,言语识别器可仅识别训练的语音的言语。说话者独立识别方案可识别任意说话者语音的言语。说话者独立识别方案提前提取关于成百上千的语音的信息并将所述信息存入数据库,因此,任何用户可使用所述信息,而无需单独的训练处理。
在一些实施例中,使用说话者依赖识别,说话者可使用语音信号(可包括整个语音信号)中的语音命令部分被验证。因此,不存在输入单独的唤醒命令的需要。例如,当使用用户的唯一语音特征来验证说话者时,不存在输入单独的唤醒命令的需要。因此,在这些实施例中,语音命令还可操作为唤醒命令。因此在步骤202和204,识别特定用户的特定语音,并通过此言语识别来自动检测唤醒命令。
可选择地,使用以预定义文本和用户的唯一语音特征的说话者依赖识别,用户可通过输入与预定义文本相应的他的语音来训练装置100以验证说话者(和特定的唤醒命令)。这样做,需要输入唤醒命令。在此,预定义文本可被用户直接输入或通过若干次输入语音被转换。电子装置100或服务器190可将语音转换为文本。
当在步骤204检测到唤醒命令时,所述方法进行到步骤206。否则,所述方法返回到201。
尽管未示出在图2中,当成功检测到唤醒命令时,在锁屏模式下“用于识别语音命令的对象”在显示器上被激活(见图8A)。可以是虚拟麦克风的此对象指示语音命令模式的激活(即,装置正积极收听语音命令)。此时,如果一个褪了色的版本先前可见,则该对象可在锁屏中被首先显示,或者,以被强调的方式被显示。此时,与言语/语音识别相关的图形用户界面(GUI)也可被显示。可选择地,当检测到唤醒命令时,显示的对象可被激活并且与语音识别相关的GUI可立即被显示在锁屏中。
在实施例变化中,当在空闲模式下检测到唤醒命令并且屏幕被锁定时,用于识别语音命令的对象和与语音识别相关的GUI被一起显示。当屏幕没有被锁定时,用于识别语音命令的对象和与语音识别相关的GUI也可被一起显示。
在步骤206,电子装置100检测在与唤醒命令相应的检测到的语音信号的第一部分(在下文中,“第一语音信号”)和与语音命令相应的检测到的语音信号的第二部分(在下文中,“第二语音信号”)之间的沉默持续时间(如果存在)。当然,这假设语音命令是与唤醒命令分离的实体(如上所述,在唤醒命令也是语音命令的情况下实施例是可行的)。例如,假设唤醒命令是“你好Galaxy”,并且语音命令是“呼叫Hong Gil-dong”,当用户连续发音“你好Galaxy”和“呼叫Hong Gil-dong”时,沉默持续时间存在于“你好Galaxy”和“呼叫Hong Gil-dong”之间。
在检测到的言语中的两个词语之间的短暂的停顿可被用于检测语音命令的开始。在实施例中,紧跟着唤醒命令的检测到的语音信号的无关的部分可被阻止与随后的语音命令一起被发送到服务器。这样做,可使用语音活动检测(VAD)技术。例如,语音信号通常具有比包括“沉默”时间段的背景噪声信号具有更多的能量。然而,当背景噪声低时,可附加地识别人的声音的独特的特征。通常,通过观察贯穿各种频率的能量分布来识别人的声音的独特的特征。人的声音包括特征标志(characteristics signature)而不包括噪声。因此,VAD技术可区分言语和包括背景噪声的沉默时间段。因此,在实施例中,装置100等待直到检测到言语,此后,仅发送跟随唤醒命令的已检测到的言语开始的声音信号,而不将包括唤醒命令之后检测到的所有声音的音频信号发送到服务器。即,方法200避免发送只是包含唤醒命令检测之后的沉默时间段的噪声的信号。
在步骤208,装置100确定与语音命令相应的第二语音信号是否开始。例如,装置100检查与“呼叫Hong Gil-dong”相应的语音信号的开始点。当第二语音信号开始时,在步骤210,装置100将与所述语音命令(例如,“呼叫Hong Gil-dong”)相应的语音信号发送到服务器。(发送到服务器的语音信号的部分在此不同地被称为“发送信号”)。(当与语音命令相应的语音信号在208没有开始时,所述流程返回到206)。有利地,通过将语音命令发送到服务器,装置100使得处理器免受识别语音命令的言语的增强任务。
在步骤212,装置100从服务器接收与语音命令相应的语音识别结果。例如,服务器分析语音命令“呼叫Hong Gil-dong”,并将与“呼叫Hong Gil-dong”相应的控制信号发送到装置100或发送路线规划请求或地图搜索请求的搜索结果。
在步骤214,装置100基于与语音命令相应的语音识别结果执行相应的操作,或显示与语音识别相应的结果。例如,当从服务器接收到与“呼叫Hong Gil-dong”相应的控制信号时,装置100在电话簿搜索Hong Gil-dong的电话号码并尝试以搜索的电话号码连接呼叫。在地图/路线请求的情况下,装置100显示路线规划请求或地图搜索请求的搜索结果。此后,所述处理结束。
图3是示出根据本发明的一个示例性实施例的由服务器190执行的方法300的流程图。此方法可补足在装置100中进行操作的上述方法200的操作。在此实施例中,在步骤301,服务器从电子装置接收发送信号(例如,在图2的步骤210发送的)(即,与语音命令(例如,“呼叫Hong Gil-dong”))相应的语音信号。
接下来,在步骤302,服务器使用语音识别算法(相当于“言语识别”算法)分析与语音命令相应的语音信号。即,服务器分析语音信号以识别言语并从识别的言语辨别语音命令。在步骤304,服务器随后确定与语音识别相应的结果是否是控制信号。如果是,则在步骤306,服务器将与语音识别相应的控制信号发送到装置100。例如,在识别“呼叫Hong Gil-dong”之后,服务器将相应的控制信号提供给装置100,以指示装置100以从装置100的电话簿存储器提取的相关的电话号码呼叫Hong Gil-dong。
当与语音识别相应的结果不是控制信号时,在步骤308,服务器将与语音识别相应的结果提供给电子装置。可选择地,服务器发送包含路线规划请求或地图搜索请求的搜索结果的图像内容,装置100藉此显示所述内容。
可选择地,在方法200和300的示例性实施例中,电子装置来实现唤醒命令检测,并且服务器实现语音命令的语音识别。根据本发明的另一示例性实施例,服务器执行唤醒命令检测和语音命令的语音识别。
图4是根据本发明的另一示例性实施例的在装置100中执行的另一示例方法的流程图。这里,在步骤401,在空闲模式和/或锁屏模式下,装置100通过麦克风110从用户接收包括唤醒命令的语音信号,其中,在唤醒命令不久之后(或连续之后)紧接着语音命令。如前所述,当识别到唤醒命令时,激活***。例如,唤醒命令可指示切换到用于输入语音命令的模式和/或对屏幕进行解锁。语音命令指示执行由电子装置100提供的各种功能。例如,语音命令执行拨号、拍摄、MP3播放等。
在步骤402,装置100将包括唤醒命令和语音命令的整个语音信号发送到服务器作为发送信号。接下来,从服务器接收到与唤醒命令相应的语音验证结果(步骤404)。即,当服务器检测到发送信号包含唤醒命令时,服务器发送在步骤404接收的语音识别结果;否则,服务器可不将任何识别信号发送回装置100。例如,当装置在步骤404接收到识别结果时,这指示检测到唤醒命令,并且在步骤406,装置100激活***。***激活对屏幕进行解锁或从空闲模式切换到激活模式或语音命令模式。(随着***激活并且处于语音命令模式,装置100随后可如步骤401检测包含语音命令的新的语音信号,并相应地重复步骤402至404和随后的步骤。)
接下来,在步骤408,装置100接收与语音命令相应的语音识别结果,并在步骤410,基于语音识别结果执行操作或显示与语音识别相应的结果。例如,当从服务器接收到与“呼叫Hong Gil-dong”相应的控制信号时,装置100在电话簿搜索Hong Gil-dong的电话号码并尝试以搜索的电话号码连接呼叫。在地图/路线示例中,装置100显示路线规划请求或地图搜索请求的搜索结果。此后,所述处理结束,装置100可在步骤401接收新的语音信号,并且将这些新的语音信号转发到服务器以进行处理,服务器藉此可继续通过发送控制信号和/或与随后的语音命令相应的结果来进行响应。即,由于装置100已经被唤醒,因此可以以仅用于语音命令的(而当然不是用于唤醒命令)相关操作重复步骤401至410。
图5是根据本发明的另一示例性实施例的由服务器190执行的示例性方法500的流程图。此方法可完成在装置100中进行操作的上述方法400的操作。
在步骤501,服务器从电子装置501接收包括唤醒命令和语音命令的语音信号(即,在步骤402发送的发送信号)。在步骤502,服务器语音识别验证算法分析与唤醒命令相应的语音信号。即,服务器分析与唤醒命令相应的语音信号,因此确定是否检测唤醒命令。此操作可与在实施例中由装置100执行的图2中的步骤202和204相同。注意,如图2的实施例中,可执行说话者依赖和/或说话者独立算法操作(在考虑多个预定的唤醒命令的情况下,可采用两种类型的识别方案)。
在步骤504,服务器将言语验证结果提供给电子装置。注意,在其他实施方式中可省略步骤504。
当在步骤506检测到唤醒命令作为言语识别处理的结果时,在步骤508,服务器随后使用语音识别算法分析与语音命令相应的语音信号。即,服务器识别与语音命令相应的言语,并产生与将由装置100执行的动作相应的响应信号,用于特定辨别的语音命令。相反地,当在语音信号中未检测到唤醒命令时,流程返回到步骤501。为此,服务器可发送通知装置100未检测到唤醒命令的信号,在步骤501,装置100藉此可继续将新检测到的语音信号发送到服务器。在各种实施方式中,当与先前的语音命令相应的语音信号是正常时,服务器可请求和接收仅与唤醒命令相应的第一语音信号。
尽管未示出,服务器可检测与唤醒命令相应的语音信号和与语音命令相应的语音信号之间的沉默持续时间,因此区分唤醒命令和语音命令。
在步骤510,服务器向电子装置通知唤醒命令结果和语音识别结果(响应信号)。例如,服务器通过分析言语是否包含短语“你好Galaxy”来确定是否检测到唤醒命令,分析语音命令“呼叫Hong Gil-dong”,因此将与“呼叫Hong Gil-dong”相应的控制信号发送给电子装置100。
接下来,服务器结束此处理,并可被配置为收听如在步骤501来自装置100的随后的语音信号发送。为此,在装置100和服务器190之间的适当的信令可被设计为向服务器190通知装置100是否已返回到空闲模式或锁屏模式。如果是,服务器将把随后接收的语言信号视作可包含唤醒命令的语音信号。如果不是,服务器将指示自然地收听新的语音命令。
图6是描绘根据本发明的另一示例性实施例的由电子装置执行的示例性方法600的操作的流程图。在此实施例中,电子装置执行用于语音命令的唤醒命令检测和语音识别两者。
步骤601、602、604、606和608可分别与图2的201、202、204、206和208相同。以下对步骤601至608的描述重述结合步骤201至208描述的一些概念。
在步骤601,在空闲模式或锁屏模式下,电子装置100通过麦克风110从用户接收包括唤醒命令和语音命令的语音信号。所述唤醒命令激活***。例如,唤醒命令可指示切换到用于输入语音命令的模式或对屏幕进行解锁。语音命令执行由电子装置100提供的各种功能。例如,语音命令执行拨号、拍摄、MP3播放等。
在步骤602,装置100使用言语识别验证算法分析语音信号,以确定语音信号是否包含唤醒命令。如前所述,如果采用了说话者依赖识别,此操作可涉及仅检测语音与预定语音匹配,或者预定语音还包含与预定唤醒命令匹配的特定言语。可选择地,可使用说话者独立识别方案。当在步骤604识别唤醒命令时,流程进行到步骤606;否则,流程返回到步骤600。
在步骤606,装置100检测与唤醒命令相应的语音信号部分和与语音命令相应的语音信号部分之间的沉默持续时间。例如,假设唤醒命令是“你好Galaxy”并且语音命令是“呼叫Hong Gil-dong”,当用户连续发音“你好Galaxy”和“呼叫Hong Gil-dong”时,沉默持续时间介于“你好Galaxy”和“呼叫Hong Gil-dong”之间。
在步骤608,电子装置100确定与语音命令相应的语音信号是否开始。例如,在步骤608,电子装置100检查与“呼叫Hong Gil-dong”相应的语音信号的开始点。
当在步骤608,与语音命令相应的语音信号开始时,在步骤610,电子装置100使用语音识别算法分析所述与语音命令相应的语音信号。
在步骤612,电子装置100基于识别的语音命令执行相应的操作。例如,当识别的语音命令是“呼叫Hong Gil-dong”时,电子装置100在电话簿搜索Hong Gil-dong的电话号码,并尝试以搜索的电话号码连接呼叫。此后,所述处理结束。
图7描绘可在上述的实施例中被分析的包括唤醒命令和语音命令的示例语音信号。输入到电子装置100的示意性语音信号可连续包含唤醒命令和语音命令。即,语音信号可具有与唤醒命令相应的部分700和与语音命令相应的部分720,其中,所述部分700和720连续输入到电子装置。沉默持续时间部分710介于唤醒命令部分700和语音命令部分720之间。
图8A、图8B和图8C是描绘根据本发明的示例性实施例的使用包含唤醒命令和语音命令的语音信号进行拨号操作的屏幕截图。如图8A中所示,用于识别语音命令的图标对象800根据与唤醒命令相应的语音信号部分700被激活。如图8B中所示,与语音信号的语音命令部分720相应的语音命令(“呼叫Hong Gil-dong”)被识别,随后所述操作根据所述语音命令被执行。例如,Hong Gil-dong的电话号码在电话簿中被搜索,并且如图8C中所示,使用搜索的电话号码自动开始呼叫连接。
图9A和图9B描绘根据本发明的示例性实施例的通过言语识别和控制操作解锁的屏幕的屏幕截面。图9A描绘示例锁定屏幕;图9B示出示例解锁屏幕。可以以图2、图4和图6的上述方法(例如,步骤214、406、410或612)中的任意方法执行用于产生如图9A和图9B中所示的解锁屏幕的对锁屏进行解锁的处理。
响应于检测到与预定唤醒命令匹配或与特定用户的语音匹配的语音信号的唤醒命令部分700,图9A的锁定屏幕被切换到图9B的解锁屏幕。尽管未示出,在屏幕被解锁之后,可通过识别与唤醒命令相应的语音信号700之后的与语音命令(“呼叫Hong Gil-dong”)相应的语音命令部分720来执行相应的操作。
在上述的本发明的示例性实施例中,唤醒命令和语音命令是分离的。可选择地,与语音命令相应的语音信号可被用于说话者验证和语音命令。即,使用与语音命令相应的语音信号来验证说话者。当说话者验证成功时,可根据语音命令控制或执行电子装置的相应的功能。
根据本公开的上述方法可单独在硬件或软件中被实施,或在硬件和软件的组合中被实施。
对于软件,可提供包含一个或多个程序(软件模块)的计算机可读存储介质。存储到计算机可读存储介质的一个或多个程序被配置用于执行电子装置和/或服务器的一个或多个处理器。一个或多个程序包括使电子装置和/或服务器执行根据如在本公开的权利要求和/或说明书中所述的实施例的方法的指令。
这样的程序(软件模块,软件)可被存储到随机存取存储器、包括闪速存储器、只读存储器(ROM)、电可擦可编程ROM(EEPROM)、磁盘存储装置、紧凑盘ROM(CD-ROM)、数字通用磁盘(DVD)或其它光学存储装置的非易失存储器和磁带。可选择地,所述程序可被存储到将这些存储介质进行部分组合或全部组合的存储器。可配备多个存储器。
所述程序可被存储到通过通信网络(例如,互联网、局域网(LAN)、广LAN(WLAN)或存储区域网(SAN)或通过组合这些网络的通信网络)可访问的电子装置和/或服务器的可连接的存储装置。存储装置可通过外部端口访问电子装置和/或服务器。
通信网络中分离的存储装置可访问便携式电子装置/服务器。
如上所述,由于包括唤醒命令部分和语音命令部分的检测到的语音信号被处理,因此用户可容易地执行所述语音命令。
另外,由于在执行语音命令之前完成唤醒命令检测,因此可基于安全/个人信息保护来执行语音命令。
尽管已经参照本发明的特定示例性实施例示出和描述了本发明,但是本领域的技术人员将理解,在不脱离权利要求及其等同物所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

Claims (23)

1.一种电子装置中的方法,包括:
检测语音信号并识别语音信号的言语;
当所述言语被识别为包含唤醒命令时,激活语音命令模式并将至少包含检测到的语音信号的一部分的信号发送到服务器;
响应于由服务器识别的发送信号之内的语音命令,接收并处理由服务器产生和发送的控制信号或结果信号。
2.如权利要求1所述的方法,其中,语音信号包括唤醒命令,其中,唤醒命令紧接着语音命令。
3.如权利要求1所述的方法,其中,唤醒命令还包括语音命令。
4.如权利要求2所述的方法,还包括:
确定在唤醒命令和语音命令之间的沉默持续时间。
5.如权利要求1所述的方法,其中,处理控制信号或结果信号的步骤包括:执行电子装置的特定应用。
6.如权利要求1所述的方法,其中,处理控制信号或结果信号的步骤包括:显示与所述结果信号相应的数据。
7.如权利要求1所述的方法,还包括:一旦进入语音命令模式,就在指示语音命令模式被激活的显示器上激活对象。
8.如权利要求7所述的方法,其中,当屏幕在识别言语中的语音命令之前被锁定时,响应于识别的唤醒命令对屏幕进行解锁。
9.如权利要求1所述的方法,其中,只要语音信号的预定说话者被识别,言语就被识别为包含预定唤醒命令。
10.如权利要求9所述的方法,其中,当识别预定说话者的语音时,自动检测唤醒命令。
11.如权利要求9所述的方法,其中,当识别预定说话者的语音并且在预定说话者的言语之内识别预定唤醒命令时,检测到唤醒命令。
12.如权利要求1所述的方法,其中,在空闲模式下通过电子装置的麦克风输入语音信号,当在空闲模式下检测到唤醒命令时,语音命令模式被激活。
13.一种用于在电子装置中执行语音命令的方法,包括:
检测包含唤醒命令和语音命令中的至少一个的语音信号;
将所述语音信号发送到服务器;
在接收指示服务器检测到语音信号中的唤醒命令的结果信号时,唤醒电子装置;
从服务器接收与语音命令相应的控制信号或结果信号;
处理与语音命令相应的控制信号或结果信号。
14.如权利要求13所述的方法,其中,处理与语音命令相应的控制信号或结果信号的步骤包括:
根据控制信号控制电子装置的功能或执行电子装置的特定应用。
15.如权利要求13所述的方法,其中,处理与语音命令相应的控制信号或结果信号的步骤包括:
显示与结果信号相应的数据。
16.如权利要求13所述的方法,还包括:
当接收到说话者验证成功消息时,激活用于识别与语音命令相应的第二语音信号的对象。
17.如权利要求16所述的方法,还包括:
当屏幕被锁定时,对屏幕进行解锁。
18.如权利要求13所述的方法,其中,说话者验证是说话者依赖识别方案或说话者独立识别方案之一。
19.如权利要求16所述的方法,其中,在空闲模式或锁屏模式下通过电子装置的麦克风输入与唤醒命令或语音命令相应的语音信号。
20.一种可在用于支持电子装置的语音命令的服务器中进行操作的方法,包括:
从电子装置接收至少包含语音命令的发送的语音信号;
通过识别和分析所述语音命令来产生与所述语音命令相应的控制信号或结果信号;
将与第一语音命令相应的控制信号或结果信号发送到电子装置。
21.一种电子装置,包括:
一个或多个处理器;
存储器;
存储在存储器中并被配置为被一个或多个处理器执行的一个或多个程序,
其中,所述程序包括如下指令:用于检测语音信号并识别语音信号的言语的指令,当所述言语被识别为包含唤醒命令时,激活语音命令模式并将至少包含检测到的语音信号的一部分的发送信号发送到服务器,并响应于由服务器识别的发送信号之内的语音命令,接收并处理由服务器产生和发送的控制信号或结果信号的指令。
22.一种电子装置,包括:
一个或多个处理器;
存储器;
存储在存储器中并被配置为被一个或多个处理器执行的一个或多个程序,
其中,所述程序包括如下指令:用于检测包含唤醒命令和语音命令中的至少一个的语音信号的指令,将所述语音信号发送到服务器的指令,当接收指示服务器检测到语音信号中的唤醒命令的结果信号时唤醒电子装置的指令,从服务器接收与唤醒命令相应的控制信号或结果信号的指令,以及处理与语音命令相应的控制信号或结果信号的指令。
23.一种电子装置,包括:
一个或多个处理器;
存储器;
存储在存储器中并被配置为被一个或多个处理器执行的一个或多个程序,
其中,所述程序包括以下指令:用于从电子装置接收至少包含语音命令的发送的语音信号的指令,通过识别和分析所述语音命令产生与所述语音命令相应的控制信号或结果信号,并将与第一语音命令相应的控制信号或结果信号发送到电子装置的指令。
CN201611027587.0A 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备 Active CN106448678B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2012-0057044 2012-05-29
KR1020120057044A KR20130133629A (ko) 2012-05-29 2012-05-29 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
CN201310205259.5A CN103456306B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201310205259.5A Division CN103456306B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备

Publications (2)

Publication Number Publication Date
CN106448678A true CN106448678A (zh) 2017-02-22
CN106448678B CN106448678B (zh) 2020-05-01

Family

ID=48625739

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201611043404.4A Active CN106297802B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备
CN201611027587.0A Active CN106448678B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备
CN201310205259.5A Active CN103456306B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201611043404.4A Active CN106297802B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310205259.5A Active CN103456306B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备

Country Status (4)

Country Link
US (4) US9619200B2 (zh)
EP (2) EP3001414B1 (zh)
KR (1) KR20130133629A (zh)
CN (3) CN106297802B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107808670A (zh) * 2017-10-25 2018-03-16 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
CN107911386A (zh) * 2017-12-06 2018-04-13 北京小米移动软件有限公司 获取服务授权信息的方法及装置
CN108509119A (zh) * 2017-02-28 2018-09-07 三星电子株式会社 用于功能执行的电子设备的操作方法和支持其的电子设备
CN108665890A (zh) * 2017-03-28 2018-10-16 三星电子株式会社 操作语音识别服务的方法、电子设备和支持该设备的***
CN108962236A (zh) * 2017-05-19 2018-12-07 Lg电子株式会社 家用电器及语音识别服务器***的动作方法
WO2019079974A1 (en) * 2017-10-24 2019-05-02 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR UNINTERRUPTED APPLICATION REVIEW AND VOICE RECOGNITION
WO2019218370A1 (zh) * 2018-05-18 2019-11-21 深圳傲智天下信息科技有限公司 一种ai语音交互方法、装置及***
CN111063356A (zh) * 2018-10-17 2020-04-24 北京京东尚科信息技术有限公司 电子设备响应方法及***、音箱和计算机可读存储介质
CN111063345A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制***
CN111261153A (zh) * 2018-12-03 2020-06-09 现代自动车株式会社 车辆语音命令处理装置和方法
CN112114887A (zh) * 2020-09-24 2020-12-22 北京小米移动软件有限公司 被控设备、唤醒被控设备的方法及存储介质
CN112334978A (zh) * 2018-08-08 2021-02-05 三星电子株式会社 支持个性化装置连接的电子装置及其方法
CN113409786A (zh) * 2021-07-07 2021-09-17 北京京东乾石科技有限公司 语音控制方法、装置、电子设备及计算机可读存储介质

Families Citing this family (338)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
KR20130133629A (ko) 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9805721B1 (en) * 2012-09-21 2017-10-31 Amazon Technologies, Inc. Signaling voice-controlled devices
US10373615B2 (en) * 2012-10-30 2019-08-06 Google Technology Holdings LLC Voice control user interface during low power mode
US10304465B2 (en) * 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
US10381001B2 (en) * 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US9584642B2 (en) * 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
TWI557722B (zh) * 2012-11-15 2016-11-11 緯創資通股份有限公司 語音干擾的濾除方法、系統,與電腦可讀記錄媒體
CN103871408B (zh) * 2012-12-14 2017-05-24 联想(北京)有限公司 一种语音识别方法及装置、电子设备
EP2945090A4 (en) * 2013-01-10 2016-08-17 Nec Corp END DEVICE, RELEASE PROCEDURE AND PROGRAM
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9689960B1 (en) 2013-04-04 2017-06-27 Amazon Technologies, Inc. Beam rejection in multi-beam microphone systems
US9530410B1 (en) 2013-04-09 2016-12-27 Google Inc. Multi-mode guard for voice commands
JP6416752B2 (ja) * 2013-04-19 2018-10-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
US20140358535A1 (en) * 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US20140358552A1 (en) * 2013-05-31 2014-12-04 Cirrus Logic, Inc. Low-power voice gate for device wake-up
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和***
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
US20150032238A1 (en) 2013-07-23 2015-01-29 Motorola Mobility Llc Method and Device for Audio Input Routing
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
WO2015030474A1 (ko) * 2013-08-26 2015-03-05 삼성전자 주식회사 음성 인식을 위한 전자 장치 및 방법
WO2015029296A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識方法及び音声認識装置
US20150112690A1 (en) * 2013-10-22 2015-04-23 Nvidia Corporation Low power always-on voice trigger architecture
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN105723451B (zh) * 2013-12-20 2020-02-28 英特尔公司 从低功率始终侦听模式到高功率语音识别模式的转换
KR102210433B1 (ko) 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US9589564B2 (en) * 2014-02-05 2017-03-07 Google Inc. Multiple speech locale-specific hotword classifiers for selection of a speech locale
US9646607B2 (en) * 2014-03-10 2017-05-09 Dell Products, L.P. Managing wake-on-voice buffer quality based on system boot profiling
US9552817B2 (en) * 2014-03-19 2017-01-24 Microsoft Technology Licensing, Llc Incremental utterance decoder combination for efficient and accurate decoding
US9547468B2 (en) * 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
CN109949815B (zh) * 2014-04-07 2024-06-07 三星电子株式会社 电子装置
US10770075B2 (en) * 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input
TW201541328A (zh) * 2014-04-30 2015-11-01 Maetay Prec Co Ltd 可根據所接收的語音切換使用者介面之手持式電子裝置及其使用者介面切換方法
US9860076B2 (en) * 2014-05-07 2018-01-02 Vivint, Inc. Home automation via voice control
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
KR102261552B1 (ko) 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US11942095B2 (en) 2014-07-18 2024-03-26 Google Llc Speaker verification using co-location information
US11676608B2 (en) 2021-04-02 2023-06-13 Google Llc Speaker verification using co-location information
US9257120B1 (en) 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制***的方法、装置及终端
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US20160076776A1 (en) * 2014-09-12 2016-03-17 General Electric Company Voice latching of appliance door
CN109324833B (zh) * 2014-09-19 2020-07-07 华为技术有限公司 一种运行应用程序的方法及装置
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US20160133255A1 (en) * 2014-11-12 2016-05-12 Dsp Group Ltd. Voice trigger sensor
US10147421B2 (en) 2014-12-16 2018-12-04 Microcoft Technology Licensing, Llc Digital assistant voice input integration
WO2016103415A1 (ja) * 2014-12-25 2016-06-30 日立マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
CN105845135A (zh) * 2015-01-12 2016-08-10 芋头科技(杭州)有限公司 一种机器人***的声音识别***及方法
KR102371697B1 (ko) 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
US9653079B2 (en) * 2015-02-12 2017-05-16 Apple Inc. Clock switching in always-on component
KR102346302B1 (ko) * 2015-02-16 2022-01-03 삼성전자 주식회사 전자 장치 및 음성 인식 기능 운용 방법
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) * 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
JP6556473B2 (ja) * 2015-03-12 2019-08-07 株式会社東芝 送信装置、音声認識システム、送信方法、およびプログラム
EP3067884B1 (en) * 2015-03-13 2019-05-08 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
KR102585228B1 (ko) * 2015-03-13 2023-10-05 삼성전자주식회사 음성 인식 시스템 및 방법
CN106033331B (zh) * 2015-03-16 2019-07-26 联想(北京)有限公司 信息处理方法及电子设备
AU2015390534B2 (en) * 2015-04-10 2019-08-22 Honor Device Co., Ltd. Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal
CN104902070A (zh) * 2015-04-13 2015-09-09 青岛海信移动通信技术股份有限公司 一种移动终端语音控制的方法及移动终端
EP3091422B1 (en) * 2015-05-08 2020-06-24 Nokia Technologies Oy Method, apparatus and computer program product for entering operational states based on an input type
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
CN106293034A (zh) * 2015-06-11 2017-01-04 中兴通讯股份有限公司 一种信息输出的方法及终端
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
CN105118505A (zh) * 2015-07-17 2015-12-02 北京乐动卓越科技有限公司 一种语音控制方法及***
CN106469040B (zh) 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
WO2017044409A1 (en) 2015-09-07 2017-03-16 Voicebox Technologies Corporation System and method of annotating utterances based on tags assigned by unmanaged crowds
US9786277B2 (en) * 2015-09-07 2017-10-10 Voicebox Technologies Corporation System and method for eliciting open-ended natural language responses to questions to train natural language processors
US9519766B1 (en) 2015-09-07 2016-12-13 Voicebox Technologies Corporation System and method of providing and validating enhanced CAPTCHAs
US9401142B1 (en) 2015-09-07 2016-07-26 Voicebox Technologies Corporation System and method for validating natural language content using crowdsourced validation jobs
US9448993B1 (en) 2015-09-07 2016-09-20 Voicebox Technologies Corporation System and method of recording utterances using unmanaged crowds for natural language processing
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
JP6710037B2 (ja) * 2015-10-23 2020-06-17 シャープ株式会社 通信装置
EP3321794A4 (en) * 2015-10-23 2018-09-12 Samsung Electronics Co., Ltd. Electronic device and control method therefor
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
CN106814639A (zh) * 2015-11-27 2017-06-09 富泰华工业(深圳)有限公司 语音控制***及方法
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105632486B (zh) * 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105677152A (zh) * 2015-12-31 2016-06-15 宇龙计算机通信科技(深圳)有限公司 一种语音触屏操作处理的方法、装置以及终端
US9633659B1 (en) * 2016-01-20 2017-04-25 Motorola Mobility Llc Method and apparatus for voice enrolling an electronic computing device
KR102642666B1 (ko) * 2016-02-05 2024-03-05 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
KR102498364B1 (ko) * 2016-03-24 2023-02-10 삼성전자주식회사 전자 장치 및 전자 장치에서의 정보 제공 방법
US10854199B2 (en) * 2016-04-22 2020-12-01 Hewlett-Packard Development Company, L.P. Communications with trigger phrases
JP2019518985A (ja) * 2016-05-13 2019-07-04 ボーズ・コーポレーションBose Corporation 分散したマイクロホンからの音声の処理
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10049670B2 (en) 2016-06-06 2018-08-14 Google Llc Providing voice action discoverability example for trigger term
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
KR20180012464A (ko) * 2016-07-27 2018-02-06 삼성전자주식회사 전자 장치 및 그의 음성 인식 방법
CN106328132A (zh) * 2016-08-15 2017-01-11 歌尔股份有限公司 一种智能设备的语音交互控制方法和装置
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
CN106335436B (zh) * 2016-08-31 2022-03-25 北京兴科迪科技有限公司 一种集成麦克风的内后视镜
KR102596430B1 (ko) 2016-08-31 2023-10-31 삼성전자주식회사 화자 인식에 기초한 음성 인식 방법 및 장치
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10140987B2 (en) 2016-09-16 2018-11-27 International Business Machines Corporation Aerial drone companion device and a method of operating an aerial drone companion device
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
KR20180055661A (ko) * 2016-11-16 2018-05-25 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20180060328A (ko) 2016-11-28 2018-06-07 삼성전자주식회사 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10079015B1 (en) * 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US9940930B1 (en) 2016-12-07 2018-04-10 Google Llc Securing audio data
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10242673B2 (en) 2016-12-07 2019-03-26 Google Llc Preventing of audio attacks using an input and an output hotword detection model
KR101801182B1 (ko) * 2016-12-08 2017-12-20 장재윤 향초 제조 장치
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DE102017219596A1 (de) * 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines Sprachbediensystems
US10937421B2 (en) * 2016-12-23 2021-03-02 Spectrum Brands, Inc. Electronic faucet with smart features
US11176932B2 (en) * 2016-12-23 2021-11-16 Spectrum Brands, Inc. Electronic faucet with smart features
KR102653450B1 (ko) 2017-01-09 2024-04-02 삼성전자주식회사 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
KR20180082033A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 음성을 인식하는 전자 장치
US10102856B2 (en) * 2017-01-20 2018-10-16 Essential Products, Inc. Assistant device with active and passive experience modes
CN108304153A (zh) * 2017-03-02 2018-07-20 腾讯科技(深圳)有限公司 语音交互方法和装置
KR102304701B1 (ko) * 2017-03-28 2021-09-24 삼성전자주식회사 사용자의 음성 입력에 대한 답변을 제공하는 방법 및 장치
KR102398649B1 (ko) * 2017-03-28 2022-05-17 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 동작 방법
CN107146608B (zh) * 2017-04-10 2020-09-25 北京猎户星空科技有限公司 一种播放控制方法、装置及智能设备
US11250844B2 (en) * 2017-04-12 2022-02-15 Soundhound, Inc. Managing agent engagement in a man-machine dialog
US10522137B2 (en) 2017-04-20 2019-12-31 Google Llc Multi-user authentication on a device
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10069976B1 (en) * 2017-06-13 2018-09-04 Harman International Industries, Incorporated Voice agent forwarding
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
US10607606B2 (en) * 2017-06-19 2020-03-31 Lenovo (Singapore) Pte. Ltd. Systems and methods for execution of digital assistant
US10283117B2 (en) * 2017-06-19 2019-05-07 Lenovo (Singapore) Pte. Ltd. Systems and methods for identification of response cue at peripheral device
KR102060775B1 (ko) * 2017-06-27 2019-12-30 삼성전자주식회사 음성 입력에 대응하는 동작을 수행하는 전자 장치
GB2563953A (en) 2017-06-28 2019-01-02 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201713697D0 (en) 2017-06-28 2017-10-11 Cirrus Logic Int Semiconductor Ltd Magnetic detection of replay attack
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及***、云端服务器与可读介质
GB201801527D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
US10504511B2 (en) 2017-07-24 2019-12-10 Midea Group Co., Ltd. Customizable wake-up voice commands
CN107508734B (zh) * 2017-08-17 2021-09-07 北京小米移动软件有限公司 多媒体留言播放方法及装置
KR102411766B1 (ko) * 2017-08-25 2022-06-22 삼성전자주식회사 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
KR102335869B1 (ko) * 2017-08-31 2021-12-07 삼성전자주식회사 전자 장치, 입력 디바이스 및 그 제어 방법
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
GB201804843D0 (en) 2017-11-14 2018-05-09 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801664D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
KR102417524B1 (ko) * 2017-10-13 2022-07-07 현대자동차주식회사 음성 인식 기반의 자동차 제어 방법
GB2567503A (en) 2017-10-13 2019-04-17 Cirrus Logic Int Semiconductor Ltd Analysing speech signals
KR102471493B1 (ko) 2017-10-17 2022-11-29 삼성전자주식회사 전자 장치 및 음성 인식 방법
US10665234B2 (en) * 2017-10-18 2020-05-26 Motorola Mobility Llc Detecting audio trigger phrases for a voice recognition session
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
KR102492727B1 (ko) * 2017-12-04 2023-02-01 삼성전자주식회사 전자장치 및 그 제어방법
CN109901698B (zh) * 2017-12-08 2023-08-08 深圳市腾讯计算机***有限公司 一种智能交互方法、可穿戴设备和终端以及***
CN109994106B (zh) * 2017-12-29 2023-06-23 阿里巴巴集团控股有限公司 一种语音处理方法及设备
EP3692522A4 (en) * 2017-12-31 2020-11-11 Midea Group Co., Ltd. METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN110021294A (zh) * 2018-01-09 2019-07-16 深圳市优必选科技有限公司 机器人的控制方法、装置以及存储装置
US11735189B2 (en) 2018-01-23 2023-08-22 Cirrus Logic, Inc. Speaker identification
US11475899B2 (en) 2018-01-23 2022-10-18 Cirrus Logic, Inc. Speaker identification
US11264037B2 (en) 2018-01-23 2022-03-01 Cirrus Logic, Inc. Speaker identification
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
KR102617265B1 (ko) * 2018-03-13 2023-12-26 삼성전자주식회사 사용자 음성 입력을 처리하는 장치
US10877637B1 (en) * 2018-03-14 2020-12-29 Amazon Technologies, Inc. Voice-based device operation mode management
US10885910B1 (en) 2018-03-14 2021-01-05 Amazon Technologies, Inc. Voice-forward graphical user interface mode management
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
CN108502656A (zh) * 2018-04-11 2018-09-07 苏州福特美福电梯有限公司 电梯语音控制方法和***
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及***、终端以及计算机可读存储介质
CN108600219B (zh) * 2018-04-23 2020-09-11 海信(广东)空调有限公司 一种语音控制方法及设备
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11169668B2 (en) * 2018-05-16 2021-11-09 Google Llc Selecting an input mode for a virtual assistant
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN108766423B (zh) * 2018-05-25 2021-07-09 三星电子(中国)研发中心 一种基于场景的主动唤醒方法和装置
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11501781B2 (en) 2018-06-05 2022-11-15 Samsung Electronics Co., Ltd. Methods and systems for passive wakeup of a user interaction device
CN109036398A (zh) * 2018-07-04 2018-12-18 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及存储介质
US10832672B2 (en) 2018-07-13 2020-11-10 International Business Machines Corporation Smart speaker system with cognitive sound analysis and response
US10832673B2 (en) 2018-07-13 2020-11-10 International Business Machines Corporation Smart speaker device with cognitive sound analysis and response
US10692490B2 (en) 2018-07-31 2020-06-23 Cirrus Logic, Inc. Detection of replay attack
CN108792856A (zh) * 2018-08-01 2018-11-13 迅达(中国)电梯有限公司 电梯呼叫***
KR102628211B1 (ko) * 2018-08-29 2024-01-23 삼성전자주식회사 전자 장치 및 그 제어 방법
US10923128B2 (en) * 2018-08-29 2021-02-16 Cirrus Logic, Inc. Speech recognition
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
KR102156054B1 (ko) * 2018-09-12 2020-09-15 김철회 인공지능스피커와 연동되는 전자펜 시스템
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11627012B2 (en) 2018-10-09 2023-04-11 NewTekSol, LLC Home automation management system
CN109286706B (zh) * 2018-10-12 2021-01-26 京东方科技集团股份有限公司 显示设备
KR102208496B1 (ko) * 2018-10-25 2021-01-27 현대오토에버 주식회사 연속 음성 명령에 기반하여 서비스를 제공하는 인공지능 음성단말장치 및 음성서비스시스템
CN109119078A (zh) * 2018-10-26 2019-01-01 北京石头世纪科技有限公司 自动机器人控制方法、装置、自动机器人和介质
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US10908883B2 (en) * 2018-11-13 2021-02-02 Adobe Inc. Voice interaction development tool
US10902851B2 (en) 2018-11-14 2021-01-26 International Business Machines Corporation Relaying voice commands between artificial intelligence (AI) voice response systems
JP7023823B2 (ja) * 2018-11-16 2022-02-22 アルパイン株式会社 車載装置及び音声認識方法
US10657968B1 (en) * 2018-11-19 2020-05-19 Google Llc Controlling device output according to a determined condition of a user
US10847156B2 (en) 2018-11-28 2020-11-24 Adobe Inc. Assembled voice interaction
US10922044B2 (en) 2018-11-29 2021-02-16 Bose Corporation Wearable audio device capability demonstration
CN111261151B (zh) * 2018-12-03 2022-12-27 中移(杭州)信息技术有限公司 一种语音处理方法、装置、电子设备及存储介质
CN109725545A (zh) * 2018-12-27 2019-05-07 广东美的厨房电器制造有限公司 智能设备及其控制方法、计算机可读存储介质
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109830232A (zh) * 2019-01-11 2019-05-31 北京猎户星空科技有限公司 人机交互方法、装置和存储介质
US11017771B2 (en) 2019-01-18 2021-05-25 Adobe Inc. Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets
US10964322B2 (en) 2019-01-23 2021-03-30 Adobe Inc. Voice interaction tool for voice-assisted application prototypes
US10923098B2 (en) 2019-02-13 2021-02-16 Bose Corporation Binaural recording-based demonstration of wearable audio device functions
US10813195B2 (en) * 2019-02-19 2020-10-20 Signify Holding B.V. Intelligent lighting device and system
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
WO2020196955A1 (ko) * 2019-03-27 2020-10-01 엘지전자 주식회사 인공 지능 기기 및 인공 지능 기기의 동작 방법
CN111754996A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 基于语音模拟遥控器的控制方法、装置及电子设备
US10855921B2 (en) 2019-04-29 2020-12-01 Sony Corporation Techniques for controlling camera interfaces using voice commands
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
CN110120222A (zh) * 2019-05-23 2019-08-13 九牧厨卫股份有限公司 一种带语音播报功能的智能镜柜的语音播报方法
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
CN110347862B (zh) * 2019-06-24 2022-09-06 歌尔股份有限公司 录音处理方法、装置、设备、***及音频设备
CN110335597A (zh) * 2019-06-24 2019-10-15 深圳市小魔信息技术有限公司 一种手机锁屏状态下的唤醒***和方法
KR20190092333A (ko) * 2019-07-19 2019-08-07 엘지전자 주식회사 음성 인식 디바이스와 통신하는 장치, 음성 인식 능력을 가진 장치 및 음성 인식 능력을 가진 장치를 제어하는 방법
CN110570840B (zh) * 2019-09-12 2022-07-05 腾讯科技(深圳)有限公司 一种基于人工智能的智能设备唤醒方法和装置
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
KR20210044985A (ko) * 2019-10-16 2021-04-26 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
CA3059029A1 (en) 2019-10-17 2021-04-17 The Toronto-Dominion Bank Maintaining data confidentiality in communications involving voice-enabled devices in a distributed computing environment
KR102156055B1 (ko) * 2020-05-11 2020-09-15 김철회 인공지능스피커와 연동하여 인터랙티브 프로그램을 제어하는 전자펜 시스템
KR102164773B1 (ko) * 2020-05-11 2020-10-13 김철회 마이크로폰으로 인공지능스피커와 연동되는 전자펜 시스템
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
KR102164774B1 (ko) * 2020-05-11 2020-10-13 김철회 인공지능스피커의 기능을 조작하는 전자펜 시스템
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
WO2021237235A1 (en) * 2020-05-20 2021-11-25 Sonos, Inc. Input detection windowing
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN111986682A (zh) * 2020-08-31 2020-11-24 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
US11700139B2 (en) * 2020-11-13 2023-07-11 Haier Us Appliance Solutions, Inc. Virtual microphone input for multiple voice assistants
CN112698872A (zh) * 2020-12-21 2021-04-23 北京百度网讯科技有限公司 语音数据处理的方法、装置、设备及存储介质
KR102494051B1 (ko) * 2021-01-26 2023-01-31 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
CN112837694B (zh) * 2021-01-29 2022-12-06 青岛海尔科技有限公司 设备唤醒方法、装置、存储介质及电子装置
KR102608344B1 (ko) * 2021-02-04 2023-11-29 주식회사 퀀텀에이아이 실시간 End-to-End 방식의 음성 인식 및 음성DNA 생성 시스템
US20220358915A1 (en) * 2021-05-10 2022-11-10 Roku, Inc. Voice command recognition system
EP4270384A1 (en) * 2022-04-29 2023-11-01 Honeywell International Inc. System and method for handling unsplit segments in transcription of air traffic communication (atc)
CN117253488A (zh) * 2022-06-10 2023-12-19 Oppo广东移动通信有限公司 语音识别方法、装置、设备及存储介质
KR102620070B1 (ko) * 2022-10-13 2024-01-02 주식회사 타이렐 상황 인지에 따른 자율발화 시스템
KR102626954B1 (ko) * 2023-04-20 2024-01-18 주식회사 덴컴 치과용 음성 인식 장치 및 이를 이용한 방법
KR102581221B1 (ko) * 2023-05-10 2023-09-21 주식회사 솔트룩스 재생 중인 응답 발화를 제어 및 사용자 의도를 예측하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
KR102617914B1 (ko) * 2023-05-10 2023-12-27 주식회사 포지큐브 음성 인식 방법 및 그 시스템
KR102632872B1 (ko) * 2023-05-22 2024-02-05 주식회사 포지큐브 음성인식 오류 교정 방법 및 그 시스템
KR102648689B1 (ko) * 2023-05-26 2024-03-18 주식회사 액션파워 텍스트 오류를 검출하는 방법
KR102616598B1 (ko) * 2023-05-30 2023-12-22 주식회사 엘솔루 번역 자막을 이용한 원문 자막 병렬 데이터 생성 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1351745A (zh) * 1999-03-26 2002-05-29 皇家菲利浦电子有限公司 客户一服务器语音识别
US20090204410A1 (en) * 2008-02-13 2009-08-13 Sensory, Incorporated Voice interface and search for electronic devices including bluetooth headsets and remote systems
US20120245941A1 (en) * 2011-03-21 2012-09-27 Cheyer Adam J Device Access Using Voice Authentication

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5165095A (en) * 1990-09-28 1992-11-17 Texas Instruments Incorporated Voice telephone dialing
US5345538A (en) * 1992-01-27 1994-09-06 Krishna Narayannan Voice activated control apparatus
US5428707A (en) * 1992-11-13 1995-06-27 Dragon Systems, Inc. Apparatus and methods for training speech recognition systems and their users and otherwise improving speech recognition performance
US5668929A (en) * 1993-01-21 1997-09-16 Hirsch Electronics Corporation Speech activated security systems and methods
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5704009A (en) * 1995-06-30 1997-12-30 International Business Machines Corporation Method and apparatus for transmitting a voice sample to a voice activated data processing system
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
DE69725270D1 (de) * 1996-07-11 2003-11-06 Sega Enterprises Kk Spieleingabevorrichtung und Spieleingabeverfahren mit Spracherkennung
US6092044A (en) * 1997-03-28 2000-07-18 Dragon Systems, Inc. Pronunciation generation in speech recognition
US6347299B1 (en) * 1997-07-31 2002-02-12 Ncr Corporation System for navigation and editing of electronic records through speech and audio
US6047255A (en) * 1997-12-04 2000-04-04 Nortel Networks Corporation Method and system for producing speech signals
US6145083A (en) * 1998-04-23 2000-11-07 Siemens Information And Communication Networks, Inc. Methods and system for providing data and telephony security
US6208971B1 (en) * 1998-10-30 2001-03-27 Apple Computer, Inc. Method and apparatus for command recognition using data-driven semantic inference
US6965863B1 (en) * 1998-11-12 2005-11-15 Microsoft Corporation Speech recognition user interface
US6606599B2 (en) * 1998-12-23 2003-08-12 Interactive Speech Technologies, Llc Method for integrating computing processes with an interface controlled by voice actuated grammars
US7082397B2 (en) * 1998-12-01 2006-07-25 Nuance Communications, Inc. System for and method of creating and browsing a voice web
US6411926B1 (en) * 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
WO2000058942A2 (en) * 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6266635B1 (en) * 1999-07-08 2001-07-24 Contec Medical Ltd. Multitasking interactive voice user interface
US6415257B1 (en) * 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
US6208917B1 (en) * 1999-12-23 2001-03-27 Daimlerchrysler Corporation Ambient temperature/inlet air temperature sensor dither
US6466654B1 (en) * 2000-03-06 2002-10-15 Avaya Technology Corp. Personal virtual assistant with semantic tagging
US7047192B2 (en) * 2000-06-28 2006-05-16 Poirier Darrell A Simultaneous multi-user real-time speech recognition system
US7171365B2 (en) * 2001-02-16 2007-01-30 International Business Machines Corporation Tracking time using portable recorders and speech recognition
US20020194003A1 (en) * 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US20030055535A1 (en) * 2001-09-17 2003-03-20 Hunter Engineering Company Voice interface for vehicle wheel alignment system
US6985865B1 (en) * 2001-09-26 2006-01-10 Sprint Spectrum L.P. Method and system for enhanced response to voice commands in a voice command platform
US7313525B1 (en) * 2001-09-26 2007-12-25 Sprint Spectrum L.P. Method and system for bookmarking navigation points in a voice command title platform
US6941265B2 (en) * 2001-12-14 2005-09-06 Qualcomm Inc Voice recognition system method and apparatus
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
US6959279B1 (en) * 2002-03-26 2005-10-25 Winbond Electronics Corporation Text-to-speech conversion system on an integrated circuit
US6965786B2 (en) * 2002-08-13 2005-11-15 Qualcomm Incorporated Annunciators for voice and data applications in wireless communication devices
US7660578B2 (en) * 2003-05-02 2010-02-09 Nokia Corporation Method for saving power in a wireless terminal and a terminal
FI20030660A0 (fi) * 2003-05-02 2003-05-02 Nokia Corp Menetelmä päätelaitteen tehonsäästöön langattomassa lähiverkossa ja päätelaite
US20050131677A1 (en) * 2003-12-12 2005-06-16 Assadollahi Ramin O. Dialog driven personal information manager
EP1562180B1 (en) * 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
US20060041926A1 (en) * 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
US8086425B2 (en) * 2004-06-14 2011-12-27 Papadimitriou Wanda G Autonomous fitness for service assessment
US7240010B2 (en) * 2004-06-14 2007-07-03 Papadimitriou Wanda G Voice interaction with and control of inspection equipment
KR100652645B1 (ko) * 2004-07-23 2006-12-06 엘지전자 주식회사 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법
US7624016B2 (en) * 2004-07-23 2009-11-24 Microsoft Corporation Method and apparatus for robustly locating user barge-ins in voice-activated command systems
US20060074658A1 (en) * 2004-10-01 2006-04-06 Siemens Information And Communication Mobile, Llc Systems and methods for hands-free voice-activated devices
US20060164205A1 (en) * 2005-01-27 2006-07-27 Buckingham Duane W Proximity wake-up activation of electronic circuits
KR100679044B1 (ko) * 2005-03-07 2007-02-06 삼성전자주식회사 사용자 적응형 음성 인식 방법 및 장치
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
KR100690800B1 (ko) 2005-06-10 2007-03-09 엘지전자 주식회사 음성인식을 이용한 음성 정보 저장 장치 및 방법
US20070073718A1 (en) 2005-09-14 2007-03-29 Jorey Ramer Mobile search service instant activation
US7620553B2 (en) * 2005-12-20 2009-11-17 Storz Endoskop Produktions Gmbh Simultaneous support of isolated and connected phrase command recognition in automatic speech recognition systems
US20070174388A1 (en) * 2006-01-20 2007-07-26 Williams Michael G Integrated voice mail and email system
KR100762636B1 (ko) * 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
US20070281748A1 (en) * 2006-05-31 2007-12-06 Spectralink Corp. Method & apparatus for unlocking a mobile phone keypad
KR100744301B1 (ko) 2006-06-01 2007-07-30 삼성전자주식회사 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법
US7881832B2 (en) * 2006-06-09 2011-02-01 Garmin International, Inc. Automatic speech recognition system and method for aircraft
US8234120B2 (en) * 2006-07-26 2012-07-31 Nuance Communications, Inc. Performing a safety analysis for user-defined voice commands to ensure that the voice commands do not cause speech recognition ambiguities
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US20080082338A1 (en) * 2006-09-29 2008-04-03 O'neil Michael P Systems and methods for secure voice identification and medical device interface
US20080140413A1 (en) * 2006-12-07 2008-06-12 Jonathan Travis Millman Synchronization of audio to reading
US8056070B2 (en) * 2007-01-10 2011-11-08 Goller Michael D System and method for modifying and updating a speech recognition program
US20110054900A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Hybrid command and control between resident and remote speech recognition facilities in a mobile voice-to-speech application
US8886545B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8886521B2 (en) * 2007-05-17 2014-11-11 Redstart Systems, Inc. System and method of dictation for a speech recognition command system
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
KR101056511B1 (ko) 2008-05-28 2011-08-11 (주)파워보이스 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템
KR101513615B1 (ko) * 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
US8498425B2 (en) * 2008-08-13 2013-07-30 Onvocal Inc Wearable headset with self-contained vocal feedback and vocal command
KR20100027865A (ko) * 2008-09-03 2010-03-11 엘지전자 주식회사 화자 및 음성 인식 장치 및 그 방법
KR101526998B1 (ko) * 2008-10-16 2015-06-08 엘지전자 주식회사 이동통신 단말기 및 그 절전 방법
WO2010075623A1 (en) 2008-12-31 2010-07-08 Bce Inc. System and method for unlocking a device
US8340969B2 (en) * 2009-04-24 2012-12-25 Research In Motion Limited Method and mobile communication device for generating dual-tone multi-frequency (DTMF) commands on a mobile communication device having a touchscreen
US20120004910A1 (en) * 2009-05-07 2012-01-05 Romulo De Guzman Quidilig System and method for speech processing and speech to text
US8217251B2 (en) * 2009-09-28 2012-07-10 Lawrence E Anderson Interactive display
US8924893B2 (en) * 2009-10-14 2014-12-30 At&T Mobility Ii Llc Locking and unlocking of an electronic device using a sloped lock track
US8335689B2 (en) * 2009-10-14 2012-12-18 Cogi, Inc. Method and system for efficient management of speech transcribers
US8717285B1 (en) * 2009-10-28 2014-05-06 Amazon Technologies, Inc. Orientation lock
KR101160071B1 (ko) * 2009-12-01 2012-06-26 (주)에이치씨아이랩 다중인식 음성 인터페이스장치 및 그 방법
US8626498B2 (en) * 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
US20110264452A1 (en) * 2010-04-27 2011-10-27 Ramya Venkataramu Audio output of text data using speech control commands
US11471091B2 (en) * 2010-07-29 2022-10-18 Kulangara Sivadas Mind strength trainer
US8402533B2 (en) * 2010-08-06 2013-03-19 Google Inc. Input to locked computing device
US20120052907A1 (en) 2010-08-30 2012-03-01 Sensory, Incorporated Hands-Free, Eyes-Free Mobile Device for In-Car Use
US20120133484A1 (en) * 2010-11-29 2012-05-31 Research In Motion Limited Multiple-input device lock and unlock
KR101208166B1 (ko) * 2010-12-16 2012-12-04 엔에이치엔(주) 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법
JP5695447B2 (ja) * 2011-03-01 2015-04-08 株式会社東芝 テレビジョン装置及び遠隔操作装置
US10146415B2 (en) * 2011-03-02 2018-12-04 Lenovo (Beijing) Limited Method and terminal device for controlling a terminal device in a locked and unlocked state
US8768707B2 (en) * 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US9395800B2 (en) * 2011-09-30 2016-07-19 Qualcomm Incorporated Enabling instant handwritten input on mobile computing devices
US8954334B2 (en) * 2011-10-15 2015-02-10 Zanavox Voice-activated pulser
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
US20130176108A1 (en) * 2012-01-06 2013-07-11 Intuit Inc. Automated mechanism to switch user data sets in a touch-based device
US8863042B2 (en) * 2012-01-24 2014-10-14 Charles J. Kulas Handheld device with touch controls that reconfigure in response to the way a user operates the device
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9536528B2 (en) * 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US9158372B2 (en) * 2012-10-30 2015-10-13 Google Technology Holdings LLC Method and apparatus for user interaction data storage
US8973104B2 (en) * 2012-12-31 2015-03-03 Google Technology Holdings LLC Method and system for providing limited usage of an electronic device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1351745A (zh) * 1999-03-26 2002-05-29 皇家菲利浦电子有限公司 客户一服务器语音识别
US20090204410A1 (en) * 2008-02-13 2009-08-13 Sensory, Incorporated Voice interface and search for electronic devices including bluetooth headsets and remote systems
US20120245941A1 (en) * 2011-03-21 2012-09-27 Cheyer Adam J Device Access Using Voice Authentication

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509119A (zh) * 2017-02-28 2018-09-07 三星电子株式会社 用于功能执行的电子设备的操作方法和支持其的电子设备
CN108509119B (zh) * 2017-02-28 2023-06-02 三星电子株式会社 用于功能执行的电子设备的操作方法和支持其的电子设备
CN108665890A (zh) * 2017-03-28 2018-10-16 三星电子株式会社 操作语音识别服务的方法、电子设备和支持该设备的***
CN108665890B (zh) * 2017-03-28 2023-10-13 三星电子株式会社 操作语音识别服务的方法、电子设备和支持该设备的***
CN108962236A (zh) * 2017-05-19 2018-12-07 Lg电子株式会社 家用电器及语音识别服务器***的动作方法
WO2019079974A1 (en) * 2017-10-24 2019-05-02 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR UNINTERRUPTED APPLICATION REVIEW AND VOICE RECOGNITION
CN110800045A (zh) * 2017-10-24 2020-02-14 北京嘀嘀无限科技发展有限公司 用于不间断应用唤醒和语音识别的***和方法
US10923119B2 (en) 2017-10-25 2021-02-16 Baidu Online Network Technology (Beijing) Co., Ltd. Speech data processing method and apparatus, device and storage medium
CN107808670A (zh) * 2017-10-25 2018-03-16 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
CN107911386A (zh) * 2017-12-06 2018-04-13 北京小米移动软件有限公司 获取服务授权信息的方法及装置
US11158318B2 (en) 2018-05-18 2021-10-26 Shenzhen Aukey Smart Information Technology Co., Ltd. AI voice interaction method, device and system
WO2019218370A1 (zh) * 2018-05-18 2019-11-21 深圳傲智天下信息科技有限公司 一种ai语音交互方法、装置及***
CN112334978A (zh) * 2018-08-08 2021-02-05 三星电子株式会社 支持个性化装置连接的电子装置及其方法
CN111063345A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制***
CN111063356A (zh) * 2018-10-17 2020-04-24 北京京东尚科信息技术有限公司 电子设备响应方法及***、音箱和计算机可读存储介质
CN111063345B (zh) * 2018-10-17 2024-01-05 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制***
CN111261153A (zh) * 2018-12-03 2020-06-09 现代自动车株式会社 车辆语音命令处理装置和方法
CN111261153B (zh) * 2018-12-03 2023-12-19 现代自动车株式会社 车辆语音命令处理装置和方法
CN112114887A (zh) * 2020-09-24 2020-12-22 北京小米移动软件有限公司 被控设备、唤醒被控设备的方法及存储介质
CN113409786A (zh) * 2021-07-07 2021-09-17 北京京东乾石科技有限公司 语音控制方法、装置、电子设备及计算机可读存储介质
CN113409786B (zh) * 2021-07-07 2023-12-05 北京京东乾石科技有限公司 语音控制方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN106448678B (zh) 2020-05-01
CN106297802B (zh) 2020-01-17
CN103456306B (zh) 2017-03-01
US10657967B2 (en) 2020-05-19
CN106297802A (zh) 2017-01-04
US9619200B2 (en) 2017-04-11
US20130325484A1 (en) 2013-12-05
EP2669889B1 (en) 2016-01-13
EP3001414B1 (en) 2017-09-20
EP3001414A1 (en) 2016-03-30
US20200279563A1 (en) 2020-09-03
EP2669889A2 (en) 2013-12-04
EP2669889A3 (en) 2014-01-01
US20170162198A1 (en) 2017-06-08
CN103456306A (zh) 2013-12-18
KR20130133629A (ko) 2013-12-09
US20190035399A1 (en) 2019-01-31
US11393472B2 (en) 2022-07-19

Similar Documents

Publication Publication Date Title
CN103456306B (zh) 用于在电子装置中执行语音命令的方法和设备
US10818289B2 (en) Method for operating speech recognition service and electronic device for supporting the same
KR101726945B1 (ko) 수동 시작/종료 포인팅 및 트리거 구문들에 대한 필요성의 저감
US10353495B2 (en) Personalized operation of a mobile device using sensor signatures
CN108735209A (zh) 唤醒词绑定方法、智能设备及存储介质
CN107924288A (zh) 电子设备及其使用语音识别来执行功能的方法
BR112015018905B1 (pt) Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
CN106293751A (zh) 一种在终端设备上显示信息的方法及终端设备
KR102561572B1 (ko) 센서 활용 방법 및 이를 구현한 전자 장치
KR20180047801A (ko) 전자 장치 및 전자 장치 제어 방법
CN108712566A (zh) 一种语音助手唤醒方法及移动终端
CN104217172B (zh) 隐私内容查看方法及装置
CN107402964A (zh) 一种信息推荐方法、服务器及终端
US20170010669A1 (en) Method for operating electronic apparatus and electronic apparatus supporting the method
EP2731369B1 (en) Mobile terminal and control method thereof
CN106973168A (zh) 语音播放方法、装置及计算机设备
CN109920309A (zh) 手语转换方法、装置、存储介质和终端
CN106126171B (zh) 一种音效处理方法及移动终端
CN108573704B (zh) 对永不熄屏通知使能基于场境的语音响应的方法和装置
CN104503736B (zh) 一种信息提示方法及装置
CN109064720B (zh) 位置提示方法、装置、存储介质及电子设备
CN108833688A (zh) 位置提醒方法、装置、存储介质及电子设备
KR101862216B1 (ko) 이동 단말기 및 그 제어방법
CN108287734A (zh) 连接控制方法、第一、第二终端及计算机可读存储介质
CN109829278A (zh) 终端解锁方法、移动终端及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant