CN104604274B - 利用语音在用户设备之间连接服务的方法和装置 - Google Patents
利用语音在用户设备之间连接服务的方法和装置 Download PDFInfo
- Publication number
- CN104604274B CN104604274B CN201380045946.3A CN201380045946A CN104604274B CN 104604274 B CN104604274 B CN 104604274B CN 201380045946 A CN201380045946 A CN 201380045946A CN 104604274 B CN104604274 B CN 104604274B
- Authority
- CN
- China
- Prior art keywords
- wireless device
- information
- equipment
- service
- connection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 238000004891 communication Methods 0.000 claims description 60
- 238000003860 storage Methods 0.000 claims description 32
- 230000002123 temporal effect Effects 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 2
- 230000000977 initiatory effect Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 29
- 230000008569 process Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 9
- 238000010295 mobile communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000003825 pressing Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 230000006855 networking Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000009849 deactivation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 241000256844 Apis mellifera Species 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000010409 thin film Substances 0.000 description 2
- 238000010977 unit operation Methods 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/24—Radio transmission systems, i.e. using radiation field for communication between two or more posts
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72412—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/06—Authentication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/50—Secure pairing of devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/60—Context-dependent security
- H04W12/65—Environment-dependent, e.g. using captured environmental data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
提供了一种在设备和至少一个其它设备之间连接服务的方法。该方法包括由设备记录在语音命令按钮已被输入的状态中输入的用户语音,当语音命令按钮的输入被取消时基于记录的用户语音输出第一信息,由设备接收与第一信息相对应的第二信息,根据第一信息和第二信息识别服务类型,在根据所识别的服务类型确定的设备的操作模式中将设备连接到对象设备,以及与连接的对象设备执行服务。
Description
技术领域
本发明概括而言涉及用于在用户设备之间连接服务的方法和装置,更具体而言涉及用于根据通过用户设备输入的用户语音在用户设备之间连接服务的方法和装置。
背景技术
随着近来数字技术的发展,正在引入各种能够执行通信和处理个人信息的便携式用户设备,诸如移动通信终端、个人数字助理(Personal Digital Assistant,PDA)、电子记事本、智能电话、平板个人计算机(Personal Computer,PC),等等。这种用户设备不需要保持在其各自的传统唯一使用区域中,而是达到了覆盖其它终端的使用区域的移动覆盖阶段。例如,用户设备可包括各种功能,用于执行语音呼叫、视频呼叫、文本消息发送(诸如短消息服务(Short Message Service,SMS)和多媒体消息服务(Multimedia MessageService,MMS)消息传送)、电子记事本功能、摄影、电子邮件发送和接收、广播重放、视频重放、互联网、电子商务、音乐重放、日程管理、社交网络服务(Social Networking Service,SNS)、朋友搜索服务、消息传递器(messenger)、字典、游戏以及无线局域网(WirelessLocal Area Network,WLAN)链接。
具体地,随着无线通信技术的发展,可用于在用户设备之间提供链接服务的各种无线连接正被开发和应用。例如,正在开发用于支持用户设备之间的链接服务的无线连接技术,诸如蓝牙、紫蜂和超宽带(Ultra-Wideband,UWB)。
为了使用这样的无线连接技术,需要复杂的过程,诸如***设备的搜索选择和认证、去到***设备的连接、对要共享的数据的选择以及对所选数据的发送的选择。
例如,为了在用户设备之间连接服务,用户设备之一首先在要连接到彼此的用户设备识别彼此的地址的状态中被作为主控设备(即,主控)来操作,然后另一用户设备被作为从属设备(即,从属)来操作,以便执行去到已经运行的主控的连接请求。另外,主控通过检查单独的预设代码以辨识出从属是否是打算连接到主控的从属来执行连接。
类似地,当打算使用现有用户设备之间的服务连接功能时,需要许多用户交互来执行必要的认证和服务连接,从而用户设备之间的服务连接变得对用户来说不方便。因此,需要一种服务,用于通过简化各种无线连接的复杂配对过程来改善用户方便性,以便执行用户设备之间的链接服务。
发明内容
技术问题
本发明是为了解决至少以上问题并且提供至少下述优点而作出的。本发明的一个方面要提供用于利用语音在用户设备之间连接服务的方法和装置,其能够简化至少两个用户设备之间的服务连接的过程。
技术方案
根据本发明的一方面,提供了一种在设备和至少一个其它设备之间连接服务的方法。该方法包括由设备记录在语音命令按钮已被输入的状态中输入的用户语音;当语音命令按钮的输入被取消时基于记录的用户语音输出第一信息;由设备接收与第一信息相对应的第二信息;根据第一信息和接收到的第二信息识别服务类型;在根据所识别的服务类型确定的设备的操作模式中将设备连接到对象设备;以及与连接的对象设备执行服务。
根据本发明的另一方面,提供了一种利用语音在设备和至少一个其它设备之间连接服务的方法。该方法包括由设备在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;接收用户语音的输入,记录接收到的用户语音,并且基于接收到的用户语音生成记录数据;当语音命令按钮的输入被取消时根据记录的时间戳、记录数据和设备的设备地址生成语音信息;将所生成的语音信息发送到服务器;从服务器接收服务信息;根据服务信息检查设备的操作模式、用于连接的对象设备的设备地址和执行服务的类型;根据检查出的操作模式将设备连接到对象设备;以及在连接到对象设备后根据检查出的执行服务的类型并且根据检查出的操作模式与连接的对象设备执行服务。
根据本发明的另一方面,提供了一种利用语音来连接服务的方法。该方法包括由第一设备在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;接收用户语音的输入并且通过记录输入的用户语音来生成记录数据;当语音命令按钮的输入被取消时生成包括记录的时间戳、记录数据和设备的设备地址的第一语音信息;将所生成的语音信息作为音频数据来加载并且通过第一设备的扬声器输出加载的音频数据;通过第一设备的麦克风接收通过第二设备的扬声器输出的第二语音信息;从第一语音信息和第二语音信息中检查第一设备的操作模式、用于与第一设备建立连接的第二设备的设备地址以及执行服务的类型;根据操作模式将第一设备连接到第二设备;以及在将第一设备连接到第二设备后根据执行服务的类型并且根据第一设备的操作模式来执行服务。
根据本发明的另一方面,提供了一种利用语音在设备和至少一个其它设备之间连接服务的方法。该方法包括在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;接收用户语音的输入并且通过记录输入的用户语音来生成记录数据;当语音命令按钮的输入被取消时通过利用记录数据的语音波形和记录的时间戳来生成具有唯一串的认证密钥;利用认证密钥来改变用于标识设备的设备信息;在预设的通信模式搜索具有与认证密钥相对应的设备信息的要与设备连接的对象设备;通过连接请求的发送和连接批准的接收来执行设备和对象设备之间的连接;以及在与对象设备执行连接后执行服务。
根据本发明的另一方面,提供了一种用于通过利用输入语音来支持设备与至少一个其它设备之间的服务连接的设备。该设备包括:存储单元,用于存储至少一个程序;以及控制器,用于执行至少一个程序来记录在语音命令按钮已被输入的状态中输入的用户语音,当语音命令按钮的输入被取消时基于记录的用户语音输出第一信息,接收与第一信息相对应的第二信息,根据第一信息和第二信息识别服务类型,在根据服务类型确定的设备的操作模式中将设备连接到对象设备,并且与连接的对象设备执行服务。
根据本发明的另一实施例,提供了一种非暂态计算机可读记录介质,其记录了用于执行在设备和至少一个其它设备之间连接服务的方法的程序。该方法包括由设备记录在语音命令按钮已被输入的状态中输入的用户语音;当语音命令按钮的输入被取消时基于记录的用户语音输出第一信息;由设备接收与第一信息相对应的第二信息;根据第一信息和接收到的第二信息识别服务类型;根据所识别的服务类型确定设备的操作模式;以及根据所确定的操作模式在设备和对象设备之间执行服务连接。
本发明的另一方面提供了一种计算机程序,其包括被布置为当被执行时实现依据上述方面中的任何一个的方法、***和/或装置的指令。又一方面提供了一种存储这种程序的机器可读存储装置。
从下列结合附图、公开本发明的示范性实施例的详细描述,本领域技术人员将清楚本发明的其它方面、优点和显著特征。
有益效果
如上所述,根据依据本发明的实施例的利用语音在用户设备之间连接服务的方法和装置,通过简化至少两个设备之间的连接的过程以及根据其的服务连接来容易且迅速地执行用户想要的服务。根据本发明的实施例,用户可以通过在用户设备各自的语音命令按钮被按压的状态中说出(即,输入)请求设备连接的语音命令来容易且迅速地自动建立用户设备之间的连接。另外,用户可以通过在用户设备各自的语音命令按钮被按压的状态中说出请求设备连接和打算实际执行的服务的语音命令,来容易且迅速地通过用户设备之间的连接来自动执行服务。
根据本发明的实施例,根据向每个用户设备输入用户语音时的时间差来自动确定各个用户设备之间的主控模式和从属模式,并且当各个用户设备相互连接时,可自动执行根据用户语音的服务(例如,数据传送、根据模式的操作的执行)。从而,用户只要通过利用各个用户设备的语音命令按钮根据服务和连接设备输入语音命令来简单地连接用户设备,就可以自动发起服务的执行。
因此,根据本发明的实施例,通过实现用户设备之间的连接的最优环境并且支持服务的执行,可以改善用户的方便性,并且可以改善用户设备的易用性、方便性和竞争力。本发明可以方便地在所有形式的用户设备以及与这样的用户设备相对应的其它各种设备中实现。
附图说明
从下列结合附图的详细描述,本发明的以上和其它方面以及特征和优点将更加清楚,附图中:
图1示意性图示了根据本发明的实施例的在用户设备之间连接服务的操作;
图2示意性图示了根据本发明的实施例的用户设备的配置;
图3示意性图示了根据本发明的实施例的用于处理功能的用户设备的平台结构;
图4是图示出根据本发明的实施例的用户设备之间的服务连接的过程的信号流程图;
图5图示了根据本发明的实施例的存储在用户设备的服务连接中使用的语音信息的示例;
图6是图示出根据本发明的实施例的在用户设备中基于用户语音的服务连接的过程的流程图;
图7是图示出根据本发明的实施例的在服务器中认证用户设备的过程的流程图;
图8示意性图示了根据本发明的实施例的在用户设备之间连接服务的构思;
图9是图示出根据本发明的实施例的用户设备之间的服务连接的过程的信号流程图;
图10是图示出根据本发明的实施例的用户设备中的基于用户语音的服务连接的流程图;并且
图11和图12是图示出根据本发明的实施例在用户设备中基于用户语音来处理服务连接的过程的流程图。
具体实施方式
参考附图来详细描述本发明的实施例如下。提供下列描述来帮助对如权利要求限定的本发明的全面理解。描述包括各种具体细节以帮助该理解,但这些细节应被视为只是示范性的。因此,本领域普通技术人员将会认识到,在不脱离本发明的范围的情况下,可以对本文描述的实施例进行各种改变和修改。
在下列描述和权利要求中使用的术语和词语不受限于字面含义,而只是被发明人用来使得能够对于本发明有清楚且一致的理解。因此,本领域技术人员应当清楚,提供下列对本发明的示范性实施例的描述只是为了说明,而不是为了限制如权利要求限定的本发明。
贯穿各图,相同或相似的标号可用于指代相同或相似的部件。为了清晰和简洁并且为了避免模糊本发明的主题,可省略对公知的过程、功能、构造和结构的详细描述。
贯穿本说明书的描述和权利要求,词语“包括”和“包含”及这些词语的变体指的是“包括但不限于”,并且并不打算排除(而且不排除)其它元素、特征、组件、整体、步骤、过程、功能、特性等等。
贯穿本说明书的描述和权利要求,单数形式(例如,“一”、“一个”)涵盖复数形式,除非上下文另有要求。从而,例如,对“一物体”的提及包括对一个或多个这种物体的提及。
结合本发明的特定方面、实施例或示例描述的元素、特征、组件、整体、步骤、过程、功能、特性等等应被理解为可适用于本文描述的任何其它方面、实施例或示例,除非与之不兼容。
还将理解,贯穿本说明书的描述和权利要求,“用于Y的X”这种一般形式的语言(其中Y是某个动作、过程、活动或步骤,X是某种用于执行该动作、活动或步骤的装置)涵盖了具体地——但不是专门地——适配于、配置为或者布置为进行Y的装置X。
本发明涉及用于在用户设备之间连接服务(例如,连接用户设备以使得用户设备能够参与服务)的方法、装置和***,更具体而言涉及用于利用通过用户设备输入的用户语音在用户设备之间连接服务的方法、装置和***。根据本发明的实施例,利用在用户设备中输入的用户语音来自动执行用于连接用户设备并且用于在连接的用户设备之间连接服务的认证过程。
根据本发明的实施例,用户输入与要在至少两个用户设备中执行的服务相对应的命令。具体而言,命令被输入到用户打算通过服务来相互连接的设备(例如,通过设备连接、设备连接之后的数据共享、设备连接之后的指定功能的执行(例如,扬声器模式、WiFi显示,等等))。可以以语音命令的形式输入命令。然后,各个用户设备确定主控模式(或者接入点(Access Point,AP)模式)和从属模式(或者非AP模式),并且在所确定的模式中自动执行与语音命令相对应的服务连接。以这种方式,各个用户设备可根据用户的语音命令自动执行相互连接,并且利用该连接来执行服务。
根据本发明的实施例,在主控模式中操作的设备可以是至少两个用户设备之中的其中经由语音命令按钮执行了用于执行服务连接过程的输入的设备,并且可以是发送数据的设备。另外,在从属模式中操作的设备可以是至少两个用户设备之中的其中经由语音命令按钮稍后(即,晚于主控设备中的相应输入)执行用于执行服务连接过程的输入的设备,并且可以是从主控模式的设备接收数据的设备。
根据本发明的实施例,对于用户设备之间的服务连接的认证可利用来自用户的语音波形输入来执行,并且对于连接的各个用户设备的主控模式和从属模式的确定可通过对来自用户的语音输入的时间分析来执行。另外,各个用户设备连接之后要执行的服务可通过与来自用户的语音输入相对应的参数分析(或通过命令)来确定。对于这样的设备之间的服务连接的认证可通过与服务器通信或链接或者通过使用设备之间交换的数据来执行。
例如,当与服务器链接时,设备(例如,第一设备)在语音命令按钮被输入或促动时(例如,在用户按压语音命令按钮时)记录时间戳。第一设备在对语音命令按钮的促动被维持的同时(例如,在语音命令按钮保持被用户按压的同时)等待接收用户语音输入,并且通过记录通过麦克风输入的用户语音来生成记录数据。当对语音命令按钮的促动被取消时(例如,当用户释放被按压的语音命令按钮时),第一设备生成包括时间戳、记录数据和第一设备的设备地址的语音信息,并且将所生成的语音信息发送给服务器。作为响应,第一设备从服务器接收与该语音信息相对应的服务信息,并且从接收到的服务信息检查第一设备的操作模式、第一设备要连接到的第二设备的设备地址以及执行的服务的类型。另外,根据操作模式在第一设备和第二设备之间建立连接,随后第一设备在与第二设备连接时根据操作模式、根据执行的服务类型执行服务。
另外,当在设备本身之间直接交换数据时,第一设备记录语音命令按钮被促动之时的时间戳,等待接收用户语音输入,并且通过记录用户通过麦克风的语音输入来生成记录数据。当对语音命令按钮的促动被取消时,第一设备生成包括时间戳、记录数据和第一设备的设备地址的第一语音信息,利用所生成的语音信息来生成声音,并且通过扬声器输出与语音信息相对应的声音以使得第二邻近设备可检测到该声音。作为响应,第二设备通过扬声器输出与第二语音信息相对应的声音,以使得第一设备可通过麦克风检测到该声音并且接收第二语音信息作为输入。第一设备从第一语音信息和第二语音信息中检查第一设备的操作模式、第一设备要连接到的第二设备的设备地址以及执行服务的类型。另外,在第一设备和第二设备之间建立连接,随后第一设备在与第二设备连接时根据与操作模式相对应的执行的服务的类型执行服务。
在下文中,参考附图来描述根据本发明的实施例的用户设备的配置和控制用户设备的方法。根据本发明的实施例的用户设备的配置和控制其操作的方法不限于以下描述,从而应当注意,本发明可应用到例如基于以下实施例的各种其它实施例。
图1是示意性图示出根据本发明的实施例的在用户设备之间连接服务的操作的图。
如图1所图示的,根据本发明的实施例的用于基于用户语音来执行服务连接的***包括第一用户设备100、第二用户设备200和服务器300。在本示例中,利用两个用户设备100和200来描述服务连接操作。然而,本发明的实施例不限于此。例如,两个或更多个用户设备之间的服务连接根据本发明的实施例也是可能的。
第一用户设备100和第二用户设备200包括语音命令按钮150,用于指示各个设备100和200等待接收从用户输入的语音以便基于语音执行服务连接。依据本发明的实施例,语音命令按钮150可以按各种方式来实现,例如以硬件按钮、软界面(例如,图形用户界面(Graphical User Interface,GUI))等等的形式实现。用户可在第一用户设备100和第二用户设备200的语音命令按钮150被按压的同时输入语音(例如,语音命令)。
第一用户设备100和第二用户设备200在感测到经由语音命令按钮150的输入后等待接收用户语音输入。此时,第一用户设备100和第二用户设备200可记录语音命令按钮150被促动的时间值作为时间戳。另外,第一用户设备100和第二用户设备200记录在语音命令按钮150被按压的同时输入的用户语音(生成记录数据),并且在对语音命令按钮150的促动被取消时对记录的语音(记录数据)执行语音识别。第一用户设备100和第二用户设备200可以在作为语音识别的结果检测到用于在用户设备之间建立连接的命令时向服务器300发送包括记录数据(尤其是波形)、时间戳和设备标识符的语音信息。
第一用户设备100和第二用户设备200向服务器300发送语音信息,并且从服务器300接收与语音信息相对应的服务信息。另外,当从服务器300接收到服务信息时,第一用户设备100和第二用户设备200建立连接,使得第一用户设备100和第二用户设备200根据服务信息相互连接,并且第一用户设备100和第二用户设备200执行服务。此时,第一用户设备100和第二用户设备200分析接收到的服务信息,并且确定服务类型、连接信息(要连接的设备的设备信息)、执行信息等等。另外,第一用户设备100和第二用户设备200根据服务类型确定主控模式或从属模式,在所确定的模式中根据按照连接信息与另一设备设定的通信方法执行连接,并且在与对应于连接信息的设备连接时根据执行信息执行服务。
根据本发明的实施例,通信方法可包括各种无线通信方法,例如无线局域网(Wireless Local Area Network,WLAN)连接、蓝牙连接、WiFi直接连接、WiFi显示连接、近场通信(Near Field Communication,NFC)连接等等。连接中使用的通信方法可利用任何适当的方式来确定。例如,可根据用户或默认设定来确定该方法,可根据最近执行的连接方法来自动确定该方法,或者可以随机确定该方法。
根据本发明的实施例,执行信息表示要执行的服务的类型。要执行的服务的类型可包括例如数据共享(发送)、左右扬声器联动功能以及指示输入和输出联动功能的某些功能(操作)的信息等等。
服务器300搜索在相同时间区间(例如,时段)期间发送了相同记录数据的至少两个设备,并且将搜索到的设备确定为用于搜索到的设备之间的服务连接的一组设备。另外,关于用于支持一组所确定的设备之间的服务连接的服务的信息可被分别发送到该组设备。
具体而言,服务器300存储来自各种用户设备——例如第一用户设备100和第二用户设备200——的语音信息。具体地,服务器300从用户设备(例如,图1的第一用户设备100和第二用户设备200)接收语音信息,并且可以通过根据设备对接收到的语音信息进行划分或分类来将接收到的语音信息存储在数据库中。此时,当存储语音信息时,服务器300解析语音信息以提取设备信息、记录数据(波形)、时间戳、连接信息(例如,设备地址)以及原始数据等等,然后存储这些信息。
当从用户设备接收到语音信息时,服务器300根据语音信息比较并分析语音波形,以用于对发送了语音信息的用户设备的连接认证。在数据库中比较并检测与接收到的语音信息的语音波形一致的语音波形。
当检测到相同(例如,匹配)的语音波形时,服务器300比较具有相同语音波形的各个用户设备的语音信息集合中的时间戳,并且根据依据每个时间戳的时间差确定每个用户设备的操作模式的服务类型。服务器300从语音信息的记录数据识别语音参数(命令)并且生成执行信息。另外,服务器300利用服务类型、连接信息和每个设备的执行信息分别生成要发送到每个用户设备的服务信息,并且将所生成的服务信息分别发送到被确定为具有相同语音波形的用户设备。此时,假定所确定的用户设备是第一用户设备100和第二用户设备200,则可向第一用户设备100和第二用户设备200提供另一服务信息集合。
例如,发送到第一用户设备100的服务信息可以是指示在主控模式的操作的服务类型信息、指示第二用户设备200的设备标识符(例如,设备地址等等)的连接信息以及具有关于要执行的服务的执行信息的第一服务信息。另外,发送到第二用户设备200的服务信息可以是指示在从属模式的操作的服务类型信息、指示第一用户设备100的设备标识符(例如,设备地址等等)的连接信息以及具有关于要执行的服务的执行信息的第二服务信息。
根据具有以上配置的本发明的实施例,各个用户设备100和200提供硬件或软件型语音命令按钮150,用于支持基于用户语音的服务连接。用户像在第一用户设备100和第二用户设备200中那样在同时或预设的误差范围内按压相互连接的两个或更多个用户设备各自的语音命令按钮150。另外,用户在按压各个语音命令按钮150之后(经由话音)输入期望的语音服务命令并且取消各个语音命令按钮150的被按压状态。
第一用户设备100和第二用户设备200通过用户语音识别模块对通过麦克风输入并且在检测到对基于语音命令按钮150的输入的取消时存储的用户语音执行语音识别。另外,如果在根据语音识别的结果中检测到用于发起设备之间的服务连接的预定义命令(例如,“设备连接”),则在服务连接中需要的语音信息,诸如记录数据、时间戳和设备标识符(例如,设备地址),可分别被发送到服务器300。
如果从用户设备(例如,第一用户设备100和第二用户设备200)接收到语音信息,则存储该语音信息,并且比较各个存储的信息集合,从而执行对于具有相关语音信息的至少两个用户设备的搜索。例如,服务器300可接收相同波形(或者一定误差范围内的相似语音波形),或者可搜索在一定误差范围内具有相似时间戳的两个或更多个用户设备。服务器300在比较语音信息时可使用任何适当的技术,例如试探法。也就是说,服务器300不必搜索完全一致或匹配的数据(语音信息),而是可搜索足够相似的数据(在一定误差范围内相同或相似的数据)。例如,服务器300可使用如下方法:在分析的初始步骤只分析某些变量(例如,相对重要的变量)而不必考虑所有变量,逐渐扩展变量的范围,并且缩窄相应的数据。下文中,为了便于说明,基于对至少两组数据的比较来确定一致的数据。
另外,当搜索具有相关语音信息的两个或更多个用户设备时,服务器300可分析语音信息的记录数据。此时,在记录数据分析中分析各个搜索出的语音信息集合。在根据本发明的实施例的一个示例中,各个语音信息集合的记录数据可以是从一个用户输入的相同记录数据,从而可以只分析一个记录数据集合。例如,服务器300可通过对记录数据的分析(例如,语音识别)来识别语音命令(或者语音参数)(例如,“设备连接”、“设备连接当前图像文件发送”、“设备连接WiFi显示”、“设备连接扬声器”、“设备连接电话簿传发送”等等)。因此,服务器300可识别打算通过设备之间的连接执行的服务的类型。
当根据以上操作确定了一致的用户设备和打算执行的服务的类型时,服务器300按照所确定的用户设备生成包括服务类型、连接信息和执行信息的服务信息,并将所生成的服务信息发送到每个用户设备。
分别从服务器300接收到服务信息的一组用户设备(例如,第一用户设备100和第二用户设备200)根据服务类型从接收到的服务信息确定主控模式或从属模式,并且在相应的模式根据连接信息连接到要连接的对象的用户设备(例如,第一用户设备或第二用户设备200),并且可根据执行信息执行服务。例如,第一用户设备100和第二用户设备200可形成无线LAN链路,并且当建立了相互连接时,被确定为主控的用户设备可向对方用户设备发送当前显示的图像文件。另外,被确定为主控的用户设备可作为左扬声器操作,而被确定为从属的用户设备可作为右扬声器操作(或者反之),从而分别输出在主控设备中重放的媒体文件的音频。另外,被确定为主控的用户设备可作为输入装置操作,而被确定为从属的用户设备可作为显示装置操作,从而可通过从属用户设备来显示主控用户设备输入的信息。另外,在被确定为主控的用户设备中显示的数据可被发送到被确定为从属的用户设备,使得在主控用户设备中显示的数据可与从属用户设备共享来显示。
图2是示意性图示出根据本发明的实施例的用户设备的配置的图。在图2中,用户设备表示第一用户设备100和第二设备200,并且图2的配置可对第一用户设备100和第二用户设备两者实现。
参考图2,根据本发明的实施例的用户设备可包括无线通信单元210、用户输入单元220、显示单元230、音频处理单元240、存储单元250、接口单元260、控制器270和电力供应单元280。在某些实施例中,图2中所图示的用户设备的组件中的一个或多个非必要组件可被省略。因此,根据本发明的某些替换实施例的用户设备可包括比图2中所图示的那些更多或更少的组件。
无线通信单元210包括允许用户设备与无线通信***之间或者用户设备与用户设备所位于的网络之间的无线通信的至少一个模块。例如,无线通信单元210可包括移动通信模块211、无线局域网(WLAN)模块213、短程通信模块215、位置计算模块217和广播接收模块219中的一个或多个。
移动通信模块211在移动通信网络上与基站、外部设备和服务器中的至少一者发送和接收无线信号。无线信号根据语音呼叫信号、视频呼叫信号或文本/多媒体消息的发送和接收可包括各种形式的数据。移动通信模块211通过移动通信网络向预定义的服务器300发送语音信息,并且根据用户设备的服务连接模式接收与语音信息相对应的服务信息。根据本发明的实施例,语音信息可包括用户语音的记录数据和执行用户设备之间的服务连接所必要的相关信息。相关信息可包括时间戳和用户设备的标识信息(例如,地址、标识符、电话号码等等)。另外,根据本发明的实施例,服务信息包括为用户设备确定的模式信息(例如,主控模式或从属模式)、在所确定的模式中要执行的功能信息以及为了服务连接而要连接的设备的用户设备的设备信息。
无线LAN模块213是用于执行无线互联网连接以及用于与另一用户设备形成无线LAN链路的模块,并且可内部地或外部地安装在用户设备中。无线互联网技术的一些示例是无线LAN(WLAN)、WiFi、无线宽带(Wireless broadband,Wibro)、微波接入全球互通(Worldinteroperability for Microwave Access,Wimax)和高速下行链路封包接入(High SpeedDownlink Packet Access,HSDPA)。无线LAN模块213可通过无线互联网发送在本发明中定义的语音信息或者从服务器300接收服务信息。当用于用户设备的服务连接的连接方法被设定为无线LAN方法时,无线LAN模块213与对应于服务信息的用户设备形成无线LAN链路。
无线通信模块215是用于执行短程通信的模块。短程通信的一些示例包括蓝牙、射频识别(Radio Frequency IDentification,RFID)、红外数据联盟(InfraRed DataAssociation,IrDA)、超宽带(Ultra WideBand,UWB)、紫蜂和近场通信(Near FieldCommunication,NFC)。如果用于用户设备的服务连接的连接方法被设定为短程通信方法,则短程通信模块215可与对应于服务信息的用户设备形成短程通信链路。
位置计算模块215是用于获取用户设备的位置的模块,并且其代表性示例是全球定位***(Global Position System,GPS)。位置计算模块215可计算离三个或更多个基站或卫星的距离信息和准确时间信息,然后对计算出的信息应用三角法,从而获取根据纬度、经度和高度的三维当前位置信息。另外,位置计算模块215可通过从三个或更多个卫星连续地实时接收用户设备的当前位置来计算位置信息。可按各种方法来获取用户设备的位置信息。
广播接收模块219通过广播信道(例如,卫星信道、地面信道等等)从外部广播管理服务器接收广播信号(例如,电视(TV)广播信号、无线电广播信号、数据广播信号等等)和/或广播相关信息(例如,与广播频道、广播节目或广播服务提供商有关的信息)。根据本发明的实施例通过广播接收模块219接收的广播信号可被发送(或者流传输)到对方用户设备,然后被显示。
用户输入单元220生成通过用户对用户设备的操作控制的输入数据。用户输入单元220可包括小键盘、圆顶开关、触摸板(恒定电压/恒定电流)、缓动盘、滚轮开关等等中的一个或多个。具体地,用户输入单元220可包括例如硬件或软件界面型的语音命令按钮150,其发起本发明的基于语音的服务连接的过程。
显示单元230显示(输出)在用户设备中处理的信息。例如,如果用户设备处于呼叫模式中,则显示呼叫相关用户界面(User Interface,UI)或图形用户界面(Graphic UserInterface,GUI)。另外,当用户设备正在视频呼叫模式或摄影模式中操作时,显示单元230显示拍摄的和/或接收到的图像或UI和GUI。显示单元230显示与在内部或外部收集的消息有关的UI或GUI。显示单元230可显示在本发明的基于语音的服务连接之时执行的执行屏幕。例如,当语音命令按钮150被输入时,可显示与如下屏幕有关的UI或GUI:引导语音输入的引导屏幕、根据输入用户语音的认证执行的认证处理屏幕、以及根据服务信息、要连接的设备的设备信息、连接的设备和执行的服务的执行信息等等来确定的模式信息的服务执行屏幕等等。
显示单元230可包括以下各项中的至少一者:液晶显示器(Liquid CrystalDisplay,LCD)、薄膜晶体管-液晶显示器(Thin Film Transistor-Liquid CrystalDisplay,TFT LCD)、发光二极管(Light Emitting Diode,LED)、有机LED(Organic LED,OLED)、有源矩阵OLED(Active Matrix OLED,AMOLED)、柔性显示器、弯曲显示器和三维(three-dimensional,3D)显示器。这些显示器中的一些可实现为透明显示器(包括透明型或光透射型透明显示器中的任一种),使得显示器的相反侧也可被查看。
根据本发明的实施例,当显示单元230和用于感测触摸操作的触摸面板形成互层结构(下文中称为“触摸屏”)时,显示单元230除了用作输出设备以外也可用作为输入设备。在此情况下,触摸面板可被配置为将施加到显示单元230的某个部分的压力或在显示单元230的某个部分上生成的电容的变化转换成电输入信号。触摸面板可被配置为检测与触摸相对应的压力,以及检测被触摸的位置和区域。当接收到对触摸面板的触摸输入时,相应的信号可被发送到触摸控制器(未示出)。触摸控制器处理这些信号并且将相应数据发送到控制器270。这样,控制器270被告知显示单元230的哪个部分被触摸了。
音频处理单元240把从控制器270输入的音频信号发送到扬声器241,并且把从麦克风243输入的诸如语音之类的音频信号发送到控制器270。音频处理单元240根据控制器270的控制通过扬声器把语音/声音数据转换成可听的声音,并且把从麦克风243接收的诸如语音之类的音频信号转换成数字信号,以将转换后的信号发送到控制器270。具体地,根据本发明的实施例的音频处理单元240在控制器270的控制下通过扬声器241输出包含语音信息(尤其是记录数据(语音波形)、时间戳等等)的声音,接收包含语音信息的声音,并将声音发送到控制器270。根据本发明的实施例,音频处理单元240和扬声器241中的至少一者包括额外的电路或电子部件(例如,电阻器、电容器等等),使得输出的声音通过存在于邻近区域的另一用户设备的麦克风243输入。
扬声器241可在于呼叫模式、记录模式、语音识别模式、广播接收模式等等中操作的同时输出从无线通信单元210接收的音频数据,或者输出存储单元250中存储的音频数据。扬声器241输出与在用户设备中执行的功能有关的声音信号(例如,呼叫信号接收声音、消息接收声音和音乐内容等等的重放)。扬声器241根据本发明的实施例可根据预定的输出强度输出包括语音信息的声音,这在下文中更详细描述。
麦克风243在于呼叫模式、记录模式、语音识别模式等等中操作的同时接收外部声音信号,并且把接收到的外部声音信号作为电语音数据来处理。语音数据被转换成可通过移动通信模块211发送到移动台基站的形式,然后转换后的数据被输出。在麦克风243中可实现用于去除在接收外部声音信号的过程中生成的噪声的各种噪声去除算法。根据本发明的实施例,麦克风243可接收从另一用户设备的扬声器(未示出)输出的声音,然后将这些声音发送到控制器270。
存储单元250存储用于控制器270的处理和控制的程序,并且执行用于临时存储输入/输出数据(例如,电话号码、消息、音频、静止图像、电子书、运动图像、语音信息、日志信息等等)的功能。每个数据项的使用频率(例如,每个电话号码、每个消息和每个多媒体等等的使用频率)及其重要度可被一起存储在存储单元250中。另外,关于在触摸屏上输入触摸之时输出的振动和声音的各种模式的数据可被存储在存储单元250中。具体地,存储单元250可存储在服务连接之时要执行的通信方案、从服务器300接收的服务信息、服务开始命令(例如,“设备连接”等等)、服务命令(例如,“发送文件”、“共享地址列表”、“执行扬声器”和“连接键盘”等等)。根据本发明的实施例,开始命令和服务命令可根据用户设定或者按任何其它适当的方式来定义。对于服务命令,用户设备要操作的功能的功能信息(例如,指示出在键盘连接之时用户设备是将作为输入装置操作还是作为显示装置操作的信息、指示出在执行扬声器时用户设备将负责左声音还是右声音的信息,等等)可被一起映射。另外,存储单元250可存储图3的平台,这在下文中描述。
存储单元250包括以下各项中的至少一者:闪存型、硬盘型、微型和卡型(例如,安全数字(Secure Digital,SD)或XD)存储器、随机访问存储器(Random Access Memory,RAM)、静态RAM(Static RAM,SRAM)、只读存储器(Read-Only Memory,ROM)、电可擦除可编程ROM(Electrically Erasable Programmable ROM,EEPROM)、可编程ROM(ProgrammableROM,PROM)、磁RAM(Magnetic RAM,MRAM)、磁盘和光盘型存储器等等。用户设备在操作时也可在远程互联网位置中利用web存储来执行存储单元250的存储功能。
接口单元260提供去到连接到用户设备的外部设备的连接路径。接口单元260从外部设备接收数据,被提供电力以向用户设备内部的每个组件发送电力,和/或把用户设备内部的数据发送到外部设备。例如,有线/无线头戴式受话器端口、外部充电器端口、有线/无线数据端口、存储卡端口、用于连接包括标识模块的设备的端口、音频输入/输出(Input/Output,I/O)端口、视频I/O端口、耳机端口等等可被包括在接口单元260中。
控制器270控制用户设备的整体操作。例如,控制器270执行针对语音呼叫、数据通信、视频呼叫等等的相关控制和过程。控制器270包括用于多媒体的播放或重放的多媒体模块(未示出)。多媒体模块(未示出)可在控制器270中实现或者可与控制器270分开实现。具体地,控制器270可通过利用通过本发明的用户设备输入的用户语音来控制与用户设备之间的服务的自动连接和执行有关的整体操作。
例如,当由语音命令按钮150启动服务时,控制器270基于通过麦克风243的语音输入控制语音信息的生成,并且控制在感测到语音命令按钮150的取消之时生成的语音信息被通过无线通信单元210发送到服务或者通过扬声器241输出到外部。另外,当从服务器300接收到服务信息时,控制器270根据接收到的服务信息确定用户设备的模式,并且根据所确定的模式来控制服务连接和服务执行。另外,当通过麦克风243从另一用户设备接收到声音信息时,控制器270根据接收到的语音信息确定用户设备的模式并且根据所确定的模式控制服务连接和服务执行。因此,控制器270负责与用户设备之间的服务连接有关的整体控制,以及依据本发明的实施例的利用语音的服务执行功能。控制器270的详细控制操作在本文中参考图针对用户设备的操作示例及其控制方法来描述。
电力供应单元280被提供以外部和内部电力并且按照控制器的控制提供每个组件的操作所必要的电力。
虽然在图2中没有图示,但是语音识别模块(未示出)可在存储单元250和控制器270中的至少一者中被存储或加载,或者可被实现为单独的组件。
另外,依据本发明的实施例描述的各种实施例可以用软件、硬件或者可由计算机等读取的记录介质或者它们的组合来实现。根据硬件实现方式,本发明的实施例可利用以下各项中的至少一者来实现:专用集成电路(Application Specific IntegratedCircuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理器件(Digital Signal Processing Device,DSPD)、可编程逻辑器件(Programmable LogicDevice,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、处理器、控制器、微控制器、微处理器和用于执行其它功能的电单元。在一些情况下,根据本发明的实施例执行的某些操作可由控制器270执行。根据软件实现方式,本说明书中描述的诸如过程和功能之类的实施例可实现为单独的软件模块。每个软件模块可执行本文描述的一个或多个功能和操作。
另外,本发明的图1的用户设备可包括利用应用处理器、图形处理单元(GraphicProcessing Unit,GPU)和中央处理单元(Central Processing Unit,CPU)的所有设备,例如所有支持本发明的实施例的功能的信息通信设备、多媒体设备及其应用设备。例如,用户设备可包括诸如以下的各种设备:平板个人计算机(Personal Computer,PC)、智能电话、数字相机、便携式多媒体播放器(Portable Multimedia Player,PMP)、媒体播放器、便携式游戏机、膝上型计算机和个人数字助理(Personal Digital Assistant,PDA),以及根据与各种通信***相对应的每种通信协议操作的移动通信终端。另外,根据本发明的实施例的控制功能的方法可应用到各种显示设备,诸如数字TV、数字标牌(Digital Signage,DS)和大型显示器(Large Format Display,LFD)。
图3示意性图示了根据本发明的实施例的用于处理功能的用户设备的平台结构。
参考图3,根据本发明的实施例的用户设备的平台可包括基于软件的操作***(Operating System,OS)来执行与利用以上语音的服务连接有关的各种操作。如图3中所图示的,用户设备可被设计为包括内核310、语音识别框架330和共享服务应用350。
内核310是OS的核心,并且执行包括以下各项中的至少一者的操作:硬件驱动器、设备内的硬件和处理器的安全、***资源的高效管理、存储器管理、通过硬件抽象为硬件提供接口、多进程以及服务连接管理。内核310内的硬件驱动器包括以下各项中的至少一者:显示驱动器、输入设备驱动器、WiFi驱动器、蓝牙驱动器、USB驱动器、音频驱动器、电力管理器、绑定器驱动器(binder driver)和存储器驱动器。
语音识别框架330包括作为共享服务应用350层内的应用的基础的程序。语音识别框架330可与任何应用兼容,可再利用组件,并且移动和交换可以是可能的。语音识别框架330可包括支持程序、用于连接其它软件组件的程序等等。例如,语音识别框架330可包括声音记录器351、引擎管理器353、话音识别引擎355、连接管理器357和服务管理器359等等。
声音记录器351可从麦克风243接收输入,记录通过内核310发送的用户的语音,并且生成记录数据。
引擎管理器353把从声音记录器351发送的记录数据发送到话音识别引擎355,并且根据从话音识别引擎355发送的结果信息把语音信息发送到连接管理器357。引擎管理器353可对在输入语音命令按钮150时的输入时间记录时间戳。另外,当话音识别引擎355已发送的分析结果指示出语音输入是请求服务连接的命令时,引擎管理器353可生成时间戳、记录数据和包括设备的设备地址的语音信息以发送到连接管理器357并且请求要发送的数据的发送。
话音识别引擎355分析通过引擎管理器353发送的记录数据。更具体而言,话音识别引擎355可分析记录数据并且分析是否包括请求服务连接的开始命令。当根据记录数据被理解为请求设备之间的服务连接的命令时,话音识别引擎355将其分析的结果发送到引擎管理器353。根据本发明的实施例,话音识别引擎355把输入信号转换成文本或语音,并且可由用于将输入文本转换成语音的文本到话音(Text-To-Speech,TTS)引擎和用于将语音转换成消息的文本的话音到文本(Speech-To-Text,STT)引擎构成。
连接管理器357从引擎管理器353接收语音信息,并且通过无线通信单元210把接收到的语音信息发送到服务器300。然后,服务器300判定其它设备是否发送了具有在相同时间区间(例如,时段)中的时间戳的相同或相似的记录数据,并且如果有具有相同记录数据和相同时间区间的时间戳的设备,则用于与该设备的服务连接的服务信息被发送到该设备。从而,如果从服务器300接收到服务信息,则连接管理器357将服务信息发送到服务管理器359。另外,连接管理器357处理根据从服务管理器359发送的要连接的设备的设备地址设定的通信方案的连接。随后,如果建立了与要连接的设备的连接,则连接管理器357根据在服务管理器359中发送的服务的执行信息来处理与要连接的设备有关的服务的执行。
服务管理器359从连接管理器357接收服务信息,并且分析接收到的服务信息。服务管理器359从服务信息中分析设备的操作模式、要连接的设备的设备地址以及执行的服务的类型。此时,当接收到服务信息时,服务管理器359从共享服务应用350收集设备中当前在操作的应用信息。
共享服务应用350包括可在设备中操作和显示的各种程序。其一些示例是用于提供设备内的各种菜单的UI应用,以及可从外部设备或通过网络下载然后存储并且可自由安装或删除的应用。通过这种应用,设备可执行诸如以下服务:通过网络连接的互联网电话服务、视频点播(Video On Demand,VOD)服务、web相册服务、社交网络服务(SocialNetworking Service,SNS)、基于位置的服务(Location-Based Service,LBS)、地图服务、web搜索服务、应用搜索服务、文本/多媒体消息服务、邮件服务、地址列表服务、媒体重放服务等等。另外,可以执行诸如游戏功能和日程管理功能之类的各种功能。
此外,根据本发明的实施例的平台还可包括中间件(未示出)。中间件(未示出)位于内核310和应用层350之间,并且可起到介质的作用,使得可在其它硬件或软件集合之间交换数据。这样,内核310使得能够提供各种环境的标准化接口和支持以及与具有不同***的其它事务的相互链接。
另外,以上考虑的平台除了用在根据本发明的实施例的用户设备中,也可用在各种电子设备中。另外,根据本发明的实施例的平台可被存储或加载在存储单元250和控制器270中的至少一者或者单独的处理器(未示出)中。另外,在设备中还可提供用于执行应用的单独的应用处理器(未示出)。
图4是图示出根据本发明的实施例的用户设备之间的服务连接的过程的信号流程图,并且图5是图示出根据本发明的实施例存储用户设备的服务连接中使用的语音信息的示例的图。
参考图4,如果在步骤401和403中接收到语音命令按钮150输入,则第一设备100和第二设备200在步骤405和407中分别记录通过麦克风243输入的用户语音。例如,用户可在按压设在第一设备100和第二设备200中的语音命令按钮150的同时输入(例如,说出)用于建立设备之间的连接的开始命令(例如,“连接设备”)或者服务命令(例如,“连接设备发送文件”、“连接设备共享地址列表”等等),并且可取消语音命令按钮150的输入。
当语音命令按钮150的输入被取消时,第一设备100和第二设备200在步骤409和411对记录的语音执行语音识别。第一设备100和第二设备200通过对记录的语音的分析判定是否检测到用于设备之间的服务连接的开始命令(例如,“设备连接”)。
当检测到用于服务连接的开始命令时,第一设备100和第二设备200在步骤413和415中生成语音信息集合并且分别将所生成的语音信息集合发送到服务器300。根据本发明的实施例,语音信息可包括用户的语音的记录数据和用户设备之间的服务连接所需要的相关信息。例如,语音信息可包括记录数据(例如,语音波形)、时间戳和设备标识符等等。
当从第一设备100和第二设备200接收到语音信息时,在步骤417中,服务器300根据设备来划分接收到的语音信息,并且将划分后的语音信息存储在数据库中。另外,在步骤419中,服务器300对存储在数据库中的语音信息执行分析。
例如,当接收到语音信息时,服务器300检查在数据库中是否有与接收到的语音信息相对应的语音信息。例如,如图5中所图示的,服务器300可按设备对接收到的语音信息进行划分或分类,并且存储设备信息、记录数据(例如,语音波形)、时间戳、连接信息(例如,设备地址)和原始数据等等。另外,服务器300可如图5中那样搜索与存储的语音信息一致的语音信息。例如,服务器300可检测被确定为与接收到的语音信息的记录数据相同的语音波形,并且通过检查检测到的波形的时间戳来判定检测到的语音波形是否已在相同时间区间中(例如,其具有小于阈值的延迟)被生成。另外,当检查到相同语音波形和相同时间区间时,服务器300判定设备在尝试与彼此建立连接。例如,服务器300可判定图5中的与设备B和设备E相对应的语音信息具有相同语音信息。
此时,服务器300根据接收到语音信息的顺序来处理语音信息分析。例如,当第一设备100的语音信息是在第二设备200之前接收到的时,以从第一设备100接收的语音信息为基础执行分析。另外,如果与从第一设备100接收的语音信息相对应的检测到的语音信息是第二设备200的语音信息,则检查从第二设备200接收的语音信息的时间戳,并且如果该时间戳属于相同时间区间(例如,在一定长度的时间段内),则可省略对从第二设备200接收的语音信息的分析。
在步骤421中,服务器300识别在通过对语音信息的分析提供了一致的声音信息的设备(例如,第一设备100和第二设备200)之间要执行的连接方法,和服务类型。例如,当判定具有相互一致的语音信息的至少两个设备存在时,服务器300检查每个设备的时间戳并且根据时间戳中记录的时间的差异来识别每个设备要执行的模式,并且通过从记录数据中分析语音命令来识别打算执行的服务。更具体而言,服务器300通过分析所识别的语音命令(例如,“连接设备”、“连接设备发送文件”等等)的过程识别在设备之间要连接哪个服务连接。
在步骤423和425中,服务器300可根据各个设备(例如,第一设备100和第二设备200)的服务类型生成服务信息,并且分别将相应的服务信息发送到第一设备100和第二设备200。例如,服务器300可利用每个设备的服务类型、连接信息和执行信息分别生成要发送到每个设备(第一设备100和第二设备200)的服务信息,并且可分别将所生成的服务信息发送到第一设备100和第二设备200。服务信息可包括每个设备的服务类型、连接信息和执行信息,并且执行信息可根据所分析的语音命令类型来选择性地包括。例如,如果语音命令像“连接设备”中那样只包括服务开始命令(“连接设备”),则可省略执行信息,而当语音命令像“连接设备发送文件”中那样包括服务开始命令(“连接设备”)和服务命令(“发送文件”)时,可包括指示文件发送的执行信息。
当接收到来自服务器300的关于语音信息的发送的服务信息时,第一设备100和第二设备200在步骤423中根据接收到的服务信息执行已相互确定的连接。例如,第一设备100和第二设备200可根据服务信息(例如,服务类型)确定要操作的模式,并且根据服务信息(例如,连接信息)确定要连接的设备的信息。另外,第一设备100和第二设备200之中在主控模式中操作的设备尝试根据预设的连接方案(例如,蓝牙连接、无线LAN连接、WiFi直接连接等等)与对应于服务信息(具体而言是连接信息)的设备连接。
在步骤429中,第一设备100和第二设备200在相互连接时根据服务信息执行服务。例如,当相互连接完成时,与主控模式的设备已连接到的从属模式的设备和服务信息(具体而言是执行信息)相对应的服务可被执行。
例如,当第一设备100在主控模式中操作并且第二设备200在从属模式中操作时,如果执行信息对应于<发送文件>,则在第一设备100中当前选择(或显示)的文件可被发送到第二设备200。另外,如果执行信息对应于<共享地址列表>,则第一设备100的地址列表信息可被发送到第二设备200。这里,当共享地址列表时,第二设备200的地址列表可与第一设备100的地址列表同步,或者第一设备100的地址列表可被添加到第二设备200的地址列表。另外,如果执行信息对应于<连接游戏>,则可执行第一设备100和第二设备200之间的网络游戏连接。另外,如果执行信息对应于<执行扬声器>,则第一设备100可负责输出环绕声扬声器的左声音,并且第二设备200可负责环绕声扬声器的右声音。另外,如果执行信息对应于<连接键盘>,则第二设备200可作为虚拟键盘或虚拟鼠标来操作,使得第二设备200可作为第一设备100的输入装置来操作。
另外,如上所述,如果在服务信息中不包括执行信息,则可以省略在第一设备100和第二设备200之间执行服务的步骤S429。
图6是图示出根据本发明的实施例在用户设备中基于用户语音建立服务连接的过程的流程图。
参考图6,当在步骤601中接收到语音命令按钮150时,控制器270在步骤603中记录通过麦克风243输入的用户语音。此时,当检测到语音命令按钮150的输入(例如,促动)时,控制器270检查麦克风243的状态,并且如果处于解除激活状态,则控制器270激活麦克风243。另外,控制器270可控制通过显示单元230显示用于引导用户的语音输入的引导屏幕。
当感测到语音命令按钮150的输入的取消时,控制器270在步骤605中对记录的用户语音执行识别,并且在步骤607中分析语音识别的结果。另外,在步骤609中,控制器270通过对记录的用户语音执行的识别判定用户语音是否对应于用于服务连接的命令。更具体而言,控制器270通过语音识别判定是否已检测到用于在设备之间建立服务连接的开始命令(例如,“连接设备”)。
如果没有检测到用于服务连接的开始命令(步骤609中的“否”),则控制器270在步骤611中可控制操作的执行。例如,控制器270可执行对用户的输入内部数据(或内容等等)的搜索,或者执行对市场的搜索(或者一般互联网搜索)。
如果检测到用于建立服务连接的开始命令(步骤609中的“是”),则控制器270在步骤613中生成语音信息,并且在步骤615中将所生成的语音信息发送到已经承诺的服务器300。例如,控制器270可生成包括设备之间的服务连接所需要的用户语音的记录数据、与语音命令按钮150被输入的时间有关的时间信息(时间戳)和设备标识符(设备地址)的语音信息,并将所生成的语音信息发送到服务器300。
在发送语音信息之后,如果在步骤617中从服务器300接收到对语音信息的响应,则控制器270在步骤619中判定来自服务器300的响应是否对应于服务信息。如果服务器300的响应不是服务信息(步骤619中的“否”),则控制器270在步骤621中控制操作的执行。例如,从服务器300接收到的响应对应于差错信息,而不是服务信息,则控制器270控制差错信息的输出。另外,在输出差错信息之后,控制器270响应于来自于用户的输入再执行服务连接过程,或者可终止服务连接过程。
如果服务器300的响应对应于服务信息(步骤619中的“是”),则控制器270在步骤623中分析接收到的服务信息。例如,控制器270可从接收到的服务信息确定服务类型、作为要连接的对象的设备和与连接的设备的执行服务。
控制器270在步骤625中根据服务信息确定模式(即,主控模式或从属模式),并且在步骤627中根据所确定的模式利用所设定的通信方法与要连接的设备执行连接。例如,控制器270根据服务信息确定主控模式和从属模式之中的一个操作模式,在所确定的操作模式中向要连接的设备发送连接请求,从要连接的设备接收连接请求,并且相应地执行连接。
当与要连接的设备连接时,控制器270在步骤629中执行与该设备和服务信息相对应的服务。例如,如上所述,控制器270在主控模式执行与执行信息相对应的服务或者可在从属模式执行与执行信息相对应的服务。
图7是图示出根据本发明的实施例的在服务器300中认证用户设备的过程的流程图。
参考图7,如果在步骤701中从某个设备接收到语音信息,则服务器300在步骤703中存储接收到的语音信息,并且在步骤705中对语音信息执行分析。此时,服务器300根据设备对接收到的信息进行划分或分类,并且将划分或分类后的信息存储在数据库中。
服务器300在步骤707中通过对语音信息的分析判定语音是否对应于服务连接命令。例如,服务器300判定接收到的语音信息是否包括预定的命令,诸如用于在设备之间建立服务连接的开始命令(例如,“连接设备”)。
如果接收到的语音信息不包括服务连接命令(在步骤707的“否”),则服务器300在步骤709中处理操作的执行。例如,服务器300判定接收到的语音信息对应于一般语音搜索字词并且根据该搜索字词执行对数据库的搜索。
当接收到的语音信息包括服务连接命令时(在步骤707的“是”),服务器300在步骤711中执行比较和搜索以判定在数据库中是否有与接收到的语音信息相对应的语音信息。基于搜索和比较的结果,服务器300在步骤713中通过语音信息中包括的语音波形比较判定是否有与接收到的语音信息相对应的另一语音信息集合(下文中称为“经认证语音信息”)。更具体而言,服务器300搜索具有与语音信息的记录数据一致或匹配的语音波形的另一语音信息集合,并且通过检查搜索到的语音信息的时间戳来执行比较和分析以判定语音信息集合是否是在相同时间区间或时段期间生成的。
当不存在与接收到的语音信息相对应的经认证语音信息时(步骤713中的“否”),服务器300在步骤715中生成差错信息,并且在步骤717中向发送了语音信息的设备发送差错信息。例如,当服务器300对于该服务连接请求没有要连接的设备时,服务器300向设备发送指示服务连接过程的终止的差错信息。
如果存在与接收到的语音信息相对应的经认证语音信息(步骤713中的“是”),则服务器300在步骤719中利用接收到的语音信息和经认证语音信息判定什么设备在尝试连接并且识别服务类型。例如,服务器300可通过检查每个时间戳来根据记录时间戳的时间的差异或顺序来为设备确定操作模式(即,主控模式或从属模式)。服务器300可通过检查已从语音信息的记录数据获得的命令来确定设备间连接及其执行服务。
在步骤721中,服务器300根据识别出的服务类型生成至少两个设备的服务信息。另外,在步骤723中,服务器300根据各个设备划分服务信息。例如,服务器300可利用每个设备的服务类型、连接信息和执行信息来生成要发送到每个设备的服务信息,并且可分别将所生成的服务信息发送到相应的各个设备。例如,当按照接收到的语音信息和认证语音信息从两个设备(例如,第一设备100和第二设备200)请求服务连接时,服务器300分别生成要发送到第一设备100的第一服务信息和要发送到第二设备200的第二设备信息。另外,服务器300将第一服务信息发送到第一设备100,并且将第二服务信息发送到第二设备200。
图8示意性图示了根据本发明的实施例的用于在用户设备之间连接服务的技术。
如以上图1中所图示的,本发明的用于基于用户语音的服务连接的***可包括第一用户设备100和第二用户设备200。与图1的***配置不同,图8图示了根据没有由服务器300执行的配置的***的示例。另外,虽然图8图示了利用两个用户设备100和200的服务连接操作,但本发明的实施例不限于此。例如,两个或更多个设备的服务连接依据本发明的实施例是可能的。第一用户设备100和第二用户设备200执行如参考图1至7所述的功能和操作。然而,在如图8中的***环境中,在第一用户设备100和第二用户设备200中,省略了利用服务器执行的功能和操作,并且额外地执行在没有服务器300的情况下的用户语音的认证。
参考图8,图8图示了第一用户设备100利用无线LAN与第二设备200连接的操作。另外,在本示例中,第一用户设备100在主控模式操作(即,AP),或者第二用户设备200在从属模式操作(即,非AP)。更具体而言,在本示例中,第一用户设备100的语音命令按钮150比第二用户设备200的语音命令按钮150更早被输入,从而第一和第二用户设备100和200的时间戳不相同。
第一用户设备100和第二用户设备200包括硬件或软件界面型的语音命令按钮150,其等待接收来自用户的语音输入以执行基于语音的服务连接。第一用户设备100和第二用户设备200记录语音命令按钮150被输入时的时间戳,并且记录在语音命令按钮150被按压的状态中输入的用户语音。另外,当对语音命令按钮150的输入被取消时,第一用户设备100和第二用户设备200对记录的语音(即,记录数据)执行语音识别。
当作为语音识别的结果检测到用于在用户设备之间建立连接的命令时,第一用户设备100和第二用户设备200加载包括记录数据的语音信息并通过扬声器241输出该语音信息。例如,包含在第一用户设备100中生成的第一语音信息的声音可被发送到邻近的第二用户设备200,并且第二用户设备200可通过麦克风243接收从第一用户设备100输出的声音。作为附加或替换,包含在第二用户设备200中生成的第二语音信息的声音可被发送到邻近或附近的第一用户设备100(例如,在能够检测到声音的一定距离之内的设备),并且第一用户设备100可通过麦克风243接收从第二用户设备200输出的声音。根据本发明的实施例,该声音包括可听频率和/或非可听频率的声波,并且被概括称为“声音”。此时,第一用户设备100和第二用户设备200对记录数据编码并将经编码的记录数据转换成音频频率或大于可听频率的声音(即,声波)以通过扬声器241输出。此时,语音信息包括时间戳、设备地址等等,以及用户语音的记录数据。
第一用户设备100和第二用户设备200通过扬声器241输出声音,并且通过第一用户设备100和第二用户设备200的麦克风243接收从另一用户设备输出的声音。然后,第一用户设备100和第二用户设备200通过利用通过麦克风243输入的语音信息和所发送的语音信息执行相互连接来执行服务。
此时,第一用户设备100和第二用户设备200通过对输入语音信息进行认证来判定输入语音信息是否对应于用于服务连接的语音信息。例如,第一用户设备100和第二用户设备200通过用于判定输入语音信息是否包括时间戳或者输入语音信息的记录数据是否与发送的语音信息的记录数据一致或匹配的比较和分析来处理对输入语音信息的认证。
当输入语音信息对应于用于服务连接的经认证语音信息时,第一用户设备100和第二用户设备200可通过分析语音信息来确定操作模式,确定要连接的设备并且确定执行服务。例如,第一用户设备100和第二用户设备200比较语音信息集合各自的时间戳并且根据记录时间差异或顺序来确定主控模式或从属模式,通过设备地址确定要连接的设备,并且根据语音识别基于命令来确定执行服务。
第一用户设备100和第二用户设备200在根据所分析的语音信息确定的操作模式中利用预设的通信方案执行与要连接的用户设备的连接,并且在相互连接时在所确定的操作模式执行与命令相对应的服务。例如,第一用户设备100和第二用户设备200可形成无线LAN链路,并且当完成了相互连接时,被确定为主控的用户设备可向对方用户设备发送当前显示的图像文件。另外,被确定为主控的用户设备可作为左扬声器操作,并且被确定为从属的用户设备可作为右扬声器操作,从而可分别输出在主控设备中重放的媒体文件的音频。另外,被确定为主控的用户设备可作为输入装置操作,并且被确定为从属的用户设备可作为显示装置操作,从而可通过作为从属操作的用户设备显示由主控的用户设备输入的信息。另外,在被确定为主控的用户设备中显示的数据可被发送到被确定为从属的用户设备,并且在该用户设备中显示的数据可与从属的用户设备一起来显示。
图9是图示出根据本发明的实施例的用户设备之间的服务连接的过程的信号流程图。具体地,图9图示了如上所图示的在没有服务器300的情况下支持用户设备之间的直接连接的操作。
参考图9,如果在步骤901和903中接收到语音命令按钮150的输入,则第一设备100和第二设备200在步骤905和907中分别记录通过麦克风243输入的用户语音。例如,在第一设备100和第二设备200中包括的语音命令按钮150被按压的状态中,用户输入(即,说出)用于在设备之间建立连接的开始命令(例如,“连接设备”)或者用于设备连接和执行的服务命令(例如,“连接设备发送文件”、“连接设备共享地址列表”,等等),并且取消对语音命令按钮150的输入。
当对语音命令按钮150的输入被取消时,第一设备100和第二设备200在步骤909和911中对记录的语音执行语音识别。第一设备和第二设备200可通过对记录的语音的分析来判定是否检测到用于设备之间的服务连接的开始命令(例如,“设备连接”)。
当检测到用于服务连接的开始命令时,第一设备100和第二设备200在步骤913和915中生成语音信息集合并且分别通过第一设备100和第二设备200中包括的扬声器241输出语音信息集合。例如,第一设备100和第二设备200可以以声音形式加载所生成的语音信息,并可以通过每个扬声器将这些声音输出到邻近的对方设备。根据另一示例,包含在第一设备100中生成的第一语音信息的声音可通过扬声器241被发送到邻近的第二用户设备200,并且第二用户设备200可通过麦克风243接收从第一用户设备100输出的声音。作为替换,包含在第二用户设备200中生成的第二语音信息的声音可通过扬声器241被发送到邻近的第一用户设备100,并且第一用户设备100可通过麦克风243接收从第二用户设备200输出的声音。
在通过扬声器241输出声音之后,当通过麦克风243输入从邻近设备输出的语音信息时,第一设备100和第二设备200在步骤917和919中比较通过麦克风243输入的语音信息和通过扬声器241发送的语音信息以便进行认证。更具体而言,第一设备100和第二设备200可通过认证输入语音信息来判定通过各个麦克风243输入的语音信息是否对应于用于服务连接的语音信息。例如,第一设备100和第二设备200可通过对于输入语音信息是否包括时间戳或者输入语音信息的记录数据是否与发送的语音信息的记录数据一致执行比较和分析来执行认证。
当成功认证了用于服务连接的输入语音信息时,第一设备100和第二设备200在步骤921和923中确定服务类型。例如,第一设备100和第二设备200可通过参考输入语音信息和发送的语音信息来检查操作模式,检查要连接的设备,并且检查在连接之时执行服务的类型。另外,第一设备100和第二设备200在步骤925和927中根据对服务类型的确定来确定其操作模式,并且在每个所确定的操作模式根据要连接的设备或者预定的连接方案尝试连接。
当第一设备100和第二设备200在步骤929中连接了时,第一设备100和第二设备200在步骤931中在每个操作模式执行与语音信息相对应的服务。例如,当第一设备100和第二设备200之间的相互连接完成时,第一设备100和第二设备200与在主控模式中操作的设备连接到的在从属模式中操作的设备执行与语音信息相对应的服务。例如,假定第一设备100在主控模式中操作并且第二设备200在从属模式中操作,则第一设备100中当前选择(或显示)的文件可被发送到第二设备200,第一设备100的地址信息可被发送到第二设备200,第一设备可被配置为执行环绕声扬声器的左声音的输出或者第二设备200可被配置为执行环绕声扬声器的右声音的输出,或者第二设备200可作为虚拟键盘或虚拟鼠标来操作以使得第二设备可作为第一设备100的输入装置来操作。
另外,如上所述,当语音信息不包括要执行的服务命令而只包括用于设备之间的连接的开始命令时,在第一设备100和第二设备200之间执行服务的步骤S931被省略。
图10是图示出根据本发明的实施例的用户设备中的基于用户语音的服务连接的流程图。
参考图10,如果在步骤1001中接收到语音命令按钮150,则控制器270在步骤1003中记录通过麦克风243输入的用户语音。此时,当检测到语音命令按钮150的输入时,控制器270检查麦克风243的状态并且如果麦克风243处于解除激活状态中则控制麦克风243的开启。另外,控制器270可控制通过显示单元230显示引导用户的语音输入的引导屏幕。
当感测到语音命令按钮150的输入的取消时,控制器270在步骤1005中对记录的用户语音执行识别,并且在步骤1007中根据语音识别分析识别结果。另外,在步骤1009中,控制器270通过对记录的用户语音的识别来判定用户语音是否对应于用于服务连接的命令。更具体而言,控制器270通过语音识别判定是否检测到用于设备之间的服务连接的开始命令(例如,“连接设备”)。
如果没有检测到用于服务连接的开始命令(1009中的“否”),则控制器270在步骤1011中控制操作的执行。例如,控制器270对于用户的输入语音命令执行内部数据(或者内容等等)的搜索,或者市场(或互联网)搜索。
如果检测到用于服务连接的开始命令(步骤1009中的“是”),则控制器270在步骤1013中生成语音信息,并且在步骤1015中以声音形式加载所生成的语音信息并通过扬声器241输出这些声音。例如,控制器270可以将包括设备之间的服务连接所需要的用户语音的记录数据、与语音命令按钮150被输入的时间有关的时间信息(即,时间戳)和用于设备标识的设备地址等等的语音信息转换成一定频率带的声波(即,声音),以通过扬声器241输出转换后的声波。
在发送语音信息之后,控制器270在步骤1017中通过麦克风243接收下一个语音信息。更具体而言,控制器270在语音信息被发送之后通过麦克风243接收包含从另一设备输出的语音信息的声音。然后,控制器270通过解析接收到的声音来获得语音信息。如果在接收到的声音中没有包括或检测到语音命令,则控制器270忽略接收到的声音。更具体而言,没有语音命令的声音被认为是噪声,并且其输入被忽略。
控制器270在步骤1019中将通过麦克风243输入的语音信息与通过扬声器241输出的语音信息相比较,并且在步骤1021中判定输入语音信息是否对应于经认证语音信息。例如,控制器270可通过对于输入语音信息是否包括一致或匹配的时间戳或者输入语音信息的记录数据是否与输出的语音信息的记录数据一致或匹配的比较和分析,来执行输入的语音信息的认证。
如果输入语音信息不是用于服务连接的经认证语音信息(步骤1021中的“否”),则控制器270在步骤1023中输出差错信息。例如,如果输入语音信息不是用于服务连接的语音信息,则控制器270可输出向用户告知服务连接不可能这个事实的差错信息。
如果输入语音信息是用于服务连接的经认证语音信息(步骤1021中的“是”),则控制器270在步骤1025中通过参考输入语音信息和输出语音信息来识别服务类型。例如,控制器270根据语音信息集合确定根据时间戳之间的时间差或者时间戳的顺序的操作模式、要连接的设备和要与连接的设备执行的服务。
控制器270在步骤1027中根据语音信息集合确定操作模式,并且在步骤1029中根据所确定的操作模式以预定的通信方案与要连接的设备执行连接。例如,控制器270根据语音信息集合确定主控模式和从属模式之中的操作模式之一,根据所确定的操作模式向要连接的设备发送连接请求,并且从要连接的设备接收连接请求并相应地执行连接。
当与要连接的设备连接时,控制器270在步骤1031中按所确定的操作模式与连接的设备执行服务。例如,控制器270可如上文所述在主控模式执行服务或者在从属模式执行服务。
图11是图示出根据本发明的实施例在用户设备中基于用户语音处理服务连接的过程的流程图。
图11示出了如上所述在没有服务器300的情况下支持用户设备之间的直接连接的另一操作示例。在本示例中,用于执行服务连接的用户设备包括第一设备和第二设备,第一设备是根据预定的通信方案(例如,WiFi直接或蓝牙)向第二设备请求设备连接的设备,并且第二设备是从第一设备接收设备连接请求的设备,图11示出了第一设备中基于用户语音来处理服务连接的操作。
参考图11,如果在步骤1101中接收到语音命令按钮150的输入,则控制器270在步骤1103中记录通过麦克风243输入的用户语音。此时,控制器270记录检测到语音命令按钮150的输入时的时间信息(即,时间戳)。另外,当检测到语音命令按钮150的输入时,控制器270检查麦克风243的状态,并且如果麦克风处于解除激活状态中则开启麦克风。另外,控制器270可控制通过显示单元230显示引导用户的语音的输入的引导屏幕。
当感测到语音命令按钮150的输入的取消时,控制器270在步骤1105中对记录的用户语音执行识别,并且在步骤1107中根据语音识别分析结果。另外,在步骤1109中,控制器270通过对记录的用户语音的识别来判定用户语音是否对应于用于服务连接的命令。更具体而言,控制器270通过语音识别判定是否检测到用于在设备之间建立服务连接的开始命令(例如,“连接设备”)。
如果没有检测到用于建立服务连接的开始命令(步骤1109中的“否”),则控制器270在步骤1111中控制相应操作的执行。例如,控制器270可对输入的用户语音命令执行内部数据(或内容)的搜索,或者执行市场搜索(或一般互联网搜索)。
如果检测到用于服务连接的开始命令(步骤1109中的“是”),则控制器270在步骤1113中生成认证密钥。例如,如果根据用于建立服务连接的开始命令确定了设备连接,则可从通过麦克风243输入并记录的用户语音的记录数据中提取语音波形,并且可检查输入时间信息(即,时间戳)。另外,控制器270可通过利用该语音波形和时间信息来生成认证密钥值。
在根据本发明的实施例的一个示例中,认证值被通过利用记录的语音波形信息和时间信息(即,时间戳)的特征生成为唯一字符(例如,字母或数字或者字母数字)串。例如,所生成的认证密钥值可被生成为随机数,例如“2412582952572257239529”,并且可从随机数被映射到的随机数的表配置。认证密钥值可被划分成指示语音波形的部分和指示时间信息的部分。例如,具有诸如“2412582952572257239529”这样的串的认证密钥值可被划分成诸如“24125829525722”这样的语音波形部分的串和诸如“57239529”这样的时间信息部分的串。此时,可以预先定义认证密钥值的语音波形部分和时间信息部分的长度。另外,在第一设备和第二设备中生成的认证密钥中,语音波形部分的串可具有相同值,并且时间信息部分的串根据第一设备和第二设备的时间戳可具有不同值。更具体而言,根据依据记录时间的时间差可以用不同的值生成密钥值,然后可将这些密钥值包括在认证密钥中。
当生成认证密钥时,控制器270生成认证密钥作为用于设备间连接之时的设备标识的设备信息(例如,设备标识符),然后该认证密钥被应用。此时,当生成认证密钥时,控制器270在步骤1113中控制用于检查预定的通信方案和支持所检查的通信方案的通信模式(即,功能)的激活。例如,控制器270可通过开启无线LAN模块213或者短程通信模块215(例如,蓝牙模块)来控制通信模式的激活。另外,控制器270可以把在激活的通信模式中要使用的设备标识符改变成基于认证密钥的设备信息。
在步骤1117中,控制器270在设定基于认证密钥的设备信息之后可根据通信方案控制对周围设备的搜索。例如,控制器270可利用无线LAN模块213搜索要经由WiFi直接连接来连接的周围设备,以及利用短程通信模块215搜索用于短程通信(例如,蓝牙通信)的周围设备。
在步骤1119中,控制器270确定根据对周围设备的搜索而搜索出的设备之中的为了服务连接而要连接的设备。具体地,控制器270检测搜索出的可连接设备之中的具有与先前生成的认证密钥相对应的设备信息的设备,并且将检测到的具有相应认证密钥的设备确定为要连接的设备。此时,控制器270可搜索与来自认证密钥的用户语音波形部分的串一致或匹配的设备信息。更具体而言,认证密钥中的时间信息部分的串可根据每个设备中输入语音命令按钮150的时间而具有时间戳上的差异,从而时间信息部分可不一致,并且因此,设备判定时间波形部分是否一致。
当确定了要连接的设备时,控制器270在步骤1121中向要连接的设备发送设备连接请求。此时,控制器270可根据所确定的通信方案发送诸如WiFi直接连接请求或蓝牙连接请求之类的请求。
在发送连接请求之后,当在步骤1123中从要连接的设备接收到对于连接请求的连接批准时,控制器270在步骤1125中执行要连接的设备和通信方案的设备之间的连接。
在步骤1127中,控制器270在与要连接的设备连接后执行服务。例如,在连接到要连接的设备之后,控制器270可向要连接的设备发送根据用户请求的数据,或者可接收从要连接的设备发送的数据。
另外,如以上所考虑的,如果通过语音识别检测到服务命令,则可自动执行根据服务命令的服务。控制器270在自动服务执行之时判定是在主控模式还是从属模式中操作,并且在所判定的主控模式或从属模式中执行服务。此时,控制器270将认证密钥与要连接的设备的设备信息中的时间信息部分的串相比较以检查时间差,并且根据检查的时间差来判定是在主控模式还是从属模式中操作。
图12是图示出根据本发明的实施例在用户设备中基于用户语音处理服务连接的过程的流程图。
图12示出了在没有服务器300的情况下支持用户设备之间的直接连接的另一操作示例。在本示例中,用于执行服务连接的用户设备包括第一设备和第二设备,其中第一设备根据预定的通信方法向第二设备请求设备连接,并且第二设备从第一设备接收设备连接请求。图12示出了在第二设备中基于用户语音处理服务连接的操作。
参考图12,如果在步骤1201中接收到语音命令按钮150的输入,则控制器270在步骤1203中记录通过麦克风243输入的用户语音。此时,控制器270记录检测到语音命令按钮150的输入时的时间信息(即,时间戳)。另外,当检测到语音命令按钮150的输入时,控制器270可控制用于开启控制或语音输入引导的显示屏幕。
当感测到语音命令按钮150的输入的取消时,控制器270在步骤1205中对记录的用户语音执行识别,并且在步骤1207中分析语音识别的结果。另外,在步骤1208中,控制器270通过记录的用户语音的识别来判定用户语音是否对应于用于服务连接的命令。更具体而言,控制器270通过语音识别判定是否检测到用于在设备之间建立服务连接的开始命令(例如,“连接设备”)。
如果没有检测到用于服务连接的开始命令(步骤1208中的“否”),则控制器270在步骤1209中控制相应操作的执行。例如,控制器270可对输入的用户语音命令执行内部数据(或内容等等)的搜索,或者可执行市场搜索或一般互联网搜索。
如果检测到用于服务连接的开始命令(步骤1208中的“是”),则在步骤1211中生成认证密钥。例如,如果根据用于服务连接的开始命令确定了设备连接,则从通过麦克风243输入并记录的用户语音的记录数据中提取语音波形,并且检查输入语音命令按钮150的时间信息(即,时间戳)。另外,控制器270可利用语音波形和时间信息来生成认证密钥值。在根据本发明的实施例的本示例中,如以上所考虑的,认证密钥值被通过利用记录的语音波形信息和时间信息的特征生成为唯一串。
当生成认证密钥时,如果认证是在设备之间连接的,则控制器270生成认证密钥作为用于标识设备的设备信息(例如,设备标识符)并且认证密钥被应用。此时,当生成认证密钥时,控制器在步骤1211中检查为建立服务连接而设定的通信方案并且控制用于支持所检查的通信方案的通信模式(即,功能)的激活。另外,控制器270可以把在该通信模式中要使用的设备标识符改变成基于认证密钥的设备信息。
在步骤1215中,控制器270在已设定了基于认证密钥的设备信息的状态中从另一外部设备接收对于服务连接的连接请求。此时,在设定基于认证密钥的设备信息之后,控制器270执行如参考图11所述的步骤S1117至S1121。然而,在根据图12的示例中,在向另一外部设备发送连接请求之前从另一外部设备接收连接请求,并且在此情况下,控制器270可省略连接请求过程。
当从另一外部设备接收到连接请求时,控制器270在步骤1217中将所生成的认证密钥与请求了连接的另一设备的设备信息相比较,并且在步骤1219中判定认证密钥是否与设备信息一致或匹配。具体地,控制器270将认证密钥与来自设备信息的用户语音波形部分的串相比较以判定认证密钥是否与该串一致或匹配。更具体而言,在根据每个设备中输入语音命令按钮150的时间的时间戳中可存在差异,从而时间信息部分可不一致,并且因此,设备判定时间波形部分是否一致。
如果认证密钥和设备信息不与彼此一致(步骤1219中的“否”),则在步骤1221中执行相应的操作。例如,控制器270可忽略来自另一设备的连接请求并且可在预定的时间内等待经认证的设备的连接请求。另外,控制器270可通过执行如本文参考图11所述的步骤S1117至S1127来请求服务连接。
如果认证密钥与设备信息一致(步骤1219中的“是”),则控制器270在步骤1223中向发送了连接请求的另一设备发送连接批准。例如,控制器270可判定发送了连接请求的另一设备是要连接的设备。另外,控制器270可响应于要连接的设备的连接请求而向要连接的设备发送连接批准。
在发送连接批准之后,控制器270在步骤1225中按通信方案与要连接的设备执行设备连接。
当与要连接的设备连接时,控制器270在步骤1227中执行服务。例如,在与要连接的设备连接之后,控制器270向要连接的设备发送根据用户请求的数据,或者接收从要连接的设备发送的数据。另外,如上所述,当通过语音识别检测到服务命令时,可自动执行根据服务命令的服务。此时,如上所述,控制器270参考认证密钥和要连接的设备的设备信息判定是在主控模式还是从属模式中操作,并且在所确定的操作模式中自动执行服务。
另外,如上所述,根据本发明的实施例,提供诸如“连接设备”之类的用于建立服务连接的开始命令。此命令被设备用来区分语音识别模式中的语音输入是要用于设备连接还是要用于内部设备数据/内容的搜索的一般语音输入。另外,本发明的实施例可在用于建立服务连接的开始命令中组合并提供用于要执行的服务的服务命令。更具体而言,可以组合用于设备连接的开始命令,诸如“连接设备发送文件”,和用于连接的设备之间的服务执行的服务命令(“发送文件”),来输入(即,说出)。服务命令可在开始命令(例如,“发送文件连接设备”)之后或之前输入。
将会领会,本发明的实施例可以按硬件、软件或者硬件和软件的组合的形式来实现。任何这种软件可按易失性或非易失性存储装置的形式来存储,所述存储装置诸如例如像ROM那样的存储设备,无论是否可擦除或可改写,或者按存储器的形式来存储,所述存储器诸如例如RAM、存储器芯片、设备或集成电路,或者存储在光可读或磁可读介质上,所述可读介质诸如例如CD、DVD、磁盘或磁带等等。
例如,前述的本发明的实施例可以通过各种计算机手段以可执行程序命令形式实现,并且被记录在计算机可读记录介质中。计算机可读记录介质可单独包括程序命令、数据文件以及数据结构,或者包括其组合。记录介质中记录的程序命令可被具体设计或配置用于本发明的实施例或者是计算机软件领域的普通技术人员已知来使用的。计算机可读记录介质可包括存储和执行程序命令的诸如硬盘、软盘或磁带之类的磁介质、诸如致密盘只读存储器(Compact Disc Read Only Memory,CD-ROM)或数字多功能盘(Digital VersatileDisc,DVD)之类的光介质、诸如软磁盘之类的磁光介质以及诸如ROM、RAM、闪存之类的硬件设备。另外,程序命令可包括由编译器创建的机器语言代码和计算机利用解释器可执行的高级语言代码。前述硬件设备可被配置为作为至少一个软件模块操作来执行本发明的实施例的操作,反之亦然。
将会明白,存储设备和存储介质是适合用于存储包括指令的一个或多个程序的机器可读存储装置的实施例,所述指令当被执行时实现本发明的实施例。因此,实施例提供了包括用于实现如本说明书的任何一个权利要求中要求保护的装置或方法的代码的程序和存储这种程序的机器可读存储装置。此外,这种程序可经由任何介质来以电子方式传输,例如在有线或无线连接上发送的通信信号,并且实施例适当地涵盖这种情况。
虽然以上已详细描述了本发明的实施例,但应当清楚地懂得,对于本领域技术人员可显现出来的对本文教导的基本发明构思的许多变化和修改仍将落在如权利要求及其等同物限定的本发明的精神和范围内。
Claims (27)
1.一种在第一无线设备和至少一个第二无线设备之间连接服务的方法,所述方法包括:
由所述第一无线设备记录在语音命令按钮已被输入的状态中输入的用户语音;
当所述语音命令按钮的输入被取消时基于记录的用户语音输出第一信息,其中,所述第一信息包括根据所述用户语音的记录数据、时间戳和所述第一无线设备的设备地址;
由所述第一无线设备接收第二信息,其中所述第二信息包括为所述第一无线设备确定的操作模式信息、所述第二无线设备的设备地址以及要执行的服务的执行信息;
由所述第一无线设备根据所述第一信息和接收到的第二信息识别服务类型;
在根据所识别的服务类型确定的所述第一无线设备的操作模式中将所述第一无线设备连接到所述第二无线设备,
其中,将所述第一无线设备连接到所述第二无线设备包括:确定主控模式和从属模式之一为所述第一无线设备的操作模式;以及以所确定的操作模式将所述第一无线设备连接到所述第二无线设备;以及
与连接的第二无线设备执行服务。
2.如权利要求1所述的方法,其中,记录用户语音包括记录与所述语音命令按钮的输入相对应的时间戳。
3.如权利要求2所述的方法,其中,输出第一信息包括将所述第一信息发送到预设的服务器。
4.如权利要求3所述的方法,其中,接收第二信息包括从所述服务器接收所述第二信息。
5.如权利要求4所述的方法,其中,识别服务类型包括从所述第二信息确定要与所述第一无线设备连接的所述第二无线设备的操作模式和执行服务的类型。
6.如权利要求5所述的方法,其中,将所述第一无线设备连接到所述第二无线设备包括:
在所确定的操作模式中按预设的通信方案将所述第一无线设备连接到所述第二无线设备。
7.如权利要求6所述的方法,其中,与连接的所述第二无线设备执行服务包括根据执行服务的类型来执行发送和接收数据中的至少一者,或者根据所述第一无线设备是正在主控模式还是从属模式中操作来执行特定的功能。
8.如权利要求3所述的方法,还包括由所述服务器搜索在相同时间区间期间发送了相同记录数据的至少两个无线设备并且将搜索到的无线设备确定为用于所述第一无线设备和所述第二无线设备之间的服务连接的一组无线设备。
9.如权利要求8所述的方法,还包括:
由所述服务器从所述第一无线设备接收所述第一信息;
由所述服务器比较并搜索具有与所述第一信息的记录数据和时间戳相对应的第三信息的至少一个第二无线设备;
由所述服务器通过检查所述第一信息的时间戳和所述第三信息的时间戳来确定所述第一无线设备和所述第二无线设备中的每一者的操作;以及
由所述服务器生成指示所述第一无线设备和所述第二无线设备中的每一者的操作模式、所述第二无线设备的设备地址和执行服务的所述第二信息,并将所生成的第二信息发送到所述第一无线设备和所述第二无线设备中的每一者。
10.如权利要求3所述的方法,其中,输出第一信息包括:
将所述第一信息作为音频数据来加载并且通过扬声器输出加载的音频数据。
11.如权利要求10所述的方法,其中,接收第二信息包括:
通过麦克风接收从邻近的第二无线设备输出的所述第二信息,
其中,所述第二信息包括所述邻近的第二无线设备的记录数据、时间戳和所述邻近的第二无线设备的设备地址。
12.如权利要求11所述的方法,其中,识别服务类型包括:
根据所述第一信息和所述第二信息确定所述第一无线设备的操作模式、所述第二无线设备的设备地址和执行服务的类型。
13.如权利要求12所述的方法,其中,所述第一无线设备的操作模式根据所述第一信息的时间戳和所述第二信息的时间戳之间的时间差被确定为主控模式和从属模式之一。
14.如权利要求13所述的方法,其中,将所述第一无线设备连接到所述第二无线设备包括:
在所确定的操作模式中根据所述第二无线设备的设备地址和预设的通信方法执行连接。
15.如权利要求14所述的方法,其中,与连接的第二无线设备执行服务包括:根据执行服务的类型执行发送和接收数据中的至少一者,或者通过所述第一无线设备和所述第二无线设备中的一者在主控模式中操作并且所述第一无线设备和所述第二无线设备中的另一者在从属模式中操作来执行特定的功能。
16.如权利要求2所述的方法,还包括:
当所述语音命令按钮的输入被取消时基于记录的用户语音生成所述第一信息;
利用所述第一信息来改变所述第一无线设备的设备信息;以及
搜索要与所述第一无线设备连接的具有与所述第一信息相对应的设备信息的另一设备作为所述第二无线设备。
17.如权利要求16所述的方法,其中,所述第一信息是具有利用记录的用户语音的语音波形和所述时间戳生成的唯一串的认证密钥。
18.如权利要求17所述的方法,其中,所述设备信息是利用所述认证密钥的串来改变的设备标识符。
19.如权利要求18所述的方法,其中,所述连接包括:
按预设的通信方案搜索周围无线设备;
将搜索出的周围无线设备之中的具有与所述认证密钥一致的设备信息的设备确定为所述第二无线设备;以及
向用于连接的所述第二无线设备发送连接请求。
20.如权利要求19所述的方法,其中,将所述第一无线设备连接到所述第二无线设备包括:
在接收到所述连接请求时把由所述第二无线设备生成的认证密钥与发送了所述连接请求的无线设备的设备信息相比较;以及
当所述第二无线设备的设备信息与所述认证密钥一致时向所述第二无线设备发送连接批准。
21.一种利用语音在第一无线设备和至少一个第二无线设备之间连接服务的方法,所述方法包括:
由所述第一无线设备在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;
接收所述用户语音的输入,记录接收到的用户语音,并且基于接收到的用户语音生成记录数据;
当所述语音命令按钮的输入被取消时根据记录的时间戳、所述记录数据和所述第一无线设备的设备地址生成语音信息;
将所生成的语音信息发送到服务器;
从所述服务器接收服务信息;
根据所述服务信息检查所述第一无线设备的操作模式、用于连接的所述第二无线设备的设备地址和执行服务的类型;
根据检查出的操作模式将所述第一无线设备连接到第二无线设备,其中,操作模式为主控模式和从属模式之一;以及
在连接到所述第二无线设备后根据检查出的执行服务的类型并且根据检查出的操作模式与连接的第二无线设备执行服务。
22.一种利用语音来连接服务的方法,所述方法包括:
由第一无线设备在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;
接收所述用户语音的输入并且通过记录输入的用户语音来生成记录数据;
当所述语音命令按钮的输入被取消时生成包括记录的时间戳、所述记录数据和所述第一无线设备的设备地址的第一语音信息;
将所生成的语音信息作为音频数据来加载并且通过所述第一无线设备的扬声器输出加载的音频数据;
通过所述第一无线设备的麦克风接收通过第二无线设备的扬声器输出的第二语音信息;
从所述第一语音信息和所述第二语音信息中检查所述第一无线设备的操作模式、用于与所述第一无线设备建立连接的所述第二无线设备的设备地址以及执行服务的类型;
根据所述操作模式将所述第一无线设备连接到所述第二无线设备,其中,操作模式为主控模式和从属模式之一;以及
在将所述第一无线设备连接到所述第二无线设备后根据所述执行服务的类型并且根据所述第一无线设备的操作模式来执行服务。
23.一种利用语音在第一无线设备和至少一个第二无线设备之间连接服务的方法,所述方法包括:
在语音命令按钮被输入时记录时间戳并且等待接收用户语音的输入;
接收所述用户语音的输入并且通过记录输入的用户语音来生成记录数据;
当所述语音命令按钮的输入被取消时通过利用所述记录数据的语音波形和记录的时间戳来生成具有唯一串的认证密钥;
利用所述认证密钥来改变用于标识所述第一无线设备的设备信息;
在预设的通信模式搜索具有与所述认证密钥相对应的设备信息的要与所述第一无线设备连接的所述第二无线设备;
通过连接请求的发送和连接批准的接收来执行所述第一无线设备和所述第二无线设备之间的连接;以及
在与所述第二无线设备执行连接后执行所述服务。
24.如权利要求23所述的方法,其中,搜索所述第二无线设备包括:
在预设的通信模式搜索周围无线设备;以及
将所述周围无线设备之中具有与所述认证密钥的语音波形部分的串一致的设备信息的无线设备确定为所述第二无线设备。
25.如权利要求23所述的方法,还包括:
将所述认证密钥的时间信息部分的串与所述设备信息的时间信息部分的串相比较从而确定所述第一无线设备的操作模式。
26.一种用于通过利用输入语音来支持第一无线设备与至少一个第二无线设备之间的服务连接的第三设备,所述第三设备包括:
存储单元,用于存储至少一个程序;以及
控制器,用于执行所述至少一个程序来:
记录在语音命令按钮已被输入的状态中输入的用户语音,
当所述语音命令按钮的输入被取消时基于记录的用户语音输出第一信息,其中,所述第一信息包括根据所述用户语音的记录数据、时间戳和所述第一无线设备的设备地址,
接收第二信息,其中,所述第二信息包括为所述第一无线设备确定的操作模式信息、所述第二无线设备的设备地址以及要执行的服务的执行信息,根据所述第一信息和所述第二信息识别服务类型,
在根据所述服务类型确定的所述第一无线设备的操作模式中将所述第一无线设备连接到所述第二无线设备,其中,将所述第一无线设备连接到所述第二无线设备包括:确定主控模式和从属模式之一为所述第一无线设备的操作模式;以及以所确定的操作模式将所述第一无线设备连接到所述第二无线设备,并且
与连接的所述第二无线设备执行服务。
27.一种非暂态计算机可读记录介质,记录了用于执行在第一无线设备和至少一个第二无线设备之间连接服务的方法的程序,所述方法包括:
由所述第一无线设备记录在语音命令按钮已被输入的状态中输入的用户语音;
当语音命令按钮的输入被取消时基于记录的用户语音输出第一信息,其中,所述第一信息包括根据所述用户语音的记录数据、时间戳和所述第一无线设备的设备地址;
由所述第一无线设备接收第二信息,其中,所述第二信息包括为所述第一无线设备确定的操作模式信息、所述第二无线设备的设备地址以及要执行的服务的执行信息;
由所述第一无线设备根据所述第一信息和接收到的第二信息识别服务类型;
根据所识别的服务类型确定所述第一无线设备的操作模式;以及
根据所确定的操作模式在所述第一无线设备和所述第二无线设备之间执行服务连接,
其中,在所述第一无线设备和所述第二无线设备之间执行服务连接包括:确定主控模式和从属模式之一为所述第一无线设备的操作模式;以及以所确定的操作模式将所述第一无线设备连接到所述第二无线设备。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0072290 | 2012-07-03 | ||
KR1020120072290A KR101972955B1 (ko) | 2012-07-03 | 2012-07-03 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
PCT/KR2013/005908 WO2014007545A1 (en) | 2012-07-03 | 2013-07-03 | Method and apparatus for connecting service between user devices using voice |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104604274A CN104604274A (zh) | 2015-05-06 |
CN104604274B true CN104604274B (zh) | 2018-11-20 |
Family
ID=48917334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380045946.3A Expired - Fee Related CN104604274B (zh) | 2012-07-03 | 2013-07-03 | 利用语音在用户设备之间连接服务的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US9805733B2 (zh) |
EP (2) | EP2683147B1 (zh) |
KR (1) | KR101972955B1 (zh) |
CN (1) | CN104604274B (zh) |
WO (1) | WO2014007545A1 (zh) |
Families Citing this family (196)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR101972955B1 (ko) * | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US8996059B2 (en) * | 2012-07-19 | 2015-03-31 | Kirusa, Inc. | Adaptive communication mode for recording a media message |
CN104969289B (zh) | 2013-02-07 | 2021-05-28 | 苹果公司 | 数字助理的语音触发器 |
US9349365B2 (en) * | 2013-03-14 | 2016-05-24 | Accenture Global Services Limited | Voice based automation testing for hands free module |
US9772919B2 (en) | 2013-03-14 | 2017-09-26 | Accenture Global Services Limited | Automation of D-bus communication testing for bluetooth profiles |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10251382B2 (en) | 2013-08-21 | 2019-04-09 | Navico Holding As | Wearable device for fishing |
US9507562B2 (en) * | 2013-08-21 | 2016-11-29 | Navico Holding As | Using voice recognition for recording events |
JP6305023B2 (ja) * | 2013-11-13 | 2018-04-04 | キヤノン株式会社 | 通信装置、通信装置の制御方法、およびプログラム |
US9972324B2 (en) * | 2014-01-10 | 2018-05-15 | Verizon Patent And Licensing Inc. | Personal assistant application |
TW201530423A (zh) * | 2014-01-22 | 2015-08-01 | Kung-Lan Wang | 觸控方法及觸控系統 |
WO2015146179A1 (ja) | 2014-03-28 | 2015-10-01 | パナソニックIpマネジメント株式会社 | 音声コマンド入力装置および音声コマンド入力方法 |
TWI601018B (zh) * | 2014-04-10 | 2017-10-01 | 拓邁科技股份有限公司 | 電子裝置間之資料提供方法及系統,及相關電腦程式產品 |
US9807343B2 (en) | 2014-05-08 | 2017-10-31 | Samsung Electronics Co., Ltd | Apparatus and method for changing mode of device |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
KR102262853B1 (ko) | 2014-09-01 | 2021-06-10 | 삼성전자주식회사 | 복수의 마이크를 포함하는 전자 장치 및 이의 운용 방법 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
GB2545151A (en) * | 2015-03-17 | 2017-06-14 | Yummi Group Singapore Pte Ltd | A method and system of creating a network to facilitate a multiplayer game |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US9940094B1 (en) * | 2015-05-19 | 2018-04-10 | Orion Labs | Dynamic muting audio transducer control for wearable personal communication nodes |
US9936010B1 (en) | 2015-05-19 | 2018-04-03 | Orion Labs | Device to device grouping of personal communication nodes |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
WO2016195545A1 (en) * | 2015-05-29 | 2016-12-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Authenticating data recording devices |
US9801219B2 (en) * | 2015-06-15 | 2017-10-24 | Microsoft Technology Licensing, Llc | Pairing of nearby devices using a synchronized cue signal |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9836129B2 (en) | 2015-08-06 | 2017-12-05 | Navico Holding As | Using motion sensing for controlling a display |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
KR102356969B1 (ko) * | 2015-09-24 | 2022-01-28 | 삼성전자주식회사 | 통신 수행 방법 및 이를 지원하는 전자장치 |
KR102393286B1 (ko) * | 2015-09-25 | 2022-05-02 | 삼성전자주식회사 | 전자 장치 및 그 연결 방법 |
US9653075B1 (en) * | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10348907B1 (en) * | 2016-05-12 | 2019-07-09 | Antony P. Ng | Collaborative data processing |
US10228906B2 (en) * | 2016-05-30 | 2019-03-12 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
CN109643548B (zh) * | 2016-06-27 | 2023-05-05 | 亚马逊技术公司 | 用于将内容路由到相关联输出设备的***和方法 |
US10271093B1 (en) * | 2016-06-27 | 2019-04-23 | Amazon Technologies, Inc. | Systems and methods for routing content to an associated output device |
US10491598B2 (en) | 2016-06-30 | 2019-11-26 | Amazon Technologies, Inc. | Multi-factor authentication to access services |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10948577B2 (en) | 2016-08-25 | 2021-03-16 | Navico Holding As | Systems and associated methods for generating a fish activity report based on aggregated marine data |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
CN106488281A (zh) * | 2016-10-26 | 2017-03-08 | Tcl集团股份有限公司 | 一种电视音频的播放方法及控制***、电视、通信*** |
KR20180082043A (ko) | 2017-01-09 | 2018-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 음성을 이용한 통신 연결 방법 |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
CN107086037A (zh) * | 2017-03-17 | 2017-08-22 | 上海庆科信息技术有限公司 | 一种嵌入式设备的语音交互方法、装置及嵌入式设备 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
KR102275564B1 (ko) * | 2017-04-14 | 2021-07-12 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서 인증 정보 전송 및 수신 방법 |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179560B1 (en) * | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
AU2017428304B2 (en) * | 2017-08-25 | 2022-12-22 | David Tuk Wai LEONG | Sound recognition apparatus |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) * | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
KR102443079B1 (ko) | 2017-12-06 | 2022-09-14 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10152970B1 (en) * | 2018-02-08 | 2018-12-11 | Capital One Services, Llc | Adversarial learning and generation of dialogue responses |
US11087752B2 (en) * | 2018-03-07 | 2021-08-10 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
WO2019172948A1 (en) * | 2018-03-07 | 2019-09-12 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
US10755694B2 (en) * | 2018-03-15 | 2020-08-25 | Motorola Mobility Llc | Electronic device with voice-synthesis and acoustic watermark capabilities |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
JP7313807B2 (ja) * | 2018-08-24 | 2023-07-25 | キヤノン株式会社 | 通信装置、その制御方法、およびそのプログラム |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11315553B2 (en) * | 2018-09-20 | 2022-04-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10978051B2 (en) * | 2018-09-28 | 2021-04-13 | Capital One Services, Llc | Adversarial learning framework for persona-based dialogue modeling |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US20190074013A1 (en) * | 2018-11-02 | 2019-03-07 | Intel Corporation | Method, device and system to facilitate communication between voice assistants |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
KR102599948B1 (ko) * | 2018-11-16 | 2023-11-09 | 삼성전자주식회사 | 전자 장치 및 그의 와이파이 연결 방법 |
WO2020104042A1 (de) * | 2018-11-23 | 2020-05-28 | Unify Patente Gmbh & Co. Kg | Computer-implementiertes verfahren zum miteinander assoziieren von zumindest zwei kommunikationsendgeräten und kommunikationsendgerät |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11622267B2 (en) * | 2019-01-17 | 2023-04-04 | Visa International Service Association | Conducting secure transactions by detecting credential message with audio between first appliance and second appliance |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US10965335B1 (en) * | 2019-09-27 | 2021-03-30 | Apple Inc. | Wireless device performance optimization using dynamic power control |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
CN111540350B (zh) * | 2020-03-31 | 2024-03-01 | 北京小米移动软件有限公司 | 一种智能语音控制设备的控制方法、装置及存储介质 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
CN111787051B (zh) * | 2020-05-15 | 2023-06-27 | 厦门快商通科技股份有限公司 | 基于语音识别的文件传输方法、***及移动终端 |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN111933168B (zh) * | 2020-08-17 | 2023-10-27 | 齐鲁工业大学 | 基于binder的软回路动态消回声方法及移动终端 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
KR20220054041A (ko) * | 2020-10-23 | 2022-05-02 | 삼성전자주식회사 | 전자 장치 및 통화 녹음 방법 |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US12007512B2 (en) | 2020-11-30 | 2024-06-11 | Navico, Inc. | Sonar display features |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
US11594219B2 (en) | 2021-02-05 | 2023-02-28 | The Toronto-Dominion Bank | Method and system for completing an operation |
US20220287110A1 (en) * | 2021-03-05 | 2022-09-08 | Samsung Electronics Co., Ltd. | Electronic device and method for connecting device thereof |
US11889569B2 (en) | 2021-08-09 | 2024-01-30 | International Business Machines Corporation | Device pairing using wireless communication based on voice command context |
US12021806B1 (en) | 2021-09-21 | 2024-06-25 | Apple Inc. | Intelligent message delivery |
US20230306965A1 (en) * | 2022-02-02 | 2023-09-28 | Google Llc | Speech Recognition Using Word or Phoneme Time Markers Based on User Input |
KR102670725B1 (ko) * | 2023-09-27 | 2024-05-30 | 주식회사 씨와이디정보기술 | 다수의 상대방 디바이스와 연결되는 음성-텍스트 변환 장치 및 이를 위한 방법 |
CN117609965B (zh) * | 2024-01-19 | 2024-06-25 | 深圳前海深蕾半导体有限公司 | 智能设备的升级数据包获取方法、智能设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101030994A (zh) * | 2007-04-11 | 2007-09-05 | 华为技术有限公司 | 语音识别方法、***、语音识别服务器 |
CN101241537A (zh) * | 2006-12-28 | 2008-08-13 | 英特尔公司 | Nfc应用的话音接口 |
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
CN102483915A (zh) * | 2009-06-25 | 2012-05-30 | 蓝蚁无线股份有限公司 | 具有包括导引配对和语音触发操作的语音控制功能的电信装置 |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7053752B2 (en) * | 1996-08-06 | 2006-05-30 | Intuitive Surgical | General purpose distributed operating room control system |
IL128720A (en) * | 1999-02-25 | 2009-06-15 | Cidway Technologies Ltd | Method for confirming actions performed over the phone |
US6339706B1 (en) * | 1999-11-12 | 2002-01-15 | Telefonaktiebolaget L M Ericsson (Publ) | Wireless voice-activated remote control device |
US20010039619A1 (en) * | 2000-02-03 | 2001-11-08 | Martine Lapere | Speaker verification interface for secure transactions |
FR2812998B1 (fr) * | 2000-08-09 | 2004-06-04 | France Telecom | Procede d'itentification d'un appelant aupres d'un service telephonique |
CN1173498C (zh) * | 2000-10-13 | 2004-10-27 | 国际商业机器公司 | 语音允许的蓝牙设备管理和访问装置及有关控制方法 |
US7171365B2 (en) * | 2001-02-16 | 2007-01-30 | International Business Machines Corporation | Tracking time using portable recorders and speech recognition |
EP1271346A1 (en) * | 2001-06-28 | 2003-01-02 | Nokia Corporation | Method for searching data in at least two databases |
US7103551B2 (en) * | 2002-05-02 | 2006-09-05 | International Business Machines Corporation | Computer network including a computer system transmitting screen image information and corresponding speech information to another computer system |
US20030236980A1 (en) * | 2002-06-20 | 2003-12-25 | Hsu Raymond T. | Authentication in a communication system |
US7260529B1 (en) * | 2002-06-25 | 2007-08-21 | Lengen Nicholas D | Command insertion system and method for voice recognition applications |
US7107010B2 (en) * | 2003-04-16 | 2006-09-12 | Nokia Corporation | Short-range radio terminal adapted for data streaming and real time services |
US7684754B2 (en) * | 2003-06-03 | 2010-03-23 | Microsoft Corporation | Capacitive bonding of devices |
US20050010417A1 (en) * | 2003-07-11 | 2005-01-13 | Holmes David W. | Simplified wireless device pairing |
US20070168674A1 (en) * | 2003-12-09 | 2007-07-19 | Masao Nonaka | Authentication system, authentication apparatus, and recording medium |
US7801283B2 (en) * | 2003-12-22 | 2010-09-21 | Lear Corporation | Method of operating vehicular, hands-free telephone system |
KR20050081470A (ko) | 2004-02-13 | 2005-08-19 | 주식회사 엑스텔테크놀러지 | 음성인식 가능한 메시지 녹음/재생방법 |
KR100679312B1 (ko) * | 2005-01-03 | 2007-02-05 | 주식회사 케이티프리텔 | 음성 녹음을 이용한 상대방 정보 표시 서비스 제공 방법및 장치 |
US8141142B2 (en) * | 2005-02-14 | 2012-03-20 | International Business Machines Corporation | Secure authentication of service users of a remote service interface to a storage media |
US8699944B2 (en) * | 2005-06-10 | 2014-04-15 | The Invention Science Fund I, Llc | Device pairing using device generated sound |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US8112794B2 (en) * | 2006-07-17 | 2012-02-07 | Research In Motion Limited | Management of multiple connections to a security token access device |
US20120233644A1 (en) * | 2007-06-05 | 2012-09-13 | Bindu Rama Rao | Mobile device capable of substantially synchronized sharing of streaming media with other devices |
EP2073515A1 (en) * | 2007-12-21 | 2009-06-24 | Koninklijke KPN N.V. | Identification of proximate mobile devices |
US8224354B2 (en) * | 2007-07-20 | 2012-07-17 | Koninklijke Kpn N.V. | Identification of proximate mobile devices |
KR20090044093A (ko) * | 2007-10-31 | 2009-05-07 | 에스케이 텔레콤주식회사 | 디바이스 협업 방법 및 시스템 |
US8219028B1 (en) * | 2008-03-31 | 2012-07-10 | Google Inc. | Passing information between mobile devices |
US8781115B2 (en) * | 2008-04-01 | 2014-07-15 | Disney Enterprises, Inc. | Method and system for pairing a medium to a user account |
US20090310762A1 (en) * | 2008-06-14 | 2009-12-17 | George Alfred Velius | System and method for instant voice-activated communications using advanced telephones and data networks |
US8463182B2 (en) * | 2009-12-24 | 2013-06-11 | Sony Computer Entertainment Inc. | Wireless device pairing and grouping methods |
US8750473B2 (en) * | 2008-09-03 | 2014-06-10 | Smule, Inc. | System and method for communication between mobile devices using digital/acoustic techniques |
RU2398356C2 (ru) * | 2008-10-31 | 2010-08-27 | Cамсунг Электроникс Ко., Лтд | Способ установления беспроводной линии связи и система для установления беспроводной связи |
KR101567603B1 (ko) * | 2009-05-07 | 2015-11-20 | 엘지전자 주식회사 | 멀티 음성 시스템의 동작 제어 장치 및 방법 |
US20100330908A1 (en) * | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Telecommunications device with voice-controlled functions |
US8416767B2 (en) * | 2009-07-06 | 2013-04-09 | T-Mobile Usa, Inc. | Communication mode swapping for telecommunications devices |
EP2278780A1 (en) * | 2009-07-23 | 2011-01-26 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Common audio event determination |
US8654952B2 (en) * | 2009-08-20 | 2014-02-18 | T-Mobile Usa, Inc. | Shareable applications on telecommunications devices |
US8294683B2 (en) * | 2009-09-25 | 2012-10-23 | Mitac International Corp. | Method of processing touch commands and voice commands in parallel in an electronic device supporting speech recognition |
US8219146B2 (en) * | 2009-11-06 | 2012-07-10 | Sony Corporation | Audio-only user interface mobile phone pairing |
US20110217950A1 (en) * | 2010-03-05 | 2011-09-08 | Alan Kozlay | Apparatus & method to improve pairing security in Bluetooth™ headsets & earbuds |
US10104183B2 (en) * | 2010-06-22 | 2018-10-16 | Microsoft Technology Licensing, Llc | Networked device authentication, pairing and resource sharing |
US8443420B2 (en) * | 2010-10-01 | 2013-05-14 | At&T Intellectual Property I, L.P. | System for communicating with a mobile device server |
JP5913381B2 (ja) * | 2011-03-01 | 2016-04-27 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 装置間の無線安全通信を可能にする方法 |
US9261603B2 (en) * | 2011-04-11 | 2016-02-16 | Telenav, Inc. | Navigation system with conditional based application sharing mechanism and method of operation thereof |
US8683263B2 (en) * | 2011-09-09 | 2014-03-25 | Microsoft Corporation | Cooperative client and server logging |
US8538333B2 (en) * | 2011-12-16 | 2013-09-17 | Arbitron Inc. | Media exposure linking utilizing bluetooth signal characteristics |
CN103179634A (zh) * | 2011-12-21 | 2013-06-26 | 株式会社Ntt都科摩 | 一种伙伴发现和选择方法、装置及*** |
KR101972955B1 (ko) * | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US9082413B2 (en) * | 2012-11-02 | 2015-07-14 | International Business Machines Corporation | Electronic transaction authentication based on sound proximity |
-
2012
- 2012-07-03 KR KR1020120072290A patent/KR101972955B1/ko active IP Right Grant
-
2013
- 2013-07-03 WO PCT/KR2013/005908 patent/WO2014007545A1/en active Application Filing
- 2013-07-03 EP EP13174992.1A patent/EP2683147B1/en not_active Not-in-force
- 2013-07-03 EP EP19152424.8A patent/EP3493513A1/en not_active Withdrawn
- 2013-07-03 US US13/934,839 patent/US9805733B2/en active Active
- 2013-07-03 CN CN201380045946.3A patent/CN104604274B/zh not_active Expired - Fee Related
-
2017
- 2017-10-30 US US15/797,910 patent/US10475464B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101241537A (zh) * | 2006-12-28 | 2008-08-13 | 英特尔公司 | Nfc应用的话音接口 |
CN101030994A (zh) * | 2007-04-11 | 2007-09-05 | 华为技术有限公司 | 语音识别方法、***、语音识别服务器 |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
CN102483915A (zh) * | 2009-06-25 | 2012-05-30 | 蓝蚁无线股份有限公司 | 具有包括导引配对和语音触发操作的语音控制功能的电信装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2683147B1 (en) | 2019-02-27 |
US20140012587A1 (en) | 2014-01-09 |
KR101972955B1 (ko) | 2019-04-26 |
WO2014007545A1 (en) | 2014-01-09 |
KR20140005410A (ko) | 2014-01-15 |
CN104604274A (zh) | 2015-05-06 |
EP3493513A1 (en) | 2019-06-05 |
US20180047406A1 (en) | 2018-02-15 |
US10475464B2 (en) | 2019-11-12 |
US9805733B2 (en) | 2017-10-31 |
EP2683147A1 (en) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104604274B (zh) | 利用语音在用户设备之间连接服务的方法和装置 | |
US20210065716A1 (en) | Voice processing method and electronic device supporting the same | |
CN105389099B (zh) | 用于语音记录和回放的方法和设备 | |
CN110046238B (zh) | 对话交互方法、图形用户界面、终端设备以及网络设备 | |
KR102261552B1 (ko) | 음성 명령어 제공 방법 및 이를 지원하는 전자 장치 | |
EP3020040B1 (en) | Method and apparatus for assigning keyword model to voice operated function | |
US20150029089A1 (en) | Display apparatus and method for providing personalized service thereof | |
US9900427B2 (en) | Electronic device and method for displaying call information thereof | |
CN108320745A (zh) | 控制显示的方法及装置 | |
CN109949795A (zh) | 一种控制智能设备交互的方法及装置 | |
KR102343084B1 (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
CN107481721A (zh) | 用于可穿戴电子设备的语音交互方法和可穿戴电子设备 | |
KR20130081176A (ko) | 이동 단말기 및 이동 단말기의 제어 방법 | |
CN107657045A (zh) | 信息收藏方法、移动终端及计算机可读存储介质 | |
KR102202896B1 (ko) | 전자 장치의 웹 페이지 저장 및 표현 방법 | |
CN107463700A (zh) | 用于获取信息的方法、装置及设备 | |
CN110047484A (zh) | 一种语音识别交互方法、***、设备和存储介质 | |
CN104461446B (zh) | 基于语音交互的软件运行方法及*** | |
CN110109608A (zh) | 文本显示方法、装置、终端及存储介质 | |
KR20140116642A (ko) | 음성 인식 기반의 기능 제어 방법 및 장치 | |
CN106471493A (zh) | 用于管理数据的方法和装置 | |
KR102330576B1 (ko) | 노래방 시스템 및 그의 제어 방법 | |
CN110365371A (zh) | 基于蓝牙设备提供触发信号实现翻译***控制的方法及其***、电子设备 | |
CN105100005A (zh) | 身份验证方法及装置 | |
CN107316644A (zh) | 用于信息交互的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181120 |
|
CF01 | Termination of patent right due to non-payment of annual fee |