CN108630201B - 一种用于建立设备关联的方法和装置 - Google Patents
一种用于建立设备关联的方法和装置 Download PDFInfo
- Publication number
- CN108630201B CN108630201B CN201810187221.2A CN201810187221A CN108630201B CN 108630201 B CN108630201 B CN 108630201B CN 201810187221 A CN201810187221 A CN 201810187221A CN 108630201 B CN108630201 B CN 108630201B
- Authority
- CN
- China
- Prior art keywords
- association
- natural
- speech signal
- instruction
- devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000004891 communication Methods 0.000 claims description 62
- 230000004913 activation Effects 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 24
- 238000013475 authorization Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000003993 interaction Effects 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000003213 activating effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种用于建立设备关联的方法和装置,所述方法包括:接收第一自然语音信号;当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。本发明基于自然语音的关联建立方式,用户操作的复杂性、频率大大降低。
Description
技术领域
本发明涉及人工智能技术领域,更具体地,涉及一种用于建立设备关联的方法和装置。
背景技术
随着人工智能技术的发展,自然语音处理技术的相关性能得到了极大的提升。越来越多的智能设备具备了自然语音处理的能力,例如智能音箱、智能手机、智能平板电脑、物联网设备等。
然而,由于智能设备之间缺少关联,每个智能设备均只能独立的工作。这种情况对于人机交互非常不友好的,因为每个智能设备都需要用户单独通过激活语音指令来进行控制,也无法实现通过一个设备的语音交互入口控制其他设备的功能。一种可行的方法是通过人工用传统的人机交互进行设备之间的关联,例如网页或计算机应用程序,从而使得多个设备之间能够具有关联性。这种方法的弊端在于操作不便利,并且需要频繁操作设备的关联和解关联。
因此,需要一种技术以提供更为便捷,交互更为自然地实现多个设备之间的关联建立。
发明内容
本发明实施例提供一种用于建立设备关联的方法和装置,以提供更为便捷,交互更为自然地实现多个设备之间的关联建立。
为了解决上述问题,本发明提供一种用于建立设备关联的方法和装置,所述方法可以包括:
接收第一自然语音信号;
当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
所述方法还可以包括:
接收第一自然语音信号;
当所述第一自然语音信号包括设备关联指令时,监听第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
可选地,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
可选地,所述操作指令包括对于第二自然语音信号的操作指令。
可选地,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
可选地,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
可选地,所述调制方式包括调幅、调频和调相的一个或多个组合。
可选地,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
可选地,所述方法还包括:基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
可选地,所述第二自然语音信号的格式是默认设置或者自定义设置。
为了解决上述问题,本发明提供一种用于建立设备关联的装置,所述装置可以包括:
第一自然语音信号接收模块,用于接收第一自然语音信号;
第二自然语音信号发送模块,用于当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
所述装置还可以包括:
第一自然语音信号接收模块,用于接收第一自然语音信号;
第二自然语音信号监听模块,用于当所述第一自然语音信号包括设备关联指令时,监听第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
可选地,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
可选地,所述操作指令包括对于第二自然语音信号的操作指令。
可选地,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
可选地,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
可选地,所述调制方式包括调幅、调频和调相的一个或多个组合。
可选地,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
可选地,所述装置还包括:
通信连接建立模块,用于基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
可选地,所述第二自然语音信号的格式是默认设置或者自定义设置。
本发明的实施例中,利用设备的自然语音处理能力,对于接收到的第一自然语音信号处理,判断是否包括设备关联指令;当第一自然语音信号包括设备关联指令时,则发送或接收第二自然语音信号,所述第二自然语音信号用于建立多个设备之间的关联。当多个设备中的至少一个设备获得全部的关联信息时,多个设备的关联就完成建立。基于自然语音的关联建立方式,用户操作的复杂性、频率大大降低。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例
图1为根据本发明一实施方式的一种用于建立设备关联的方法流程图;
图2为根据本发明一实施方式的一种用于建立设备关联的方法流程图;
图3为根据本发明一实施方式的一种用于建立设备关联的装置结构图;
图4为根据本发明一实施方式的一种用于建立设备关联的装置结构图;
图5为根据本发明一实施方式的电子设备示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本领域技术人员可以理解,本申请中的“第一”、“第二”等术语仅用于区别不同设备、模块或参数等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
语音信号处理是语音学和数字信号处理相结合的交叉学科,同时又与心理声学、语言学、模式识别和人工智能等学科相联系。既依赖这些学科的发展,又可以促进这些学科的进步。目前语音信号处理的主要应用分支:利于存储、传输的语音编解码、让机器能“说话”的语音合成、让机器能够识别和理解人类的语言内容的语音识别、让机器人能识别说话人的模式识别、提高语音的清晰度和可懂度的语音增强。在本发明中的智能设备具有语音识别和语音合成能力。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把自然语音信号转变为相应的文本或命令的技术,主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。根据待识别的对象不同,语音识别大体可分为三类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keywordspotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知或预定的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,可以是一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知或预定的若干关键词在何处出现,例如在一段话中检测“计算机”、“世界”这两个词。语音识别常见的应用领域包括:语音输入,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号***、智能家电、声控智能玩具等许多领域;智能对话查询,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务***、订票***、医疗服务、银行服务、股票查询服务等等。目前,隐式马尔科夫模型(HMM)、人工神经网络是语音识别中的主流技术方法。
语音合成是通过机械的、电子的方法产生人造语音的技术。文本语音转换技术(TTS技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术,具体涉及语言处理、韵律处理和声学处理。语言处理在文语转换***中起着重要的作用,主要模拟人对自然语言的理解过程——文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。韵律处理为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。声学处理根据前两部分处理结果的要求输出语音,即合成语音。
如图1所示,本发明一实施方式的一种用于建立设备关联的方法流程图,应用于具有自然语音处理能力的一个设备,例如智能手机、智能平板、智能音箱、笔记本、物联网设备等。这里的自然语音处理能力包括:语音识别和语音合成能力。可以将多个设备分为当前设备和目标设备,当前设备、目标设备可以是一个,也可以是多个。
步骤S11,接收第一自然语音信号;
具有自然语音处理能力的当前设备通过声音采集装置,例如麦克风,采集自然语音信号。这里的第一自然语音信号可以是用户发出的自然语音信号,也可以是其他设备发出的自然语音信号,本发明的实施例不作限制。另一方面,这里的第一自然语音信号可以是用户主动发出的自然语音信号,例如“建立设备关联”;也可以是当前设备先向用户发出询问,用户对该询问做出回答,例如,当前设备询问:“是否需要建立设备管理”,用户回答:“需要”。这里用户做出的回答可以是标准格式,例如设备只能识别“是”,也可以是任意当前设备可以识别的肯定回答,例如“是”“需要”“好”“建立”“yes”等,本发明的实施例不作限制。对于接收到的第一自然语音信号,当前设备可以对其进行预处理,例如降噪、增强等,预处理也可以在与当前设备相连的其他设备上完成,例如云端服务器,本发明的实施方式不作限制。
步骤S12,当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
当前设备对接收到的第一自然语音信号进行语音识别处理,得到实际的操作指令。当操作指令包括设备关联指令时,即第一自然语音信号包括设备关联指令时,当前设备发送第二自然语音信号。所述设备关联指令用于指示多个设备通过自然语音建立设备关联,可以说是设备关联流程开始的触发指令。所述设备关联指令可以是关键词,例如“关联”;也可以是连续语音流的识别,例如“建立关联”;也可以是连续语音流中的关键词,例如“建立”“关联”。这里的关键词或者说设备关联指令都可以是用户自定义的,非通用的,本发明的实施例不作限制。所述第二自然语音信号是用于建立当前设备与目标设备之间的关联,旨在让当前设备与目标设备获得关联所需要的信息。
本发明的实施方式中,利用设备的自然语音处理能力,对于接收到的第一自然语音信号处理,判断是否包括设备关联指令;当第一自然语音信号包括设备关联指令时,则发送第二自然语音信号,所述第二自然语音信号用于建立多个设备之间的关联。基于自然语音的关联建立方式,用户操作的复杂性、频率大大降低。
如图2所示,本发明一实施方式的一种用于建立设备关联的方法流程图,应用于具有自然语音处理能力的一个设备,例如智能手机、智能平板、智能音箱、笔记本、物联网设备等。这里的自然语音处理能力包括:语音识别和语音合成能力。可以将多个设备分为当前设备和目标设备,当前设备、目标设备可以是一个,也可以是多个。
步骤S21,接收第一自然语音信号;
具有自然语音处理能力的当前设备通过声音采集装置,例如麦克风,采集自然语音信号。这里的第一自然语音信号可以是用户发出的自然语音信号,也可以是其他设备发出的自然语音信号,本发明的实施例不作限制。另一方面,这里的第一自然语音信号可以是用户主动发出的自然语音信号,例如“建立设备关联”;也可以是当前设备先向用户发出询问,用户对该询问做出回答,例如,当前设备询问:“是否需要建立设备管理”,用户回答:“需要”。这里用户做出的回答可以是标准格式,例如设备只能识别“是”,也可以是任意当前设备可以识别的肯定回答,例如“是”“需要”“好”“建立”“yes”等,本发明的实施例不作限制。对于接收到的第一自然语音信号,当前设备可以对其进行预处理,例如降噪、增强等,预处理也可以在与当前设备相连的其他设备上完成,例如云端服务器,本发明的实施方式不作限制。
步骤S22,当所述第一自然语音信号包括设备关联指令时,监听第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
当前设备对接收到的第一自然语音信号进行语音识别处理,得到实际的操作指令。当操作指令包括设备关联指令时,即第一自然语音信号包括设备关联指令时,当前设备监听第二自然语音信号。第二自然语音信号理论是其他待关联的设备发出的自然语音信号,但是实际上也不能排除用户发出该语音信号帮助多个设备建立关联。所述设备关联指令用于指示多个设备通过自然语音建立设备关联,可以说是设备关联流程开始的触发指令。所述设备关联指令可以是关键词,例如“关联”;也可以是连续语音流的识别,例如“建立关联”;也可以是连续语音流中的关键词,例如“建立”“关联”。这里的关键词或者说设备关联指令都可以是用户自定义的,非通用的,本发明的实施例不作限制。所述第二自然语音信号是用于建立当前设备与目标设备之间的关联,旨在让当前设备与目标设备获得关联所需要的信息。
本发明的实施方式中,利用设备的自然语音处理能力,对于接收到的第一自然语音信号处理,判断是否包括设备关联指令;当第一自然语音信号包括设备关联指令时,则监听第二自然语音信号,所述第二自然语音信号用于建立多个设备之间的关联。基于自然语音的关联建立方式,用户操作的复杂性、频率大大降低。
对于上述的两个实施方式,设备建立关联的流程中可以包括多个第二自然语音信号的发送和接收,每一次发送和接收用于传输某一信息。例如,当前设备接收到包括设备关联指令的第一自然语音信号后,首先发送第一个第二自然语音信号,然后监听目标设备发出的第一个第二自然语音信号的响应,即接收第二个自然语音信号,然后再发送出第三个第二自然语音信号……再例如,当前设备接收到包括设备关联指令的第一自然语音信号后,首先监听第一个第二自然语音信号,当接收到第一个第二自然语音信号后做出响应,即发送第二个自然语音信号,然后再监听第三个第二自然语音信号……一般而言,设备在发送一条第二自然语音信号后进入继续监听的状态,在接收到另一条第二自然语音信号后进入继续发送的状态,在发送和接收中不断重复,直至获得建立关联所需要的关联信息。当然设备也可以设置成发送多条第二自然语音信号后才进入到监听状态。如果设备在发送一条第二自然语音信号后等待监听一段时间,但仍未接收到回馈或者新的第二自然语音信号,该设备也可以进行自动重发,本发明的实施例不作限制。建立关联的流程中还可以包含一个用于指示关联流程建立结束的指令。
当所述多个设备中的至少一个设备获得全部的关联信息时,就可以认为所述多个设备的关联完成建立。此时获得了全部的关联信息的设备在多个设备中相当于主设备,能够对其他设备实现操控,即主设备主动发送指令并获得反馈,而其他设备只能响应该指令。当多个设备都获得全部的关联信息,用户则可以通过多个设备中的任意设备操控其他的任意设备,即多个设备都具有主动发送指令并获得反馈的能力。指令可以是操作指令、信息获取指令、调用指令等等,本发明的实施例不作限制。通过成功建立关联,用户就可以通过其中的一个设备操控其他设备,使用便利性大大提高。
可选地,所述第一自然语音信号还可以包括激活指令、设备标识、操作指令的一个或多个组合。激活指令用于指示设备进入基于自然语音交互的状态。激活指令是指一个用于启动基于自然语音的交互过程的语音指令,一般是预定义的,可以是自定义的。设备在休眠或待机时不间断地监听该指令,当采集到的语音信号与该指令匹配成功时,设备进入基于自然语音交互的状态。设备标识包括:当前设备的标识、目标设备的标识。目标设备的标识、当前设备的标识可以是设备的名称或代号。多个设备可以同时接收到第一自然语音信号,但是用户只希望其中的某几个建立管理,此时第一自然语音信号中可以直接或间接包括当前设备和/或目标设备的标识。操作指令反映的时用户的实际操作要求,可以是当前设备的,也可以是某一目标设备的,例如对于当前设备A的第一自然语音信号是“建立关联,打开设备D中的xxx文件”,其中“建立关联”是设备关联指令,“设备D”是目标设备的标识,“打开xxx文件”是操作指令。
进一步地,所述操作指令包括对于第二自然语音信号的操作指令。例如如果当前设备收到的第一自然语音信号中包括“发送设备关联请求”这一操作指令,则当前设备发送第二自然语音信号;再例如如果当前设备收到的第一自然语音信号中包括“等待接收设备关联请求”这一操作指令,则当前设备监听第二自然语音信号。这里的例子都是第一自然语音信号中直接包括对于第二自然语音信号的操作指令,实际中可以是间接包括,间接包括方式本发明的实施例不作限制。设备在接收到包括设备关联指令的第一自然语音信号时,是发送还是监听第二自然语音信号也可以是预定义的,例如进入设备关联流程后设备A默认发送设备关联请求,设备B等待接收设备关联请求,设备C等待接收设备关联请求。这里的预定义可能是因为设备是同一个供应商而约定的,也可能是用户在使用前认为约定的,本发明的实施例不作限制。
可选地,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。为了实现多个设备之间的关联,多个设备中的至少一个设备必然要获得其他设备的信息。换言之,关联信息是服务于设备关联的建立。
可选地,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。所述调制方式包括调幅、调频和调相的一个或多个组合。当建立关联是通过自然语音的方式时,设备之间将需要交换的关联信息翻译成第二自然语音信号,并通过语音交互得到获取。当建立关联是通过调制的自然语音的方式时,设备将关联信息的数字信号通过相位或幅度调制的方式加载到第二自然语音信号,并通过音频发送和接收。
进一步地,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。激活指令用于指示设备进入基于自然语音交互的状态。这里的设备关联指令是用于指示目标设备进入设备关联流程。设备标识包括:目标设备的标识、当前设备的标识。通信方式包括有线方式、无线方式。通信地址是设备地址(device address),可以是在数据通信中发送或接收数据的任何设备的标识,也可以是由通道连接设备识别的第一个子通道地址。通信协议(CommunicationProtocol)是指双方实体完成通信或服务所必须遵循的规则和约定。设备功能是指建立关联或者将要建立关联的设备所具有的功能,可以是明确的功能,例如智能音箱具有播放音乐的功能,也可以是不明确的功能,例如智能平板具有播放音视频文件、文本文件、浏览网页等多种功能,其他设备不需要获悉智能平板的功能,而是在接收到操作指令的基础上向智能平板发出进一步的请求或询问。激活指令是指一个用于启动基于自然语音的交互过程的语音指令,一般是预定义的,可以是自定义的。设备在休眠或待机时不间断地监听该指令,当采集到的语音信号与该指令匹配成功时,设备进入基于自然语音交互的状态。基于自然语音的特征性,模式识别是当前自然语音处理中的一个重要领域。相应地为了验证使用身份,某些智能设备仅能识别其主人的自然语音,想要利用一台具有自然语音处理能力的设备与该设备“沟通”,或者控制该设备,可以使前者发出的第二自然语音信号是经过处理的、能够模拟主人的自然语音。当然,也可以预先设置一个授权指令,当前者发出的第二自然语音信号包括授权指令时,后者能识别前者的自然语音信号,或者认为前者具有控制权。在一些实施方式中,授权指令可以是激活指令,即一个指令具有激活设备进入人机交互的状态的作用,也同时也具有身份验证的作用。关联信息的确定或选择,可以是默认设置,也可以根据实际场景中用户的需要而自定义,本发明的实施例不作限制。
可选地,所述方法还包括步骤S3,基于所述关联信息,建立所述多个设备的基于电信号的通信连接。相对而言,语音信号在传输距离、传输质量等多个上不如基于电信号的通信连接完美。因此在多个设备之间获得了一定的关联信息后,则不再需要自然语音信号的方式进行通信和/或控制。例如,基于关联信息中的通信标识、通信地址、通信协议、通信方式中的一个或多个,进行传统的基于电信号的通信,例如通过有线以太网,无线区域网,无线广域网等方式进行通信。通信标识可以是设备标识,也可以是基于电信号的通信的IP地址。通信连接的建立可以是在设备关联的完成建立前,利用通信连接传输多个设备关联所需要的关联信息。当然,通信连接的建立可以是在设备关联的完成建立后。此时,每个设备中存储了关联设备的设备标识、设备功能、基于电信号的通信地址、通信协议等一个或多个信息,设备之间可以通过存储的信息进行更快速、更敏捷的通信和/或控制。
可选地,所述第二自然语音信号的格式是默认设置或者自定义设置。第二自然语音信号的格式是指第二自然语音信号包括的信息的格式,例如对于第二自然语音信号是“请求建立关联,我是设备A,IP地址是yyyy”,其格式是设备关联指令、当前设备标识、通信地址。第二自然语音信号的格式可以是默认设置,也可以根据实际场景中用户的需要而自定义,这个自定义可以是在用户使用该关联功能前也可以包括在第一自然语音信号中,本发明的实施例不作限制。
为了说明的更清楚,这里我们再详细列举两个实施例。
在实施例一中,我们给出两个设备通过自然语音建立关联和通信的方法。例如用户拥有设备A和设备B,设备A为一个智能手机,设备B为一个智能平板电脑。设备A和设备B属于同一个供应商Sky,两者都具备了自然语音处理能力。假设两个设备的激活语音指令为“Hey Sky”,也就是当用户可以在两个设备在距离较近的情况下,发出语音指令“Hey Sky”,则此时两个设备均进入基于自然语音的交互状态,此时两个设备均在监听用户接下来要发出的语音指令。这里要注意的是并不是同一个供应商的设备激活指令就是同一个,激活指令可以自定义,也可以不同供应商的设备使用同一个激活指令。然后,用户发出预定义的设备关联指令“建立设备关联”,即第一自然语音信号,此时两个设备同时接收并识别该设备关联指令,并进入基于自然语音的建立设备关联流程。由于两个设备是同一个供应商的产品,因此两者可以都存储有预定义的建立关联的流程,这里可以是智能手机率先发送第一个第二自然语音信号,智能平板等待接收第一个第二自然语音信号。例如,智能手机发送的自然语音信号,即第二自然语音信号包括标识信息和地址信息:“请求建立连接,我是设备xxxx,IP地址为yyyy”。在接收到语音信号之后,智能平板电脑可以发送自然语音“收到建立连接请求,我是设备xxx,IP地址为yyy”。此时,两个设备均获知了对方的设备标识和IP地址,进而,两者可以建立通信。进一步,两个设备可以使用基于自然语音信号和/或电信号的方式交换其他的关联信息,直到多个设备建立关联。此时,通信连接是指双方获得了在例如局域网内部的IP地址,同时两个智能设备获知双方在同一个区域内,并可以通过获得的IP地址进行通信。在完成设备A和设备B的关联后,一种实施方式中用户可以通过自然语音的方式与智能手机交互,进而完成对智能平板的控制。例如,用户说“Hey Sky”之后,智能平板并不进行响应,而只有智能手机进入基于自然语音的人机交互状态。此时,用户可以进一步说“播放yyy上的视频”,此后智能手机识别了该指令为一个控制命令,同时该指令的目标设备为yyy的智能平板设备,这里的目标设备的确认可以是根据视频文件“yyy”的位置而推断得到的。进一步,通过设备的通信地址,智能手机将“播放视频yyy”这一指令发送至智能平板设备。此时,设备间完成了关联、通信和操控的功能。
在实施例二中,我们给出两个隶属于不同供应商的设备通过自然语音建立关联的方法。例如用户拥有第一供应商的设备C和第二供应商的设备D,并且其激活语音指令也不相同,但两者都具备了自然语音处理能力。设备C的激活语音指令为“Hey Sky”,设备D的激活指令为“Hey Blue”。由于两者的激活语音指令不同,因此用户无法通过一个相同的语音指令启动设备关联的流程。因此,在本实施例中,用户首先通过语音指令激活设备C:“HeySky”,进一步通过语音指令即第一语音信号“等待建立设备关联”控制设备C进入建立关联流程,这里的设备关联指令是“建立设备关联”。此时,由于第一语音信号中包括“等待”这个关键词,按照语义定义规则,设备C进入监听状态,即等待接收第二语音信号。随后,用户通过语音指令“Hey Blue”激活设备D,进而用户通过第一语音信号控制“使用激活指令HeySky,与第一供应商的设备C建立设备关联”,根据这一语音信号,设备D可以分析得到设备关联指令“建立设备关联”,目标设备是设备C,并且设备C的激活指令是“Hey Sky”,此后,设备D进入建立关联流程。在该状态下设备D首先使用设备C的激活语音指令向其发出语音信号:“Hey Sky,我是设备xxxx,请求建立设备关联和通信”,即第二语音信号。进一步,设备C收到激活语音指令,并反馈“Hey Blue,我是设备yyyy,收到请求信息”,即第二语音信号。进一步,两个设备分别使用其他预定义的语音指令交换建立设备关联所需要的关联信息。在另外一种实施方式中,用户只需要向设备D输入第一语音信号:“Hey Blue,建立与设备A的关联和通信,使用激活语音指令Hey Sky”,即包括设备关联指令、当前设备的激活指令、目标设备的标识和目标设备的激活指令,此后设备D将自动生成相应的语音指令:“Hey Sky,我是设备xxxx,请求建立设备关联和通信”,即第二语音信号,这一语音指令对于设备C就是第一语音信号。此后,设备C通过“Hey Sky”部分被激活,识别到“建立设备关联”的设备关联指令,该指令将控制设备C进入建立设备关联的流程。在本实施例中,“建立设备关联”是一个特殊语音控制指令,设备在识别该指令之后,进入与其他人机交互的处理程序所不同的程序,该程序的目的并不是向用户反馈一个用户需要得到的信息,而是与另外一个设备建立关联的渠道。
如图3所示,本发明提供一种用于建立设备关联的装置,用于使得具有自然语音处理能力的智能设备之间建立关联。这里的自然语音处理能力包括:语音识别和语音合成能力。所述装置包括:
第一自然语音信号接收模块31,用于接收第一自然语音信号;
第二自然语音信号发送模块32,用于当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
如图4所示,本发明提供一种用于建立设备关联的装置,用于使得具有自然语音处理能力的智能设备之间建立关联。这里的自然语音处理能力包括:语音识别和语音合成能力。所述装置包括:
第一自然语音信号接收模块41,用于接收第一自然语音信号;
第二自然语音信号监听模块42,用于当所述第一自然语音信号包括设备关联指令时,监听第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
本发明的实施方式中,利用设备的自然语音处理能力,对于第一自然语音接收模块31或41接收到的第一自然语音信号处理,判断是否包括设备关联指令;当第一自然语音信号包括设备关联指令时,第二自然语音信号发送模块32发送第二自然语音信号,或第二自然语音信号接收模块42接收第二自然语音信号,所述第二自然语音信号用于建立多个设备之间的关联。基于自然语音的关联建立方式,用户操作的复杂性、频率大大降低。
可选地,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
可选地,所述操作指令包括对于第二自然语音信号的操作指令。
可选地,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
可选地,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
可选地,所述调制方式包括调幅、调频和调相的一个或多个组合。
可选地,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
可选地,所述装置还包括:
通信连接建立模块5,用于基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
可选地,所述第二自然语音信号的格式是默认设置或者自定义设置。
参考图5,为本发明一个实施方式的电子设备示意图。如图5所示,该电子设备包括:
存储器53以及一个或多个处理器51;
其中,所述存储器53与所述一个或多个处理器51通信连接,所述存储器53中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器51执行,以使所述一个或多个处理器51执行:接收第一自然语音信号;当所述第一自然语音信号包括设备关联指令时,发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
或者,所述指令被所述一个或多个处理器51执行,以使所述一个或多个处理器51执行:
接收第一自然语音信号;
当所述第一自然语音信号包括设备关联指令时,监听第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立设备关联。
可选地,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
可选地,所述操作指令包括对于第二自然语音信号的操作指令。
可选地,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
可选地,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
可选地,所述调制方式包括调幅、调频和调相的一个或多个组合。
可选地,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
可选地,所述方法还包括:基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
可选地,所述第二自然语音信号的格式是默认设置或者自定义设置。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (22)
1.一种用于建立设备关联的方法,其特征在于,所述方法包括:
接收第一自然语音信号;
当所述第一自然语音信号包括设备关联指令时,根据所述设备关联指令发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立所述多个设备之间的关联。
2.一种用于建立设备关联的方法,其特征在于,所述方法包括:
接收第一自然语音信号;
当所述第一自然语音信号包括设备关联指令时,监听根据所述设备关联指令的第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立所述多个设备之间的关联。
3.根据权利要求1或2所述的方法,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
4.根据权利要求3所述的方法,所述操作指令包括对于第二自然语音信号的操作指令。
5.根据权利要求1或2所述的方法,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
6.根据权利要求5所述的方法,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
7.根据权利要求6所述的方法,所述调制方式包括调幅、调频和调相的一个或多个组合。
8.根据权利要求5所述的方法,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
9.根据权利要求5所述的方法,所述方法还包括:基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
10.根据权利要求1或2所述的方法,所述第二自然语音信号的格式是默认设置或者自定义设置。
11.一种用于建立设备关联的装置,其特征在于,所述装置包括:
第一自然语音信号接收模块,用于接收第一自然语音信号;
第二自然语音信号发送模块,用于当所述第一自然语音信号包括设备关联指令时,根据所述设备关联指令发送第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立所述多个设备之间的关联。
12.一种用于建立设备关联的装置,其特征在于,所述装置包括:
第一自然语音信号接收模块,用于接收第一自然语音信号;
第二自然语音信号监听模块,用于当所述第一自然语音信号包括设备关联指令时,监听根据所述设备关联指令的第二自然语音信号;所述设备关联指令用于指示多个设备通过自然语音建立设备关联;所述第二自然语音信号用于建立所述多个设备之间的关联。
13.根据权利要求11或12所述的装置,所述第一自然语音信号还包括激活指令、设备标识、操作指令的一个或多个组合。
14.根据权利要求13所述的装置,所述操作指令包括对于第二自然语音信号的操作指令。
15.根据权利要求11或12所述的装置,所述第二自然语音信号包括关联信息,所述关联信息用于建立设备关联。
16.根据权利要求15所述的装置,所述关联信息的部分或全部通过调制方式加载到所述第二自然语音信号上。
17.根据权利要求16所述的装置,所述调制方式包括调幅、调频和调相的一个或多个组合。
18.根据权利要求16所述的装置,所述关联信息包括设备关联指令、设备标识、通信地址、通信方式、通信协议、设备功能、激活指令、授权指令中的一个或多个组合。
19.根据权利要求16所述的装置,所述装置还包括:
通信连接建立模块,用于基于所述关联信息,建立所述多个设备的基于电信号的通信连接。
20.根据权利要求11或12所述的装置,所述第二自然语音信号的格式是默认设置或者自定义设置。
21.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行,以使所述一个或多个处理器能够实现如权利要求1-10中任一项所述的方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后用以实现如权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810187221.2A CN108630201B (zh) | 2018-03-07 | 2018-03-07 | 一种用于建立设备关联的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810187221.2A CN108630201B (zh) | 2018-03-07 | 2018-03-07 | 一种用于建立设备关联的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108630201A CN108630201A (zh) | 2018-10-09 |
CN108630201B true CN108630201B (zh) | 2020-09-29 |
Family
ID=63706103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810187221.2A Active CN108630201B (zh) | 2018-03-07 | 2018-03-07 | 一种用于建立设备关联的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108630201B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103197571A (zh) * | 2013-03-15 | 2013-07-10 | 张春鹏 | 一种控制方法及装置、*** |
CN103885350A (zh) * | 2014-03-19 | 2014-06-25 | 四川长虹电器股份有限公司 | 一种语音控制家庭电器的方法和装置 |
EP2801973A1 (en) * | 2013-05-06 | 2014-11-12 | Honeywell International Inc. | Systems and methods for control of devices by voice recognition |
US8996375B1 (en) * | 2007-10-04 | 2015-03-31 | Great Northern Research, LLC | Speech interface system and method for control and interaction with applications on a computing system |
WO2016136207A1 (ja) * | 2015-02-27 | 2016-09-01 | パナソニックIpマネジメント株式会社 | 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム |
CN106653008A (zh) * | 2015-10-28 | 2017-05-10 | 中兴通讯股份有限公司 | 一种语音控制方法、装置及*** |
CN106886166A (zh) * | 2015-12-11 | 2017-06-23 | 美的集团股份有限公司 | 通过音箱控制家用电器的方法、装置以及音箱 |
CN107680595A (zh) * | 2017-11-15 | 2018-02-09 | 安徽声讯信息技术有限公司 | 一种智能语音手机或智能语音平板 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8494854B2 (en) * | 2008-06-23 | 2013-07-23 | John Nicholas and Kristin Gross | CAPTCHA using challenges optimized for distinguishing between humans and machines |
-
2018
- 2018-03-07 CN CN201810187221.2A patent/CN108630201B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8996375B1 (en) * | 2007-10-04 | 2015-03-31 | Great Northern Research, LLC | Speech interface system and method for control and interaction with applications on a computing system |
CN103197571A (zh) * | 2013-03-15 | 2013-07-10 | 张春鹏 | 一种控制方法及装置、*** |
EP2801973A1 (en) * | 2013-05-06 | 2014-11-12 | Honeywell International Inc. | Systems and methods for control of devices by voice recognition |
CN103885350A (zh) * | 2014-03-19 | 2014-06-25 | 四川长虹电器股份有限公司 | 一种语音控制家庭电器的方法和装置 |
WO2016136207A1 (ja) * | 2015-02-27 | 2016-09-01 | パナソニックIpマネジメント株式会社 | 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム |
CN106653008A (zh) * | 2015-10-28 | 2017-05-10 | 中兴通讯股份有限公司 | 一种语音控制方法、装置及*** |
CN106886166A (zh) * | 2015-12-11 | 2017-06-23 | 美的集团股份有限公司 | 通过音箱控制家用电器的方法、装置以及音箱 |
CN107680595A (zh) * | 2017-11-15 | 2018-02-09 | 安徽声讯信息技术有限公司 | 一种智能语音手机或智能语音平板 |
Also Published As
Publication number | Publication date |
---|---|
CN108630201A (zh) | 2018-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6613347B2 (ja) | 情報をプッシュする方法及び装置 | |
CN108831469B (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
US10708423B2 (en) | Method and apparatus for processing voice information to determine emotion based on volume and pacing of the voice | |
CN106653008B (zh) | 一种语音控制方法、装置及*** | |
KR100679043B1 (ko) | 음성 대화 인터페이스 장치 및 방법 | |
KR20140105673A (ko) | 번역 기반 통신 서비스 지원 방법 및 시스템과, 이를 지원하는 단말기 | |
EP3084633A1 (en) | Attribute-based audio channel arbitration | |
CN105206272A (zh) | 语音传输控制方法及*** | |
JP6783339B2 (ja) | 音声を処理する方法及び装置 | |
KR20180046780A (ko) | 이중 웨이크업을 이용한 음성 인식 서비스 제공 방법 및 이를 위한 장치 | |
CN110517686A (zh) | 智能音箱端语音开通应用的方法及*** | |
CN111161742A (zh) | 一种定向人员沟通方法、***、存储介质及智能语音设备 | |
CN111933135A (zh) | 终端控制方法、装置、智能终端及计算机可读存储介质 | |
CN112349266A (zh) | 一种语音编辑方法及相关设备 | |
CN108630201B (zh) | 一种用于建立设备关联的方法和装置 | |
CN108766429B (zh) | 语音交互方法和装置 | |
US11790913B2 (en) | Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal | |
KR102584324B1 (ko) | 음성 인식 서비스 제공 방법 및 이를 위한 장치 | |
CN115424622A (zh) | 一种人机语音智能交互方法和装置 | |
KR20220140304A (ko) | 학습자의 음성 명령을 인식하는 화상 학습 시스템 및 그 방법 | |
CN111353771A (zh) | 一种远程控制支付的方法、装置、设备和介质 | |
CN105118507A (zh) | 声控***及其控制方法 | |
Dumitrescu | Cassandra smart-home system description | |
KR102150902B1 (ko) | 음성 응답을 위한 장치 및 방법 | |
US11527247B2 (en) | Computing device and method of operating the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |