CN111312206A - 一种基于语音的信息识别方法及装置、电子设备和*** - Google Patents

一种基于语音的信息识别方法及装置、电子设备和*** Download PDF

Info

Publication number
CN111312206A
CN111312206A CN201911335555.0A CN201911335555A CN111312206A CN 111312206 A CN111312206 A CN 111312206A CN 201911335555 A CN201911335555 A CN 201911335555A CN 111312206 A CN111312206 A CN 111312206A
Authority
CN
China
Prior art keywords
voice
content
digital object
identifier
object identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911335555.0A
Other languages
English (en)
Inventor
李丰
周健华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911335555.0A priority Critical patent/CN111312206A/zh
Publication of CN111312206A publication Critical patent/CN111312206A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本说明书实施例公开了一种基于语音的信息识别方法及装置、***和电子设备,其中所述基于语音的信息识别方法,应用于具有数字对象标识符的设备,包括接收对数字对象标识符的播报指令;将所述数字对象标识符的数字对象标识符内容转换为语音;播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。

Description

一种基于语音的信息识别方法及装置、电子设备和***
技术领域
本说明书涉及计算机技术领域,尤其涉及一种基于语音的信息识别方法及装置、电子设备和***。
背景技术
二维码、条形码等数字对象标识符是一个近几年来移动应用市场上流行的一种编码方式,并且随着移动应用的普及。
目前常见的数字对象标识符识别方法是通过移动设备的摄像头设备去拍照识别或通过光电设备扫描识别,获取标识符内容从而进行后续的处理操作。
发明内容
有鉴于此,本说明书实施例提供了一种基于语音的信息识别方法以及装置、电子设备和***。
本说明书实施例采用下述技术方案:
本说明书实施例提供一种基于语音的信息识别方法,应用于具有数字对象标识符的设备,包括:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
本说明书实施例提供一种基于语音的信息识别方法,应用于具有数字对象标识符的设备,包括:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
本说明书实施例还提供一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块,接收对所述数字对象标识符的播报指令;
转换模块,将所述数字对象标识符的标识符内容转换为语音;
播放模块,播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
本说明书实施例还提供一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块,接收对所述数字对象标识符的播报指令;
转换模块,将所述数字对象标识符的标识符内容转换为语音;
播放模块,播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
所述设备接收模块接收所述服务器根据所述客户端所识别的内容、发送的控制指令;
执行模块,执行所述控制指令对应的业务操作。
本说明书实施例还提供一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
本说明书实施例还提供一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
本说明书实施例还提供一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
本说明书实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容。
本说明书实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是设备接收播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容;
所述客户端发送模块,发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
本说明书实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容;
所述客户端发送模块,发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示模块,展示所述服务器反馈的所述业务信息。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
本说明书实施例还提供一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容,处理所识别出的内容。
本说明书实施例还提供一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容;
服务器,所述服务器根据所述客户端识别出的所述语音所对应的内容,向所述设备发送控制指令;
所述设备根据所述控制指令,执行对应的业务操作。
本说明书实施例还提供一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容;
服务器,根据所述客户端识别出的所述语音所对应的内容,反馈对应的业务信息给所述客户端;
所述客户端展示所述业务信息。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:具有数字对象标识符的设备接收对所述数字对象标识符的播报指令,触发将标识符内容转换为语音的流程并播放,客户端获取和识别所述语音所对应的内容,从而将信息识别方式转换为语音识别方式,提高数字对象标识符设备所携带信息的识别方式的可选择性。尤其是,当客户端无法识别数字对象标识符的情况下,可以基于语音获取数字对象标识符的内容,提升信息识别效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1A为本说明书的一个实施例的基于语音的信息识别***的结构示意图。
图1B为本说明书的另一个实施例的基于语音的信息识别***的结构示意图。
图1C为本说明书的另一个实施例的基于语音的信息识别***的结构示意图。
图2A为本说明书一个实施例提供的基于语音的信息识别方法的流程图,本实施例的所述基于语音的信息识别方法被应用于具有数字对象标识符的设备。
图2B为本说明书的一个实施例的基于语音的信息识别装置的结构图,本实施例的所述基于语音的信息识别装置被应用于具有数字对象标识符的设备侧,与图2A中的基于语音的信息识别方法相对应。
图2C为图2B所示实施例的一种基于语音的信息识别装置的具体实施例的结构示意图。
图3A为本说明书另一个实施例提供的基于语音的信息识别方法的流程图,本实施例的所述基于语音的信息识别方法被应用于具有数字对象标识符的设备。
图3B为本说明书的一个实施例的基于语音的信息识别装置的结构图,本实施例的所述基于语音的信息识别装置被应用于具有数字对象标识符的设备侧,与图3A中的基于语音的信息识别方法相对应。
图4为本说明书一个实施例的基于语音的信息识别方法所引用的语音编码规则的示意图。
图5A为本说明书一个实施例提供的基于语音的信息识别方法的流程图,本实施例的所述基于语音的信息识别方法被应用于客户端。
图5B为本说明书的一个实施例的基于语音的信息识别装置的结构图,本实施例的所述基于语音的信息识别装置被应用于客户端,与图5A中的基于语音的信息识别方法相对应。
图6A为本说明书另一个实施例提供的基于语音的信息识别方法的流程图,本实施例的所述基于语音的信息识别方法被应用于客户端。
图6B为本说明书的一个实施例的基于语音的信息识别装置的结构图,本实施例的所述基于语音的信息识别装置被应用于客户端,与图6A中的基于语音的信息识别方法相对应。
图7A为本说明书另一个实施例提供的基于语音的信息识别方法的流程图,本实施例的所述基于语音的信息识别方法被应用于客户端。
图7B为本说明书的一个实施例的基于语音的信息识别装置的结构图,本实施例的所述基于语音的信息识别装置被应用于客户端,与图7A中的基于语音的信息识别方法相对应。
具体实施方式
拍照或光电扫描识别二维码、条形码等数字对象标识符的方式在在大部分场景下已经够用和便捷,但是当面对无摄像头设备如何识别数字对象标识符,数字对象标识符被损毁无法扫码等情况时,拍照或光电扫描识别数字对象标识符的方式就无法适用。
本说明书实施例提供一种基于语音的信息识别方法及装置、电子设备和***,其中具有数字对象标识符的设备接收播报指令,触发将标识符内容转换为语音的流程并播放,客户端获取和识别所述语音所对应的内容,从而将信息识别方式转换为语音识别方式,提高数字对象标识符设备所携带信息的识别方式的可选择性。尤其是,当客户端无法识别数字对象标识符的情况下,可以基于语音获取数字对象标识符的内容,提升信息识别效率。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
如图1A所示,为本说明书实施例提供的一种基于语音的信息识别***,包括:
具有数字对象标识符的设备100,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端200,收所述语音,识别所述语音所对应的内容,处理所识别出的内容。
所述设备100是具有数字对象标识符的设备,例如,所述设备100可以是具有二维码的共享单车、具有二维码的共享充电宝等。所述数字对象标识符可以是例如二维码、条形码等利用特定图形按照一定规律在平面(二维方向上)分布的图形。所述数字对象标识符所记录的内容可以是数据符号信息,例如URL地址。
所述客户端200是指用户侧使用的设备,可以是移动手机、平板、穿戴设备等等。
对所述数字对象标识符的所述播报指令是用于将所述基于语音的信息识别***中的信息识别模式从原先的非语音信息识别模式(例如图像识别模式)转换至语音信息识别模式,并触发所述设备100进入将标识符内容转换为语音并播放的流程。
这样,在非语音信息识别模式无法适用的情况下,例如无摄像头设备如何识别二维码、二维码被损毁无法扫码等情况,所述基于语音的信息识别***可以根据所述信息识别方式转换指令切换至基于语音的信息识别模式,完成信息识别,从而使得所述数字对象标识符设备所携带信息的识别方式的具有可选择性,适应更多的应用场景。
如图1B所示,为本说明书的另一个实施例提供的一种基于语音的信息识别***,包括:
具有数字对象标识符的设备100A,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端200A,接收所述语音,识别所述语音所对应的内容;
服务器300A,所述服务器根据所述客户端识别出的所述语音所对应的内容,向所述设备发送控制指令;
所述设备100A根据所述控制指令,执行对应的业务操作。
具体地,在本实施例中,所述客户端200A将识别出的所述语音所对应的内容发送给所述服务器300A。所述服务器300A分析所述语音所对应的内容,生成对应的用于控制所述设备100A的控制指令。所述设备100A接收所述控制指令,并执行对应的业务操作。
所述客户端200A和所述设备100A的其他功能可以参见前述实施例,此处不再赘述。
以所述设备100A为具有二维码的共享单车为例进行说明,所述客户端200A识别出的所述语音所对应的内容可能是共享单车的ID编号和开锁密码。所述客户端200A将共享单车的ID编号和开锁密码发送给所述服务器300A。所述服务器300A验证开锁密码是否正确,如果正确,则向该共享单车发送开锁的控制指令。该共享单车根据开锁的控制指令,自动地开锁。
这样,在非语音信息识别模式无法适用的情况下,例如无摄像头设备如何识别二维码、二维码被损毁无法扫码等情况,所述客户端200A仍然可以向所述服务器300A发送业务请求,进而使用所述设备,使所述设备执行对应的业务操作。
如图1C所示,为本说明书的另一个实施例提供的一种基于语音的信息识别***,包括:
具有数字对象标识符的设备100B,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端200B,接收所述语音,识别所述语音所对应的内容;
服务器300B,根据所述客户端识别出的所述语音所对应的内容,反馈对应的业务信息给所述客户端;
所述客户端200B展示所述业务信息。
具体地,在本实施例中,所述客户端200B将识别出的所述语音所对应的内容发送给所述服务器300B。对应地,所述服务器300B分析所述语音所对应的内容,确定所述客户端200B的目标业务信息,进而将对应的业务信息反馈给所述客户端200B。所述客户端200B接收并展示所述业务信息,以便使用所述客户端的用户可以浏览所述业务信息。
所述客户端200B和所述设备100B的其他功能可以参见前述实施例,此处不再赘述。
举例说明,所述识别出的所述语音所对应的内容为URL地址。所述客户端200B将该URL地址发送给所述服务器300B。所述服务器300B可以通过通用协议分析该URL地址,确定所述客户端200B的目标页面,并反馈给所述客户端200B。所述客户端200B接收并展示该页面。
如图2A所示,为本说明书的实施例提供的一种基于语音的信息识别方法的流程图。本实施例的所述基于语音的信息识别方被应用于具有数字对象标识符的设备,以实现本说明书实施例的优势和目的。
步骤210:接收对所述数字对象标识符的播报指令。
所述设备所携带的信息可以具有至少两种表现形式,一种是通过数字对象标识符,比如二维码,另一种是语音播放。所述播报指令是用于触发所述设备将其所携带的数字对象标识符的内容以语音播放的方式表现,从而在数字对象标识符识别不适用的情况下,仍可以实现信息识别。
所述播报指令的生成形式并不限定,可以是通过按键生成,比如在所述设备装配语音播报的按键;可以是通过拍打或摇晃所述设备生成;可以是客户端通过蓝牙、NFC等近距离通信方式向所述设备发送指令,等等。
在本说明书的一个实施例中,所述信息识别方式转换指令可以表现为所述数字对象标识符识别失败生成的消息等,从而在数字对象标识符识别失败后,自动进入语音识别。
具体地,接收对所述数字对象标识符的播报指令,包括:
接收所述客户端通过近距离无线通信发送的所述播报指令。
步骤220:将所述数字对象标识符的标识符内容转换为语音。
在本实施例中,将所述标识符内容中的字符转换为对应语音的方式并不限定,比如TTS文字转语音技术等,从而直接将所述标识符内容播放。例如,所述标识符内容为某一URL地址,则利用TTS文字转语音技术,播放语音为“https:……”。
优选地,所述标识符内容被按照一定的语音编码规则,在转换为语音的同时进行加密,转换为加密语音,从而便于客户端识别、降低转换技术要求。
所述语音编码规则是指标识符的字符与语音代码之间的对应关系。转换后的所述加密语音可以单个的声音,也可以是若干种声音的组合,可以预先设定,本说明书的实施例并不限定。
具体地,将所述标识符内容转换为语音,包括:
根据语音编码规则,将所述标识符内容转换为加密语音。
举例说明,所述语音编码规则可以包括用于表达所述标识符内容的字符和语音代码的对应关系,以及用于组成所述语音代码的基本信号符和基础音的对应关系。
所述语音代码是指由所述基本信号符按照一定规则组成的代码,例如所述基本信号可以“.”、“-”等本说明书实施例并不限定。
所述基础音是指构成所述加密语音的声音元素,例如所述基础音可以是“滴”、“哒”、“咻”等等。本领域技术人员可以采用任何声音作为基础音。
用于表达所述标识符内容的所述字符可以是数字、字母、符号等。例如,所述字符构成的所述标识符内容是某个网页的URL。
举例说明,如图4所示,在一个语音编码规则中,所述基本信号为"."和“-”,所述基础音为“滴”和“咻”,其中所述基本信号"."和所述基础音“滴”对应,所述基本信号“-”和所述基础音“咻”对应。
字符“a”对应的语音代码为“...-.-”,则字符“a”转换后的加密语音是“滴滴滴咻滴咻”;字符“b”对应的语音代码为“-..-.-”,则字符“b”转换后的加密语音是“咻滴滴咻滴咻”。
具体地,根据语音编码规则,将所述标识符内容转换为加密语音,包括:
对所述标识符内容进行解析,得到所述标识符内容的字符;
根据所述语音编码规则中字符与语音代码之间的对应关系,确定所述标识符内容的字符所对应的语音代码;
根据所述语音编码规则,将所确定的语音代码转换为所述加密语音。
为了便于客户端识,可以在转换所得所述语音始末分别增加所述起始音和所述终止音。即,所述语音包括起始音和终止音。
具体地,所述语音编码规则可以设有起始信号和终止信号,以及与所述起始信号和所述终止信号对应的起始音和终止音,使得所述加密语音包括起始音和终止音,从而在播报信息内容的始末分别增加所述起始音和所述终止音,便于客户端识别。
例如,在所述语音编码规则中,所述起始信号为“#”,对应的所述起始音为“哒”,所述终止信号为“*”,对应的所述终止音为“哈”。
可选地,在所述语音编码规则中,相邻的字符所述编码音之间设有预设时间间隔,比如2秒时间间隔,从而便于客户端识别相邻对应的编码音。
举例说明,所述标识符内容的为“ab”,则根据所述语音编码规则转换所得的、与所述标识符内容相对应的所述加密语音为“哒滴滴滴咻滴咻咻滴滴咻滴咻哈”。
步骤230:播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
所述设备得到转换所得的所述语音并播放,例如,前述举例中,所述数字对象标识符设备播放“哒滴滴滴咻滴咻咻滴滴咻滴咻哈”。
所述设备可以将所述标识符内容对应的语音全部转换后播放,也可以是对所述标识符内容中的字符按照顺序逐一转换,得到所述语音并播放等等。
进一步,为了便于客户端获取所述语音,可以循环播放所述语音,从而使得客户端即使错过本次播放,还可以获取下次播放。
具体地,播放转换所得的所述语音,包括:
循环播放所述语音。
这样,所述设备一方面可支持常规的数字对象标识符图片类型识别方式,也可以通过设备播放标识符内容,支持语音识别标识符内容的识别方式,从而适应更多的应用场景,便于数字对象标识符设备的适用和使用。
基于同一发明构思,如图2B所示,本说明书实施例还提供一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块110,接收对所述数字对象标识符的播报指令;
转换模块120,将所述数字对象标识符的标识符内容转换为语音;
播放模块130,播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
具体地,所述设备接收模块110用于接收客户端或服务器等其他装置发给所述设备的指令、消息和请求等。所述设备接收模块110接收所述播报指令,可以是来自所述设备的预设按键被点击,来自所述服务器的远程发送,可以是所述客户端的交互发送,可以是所述数字对象标识符设备被拍打或摇晃感应等等,本实施例并不限定。
所述转换模块120可以采用文字转语音等技术将所述标识符内容转换为对应的语音。
在本说明书的一个实施例中,所述转换模块120根据所述语音编码规则,将所述标识符内容转换为加密语音。例如,所述转换模块120根据语音编码规则,确定所述标识符内容中的各字符与语音代码的对应关系,按照所述标识符内容所对应的语音代码,依次将所述语音代码转换为对应的声音,得到对应的所述加密语音。
所述播放模块130用于播放所述语音。具体地,在一个实施例中,所述播放模块130按照所述标识符内容中各字符的顺序,依次播报对应的语音,也可以在所述转换模块120按照所述标识符内容中各字符的顺序都转换为对应的语音完成后,再依次播报,本实施例中并不限定。
如图2C所示,为图2B所示实施例的一种基于语音的信息识别装置的具体实施例。具体地,所述基于语音的信息识别装置包括设备接收模块110A、转换模块120A、播放模块130A和存储模块140A。
所述存储模块140A用于存储所述语音编码规则和所述标识符内容。具体地,所述设备接收模块110A接收所述语音编码规则,并将其存储于所述存储模块140A。所述转换模块120A调用所述存储模块140A中的所述语音编码规则和所述标识符内容,实现所述标识符内容转换为对应的所述编码音的过程。
所述设备接收模块110A、所述转换模块120A和所述播放模块130A的其他具体功能可以参见前文所述,此处不再赘述。
进一步,所述存储模块140A还可以存储所述语音代码所对应的声音。所述转换模块120A根据所述语音编码规则和所述标识符内容,调用对应的声音,构成所述编码音。
在本说明书的另一个实施例中,所述转换模块包括基础音发音模块,用于发出对应的声音。所述基础音发音模块根据所述语音编码规则和所述标识符内容,发出对应的声音,并由所述播放模块播出,也就是播放了对应的加密语音。
这样,在即可所述设备侧完成所述语音的转换和播报,从而适用识别数字对象标识符失败或不可能实施时候,仍可以使用或享受所述标识符内容提供的服务和业务,拓展了所述设备的服务场景。
如图3A所示,为本说明书的另一个实施例提供的一种基于语音的信息识别方法的流程图。本实施例的所述基于语音的信息识别方被应用于具有数字对象标识符的设备,以实现本说明书实施例的优势和目的。
步骤310:接收对所述数字对象标识符的播报指令。
步骤320:将所述数字对象标识符的标识符内容转换为语音。
步骤330:播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器。
步骤340:接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
在本实施例中,所述客户端获取并识别所述语音对应的内容后,将所识别的内容给服务器,由所述服务器分析所识别的内容,进而根据所识别的内容控制所述设备执行对应的业务操作。例如,所述服务器根据所识别的内容控制所述设备打开或关闭等等。
基于同一发明构思,如图3B所示,本说明书的另一个实施例还提供一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块110B,接收对所述数字对象标识符的播报指令;
转换模块120B,将所述数字对象标识符的标识符内容转换为语音;
播放模块130B,播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
所述设备接收模块110B接收所述服务器根据所述客户端所识别的内容、发送的控制指令;
执行模块150B,执行所述控制指令对应的业务操作。
所述执行模块150B根据所述业务操作的不同,可以对应不同,例如所述执行模块150B可以是开关控制器等。所述设备接收模块110B在接收所述控制指令指令之后,所述执行模块150B对应执行业务操作,比如打开或关闭开关等。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
其中,所述电子设备的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
如图5A所示,为本说明书的实施例提供的一种基于语音的信息识别方法的流程图。本实施例的所述基于语音的信息识别方被应用于所述客户端,以实现本说明书实施例的优势和目的。
步骤510:向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令。
步骤520:接收语音,其中所述语音是设备接收所述播报指令后、转换数字所述数字对象标识符的标识符内容得到并播放的。
步骤530:识别所述语音所对应的内容。
以二维码为例,在所述设备被触发播放二维码内容对应的语音后,所述客户端接收并识别所述语音,得到所对应的内容,进而可以访问和处理所识别出的内容。例如根据通用协议,可选择打开浏览器引导至特定的页面,也可选择通过某APP去执行访问二维码内容等等。
具体地,所述语音是数字对象标识符设备接收播报指令后、根据语音编码规则、转换所述设备的所述标识符内容得到并播放的加密语音;
其中,识别所述语音所对应的内容,包括:
根据所述语音编码规则,识别所述加密语音所对应的内容。
例如前文举例,所述设备播放“哒滴滴滴咻滴咻咻滴滴咻滴咻哈”的加密语音,所述客户端接收该加密语音。
根据所述语音编码规则中基础音和基本信号的对应关系,可以识别出所接收的加密语音所对应的语音代码,即“#...-.--..-.-*”。
根据所述语音代码和所述字符的对应关系,可以识别出该语音代码所对应的字符,即“ab”。也就是说,所述语音所对应的内容为“ab”。
具体地,根据所述语音编码规则,识别所述加密语音所对应的内容,包括:
根据所述语音编码规则中所述加密语音和语音代码的对应关系,确定所述加密语音对应的语音代码;
根据所述语音编码规则中所述语音代码和用于表达所述标识符内容的字符的对应关系,确定所述加密语音所对应的内容。
所述设备接收的播报指令可以来自于所述客户端,比如客户端扫描并识别所述设备的数字对象标识符失败后,向所述设备发送所述播报指令。
具体地,向所述设备发送所述播报指令,包括:
扫描并识别所述设备的所述数字对象标识符;
当所述数字对象标识符识别失败,向所述设备发送所述播报指令。
这样,所述客户端侧可以根据需求转换信息识别的方式,便于用户根据需求和所面对的情况,选择合适的识别方式。通过在所述客户端侧引入语音识别机制,可以使得用户在靠近述数字对象标识符设备时,便可识别标识符内容并进行访问,极大地简化了用户掏出移动设备并进行扫码识别的流程。
基于同一发明构思,如图5B所示,本说明书实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块230,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块210,接收语音,其中所述语音是设备接收对所述数字对象标识符的播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块220,识别所述语音所对应的内容。
所述语音的转换形成过程可参照前文实施例所述,此处不再赘述。
所述客户端接收模块210用于接收服务器或设备等其他装置发给所述客户端的指令、消息和请求等。所述设备播放所述语音,所述客户端接收模块210接收所述语音。具体地,所述客户端接收模块210可以被实施为包括听筒或收音器等的装置,本实施例并不限制。所述客户端接收模块210和所述客户端发送模块230可以是所述客户端的通信模块。
所述识别模块220识别所述语音所对应的信息内容。在本发明的一个实施例中,所述识别模块220调用语音编码规则,确定用于构成加密语音的编码基础音和用于构成所述语音代码的基本信号的对应关系,进而确定了所述加密语音对应的语音代码;确定所述语音代码和用于表达所述标识符内容的字符的对应关系,进而确定了所述加密语音对应的内容。
所述语音编码规则可以是由所述客户端向所述服务器请求,由所述服务器响应请求发送给所述客户端,也可以所述服务器主动向所述客户端发送,本实施例并不限制。
如图6A所示,为本说明书的另一个实施例提供的一种基于语音的信息识别方法的流程图。本实施例的所述基于语音的信息识别方被应用于所述客户端,以实现本说明书实施例的优势和目的。
步骤610:向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令。
步骤620:接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的。
步骤630:识别所述语音所对应的内容。
步骤640:发送所识别的内容给服务器,使得服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
本实施例中,所述客户端在识别出所述语音所对应的内容后,将所识别的内容给服务器,进而由所述服务器根据所识别的内容,向所述设备发送控制指令,使得所述设备执行对应的业务操作。这样,在图像等识别无法适用的情况下,所述客户端仍然可以通过服务器控制所述设备,获得目标业务服务,例如通过服务器打开共享单车的车锁。
基于同一发明构思,如图6B所示,本说明书的另一个实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块230A,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块210A,接收语音,其中所述语音是设备接收对所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块220A,识别所述语音所对应的内容。
所述客户端发送模块230A,发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
如图7A所示,本说明书的另一个实施例还提供的一种基于语音的信息识别方法的流程图。本实施例的所述基于语音的信息识别方被应用于所述客户端,以实现本说明书实施例的优势和目的。
步骤710:向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令。
步骤720:接收语音,其中所述语音是设备接收播报指令后、转换所述数字对象标识符的标识符内容得到并播放的。
步骤730:识别所述语音所对应的内容。
步骤750:发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息。
步骤750:展示所述服务器反馈的所述业务信息。
在本实施例中,所述客户端通过语音识别出所述标识符内容后,可以处理和访问所述标识符内容,比如所述服务器根据所识别的网址反馈特定页面,所述客户端展示反馈的特定页面,使得用户可以操作或浏览。
进一步,所述基于语音的信息识别方法,还包括:
根据所述业务信息,向所述设备发送控制指令,以使所述设备执行对应的业务操作。
举例说明,所述服务器反馈的所述业务信息可以是某种验证密码等,所述客户端获得验证密码后,获得操作权限,向所述设备发送控制指令,可以使得所述设备执行对应的业务操作。比如,所述述服务器反馈的所述业务信息可以是开锁密码,所述客户端获得开锁密码后,向所述设备发开锁指令,使得所述述设备执行开锁操作。
基于同一发明构思,如图7B所示,本说明书的另一个实施例还提供一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块230B,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块210B,接收语音,其中所述语音是设备接收播报指令后、转换数字对象标识符所述数字对象标识符的标识符内容得到并播放的;
识别模块220B,识别所述语音所对应的内容。
所述客户端发送模块230B,发送所识别的内容给服务器,以使所述服务器根据所述信息内容反馈对应的业务信息;
展示模块240B,展示所述服务器反馈的所述业务信息。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
值得一提的是,所述语音加密规则可以是所述服务器在所述数字对象标识符设备的制备设定过程中发送给所述数字对象标识符设备,在所述客户端与所述数字对象标识符设备交互的过程中发送给所述客户端;也可以是所述数字对象标识符设备和所述客户端每次的交互过程中,所述服务器根据请求分别发送所述语音加密规则给所述数字对象标识符设备和所述客户端。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (28)

1.一种基于语音的信息识别方法,应用于具有数字对象标识符的设备,包括:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
2.根据权利要求1所述的基于语音的信息识别方法,接收对所述数字对象标识符的播报指令,包括:
接收所述客户端通过近距离无线通信发送的所述播报指令。
3.根据权利要求1所述的基于语音的信息识别方法,将所述数字对象标识符的标识符内容转换为语音,包括:
根据语音编码规则,将所述标识符内容转换为加密语音。
4.根据权利要求3所述的基于语音的信息识别方法,根据语音编码规则,将所标识符内容转换为加密语音,包括:
对所述标识符内容进行解析,得到所述标识符内容的字符;
根据所述语音编码规则中字符与语音代码之间的对应关系,确定所述标识符内容的字符所对应的语音代码;
根据所述语音编码规则,将所确定的语音代码转换为所述加密语音。
5.根据权利要求1所述的基于语音的信息识别方法,播放转换所得的所述语音,包括:
循环播放所述语音。
6.一种基于语音的信息识别方法,应用于具有数字对象标识符的设备,包括:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容发送的控制指令,并执行所述控制指令对应的业务操作。
7.一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块,接收对所述数字对象标识符的播报指令;
转换模块,将所述数字对象标识符的标识符内容转换为语音;
播放模块,播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
8.根据权利要求7所述的基于语音的信息识别装置,接收对所述数字对象标识符的播报指令,包括:
接收所述客户端通过近距离无线通信发送的所述播报指令。
9.根据权利要求7所述的基于语音的信息识别装置,将所述数字对象标识符的标识符内容转换为语音,包括:
根据语音编码规则,将所述标识符内容转换为加密语音。
10.一种基于语音的信息识别装置,应用于具有数字对象标识符的设备,包括:
设备接收模块,接收对所述数字对象标识符的播报指令;
转换模块,将所述数字对象标识符的标识符内容转换为语音;
播放模块,播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
所述设备接收模块接收所述服务器根据客户端所识别的内容、发送的控制指令;
执行模块,执行所述控制指令对应的业务操作。
11.一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
12.根据权利要求11所述的信息识别方法,所述语音是所述设备接收所述播报指令后、根据语音编码规则、转换所述设备的所述标识符内容得到并播放的加密语音;
其中,识别所述语音所对应的内容,包括:
根据所述语音编码规则,识别所述加密语音所对应的内容。
13.根据权利要求12所述的信息识别方法,根据所述语音编码规则,识别所述加密语音所对应的内容,还包括:
根据所述语音编码规则中所述加密语音和语音代码的对应关系,确定所述加密语音对应的语音代码;
根据所述语音编码规则中所述语音代码和用于表达所述标识符内容的字符的对应关系,确定所述加密语音所对应的内容。
14.根据权利要求11所述的信息识别方法,向具有数字对象标识符设备发送对所述数字对象标识符的播报指令,包括:
扫描并识别所述设备的所述数字对象标识符;
当所述数字对象标识符识别失败,向所述设备发送所述播报指令。
15.一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
16.一种基于语音的信息识别方法,应用于客户端,包括:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
17.根据权利要求16所述的信息识别方法,还包括:
根据所述业务信息,向所述设备发送控制指令,以使所述设备执行所述控制指令对应的业务操作。
18.一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容。
19.一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容;
所述客户端发送模块,发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
20.一种基于语音的信息识别装置,应用于客户端,包括:
客户端发送模块,向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
客户端接收模块,接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别模块,识别所述语音所对应的内容;
所述客户端发送模块,发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示模块,展示所述服务器反馈的所述业务信息。
21.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,以供客户端获取和识别所述语音对应的内容。
22.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收对所述数字对象标识符的播报指令;
将所述数字对象标识符的标识符内容转换为语音;
播放转换所得的所述语音,使得客户端获取和识别所述语音对应的内容,并发送所识别的内容给服务器;
接收所述服务器根据所述客户端所识别的内容、发送的控制指令,并执行所述控制指令对应的业务操作。
23.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容。
24.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,使得所述服务器向所述设备发送控制指令,所述设备执行所述控制指令对应的业务操作。
25.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
向具有数字对象标识符的设备发送对所述数字对象标识符的播报指令;
接收语音,其中所述语音是所述设备接收所述播报指令后、转换所述数字对象标识符的标识符内容得到并播放的;
识别所述语音所对应的内容;
发送所识别的内容给服务器,以使所述服务器根据所识别的内容反馈对应的业务信息;
展示所述服务器反馈的所述业务信息。
26.一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容,处理所识别出的内容。
27.一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容;
服务器,所述服务器根据所述客户端识别出的所述语音所对应的内容,向所述设备发送控制指令;
所述设备根据所述控制指令,执行对应的业务操作。
28.一种基于语音的信息识别***,包括:
具有数字对象标识符的设备,接收对所述数字对象标识符的播报指令,将所述数字对象标识符的标识符内容转换为语音并播放;
客户端,接收所述语音,识别所述语音所对应的内容;
服务器,根据所述客户端识别出的所述语音所对应的内容,反馈对应的业务信息给所述客户端;
所述客户端展示所述业务信息。
CN201911335555.0A 2019-12-23 2019-12-23 一种基于语音的信息识别方法及装置、电子设备和*** Pending CN111312206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911335555.0A CN111312206A (zh) 2019-12-23 2019-12-23 一种基于语音的信息识别方法及装置、电子设备和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911335555.0A CN111312206A (zh) 2019-12-23 2019-12-23 一种基于语音的信息识别方法及装置、电子设备和***

Publications (1)

Publication Number Publication Date
CN111312206A true CN111312206A (zh) 2020-06-19

Family

ID=71148798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911335555.0A Pending CN111312206A (zh) 2019-12-23 2019-12-23 一种基于语音的信息识别方法及装置、电子设备和***

Country Status (1)

Country Link
CN (1) CN111312206A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998010412A2 (en) * 1996-09-09 1998-03-12 Voice Control Systems, Inc. Speech verification system and secure data transmission
JP2006048476A (ja) * 2004-08-06 2006-02-16 Tadao Cho 文書や書籍の記載内容の二重認識方法と、そのための文書又は書籍と二次元コード情報再生装置。
US20160005334A1 (en) * 2014-06-13 2016-01-07 Alibaba Group Holding Limited Method and guide cane for guiding the blind
EP3147890A1 (en) * 2015-09-28 2017-03-29 Mobilead Authenticity tag and methods of encoding and verification
CN106934892A (zh) * 2017-03-10 2017-07-07 华南理工大学 一种共享自行车智能车锁及其计费方法
CN107578505A (zh) * 2017-09-07 2018-01-12 上海共佰克智能科技有限公司 一种智能开锁方法和智能开锁装置
CN107734460A (zh) * 2017-09-20 2018-02-23 广州市盈泽信息科技有限公司 一种基于移动终端实现蓝牙锁智能开锁的方法及终端
CN109215203A (zh) * 2018-09-25 2019-01-15 上海钧正网络科技有限公司 一种智能语音车锁及其控制***和控制方法
CN109995939A (zh) * 2019-03-25 2019-07-09 联想(北京)有限公司 信息处理方法和电子设备
CN110070654A (zh) * 2019-04-29 2019-07-30 深圳前海微众银行股份有限公司 电子锁解锁方法、***、终端、电子锁和计算机存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998010412A2 (en) * 1996-09-09 1998-03-12 Voice Control Systems, Inc. Speech verification system and secure data transmission
JP2006048476A (ja) * 2004-08-06 2006-02-16 Tadao Cho 文書や書籍の記載内容の二重認識方法と、そのための文書又は書籍と二次元コード情報再生装置。
US20160005334A1 (en) * 2014-06-13 2016-01-07 Alibaba Group Holding Limited Method and guide cane for guiding the blind
EP3147890A1 (en) * 2015-09-28 2017-03-29 Mobilead Authenticity tag and methods of encoding and verification
CN106934892A (zh) * 2017-03-10 2017-07-07 华南理工大学 一种共享自行车智能车锁及其计费方法
CN107578505A (zh) * 2017-09-07 2018-01-12 上海共佰克智能科技有限公司 一种智能开锁方法和智能开锁装置
CN107734460A (zh) * 2017-09-20 2018-02-23 广州市盈泽信息科技有限公司 一种基于移动终端实现蓝牙锁智能开锁的方法及终端
CN109215203A (zh) * 2018-09-25 2019-01-15 上海钧正网络科技有限公司 一种智能语音车锁及其控制***和控制方法
CN109995939A (zh) * 2019-03-25 2019-07-09 联想(北京)有限公司 信息处理方法和电子设备
CN110070654A (zh) * 2019-04-29 2019-07-30 深圳前海微众银行股份有限公司 电子锁解锁方法、***、终端、电子锁和计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任伟建等: "改进BP神经网络在电力手持防误***的应用", 《控制工程》 *
吴新华等: "基于二维码识别的垃圾分类投放***设计", 《江苏工程职业技术学院学报》 *

Similar Documents

Publication Publication Date Title
CN115145529B (zh) 语音控制设备的方法及电子设备
EP3680896B1 (en) Method for controlling terminal by voice, terminal, server and storage medium
CN104618780B (zh) 电器设备控制方法及***
CN111095892B (zh) 电子装置及其控制方法
US20070222734A1 (en) Mobile device capable of receiving music or video content from satellite radio providers
US20070263796A1 (en) Method and apparatus to provide data to an interactive voice response (ivr) system
CN108564946A (zh) 在语音对话平台创建技能、语音对话产品的方法及***
CN102668391A (zh) 用于控制移动装置的外部输出的方法和***
CN110968362B (zh) 应用运行方法、装置及存储介质
CN108595215A (zh) 车载终端的开机动画的播放方法、装置、设备和存储介质
CN104837057A (zh) 视频文件播放方法、装置和***
CN110943908A (zh) 语音消息发送方法、电子设备及介质
CN111601154B (zh) 一种视频处理方法及相关设备
CN110418181B (zh) 对智能电视的业务处理方法、装置、智能设备及存储介质
CN114121028A (zh) 语音播放方法、装置、设备以及存储介质
CN110659361B (zh) 一种对话方法、装置、设备及介质
WO2024149301A1 (zh) 一种云桌面的多媒体播放方法、***、设备及存储介质
CN109348048B (zh) 通话留言方法、终端和具有存储功能的装置
EP3823270A1 (en) Video processing method and device, and terminal and storage medium
KR102506604B1 (ko) 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치
CN106782578B (zh) 一种分布式解码控制器、分布式解码方法及音频终端
CN111312206A (zh) 一种基于语音的信息识别方法及装置、电子设备和***
US10936878B2 (en) Method and device for determining inter-cut time range in media item
CN111292749A (zh) 智能语音平台的会话控制方法及装置
CN111862966A (zh) 智能语音交互方法以及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200619