CN110570852A - 一种服务辅助方法、装置及电子设备 - Google Patents

一种服务辅助方法、装置及电子设备 Download PDF

Info

Publication number
CN110570852A
CN110570852A CN201910735699.9A CN201910735699A CN110570852A CN 110570852 A CN110570852 A CN 110570852A CN 201910735699 A CN201910735699 A CN 201910735699A CN 110570852 A CN110570852 A CN 110570852A
Authority
CN
China
Prior art keywords
service
providing terminal
service providing
audio signal
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910735699.9A
Other languages
English (en)
Inventor
戴毓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910735699.9A priority Critical patent/CN110570852A/zh
Publication of CN110570852A publication Critical patent/CN110570852A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F9/00Details other than those peculiar to special kinds or types of apparatus
    • G07F9/006Details of the software used for the vending machines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例提供一种服务辅助方法、装置及电子设备。其中,方法应用于一服务辅助装置,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端,包括:对服务提供终端的服务区域进行声源检测。在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号。将所述音频信号转换为与所述服务提供终端匹配的数字信号。基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。

Description

一种服务辅助方法、装置及电子设备
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种服务辅助方法、装置及电子设备。
背景技术
随着社会的快速发展,市面上向人们提供自助式服务的终端设备也越来越多。其中常见的有自动售卖机、图书租借机、商场导航机等。目前这类服务提供终端主要依赖手动输入操作,对使用者来讲操作不够便捷,带来了不好的使用体验。
为此,如何较为实用地将目前市面上的服务提供终端升级为支持语音输入操作,是当前亟待解决的技术问题。
发明内容
本申请实施例目的是提供一种服务辅助方法、装置及电子设备、装置及电子设备,能够较为实用地将目前市面上的服务提供终端升级为支持语音输入操作。
为了实现上述目的,本申请实施例是这样实现的:
第一方面,提供一种方法服务辅助方法,包括:
服务辅助装置对服务提供终端的服务区域进行声源检测,其中,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端;
所述服务辅助装置在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
所述服务辅助装置将所述音频信号转换为与所述服务提供终端匹配的数字信号;
所述服务辅助装置基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
第二方面,提供一种服务辅助装置,能够通过数据总线以可拆卸方式连接于服务提供终端,包括:
声源检测模块,对服务提供终端的服务区域进行声源检测,其中,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端;
音频信号采集模块,在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
信号转换模块,将所述音频信号转换为与所述服务提供终端匹配的数字信号;
信号发送模块,基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
第三方面,提供一种服务辅助装置,包括:处理器、存储器、麦克风阵列、数据总线以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
基于所述麦克风阵列,对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,基于所述麦克风阵列,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
第四方面,提供一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
第五方面,提供一种算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
本申请实施例的方案通过一个服务辅助装置实现采集对服务提供终端下达操作的音频信号的功能以及将音频信号转换为服务提供终端可识别的数字信号的功能,从而在将服务辅助装置数据接入至服务提供终端后,可以在不对服务提供终端进行改动的前提下,使其支持语音输入操作。整个方案对能够以较低的成本对已有服务提供终端进行改造,且后续只需要对可拆卸的服务辅助装置进行软硬件的升级、维护,因此具有极高的实用性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的服务辅助方法的第一种流程示意图。
图2为本申请实施例提供的服务辅助方法的第二种流程示意图。
图3为本申请实施例提供的服务辅助装置的第一种结构示意图。
图4为本申请实施例提供的服务辅助装置的第二种结构示意图。
图5为本申请实施例提供的服务辅助装置的第三种结构示意图。
图6为本申请实施例提供的服务辅助装置的第四种结构示意图。
图7为本申请实施例提供的服务辅助装置的第五种结构示意图。
图8为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
如前所述,目前绝大部分自助式的服务提供终端只支持手动输入操作,对于使用者来讲操作不够便捷,带来了不好的使用体验。而对这类服务提供终端进行更新换代需要付出极大的成本,显然是不够现实的解决方法。
为此,本申请旨在提供一种具有较高实用性的能够使现有服务提供终端支持语音输入操作的技术方案。
图1是本申请实施例服务辅助方法的流程图。图1所示的方法可以由下文相对应的装置执行,包括:
步骤S102,服务辅助装置对服务提供终端的服务区域进行声源检测,其中,服务辅助装置通过数据总线以可拆卸方式连接于服务提供终端。
应理解,上述服务提供终端可以但不限于是指不支持语音输入操作的设备,例如传统的自动售卖机、图书租借机、商场导航机等。此外,服务辅助装置可以具有商业用途,也可以具有非商业用途,这与本申请实施例的方案不具有直接联系,因此不作具体限定。
步骤S104,服务辅助装置在检测到服务区域内存在声源时,采集用于针对服务提供终端下达操作的音频信号。
应理解,服务区域可以是指用户正常使用指服务提供终端时所对应的活动区域。显然,若服务辅助装置在服务区域内检测到声源,则有很大概率表示服务提供终端将被使用,此时服务辅助装置开始采集用于针对服务提供终端下达操作的音频信号。
步骤S106,服务辅助装置将音频信号转换为与服务提供终端匹配的数字信号。
具体地,数字信号的类型可以取决于数据总线。假设在本申请实施例中,服务辅助装置通过通用串行总线USB与服务提供终端建立连接,则数字信号具体为USB信号。
步骤S108,服务辅助装置基于数据总线,将数字信号发送至服务提供终端,使得服务提供终端基于数字信号执行对应的操作。
应理解,数字信号表征服务提供终端当前已有的操作命令。即,服务提供终端不需要进行任何改动,即可执行数字信号所对应的操作。
基于图1所示的服务辅助方法可以知道,本申请实施例的方案通过一个服务辅助装置实现采集对服务提供终端下达操作的音频信号的功能以及将音频信号转换为服务提供终端可识别的数字信号的功能,从而在将服务辅助装置数据接入至服务提供终端后,可以在不对服务提供终端进行改动的前提下,使其支持语音输入操作。整个方案对能够以较低的成本对已有服务提供终端进行改造,且后续只需要对可拆卸的服务辅助装置进行软硬件的升级、维护,因此具有极高的实用性。
下面对本申请实施例的方法进行详细描述。
本申请实施例的方法将服务提供终端实现语音输入操作所需要的软、硬件集成在便携式的服务辅助装置上。服务辅助装置能够通过数据总线与服务提供终端建立交互通道,从而将以语音识别到的针对服务提供终端的操作指令转换为数字信号发送给服务提供终端,由服务提供终端进行处理。
其中,参考图2,服务辅助方法的主要流程包括:
步骤S201,服务辅助装置对服务提供终端的服务区域进行声源检测。
具体地,服务辅助装置设置有麦克风阵列和麦克风阵列声源定位算法。
本步骤中,服务辅助装置可以周期性通过麦克风阵列采集声源,并在采集到声源后,基于麦克风阵列声源定位算法完成声源定位,从而确定检测到的声源是否位于服务区域。
这里需要说明的是,基于麦克风阵列进行声源定位的算法属于现有技术,本申请不涉及该方面的改进,因此不再举例进行赘述。
步骤S202,服务辅助装置在检测到服务区域内存在声源时,基于与服务提供终端之间的数据总线,建立交互通道。
应理解,交互通道建立后,数据总线被服务辅助装置激活。本步骤中,服务辅助装置可以在激活数据总线后,通过该数据总线确认服务提供终端安装的针对服务辅助装置的驱动是否需要升级。其中,若需要升级,则服务辅助装置基于交互通道,将本地存储的驱动安装程序发送至服务提供终端,使得服务提供终端基于接收到的驱动安装程序升级针对服务辅助装置的驱动。这里需要说明的是,只要数据总线被激活,服务辅助装置可以在任意时间检测服务提供终端的驱动是否需要升级,本申请实施例对此不作具体限定。
步骤S203,服务辅助装置基于数据总线,控制服务提供终端进入服务操作界面。
具体地,本步骤中,服务辅助装置在检测到服务区域内存在声源时,可以通过数据总线,向服务提供终端发送服务操作界面的激活命令,服务提供终端在执行该激活命令后进入服务操作界面。
步骤S204,服务辅助装置在服务提供终端进入服务操作界面后,采集用于针对服务提供终端下达操作的音频信号。
具体地,本步骤中,服务辅助装置可以通过自身设置的麦克风阵列,来采集多方位的音频信号。之后,对多方位采集得到的音频信号进行差分降噪处理,得到降噪后的音频信号。
下面对差分降噪处理的方法进行举例介绍。
假设麦克风阵列有麦克风A和麦克风B。服务提供终端通过麦克风A采集得的音频信号为As1,Sm1包含来自服务区域的有效信号Sm1和来自非服务区域的噪音信号M1。服务提供终端通过麦克风B采集得到的音频信号为As2,As2包含来自服务区域的有效信号Sm2和来自非服务区域的噪音信号M2。假设,麦克风A相比麦克风B更接近服务区域,则信号强度上Sm1>Sm2。而噪声则来源于周围环境,难以限定哪个麦克风更接近噪音位置,因此信号强度上M1≈M2。这里,通过差分的方式可以完成降噪计算:Sv=Sm1-Sm2。其中,Sv即为降噪后的音频信号(如果Sv的信号强度无法满足要求,可以对其进行放大处理)。
显然,具体的差分降噪处理取决于麦克风阵列的设置。当麦克风阵列的麦克风数量为多个时,则可以将上述As1等效替换为最接近服务区域的麦克风所采集的音频信号,上述As2等效替换为其余麦克风所采集的平均信号强度的音频信号。
步骤S205,服务辅助装置将音频信号转换为与服务提供终端匹配的数字信号。
具体地,服务辅助装置可以预先存储有服务提供终端的指令集与操作之间的映射关系。
本步骤中,服务辅助装置可以先对音频信号进行语义识别,确定音频信号表征的操作。之后,服务辅助装置基于存储的映射关系确定出音频信号表征的操作所对应的指令,并生成该指令的数字信号。
步骤S206,服务辅助装置基于数据总线,将数字信号发送至服务提供终端,使服务提供终端执行相应的操作。
下面结合一个实际的应用场景对本申请示例的方法进行示例介绍。
在本应用场景中,服务提供终端具体为自动售卖机。本申请实施例的服务辅助方法在应用于自动售卖机时的流程包括:
步骤一,服务辅助装置在检测到声源时,判断声源是否位于自动售卖机的服务区域。是,则执行步骤二;否,则流程结束。
步骤二,服务辅助装置通过数据总线与自动售卖机建立交互通道,以控制自动售卖机进入购物界面。
步骤三,服务辅助装置在自动售卖机进入购物界面后,采集消费者针对购物界面所下达的选定购买商品的音频信号,并将音频信号转换为数字信号后,通过交互通道发送给自动售卖机。
步骤四,服务辅助装置采集消费者针对购物界面所下达的用于将选定的购买商品添加至购物车的音频信号,并将音频信号转换为数字信号后,通过交互通道发送给自动售卖机。
步骤五,服务辅助装置采集消费者针对购物界面所下达的用于对购物车发起结账的音频信号,并将音频信号转换为数字信号后,通过交互通道发送给自动售卖机,使自动售卖机的购物界面向消费者提示选择何种支付方式。
步骤六,服务辅助装置采集消费者针对购物界面所下达的用于选定支付方式的音频信号,并将音频信号转换为数字信号后,通过交互通道发送给自动售卖机,使自动售卖机的购物界面显示消费者指定支付方式的支付动画。
步骤七,服务辅助装置采集消费者针对购物界面所下达的用于执行支付验证的音频信号,并将音频信号转换为数字信号后,通过交互通道发送给自动售卖机,使自动售卖机进行支付验证,并在验证通过后发起结账流程。
其中,服务辅助装置可以将用于执行支付验证的音频信号的声纹特征等效转换为数字信号,由自动售卖机基于表征声纹特征的数字信号进行支付验证。
以上是本应用场景的介绍。应理解,对于服务提供终端的使用用户来讲,并不一定要将全部的操作都通过服务辅助设备完成。比如,上述步骤七中的支付验证的操作可以是用户直接通过自动售卖机手动输入完成,从而保证个人信息的安全。
与上述方法相对应地,如图3所示,本申请实施例还提供一种服务辅助装置300,包括:
声源检测模块310,对服务提供终端的服务区域进行声源检测,其中,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端;
音频信号采集模块320,在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
信号转换模块330,将所述音频信号转换为与所述服务提供终端匹配的数字信号;
信号发送模块340,基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
基于图3所示的服务辅助装置可以知道,本申请实施例的方案通过一个服务辅助装置实现采集对服务提供终端下达操作的音频信号的功能以及将音频信号转换为服务提供终端可识别的数字信号的功能,从而在将服务辅助装置数据接入至服务提供终端后,可以在不对服务提供终端进行改动的前提下,使其支持语音输入操作。整个方案对能够以较低的成本对已有服务提供终端进行改造,且后续只需要对可拆卸的服务辅助装置进行软硬件的升级、维护,因此具有极高的实用性。
可选地,音频信号采集模块320在执行时,具体在检测到所述服务区域内存在声源时,基于所述数据总线控制所述服务提供终端进入服务操作界面。在所述服务提供终端进入服务操作界面后,再采集用于针对所述服务提供终端下达操作的音频信号。
可选地,音频信号采集模块320在执行时,具体采集来自所述服务区域的用于针对所述服务提供终端下达操作的音频信号和来自非服务区域的噪音信号。之后,基于所述噪音信号对所述音频信号进行降噪处理,得到降噪后的音频信号。
可选地,本申请实施例的装置还包括:
驱动升级模块,在所述服务辅助装置通过所述数据总线连接于所述服务提供终端时,基于所述数据总线确定所述服务提供终端安装的针对所述服务辅助装置的驱动是否需要升级。若需要升级,则基于所述数据总线,将本地存储的驱动安装程序发送至所述服务提供终端,使得所述服务提供终端基于接收到的所述驱动安装程序升级针对所述服务辅助装置的驱动。
可选地,所述服务提供终端为自动售卖机,用于针对所述服务提供终端下达操作的音频信号包括以下至少一者:
用于选定购买商品的音频信号、用于将选定的购买商品添加至购物车的音频信号、用于对购物车发起结账的音频信号、用于选定支付方式的音频信号以及用于执行支付验证的音频信号。
可选地,所述数据总线包括以下至少一者:
通用串行总线、集成电路内置音频总线、吉比特介质独立接口总线、串行外设接口总线以及安全数字输入输出卡总线。
显然,本申请实施例的服务辅助装置可以作为上述图1所示的服务辅助方法的执行主体,因此实现服务辅助方法在图1和图2所实现的功能。由于原理相同,本文不再赘述。
图4是本申请的一个实施例服务辅助装置的结构示意图。参考图4,服务辅助装置包括处理器410、存储器420、麦克风阵列430、数据总线440以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
基于所述麦克风阵列,对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,基于所述麦克风阵列,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
基于图4所示的服务辅助装置可以知道,本申请实施例的方案通过一个服务辅助装置实现采集对服务提供终端下达操作的音频信号的功能以及将音频信号转换为服务提供终端可识别的数字信号的功能,从而在将服务辅助装置数据接入至服务提供终端后,可以在不对服务提供终端进行改动的前提下,使其支持语音输入操作。整个方案对能够以较低的成本对已有服务提供终端进行改造,且后续只需要对可拆卸的服务辅助装置进行软硬件的升级、维护,因此具有极高的实用性。
下面结合不同的实现方式对本申请实施例的服务辅助装置进行示例性介绍。
实现方式一
参考图5,实现方式一中,服务辅助装置具体包括处理器410、存储器420、麦克风阵列430(包含1至4麦克风)和数据总线440。
其中,麦克风阵列430中的所有麦克风直接连接处理器410,处理器410进一步直接数据总线440。
显然,麦克风阵列430中的所有麦克风在采集到音频信号后,可以直接到达处理器410,并由处理器410负责转换为数字信号。之后,处理器410将转换得到的数字信号进一步通过数据总线440发送至服务提供终端。
实现方式二
本实现方式二中,麦克风阵列的麦克风数量为5至8个,处理器通过两个音频解码芯片连接麦克风阵列的麦克风。其中,处理器通过一个音频解码芯片最多连接4个麦克风。
作为示例性介绍,假设麦克风阵列具有8个麦克风,则服务辅助装置如图6所示,具体包括:
处理器410、存储器420、麦克风阵列430(8个麦克风)、数据总线440和两个音频解码芯片450。
其中,处理器410分别通过通过集成电路内置音频I2S总线、时分复用模式TDM总线和脉冲密度调制PDM总线中的一者连接两个音频解码芯片450。每个音频解码芯片又分别不重复连接麦克风阵列430中的4个麦克风。
这里,音频解码芯片450可以视为集线接口,处理器通410过音频解码芯片450,可以与8个麦克风建立连接。
实现方式三
本实现方式三中,麦克风阵列的麦克风数量为9至16个,处理器为2个且相互级联,每个处理器均对应有麦克风阵列中不同的麦克风,并通过专属的一个或两个音频解码芯片与对应的麦克风连接;其中,一个处理器最多对应有8个麦克风,并通过一个音频解码芯片最多连接4个麦克风。
作为示例性介绍,假设麦克风阵列具有16个麦克风,则服务辅助装置如图7所示,具体包括:
两个处理器410、存储器420、麦克风阵列430(16个麦克风)、数据总线440以及4个音频解码芯片450。
其中,每个处理器410分别通过I2S总线、TDM总线和PDM总线中的一者不重复连接两个音频解码芯片450。每个音频解码芯片又分别不重复连接麦克风阵列430中的4个麦克风。
这里,可以指定其中一个处理器410作为主处理器,另一个处理器410作为从处理器。主处理器负责连接数据总线440,从处理器可以将转换获得数字信号发送给主处理器,再由主处理器通过数据总线440转发给服务提供终端。
图8是本申请的一个实施例电子设备的结构示意图。请参考图8,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成服务辅助装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
上述如本申请图1所示实施例揭示的服务辅助方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
应理解,本申请实施例的电子设备可以实现上述服务辅助装置在图1和图2所示的实施例的功能,本文不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
此外,本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下方法:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
应理解,上述指令当被包括多个应用程序的便携式电子设备执行时,能够使上文所述的服务辅助装置实现图1和图2所示实施例的功能,本文不再赘述。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (13)

1.一种服务辅助方法,包括:
服务辅助装置对服务提供终端的服务区域进行声源检测,其中,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端;
所述服务辅助装置在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
所述服务辅助装置将所述音频信号转换为与所述服务提供终端匹配的数字信号;
所述服务辅助装置基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
2.根据权利要求1所述的方法,
所述服务辅助装置在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号,包括:
所述服务辅助装置在检测到所述服务区域内存在声源时,基于所述数据总线控制所述服务提供终端进入服务操作界面;
所述服务辅助装置在所述服务提供终端进入服务操作界面后,采集用于针对所述服务提供终端下达操作的音频信号。
3.根据权利要求1所述的方法,
采集用于针对所述服务提供终端下达操作的音频信号,包括:
所述服务辅助装置基于自身设置的麦克风阵列,多方位采集针对所述服务提供终端下达操作的音频信号;
所述服务辅助装置对多方位采集得到的音频信号进行差分降噪处理,得到降噪后的音频信号。
4.根据权利要求1-3中任一项所述的方法,还包括:
所述服务辅助装置基于所述数据总线确定所述服务提供终端安装的针对所述服务辅助装置的驱动是否需要升级;
若需要升级,则所述服务辅助装置基于所述数据总线,将本地存储的驱动安装程序发送至所述服务提供终端,使得所述服务提供终端基于接收到的所述驱动安装程序升级针对所述服务辅助装置的驱动。
5.根据权利要求1-3中任一项所述的方法,
所述服务提供终端为自动售卖机,用于针对所述服务提供终端下达操作的音频信号包括以下至少一者:
用于选定购买商品的音频信号、用于将选定的购买商品添加至购物车的音频信号、用于对购物车发起结账的音频信号、用于选定支付方式的音频信号以及用于执行支付验证的音频信号。
6.根据权利要求1-3中任一项所述的方法,
所述数据总线包括以下至少一者:
通用串行总线、集成电路内置音频总线、吉比特介质独立接口总线、串行外设接口总线以及安全数字输入输出卡总线。
7.一种服务辅助装置,能够通过数据总线以可拆卸方式连接于服务提供终端,包括:
声源检测模块,对服务提供终端的服务区域进行声源检测,其中,所述服务辅助装置通过数据总线以可拆卸方式连接于所述服务提供终端;
音频信号采集模块,在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
信号转换模块,将所述音频信号转换为与所述服务提供终端匹配的数字信号;
信号发送模块,基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
8.一种服务辅助装置,包括:处理器、存储器、麦克风阵列、数据总线以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
基于所述麦克风阵列,对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,基于所述麦克风阵列,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
9.根据权利要求8所述的服务辅助装置,
所述麦克风阵列的麦克风数量为1至4个,所述处理器直接所述麦克风阵列的麦克风。
10.根据权利要求8所述的服务辅助装置,
所述麦克风阵列的麦克风数量为5至8个,所述处理器通过两个音频解码芯片连接所述麦克风阵列的麦克风;其中,所述处理器通过一个音频解码芯片最多连接4个麦克风。
11.根据权利要求8所述的服务辅助装置,
所述麦克风阵列的麦克风数量为9至16个,所述处理器为2个且相互级联,每个处理器均对应有所述麦克风阵列中不同的麦克风,并通过专属的一个或两个音频解码芯片与对应的麦克风连接;其中,一个处理器最多对应有8个麦克风,并通过一个音频解码芯片最多连接4个麦克风。
12.一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
13.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
对服务提供终端的服务区域进行声源检测;
在检测到所述服务区域内存在声源时,采集用于针对所述服务提供终端下达操作的音频信号;
将所述音频信号转换为与所述服务提供终端匹配的数字信号;
基于所述数据总线,将所述数字信号发送至服务提供终端,使得所述服务提供终端基于所述数字信号执行对应的操作。
CN201910735699.9A 2019-08-09 2019-08-09 一种服务辅助方法、装置及电子设备 Pending CN110570852A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910735699.9A CN110570852A (zh) 2019-08-09 2019-08-09 一种服务辅助方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910735699.9A CN110570852A (zh) 2019-08-09 2019-08-09 一种服务辅助方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN110570852A true CN110570852A (zh) 2019-12-13

Family

ID=68774892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910735699.9A Pending CN110570852A (zh) 2019-08-09 2019-08-09 一种服务辅助方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110570852A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127099A (ja) * 1989-10-13 1991-05-30 Matsushita Refrig Co Ltd 音声認識システム
JPH0997368A (ja) * 1995-09-30 1997-04-08 Sanyo Electric Co Ltd 自動販売機
KR20060020101A (ko) * 2004-08-31 2006-03-06 이경목 음성 인식과 터치 스크린 패드를 겸용한 안내와 자동 판매시스템
CN203773629U (zh) * 2013-11-06 2014-08-13 上海煦荣信息技术有限公司 一种智能化的自助售货***
CN107909715A (zh) * 2017-09-29 2018-04-13 嘉兴川森智能科技有限公司 自动售货机中的语音识别***及方法
CN109712337A (zh) * 2018-12-21 2019-05-03 上海三杰富景新能源科技有限公司 一种基于人工智能语音控制的智能售货寄存柜
CN109920404A (zh) * 2019-01-31 2019-06-21 安徽智佳信息科技有限公司 拥有智能感知作用的自助售货广告管理***的信息采集装置及采集方法
CN209149137U (zh) * 2019-01-24 2019-07-23 昆山毅普腾自动化技术有限公司 自动售货机安卓智能控制***
CN209199202U (zh) * 2019-01-24 2019-08-02 昆山毅普腾自动化技术有限公司 自动售货机智能显示控制单元

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03127099A (ja) * 1989-10-13 1991-05-30 Matsushita Refrig Co Ltd 音声認識システム
JPH0997368A (ja) * 1995-09-30 1997-04-08 Sanyo Electric Co Ltd 自動販売機
KR20060020101A (ko) * 2004-08-31 2006-03-06 이경목 음성 인식과 터치 스크린 패드를 겸용한 안내와 자동 판매시스템
CN203773629U (zh) * 2013-11-06 2014-08-13 上海煦荣信息技术有限公司 一种智能化的自助售货***
CN107909715A (zh) * 2017-09-29 2018-04-13 嘉兴川森智能科技有限公司 自动售货机中的语音识别***及方法
CN109712337A (zh) * 2018-12-21 2019-05-03 上海三杰富景新能源科技有限公司 一种基于人工智能语音控制的智能售货寄存柜
CN209149137U (zh) * 2019-01-24 2019-07-23 昆山毅普腾自动化技术有限公司 自动售货机安卓智能控制***
CN209199202U (zh) * 2019-01-24 2019-08-02 昆山毅普腾自动化技术有限公司 自动售货机智能显示控制单元
CN109920404A (zh) * 2019-01-31 2019-06-21 安徽智佳信息科技有限公司 拥有智能感知作用的自助售货广告管理***的信息采集装置及采集方法

Similar Documents

Publication Publication Date Title
US11984119B2 (en) Electronic device and voice recognition method thereof
KR20190024762A (ko) 음악추천방법, 장치, 디바이스 및 저장매체
US20190287552A1 (en) Method, apparatus, system and storage medium for implementing a far-field speech function
CN108831505B (zh) 用于识别应用的使用场景的方法和装置
CN110324314B (zh) 用户注册方法及装置、存储介质、电子设备
CN109346074A (zh) 一种语音处理方法及***
CA3158927A1 (en) Shopping method, device and system
CN109087109B (zh) 一种移动支付确认方法、装置、***和存储介质
CN109214801B (zh) 一种电子支付确认方法、装置和存储介质
CN110570852A (zh) 一种服务辅助方法、装置及电子设备
CN109509469A (zh) 语音控制体温检测方法、装置、***及存储介质
CN112367348A (zh) 数据获取方法、装置、设备及介质
CN111626726B (zh) 生活缴费方法、装置、设备及存储介质
CN110753033A (zh) 基于运营商认证服务的免交互身份验证方法及装置
CN110379408A (zh) 一种驾驶中语音通讯的方法、计算机装置及计算机可读存储介质
CN113962651A (zh) 获取考勤记录的方法、装置、电子设备及存储介质
CN112579370B (zh) 一种车载hmi设备的检测方法及装置
US10127910B2 (en) Speech recognition apparatus and computer program product for speech recognition
KR102386040B1 (ko) 음성 입력을 처리하기 위한 방법, 장치 및 명령어들을 갖는 컴퓨터 판독 가능한 저장 매체, 음성 처리 기능을 갖는 자동차, 및 사용자 단말기
EP3767621A1 (en) Onboard device, traveling state estimation method, server device, information processing method, and traveling state estimation system
CN111784481A (zh) 扫码下单方法、业务码创建方法、装置和电子设备
CN111554058A (zh) 敏感操作的处理方法、装置、设备及计算机可读存储介质
CN110659062A (zh) 前端脚手架的配置方法和装置、可读存储介质、电子设备
CN108449740A (zh) 一种数据传输方法、装置、设备和存储介质
CN117435174B (zh) 一种支付扩展方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40018754

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20201012

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201012

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right