CN109979447A - 一种基于位置的点餐控制方法、电子设备及存储介质 - Google Patents

一种基于位置的点餐控制方法、电子设备及存储介质 Download PDF

Info

Publication number
CN109979447A
CN109979447A CN201910072430.7A CN201910072430A CN109979447A CN 109979447 A CN109979447 A CN 109979447A CN 201910072430 A CN201910072430 A CN 201910072430A CN 109979447 A CN109979447 A CN 109979447A
Authority
CN
China
Prior art keywords
ordering
information
location
control method
based control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910072430.7A
Other languages
English (en)
Inventor
傅峰峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Fugang Wanjia Intelligent Technology Co Ltd
Original Assignee
Guangzhou Fugang Wanjia Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Fugang Wanjia Intelligent Technology Co Ltd filed Critical Guangzhou Fugang Wanjia Intelligent Technology Co Ltd
Priority to CN201910072430.7A priority Critical patent/CN109979447A/zh
Publication of CN109979447A publication Critical patent/CN109979447A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于位置的点餐控制方法,包括以下步骤:获取步骤:通过声音采集设备获取当前用户的声音信息;定位步骤:采用声源定位技术以定位声音信息所在位置;第一判断步骤:判断所述声音信息所在位置是否存储在服务器中,如果是,则执行信息提取步骤;信息提取步骤:提取声音信息中的菜品名称信息,并生成点餐指令。本发明还提供了一种电子设备和计算机可读存储介质。本发明的基于位置的点餐控制方法通过区分声音信息所在位置来进一步判断是否对其声音进行提取识别,这样能够使得点餐过程更为的高效。

Description

一种基于位置的点餐控制方法、电子设备及存储介质
技术领域
本发明涉及一种点餐技术领域,尤其涉及一种基于位置的点餐控制方法、电子设备及存储介质。
背景技术
市面上现有的自助服务机包括有自助点餐机,在一些餐厅中,可以通过自助点餐机自助点餐,这样可以减轻工作人员的工作量。但是这样的点餐机器铺设成本相对较高。随着社会的进步,餐饮业也在不断的进步当中,时下有一种新的点餐方式正在逐渐流行开来,这个便是电子点餐,比较常用的方式是通过扫描二维码的方式进行。目前的电子点餐***中,用户可以快速浏览和选择菜品,并进行下单,速度高于传统菜谱,这使用户的点餐过程变得非常随意自由,给用户带来美好的用餐体验。但是这种方式还是应用于比较常规的需要服务员服务的方式,对于更智能的无人餐厅来说,如何降低顾客的使用负担,使得用户可以只是通过讲话就实现点餐成为本领域技术人员所要解决的技术问题。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种基于位置的点餐控制方法,其能解决高效点餐的技术问题。
本发明的目的之二在于提供一种电子设备,其能解决高效点餐的技术问题。
本发明的目的之三在于提供一种计算机可读存储介质,其能解决高效点餐的技术问题。
本发明的目的之一采用如下技术方案实现:
一种基于位置的点餐控制方法,包括以下步骤:
获取步骤:通过声音采集设备获取当前用户的声音信息;
定位步骤:采用声源定位技术以定位声音信息所在位置;
第一判断步骤:判断所述声音信息所在位置是否存储在服务器中,如果是,则执行点餐步骤;
信息提取步骤:提取声音信息中的菜品名称信息,并生成点餐指令。
进一步地,在信息提取步骤之后还包括信息读取步骤:当接收到点餐结束指令时,通过扬声器读取获取到的所有的菜品名称信息。
进一步地,在信息确认步骤之后还包括以下步骤:
接收步骤:接收当前用户发出的信息确认指令;
第二判断步骤:根据信息确认指令以判断是否需要修改对应的点餐指令,如果是,则修改对应的点餐指令;
点餐步骤:将最终的点餐指令发送至服务器端以完成点餐。
进一步地,在点餐步骤之后还包括设备关闭步骤:控制关闭声音采集设备或者使得声音采集设备处于休眠状态。
进一步地,在第一判断步骤之后还包括位置变换步骤:当获取到的声音信息所在位置改变时,则返回定位步骤以对声音信息进行重新定位。
进一步地,在获取步骤之前还包括唤醒步骤:当接收到预设唤醒词时,启动声音采集设备。
进一步地,所述唤醒步骤具体为:当接收到的预设唤醒词时,判断与预设唤醒词对应的声纹信息是否存储在服务器中,如果是,则启动声音采集设备。
进一步地,所述定位步骤中,所述声源定位技术为基于时延估计的算法或者基于高分辨率谱估计的算法或者基于稀疏表示的算法,且所述定位步骤具体为:当采用声源定位技术定位声音所在位置后,关闭除了与声音信息所在位置最近的麦克风外的其余麦克风,且所述获取步骤中具体为:通过环形麦克风阵列获取当前用户的声音信息。
本发明的目的之二采用如下技术方案实现:
一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明目的之一中任意一项所述的一种基于位置的点餐控制方法。
本发明的目的之三采用如下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明目的之一中任意一项所述的一种基于位置的点餐控制方法。
相比现有技术,本发明的有益效果在于:
本发明的基于位置的点餐控制方法通过区分声音信息所在位置来进一步判断是否对其声音进行提取识别,这样能够使得点餐过程更为的高效。
附图说明
图1为实施例一的基于位置的点餐控制方法的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
如图1所示,本实施例提供了一种基于位置的点餐控制方法,包括以下步骤:
S1:通过声音采集设备获取当前用户的声音信息;所述声音采集设备最为优选的,采用环形麦克风阵列以采集当前用户的声音信息;这一步主要是为了获取到对应用户的声音信息,这也是下面所有步骤的基础。通过环形麦克风可以更为高效准确的获取圆桌四周的声音信息,获取到的声音源信息越清晰,那么后期进行语音翻译也就会使得其越准确。该环形麦克风一般设置于餐桌上,针对于不同的餐桌设置有不同的数量的麦克风数,比如针对于四人桌,环形麦克风中拥有麦克风的数量为四个,针对于六人桌,环形麦克风中拥有麦克风的数量为六个,针对于十人桌,环形麦克风中拥有麦克风的数量为十个;这样在进行具体操作的时候,可以设定每个座位有对应一个麦克风。除了上述这样的方式之外,还可以设置固定数量的麦克风,比如不论是几人桌,环形麦克风中拥有麦克风的数量均为六个;因为在这个过程中只需要通过麦克风来完成定位,而不需要使得每个人都可以分配得到一个麦克风,不过,在进行设置的时候,拥有录音权限的那个座位必须有分配对应的一个麦克风,以便于更好的进行信息接收。
在本实施例中还提供了另外一种实施方式来进行该控制方法的唤醒,一般的唤醒方式可以直接通过电源按键来实现语音识别***的开关,这种是最为原始的,也不够智能;在本实施例中其作为一种可以替代的方式可以进行选择,还可以设置语音识别***处于常开的状态,只是这样会比较耗费电量,并且很容易形成很多不必要的“点餐指令”,但是其也可以作为一种方式来进行实施,只是不属于本发明中所要着重描述的最为优选的方式。
在本实施例中最为优选地,是可以采用关键词唤醒的方式来进行语音识别***的唤醒,比如将唤醒关键词设置为“点餐开始”或者“开始点菜”,当声音采集设备采集到这样的信息的时候,则将处于待机状态下的语音识别***唤醒以进行工作,从而实现真正的自动化处理。使得点餐可以进行的更为的顺畅。由于并非是所有人都可以来控制会议的进行,故而需要设置一个或者多个用户来进行统筹,最为优选地是设定一个用户来进行统筹,因为点餐人数一般不会特别多,所以只需要一个用户来进行统一管理比较合适。将这个用户的声纹信息预先存储在服务器中,只有他说出来的预设唤醒词才具备启动的功能。所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。所以采用声纹这种识别方式,识别更为的高效。
当接收到的预设唤醒词时,判断与预设唤醒词对应的声纹信息是否存储在服务器中,如果是,则启动声音采集设备。这里进行预设唤醒词的设置的时候,可以依照用户的习惯来进行设置,比如通常的可以设置“会议开始”,这样的常规性词句,对应的饭店也可以依据自己的企业文化,设定不同的唤醒词。比如外婆家的唤醒词可以设置“外婆,我来了”这样的更个性,更具备特色的唤醒方式,使得该***能够具备更高的用户黏性。从而使得单一的***能够通过这样不同的方式具有较高的区分度,也更加便于不同的企业具有更个性化的定制。
在进行唤醒词设置的时候,可以设置为以下方式,“请大家安静,准备开始点菜。”当这样设置的时候,具备更高的抗干扰性。因为,当用户进行一间餐厅的时候,这时候朋友之间会交谈,有时候会不经意间触发语音识别***,这样就会造成一定的启动失误,会从一定程度上降低用户对***稳定性的信任。因此设置相对较长的话语,可以使得其唤醒难度加大。更为重要的是,当说完“请大家安静”的时候,可以通过检测环境噪声这样的信息来确认,是否是点餐主持者发出的明确指令,如果说完之后,环境噪声明显降低,那么说明确实是要正式进入点餐模式,此时,启动语音识别***。在启动之后,该语音识别***,还可以进一步发出询问,以确认点餐是否开始,当该信息为肯定回答时,则完全启动。
S2:采用声源定位技术以定位声音信息所在位置;所述声源定位技术为基于时延估计的算法或者基于高分辨率谱估计的算法或者基于稀疏表示的算法,且所述定位步骤具体为:当采用声源定位技术定位声音所在位置后,关闭除了与声音信息所在位置最近的麦克风外的其余麦克风。当定位到具体的位置的时候,最好的是只开启其面前的麦克风,而将其余的麦克风关闭,这样能够更为有效的获取当前说话者的声音信息,而屏蔽掉一部分说话者的低语,不会因为产生多处声源而造成声音获取处于一种比较混乱的状态。因为如果当说话的人不是一个的时候,而此时又同时开启有多个麦克风,那么就无法判断他们的来源强弱,而会将所有的声音信息都录入,从而会产生一定的混乱,而只开启说话者面前的麦克风的话,其可以通过声音强弱,声音方向等来定位是否需要记录对应的信息,并且判断是否需要进行录音更换等。
所述声源定位技术其是基于TDE的算法核心在于对传播时延的准确估计,一般通过对麦克风间信号做互相关处理得到。进一步获得声源位置信息,可以通过简单的延时求和、几何计算或是直接利用互相关结果进行可控功率响应搜索等方法。这种类型的算法实现相对简单,运算量小,便于实时处理,因此在实际中运用最广。
基于广义互相关函数的时延估计算法引入了一个加权函数,对互功率谱密度进行调整,从而优化时延估计的性能。根据加权函数的不同,广义互相关函数有多种不同的变形,在本实施例中采用广义互相关-相位变换方法(Generalized Cross CorrelationPHAse Transformation,GCC-PHAT)。GCC-PHAT方法本身具有一定的抗噪声和抗混响能力,但是在信噪比降低和混响增强时,该算法性能急剧下降。
通过长时间实践发现麦克风对GCC-PHAT函数的最大值越大则该对麦克风的接收信号越可靠,也就是接收信号质量越高。广义互相关函数时延估计算法根据两个麦克风信号的互相关函数峰值来估计时延值。在声源定位***中,麦克风阵列的每个阵元接收到的目标信号都来自于同一个声源。因此,各通道信号之间具有较强的相关性。理想情况下,通过计算每两路信号之间的相关函数,就可以确定两个麦克风观测信号之间的时延。从而完成声源的定位。
SRP-PHAT(Steered Response Power-Phase Transform)基于相位变换加权的可控响应功率的声源定位算法。虽然基于麦克风阵列的声源定位方法很多,但是相位变换加权的可控响应功率SRP-PHAT声源定位算法在混响环境中有较强的鲁棒性,可实现真实环境中的声源定位,因此该算法也可以作为本实施例中的一种实施方式来进行实施。SRP-PHAT对麦克风的阵型没有特定要求,因此也适用于分布式阵列,因此当铺设为基于分布式阵列的定位***,其可以采用该算法。
SRP-PHAT算法的基本原理是在假想声源位置计算所有麦克风对接收信号的相位变换加权的广义互相关GCC-PHAT函数之和,在整个声源空间寻找使SRP值最大的点即为声源位置估计。SRP-PHAT对混响有较强的鲁棒性,但是在低信噪比SNR(Signal-to-NoiseRatio)环境中其定位性能较差。上述几种为具体的声源定位技术,但是其仅仅是其中三种,在具体的信息采集的时候,该声源定位技术不限于上述三种,用户可以根据实际情况来进行设计。
S3:判断所述声音信息所在位置是否存储在服务器中,如果是,则执行步骤S4;这一步主要是为了筛选出具备点菜权限的用户,当所有用户都在说话的时候,只选择其中的拥有点菜权限的从而完成对应的点餐。
当定位到声源的位置之后,就开始从后台获取拥有权限的用户。在声源位置没有改变之前,所识别的语音结果都会对应这个位置。因为本实施例是通过位置来判断是否记录该说话者的声音信息的,所以在最开始进行会议之前就要分配好对应的位置,比如在一个环形点餐桌前,有8个座位,其编号分别是1、2、3、4、5、6、7和8,并且规定只有1号的声音信息可以被录制并记录,而其他的号码的声音不可以,这个时候,在进行点餐的时候,一般发起这个饭局的用户来坐到1号位,然后开始进行点餐操作。或者在进行设置的时候,设定两个座位使得其拥有点餐权限,具体的设定方式在本实施例中不进行限定,餐厅可以根据自己的实际需求进行设定,针对不同的餐位进行不同的设定,所以在进行设计的时候可以开放这个设定,使得各个餐厅自身拥有权限去进行修改。
当有多个用户拥有点餐权限的时候,还会出现位置变化的问题,为了使得其拥有更高的自动化程度,本实施例还提供了这样的方式来进行实施。当获取到的声音信息所在位置改变时,则返回步骤S2以对声音信息进行重新定位;当语音的方向改变之后,要重新对语音的方向进行定位,回到步骤S2,重新获取声源位置和对应的人的信息。如果是原来讲话的人已经停止说话了,需要判断整个点餐是否结束了,如果没有结束,就等待之后讲话的人,接着步骤S3开始。如果点餐结束了,提示询问点餐是否结束,点餐结束了就停止录音,准备点餐确认。因为在整个点餐的过程中,声音的方位是不断的改变的,如果只能够记录单一用户的信息,那么会使得点餐很不完整;并且当人数比较多的时候,所有的信息都需要一个用户来进行确认的话,会加重该用户的任务,并且使得整个就餐过程不是特别的愉快。所以在整个点餐的过程中,除了能够识别到当前的声音,当声音的方位变换的时候,该***也可以根据实际的情况来重新的定位从而完成对声音信息的采集。
S4:提取声音信息中的菜品名称信息,并生成点餐指令。这一步主要是为了提取声音信息中包括的菜品名称信息,但是这个菜品名称信息的确认不单单是识别到其中拥有菜品名称信息之后就直接进行提取,而是需要进一步判断的;只有在确认点这个菜品的时候才提取并生成点餐指令。比如,当出现有“鱼香肉丝怎么样?”这样的信息的时候,肯定是不需要提取,只有出现陈述句的时候才提取,“我要鱼香肉丝。”所以在这个过程中还需要对获取到的声音信息进行语义识别,只有再确认该语句是进行点餐的时候,才进行点餐操作。
S5:当接收到点餐结束指令时,通过扬声器读取获取到的所有的菜品名称信息。为了使得整个点餐过程中的服务信息能够更为的准确,在接收到点餐结束指令的时候,通过扬声器来进行读取所获得的所有的菜品的名称。因为点餐与会议不同,会议结束的时候,其会有停顿的发生,而点餐这个过程却不同,点餐结束后不会有停顿,朋友之间还会进行交谈,所以需要采用直接的方式对该***进行关闭,以防止点到不必要的菜品。在进行关闭的时候,也是可有物理关闭方式和软件关闭方式,物理关闭方式是直接点击电源开关;而软件关闭方式是通过说“点餐结束”这样的词语来进行关闭的;在本实施例中优选的采用软件关闭的方式。当接收到这样的指令之后,会发送完成的点餐目录给当前的用户确认是否是所有的这些菜品。
S6:接收当前用户发出的信息确认指令;用户听完所有的菜品之后,如果准确无误,则直接回复不需要修改或者是点餐没有错误这样的信息给到***去进行进一步确认。而当出现有修改的时候,比如用户中间有一个菜品突然不想要或者是用户没有点,则其说出“不要鱼香肉丝”这样的话语指令给到***去进行进一步判断。
S7:根据信息确认指令以判断是否需要修改对应的点餐指令,如果是,则修改对应的点餐指令;***在接收到这样的指令之后,需要进一步分析这句话中包含的内容信息,比如“不要鱼香肉丝”通过语义分析是确认将菜单目录中的鱼香肉丝这个条目给删除,而当出现“增加茄子煲”这样的话语的时候,通过语义分析确认是需要通过增加菜品来实现的,这时候则在菜单目录中增加对应的菜品信息。
S8:将最终的点餐指令发送至服务器端以完成点餐。最终的点餐指令指的是经过用户确认的所有的菜品信息,当获取到这样的最终的菜品信息的时候,只需要将这些信息发送至后台服务器去确认即可,这时候后台服务器发送至后厨去进行备餐。这样就可以实现整个点餐操作。由于点餐操作已经完成,所以这时候需要控制关闭声音采集设备或者使得声音采集设备处于休眠状态,从而使得该***不能够接收点菜指令去进行点餐,以防止用户误点。
当在就餐过程中,该餐桌的用户需要加菜的时候,这时候还是对应的拥有点餐权限的用户去对该声音采集设备进行唤醒。这时候的唤醒词最好与开始的时候唤醒词不一样,可以将其设定为“需要加菜”。这样有利于一个完成的就餐过程中的判断,使得在进行结算的时候能够更方便。
实施例二
实施例二公开了一种电子设备,该电子设备包括处理器、存储器以及程序,其中处理器和存储器均可采用一个或多个,程序被存储在存储器中,并且被配置成由处理器执行,处理器执行该程序时,实现实施例一的一种基于位置的点餐控制方法。该电子设备可以是手机、电脑、平板电脑等等一系列的电子设备。
实施例三
实施例三公开了一种计算机可读存储介质,该存储介质用于存储程序,并且该程序被处理器执行时,实现实施例一的一种基于位置的点餐控制方法。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述基于内容更新通知装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims (10)

1.一种基于位置的点餐控制方法,其特征在于,包括以下步骤:
获取步骤:通过声音采集设备获取当前用户的声音信息;
定位步骤:采用声源定位技术以定位声音信息所在位置;
第一判断步骤:判断所述声音信息所在位置是否存储在服务器中,如果是,则执行信息提取步骤;
信息提取步骤:提取声音信息中的菜品名称信息,并生成点餐指令。
2.如权利要求1所述的一种基于位置的点餐控制方法,其特征在于,在信息提取步骤之后还包括信息读取步骤:当接收到点餐结束指令时,通过扬声器读取获取到的所有的菜品名称信息。
3.如权利要求2所述的一种基于位置的点餐控制方法,其特征在于,在信息读取步骤之后还包括以下步骤:
接收步骤:接收当前用户发出的信息确认指令;
第二判断步骤:根据信息确认指令以判断是否需要修改对应的点餐指令,如果是,则修改对应的点餐指令;
点餐步骤:将最终的点餐指令发送至服务器端以完成点餐。
4.如权利要求3所述的一种基于位置的点餐控制方法,其特征在于,在点餐步骤之后还包括设备关闭步骤:控制关闭声音采集设备或者使得声音采集设备处于休眠状态。
5.如权利要求1所述的一种基于位置的点餐控制方法,其特征在于,在第一判断步骤之后还包括位置变换步骤:当获取到的声音信息所在位置改变时,则返回定位步骤以对声音信息进行重新定位。
6.如权利要求1-5中任意一项所述的一种基于位置的点餐控制方法,其特征在于,在获取步骤之前还包括唤醒步骤:当接收到预设唤醒词时,启动声音采集设备。
7.如权利要求6所述的一种基于位置的点餐控制方法,其特征在于,所述唤醒步骤具体为:当接收到的预设唤醒词时,判断与预设唤醒词对应的声纹信息是否存储在服务器中,如果是,则启动声音采集设备。
8.如权利要求1-5中任意一项所述的一种基于位置的点餐控制方法,其特征在于,所述定位步骤中,所述声源定位技术为基于时延估计的算法或者基于高分辨率谱估计的算法或者基于稀疏表示的算法,且所述定位步骤具体为:当采用声源定位技术定位声音所在位置后,关闭除了与声音信息所在位置最近的麦克风外的其余麦克风,且所述获取步骤中具体为:通过环形麦克风阵列获取当前用户的声音信息。
9.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任意一项所述的一种基于位置的点餐控制方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-8任意一项所述的一种基于位置的点餐控制方法。
CN201910072430.7A 2019-01-25 2019-01-25 一种基于位置的点餐控制方法、电子设备及存储介质 Pending CN109979447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910072430.7A CN109979447A (zh) 2019-01-25 2019-01-25 一种基于位置的点餐控制方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910072430.7A CN109979447A (zh) 2019-01-25 2019-01-25 一种基于位置的点餐控制方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN109979447A true CN109979447A (zh) 2019-07-05

Family

ID=67076701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910072430.7A Pending CN109979447A (zh) 2019-01-25 2019-01-25 一种基于位置的点餐控制方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109979447A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110673096A (zh) * 2019-09-30 2020-01-10 北京地平线机器人技术研发有限公司 语音定位方法和装置、计算机可读存储介质、电子设备
CN111331590A (zh) * 2020-04-02 2020-06-26 上海国民集团健康科技有限公司 一种机器人头部拟人化转动机构及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010098546A2 (ko) * 2009-02-27 2010-09-02 고려대학교 산학협력단 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치
CN103632317A (zh) * 2013-11-14 2014-03-12 成都博约创信科技有限责任公司 一种自助式点餐及结算的方法
CN105070304A (zh) * 2015-08-11 2015-11-18 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
CN105931145A (zh) * 2016-05-06 2016-09-07 乐视控股(北京)有限公司 一种智能点餐方法及装置
CN106356067A (zh) * 2016-08-25 2017-01-25 乐视控股(北京)有限公司 录音方法、装置及终端
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN106981032A (zh) * 2017-03-31 2017-07-25 旗瀚科技有限公司 一种餐饮机器人智能点餐***及方法
CN107103564A (zh) * 2017-05-15 2017-08-29 河北建筑工程学院 自助点餐方法及终端设备
CN108831451A (zh) * 2018-03-30 2018-11-16 广东思派康电子科技有限公司 一种计算机可读存储介质及应用该介质的语音识别音箱
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010098546A2 (ko) * 2009-02-27 2010-09-02 고려대학교 산학협력단 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치
CN103632317A (zh) * 2013-11-14 2014-03-12 成都博约创信科技有限责任公司 一种自助式点餐及结算的方法
CN105070304A (zh) * 2015-08-11 2015-11-18 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
CN105931145A (zh) * 2016-05-06 2016-09-07 乐视控股(北京)有限公司 一种智能点餐方法及装置
CN106356067A (zh) * 2016-08-25 2017-01-25 乐视控股(北京)有限公司 录音方法、装置及终端
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN106981032A (zh) * 2017-03-31 2017-07-25 旗瀚科技有限公司 一种餐饮机器人智能点餐***及方法
CN107103564A (zh) * 2017-05-15 2017-08-29 河北建筑工程学院 自助点餐方法及终端设备
CN108831451A (zh) * 2018-03-30 2018-11-16 广东思派康电子科技有限公司 一种计算机可读存储介质及应用该介质的语音识别音箱
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110673096A (zh) * 2019-09-30 2020-01-10 北京地平线机器人技术研发有限公司 语音定位方法和装置、计算机可读存储介质、电子设备
CN110673096B (zh) * 2019-09-30 2022-02-01 北京地平线机器人技术研发有限公司 语音定位方法和装置、计算机可读存储介质、电子设备
CN111331590A (zh) * 2020-04-02 2020-06-26 上海国民集团健康科技有限公司 一种机器人头部拟人化转动机构及方法

Similar Documents

Publication Publication Date Title
US11798547B2 (en) Voice activated device for use with a voice-based digital assistant
JP7177235B2 (ja) デジタルアシスタントのためのボイストリガ
CN110214351B (zh) 记录的媒体热词触发抑制
CN108228699B (zh) 协作性语音控制装置
KR101726945B1 (ko) 수동 시작/종료 포인팅 및 트리거 구문들에 대한 필요성의 저감
Xu et al. Crowd++ unsupervised speaker count with smartphones
US10410630B2 (en) System and method for speech-enabled personalized operation of devices and services in multiple operating environments
KR20220024557A (ko) 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록
CN109189980A (zh) 与用户进行语音交互的方法和电子设备
CN104202469B (zh) 管理通话连接的方法、装置和终端
US20210241768A1 (en) Portable audio device with voice capabilities
CN109817225A (zh) 一种基于位置的会议自动记录方法、电子设备及存储介质
CN105744090A (zh) 语音信息处理方法及装置
CN109785835A (zh) 一种通过移动终端实现声音录制的方法及装置
CN109887508A (zh) 一种基于声纹的会议自动记录方法、电子设备及存储介质
CN108449507A (zh) 语音通话数据处理方法、装置、存储介质及移动终端
WO2021086528A1 (en) Ai-driven personal assistant with adaptive response generation
CN109887509A (zh) 一种基于声纹的点餐控制方法、电子设备及存储介质
US11909786B2 (en) Systems and methods for improved group communication sessions
CN108449496A (zh) 语音通话数据检测方法、装置、存储介质及移动终端
CN108418968A (zh) 语音通话数据处理方法、装置、存储介质及移动终端
CN109979447A (zh) 一种基于位置的点餐控制方法、电子设备及存储介质
CN109934731A (zh) 一种基于图像识别的点餐方法、电子设备及存储介质
US11381675B2 (en) Command based interactive system and a method thereof
US20230282224A1 (en) Systems and methods for improved group communication sessions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705