CN113936654A - 一种控制方法、送餐机器人及计算机可读存储介质 - Google Patents

一种控制方法、送餐机器人及计算机可读存储介质 Download PDF

Info

Publication number
CN113936654A
CN113936654A CN202111091597.1A CN202111091597A CN113936654A CN 113936654 A CN113936654 A CN 113936654A CN 202111091597 A CN202111091597 A CN 202111091597A CN 113936654 A CN113936654 A CN 113936654A
Authority
CN
China
Prior art keywords
food
food delivery
target point
robot
meal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111091597.1A
Other languages
English (en)
Inventor
方林
万永辉
张飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Keenlon Intelligent Technology Co Ltd
Original Assignee
Shanghai Keenlon Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Keenlon Intelligent Technology Co Ltd filed Critical Shanghai Keenlon Intelligent Technology Co Ltd
Priority to CN202111091597.1A priority Critical patent/CN113936654A/zh
Publication of CN113936654A publication Critical patent/CN113936654A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/008Manipulators for service tasks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • Manipulator (AREA)

Abstract

本发明提供了一种送餐机器人的控制方法,送餐机器人包括语音控制***和多个食品容置层,控制方法包括:接收操作人员发出的送餐指令;通过语音控制***对送餐指令进行语音识别,以确定送餐指令的内容,送餐指令的内容至少包括目标点位;当送餐指令涵盖了多个食品容置层中的每个食品容置层时,控制送餐机器人执行送餐指令。本发明的实施例通过语音对送餐机器人执行送餐过程进行控制,操作人员无需手动输入送餐目标点位,操作过程简单,并且避免了直接接触,提高工作效率的同时减少卫生安全隐患。本发明还提供了一种送餐机器人和计算机可读存储介质,用于配合前述送餐机器人的控制方法。

Description

一种控制方法、送餐机器人及计算机可读存储介质
技术领域
本发明大致涉及智能设备技术领域,尤其是一种控制方法、送餐机器人及计算机可读存储介质。
背景技术
送餐机器人是一种代替人工送餐服务的智能设备,在带给顾客新奇体验的同时,还能够降低人工劳动强度,提高工作效率,已经被越来越多地应用在食堂、餐厅等场所。但现有的送餐机器人主要通过操作人员手动输入送餐目的地来控制送餐机器人执行送餐动作,如果餐厅规模较大,对送餐目的地进行了分区,会导致手动输入的操作过程繁琐,影响送餐效率。同时,送餐机器人主要在餐厅和厨房送餐口之间活动,而手动输入送餐目的地的方式通常通过人机交互界面完成,这一过程还可能存在卫生安全隐患。而且,发明人发现市场上常见的送餐机器人并非手动输入送餐目的地后立即执行送餐动作,而是会设置类似于“立即出发”之类的按键,操作更为繁琐。
背景技术部分的内容仅仅是发明人所知晓的技术,并不当然代表本领域的现有技术。
发明内容
针对现有技术中的一个或多个缺陷,本发明提供了一种控制方法的实施方式,实现对送餐机器人的语音控制,并提供了送餐机器人同时配送多件食品时的控制方法,提高工作效率,避免操作人员与送餐机器人直接接触;同时本发明还提供了送餐机器人以及计算机可读存储介质的实施例,用以配合实现上述的控制方法。
为解决上述技术问题,本发明采用如下的技术方案:
一种送餐机器人的控制方法,所述送餐机器人包括语音控制***和多个食品容置层,所述控制方法包括:
接收操作人员发出的送餐指令;
通过所述语音控制***对所述送餐指令进行语音识别,以确定所述送餐指令的内容,所述送餐指令的内容至少包括目标点位;
当所述送餐指令涵盖了所述多个食品容置层中的每个食品容置层时,控制所述送餐机器人执行所述送餐指令。
根据本发明的一个方面,其中所述确定送餐指令的内容的步骤包括:确定所述送餐指令包含的目标点位的数量;
其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤包括:当所述目标点位的数量与所述食品容置层的数量相等时,控制所述送餐机器人执行所述送餐指令。
根据本发明的一个方面,其中所述确定送餐指令的内容的步骤包括:确定所述送餐指令包含的目标点位的数量,
其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤包括:当所述目标点位的数量少于所述食品容置层的数量、同时至少其中两个食品容置层对应于同一个目标点位时,控制所述送餐机器人执行所述送餐指令。
根据本发明的一个方面,其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤还包括:当所述目标点位的数量与所述食品容置层的数量相等时,将所述目标点位与所述食品容置层按照预设对应关系一一对应,并控制所述送餐机器人执行所述送餐指令。
根据本发明的一个方面,其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时,控制送餐机器人执行送餐指令的步骤还包括:控制所述送餐机器人播放第一预设音频,所述第一预设音频至少包括所述送餐机器人的当前任务数;同时监控所述第一预设音频播放完毕后,控制所述送餐机器人执行所述送餐任务。
根据本发明的一个方面,还包括:当确定所述送餐指令仅包括一个目标点位时,控制所述送餐机器人播放第二预设音频,监控所述第二预设音频播放完毕后,控制所述送餐机器人执行所述送餐任务,其中所述第二预设音频至少指示所述送餐机器人接收到送餐任务。
根据本发明的一个方面,其中所述语音控制***包括语音采集单元、音频处理单元和后台控制单元,其中所述接收操作人员发出的送餐指令的步骤通过所述语音采集单元执行,所述通过语音控制***对送餐指令进行语音识别以确定送餐指令的内容的步骤还包括:
通过所述音频处理单元对所述语音采集单元获取的送餐指令进行数字化处理,获取数字信号;
通过所述音频处理单元基于所述数字信号进行语音识别,获得所述送餐指令对应的文本信息;和
通过所述后台控制单元根据所述文本信息获得目标点位信息。
根据本发明的一个方面,还包括:当所述目标点位的数量大于所述食品容置层的数量时,忽略超出所述食品容置层数量的目标点位。
根据本发明的一个方面,其中所述通过后台控制单元根据文本信息获得目标点位信息的步骤包括:
从所述文本信息中识别出送餐意图关键字;和
根据所述送餐意图关键字,获得所述目标点位信息。
根据本发明的一个方面,提供一种送餐机器人,包括:
主体,所述主体上设置有多个食品容置层;
驱动***,所述驱动***设置在所述主体上,并可受控以驱动所述送餐机器人移动;
语音控制***,所述语音控制***设置在所述主体上,并且配置成可执行如前所述的控制方法。
在本发明的送餐机器人的一个实施例中,还包括图形用户界面,所述图形用户界面与所述语音控制***通讯,所述语音控制***配置成可控制所述图形用户界面渲染并显示所述目标点位。
根据本发明的一个方面,提供一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如前所述的控制方法。
与现有技术相比,本发明的实施例提供了一种送餐机器人的控制方法,通过语音对送餐机器人执行送餐过程进行控制,操作人员无需手动输入送餐目标点位,操作过程简单,并且避免了直接接触,提高工作效率的同时减少卫生安全隐患。本发明还提供了一种送餐机器人和计算机可读存储介质,用于配合前述送餐机器人的控制方法。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的一个实施例中送餐机器人的结构示意图;
图2是本发明其中一个实施例的流程示意图;
图3是本发明其中一个实施例执行送餐指令的完整流程示意图;
图4是本发明其中一个实施例中送餐指令识别的流程示意图;
图5是本发明其中一个实施例中送餐命令识别过程的示意图;
图6是本发明提供的一种送餐机器人的***示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
在本发明的描述中,需要理解的是,术语"中心"、"纵向"、"横向"、"长度"、"宽度"、"厚度"、"上"、"下"、"前"、"后"、"左"、"右"、"竖直"、"水平"、"顶"、"底"、"内"、"外"、"顺时针"、"逆时针"等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语"第一"、"第二"仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有"第一"、"第二"的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,"多个"的含义是两个或两个以上,除非另有明确具体的限定。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语"安装"、"相连"、"连接"应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接:可以是机械连接,也可以是电连接或可以相互通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之"上"或之"下"可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征"之上"、"上方"和"上面"包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征"之下"、"下方"和"下面"包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度小于第二特征。
下文的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本发明提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
以下结合附图对本发明的实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
图1示出了根据本发明的一个实施例的送餐机器人10,图2示出了根据本发明一个实施例的送餐机器人的控制方法100,下面参考附图详细描述。
如图1所示,送餐机器人10包括主体14、驱动***15和语音控制***11。其中所述主体14上设置有多个食品容置层12(图1中示意性示出了具有两个食品容置层12),可用于盛放等待配送的食品。驱动***15设置在所述主体14上,并可受控以驱动所述送餐机器人移动,使送餐机器人能够完成出餐口与目标点位之间的移动。驱动***例如包括车轮、履带、电机、变速器等机构。语音控制***11设置在所述主体14上,用于接收操作人员发出的送餐指令,并对送餐指令进行识别,获取目标点位,控制所述送餐机器人执行所述送餐指令。
如图2所示,提供了一种送餐机器人的控制方法100,可用于图1所示的送餐机器人10。控制方法100包括以下步骤:
在步骤S101中:接收操作人员发出的送餐指令,例如在餐厅的出餐口,食品制作完成之后需要配送,操作人员将食品放置在如图1所述的送餐机器人的食品容置层12内,并发出送餐指令,送餐机器人10通过语音控制***11来接收操作人员的送餐指令。
在步骤S102中:通过所述语音控制***11对所述送餐指令进行语音识别,以确定所述送餐指令的内容,所述送餐指令的内容至少包括目标点位,即需要将食品送到的位置。语音指令例如“送到某某位置”或“送到某某桌”,这里所说的某某位置和某某桌可以是餐厅预先设定好的定位点对应的编码或预先设定好的桌位号。
在步骤S103中:判断所述送餐指令是否涵盖了所述多个食品容置层12中的每个食品容置层12。如果在步骤S103中判断的结果为“是”,则进行到步骤S104,控制所述送餐机器人执行所述送餐指令,例如沿预先设定好的路线,将食品配送到顾客面前。
根据本发明的一个实施例,只有当送餐指令涵盖了每个食品容置层12时,才控制送餐机器人出发去执行送餐任务。本发明中,“送餐指令涵盖了每个食品容置层12”是指每个食品容置层都直接或者间接地被所述送餐指令所包括在内,而没有遗漏。
根据本发明的不同实施例,“所述送餐指令涵盖了所述多个食品容置层12中的每个食品容置层12”可以包括不同的情形,下面针对不同的情形分别举例说明。
根据本发明的一个实施例,所述步骤S102中还包括:确定所述送餐指令包含的目标点位的数量,例如是3个目标点位。送餐指令涵盖了多个食品容置层12中的每个食品容置层12的一种情况是:当所述目标点位的数量与所述食品容置层12的数量相等时,即认为满足了步骤S103的判断条件,进而控制所述送餐机器人执行所述送餐指令。例如送餐机器人的食品容置层12共有3层(数目是已知的)。根据一个实施例,操作人员发出的送餐指令为“送餐到第一桌、第三桌、第五桌”,在步骤S102经过语音识别后,识别出其中共有3个送餐点位(分别为第一桌、第三桌、第五桌),那么此时识别出的3个目标点位与3层食品容置层12就是一一对应的,也就是送餐指令中的3个目标点位涵盖了每个食品容置层12,那么控制所述送餐机器人执行所述送餐指令,分别将菜品或食品根据规划好的路线配送到第一桌、第三桌、第五桌。
另一种情况是:当所述目标点位的数量少于所述食品容置层12的数量、同时至少其中两个食品容置层12对应于同一个目标点位时,仍然可能满足所述步骤S103的判断条件,可以控制所述送餐机器人执行所述送餐指令。在本实施例中送餐机器人的食品容置层12共有3层,操作人员发出的送餐指令为“将第一层送餐到第一桌、第二层和第三层送到第三桌”,在步骤S102经过语音识别后,识别出其中共有两个送餐点位(分别为第一桌和第三桌),但其中第三桌涵盖了两个食品容置层,那么此时识别出的送餐指令就涵盖了每个食品容置层12,此时同样符合执行送餐指令的情形,那么控制所述送餐机器人执行所述送餐指令,分别将菜品或食品根据规划好的路线配送到第一桌和第三桌。
在另一种情况中,餐机器人的食品容置层12共有3层,操作人员发出的送餐指令为“将第一层送餐到第一桌、第二层送餐到第三桌”,在步骤S102经过语音识别后,识别出其中共有两个送餐点位(分别为第一桌和第三桌),每个送餐点位对应于其中一层食品容置层,那么此时识别出的送餐指令就没有涵盖每个食品容置层12,因此不符合执行送餐指令的情形,无法控制所述送餐机器人执行所述送餐指令。
图3示出了根据本发明的一个实施例的送餐机器人的控制方法200,所述控制方法还可以包括唤醒所述送餐机器人的过程,下面参考图3详细描述。
在步骤S201,送餐机器人启动,控制方法200开始。在接收操作人员发出的送餐指令之前,可以将送餐机器人设定为休眠状态。在步骤S202,唤醒送餐机器人,例如可通过预设语音或预设行为唤醒,例如操作人员通过发出“你好,花生”的语音指令,或者通过启动按键开关,来唤醒送餐机器人。
送餐机器人唤醒之后,将持续监控是否接收到操作人员的送餐指令,如步骤S203所示,如果在唤醒后的预设时间内(例如5秒钟内)接收到操作人员发送出的送餐指令,则正常执行后续步骤,进行到步骤S204;如果并未在预设时间内接收到送餐指令,则自动结束,此时认为并没有送餐任务,可能是误触或错误操作,送餐机器人可重新回到休眠状态,以节省电力。
在步骤S204,送餐机器人的语音控制***对接收到的送餐指令进行语音识别,输出识别的文本。可以通过现有的语音识别方法或算法来进行语音识别。下文将描述根据本发明一个实施例的语音识别方法。在步骤S204之后,根据语音识别的结果分别进行到步骤S205或步骤S209。其中在步骤S205,从步骤S204输出的文本中解析识别出多个送餐任务,例如分别对应于目标点位Y1、Y2和Y3,然后在步骤S206确定目标点位与各个食品容置层12对应关系。例如当所述目标点位的数量与所述食品容置层12的数量相等时,将所述目标点位与所述食品容置层12按照预设对应关系一一对应。例如用于实现本实施例的送餐机器人共有3个食品容置层12,分别设为X1、X2和X3,所述语音控制***11共识别出目标点位的数量同样为3个,设为Y1、Y2和Y3,这里所述的预设对应关系可以是X1-Y1,X2-Y2,X3-Y3的顺序对应关系,也可以是X1-Y3,X2-Y2,X3-Y1的倒序对应关系,还可以是类似于X1-Y2,X2-Y3,X3-Y1的无固定联系的对应关系,本实施例中提出的预设对应关系不限于顺序或倒序,仅需提前设定好相应的对应关系,即可实现识别出的目标点位与食品容置层12一一对应,获得每一个食品容置层12对应的目标点位。
在步骤S206确认了对应关系之后,根据本发明的一个实施例,进行到步骤S207和S208。其中在S207,在送餐机器人的用户接口上渲染并显示目标点位。所述送餐机器人通常可包括带有图形用户界面13的用户接口,其上可显示送餐机器人10当前送餐的目标点位。根据本发明的一个实施例,当所述送餐指令涵盖了所述多个食品容置层12中的每个食品容置层12时,在所述图形用户界面13上渲染并显示所述目标点位。通过图形用户界面13显示食品容置层12与目标点位的对应关系,操作人员能够清楚地观察到送餐指令中的信息以及对应关系,方便操作人员核验目标点位识别是否正确,目标点位与食品容置层12的对应关系是否正确,进一步提高送餐准确性,避免发生配送错误或送餐信息遗漏的情况。
在步骤S208,控制所述送餐机器人播放第一预设音频,所述第一预设音频至少包括所述送餐机器人的当前任务数。本实施例中的控制方法在控制送餐机器人执行送餐指令前增加了播放第一预设音频的过程,其中第一预设音频至少包括所述送餐机器人的当前任务数,还可以包括语音控制***11识别出的目标点位信息以及与目标点位相对应的食品容置层12的信息,通过播放语音的方式表明即将执行的送餐指令,同时将即将执行的送餐指令反馈给操作人员,方便操作人员再次核对送餐指令是否准确。为保证接受到的送餐命令准确无误,第一预设音频完整播放,本实施例中的控制方法还同时监控所述第一预设音频播放(步骤S212),等待第一预设音频播放完毕后(步骤S213),控制所述送餐机器人执行所述送餐任务(步骤S214),如果监控到所述第一预设音频未播放完毕,则继续等待,直到其第一预设音频播放完毕。进一步的,在播放完成第一预设音频后,还可以增加是否确认的语音识别过程,在接收到操作人员发出的确认命令,例如“确认”的指令,然后进入到执行所述送餐指令的步骤。
如图3所示,根据本发明的一个实施例,所述控制方法还包括:当送餐指令中仅包括单一任务时,执行步骤S205,从语音识别的文本中解析出具体的单一任务,例如对应于目标点位Y。然后进行到步骤S207和S210,在送餐机器人的图形用户界面上渲染并显示目标点位。在步骤S210,控制所述送餐机器人播放第二预设音频,监控所述第二预设音频的播放(步骤S211),直到第二预设音频播放完毕后(S212),控制所述送餐机器人执行所述送餐任务(步骤S213),其中所述第二预设音频至少指示所述送餐机器人接收到送餐任务。作为本发明提供的实施例的一种极端情况,所述目标点位仅为一个,例如目标点位为Y,这种情况包括食品容置层12仅有一层,也包括多个食品容置层12的情形,例如3个食品容置层12均对应目标点位Y,尽管在一种特殊情况下只有一个目标点位,但依然符合步骤S103中的条件“所述送餐指令涵盖了所述多个食品容置层12中的每个食品容置层12”,可以控制送餐机器人执行送餐命令。相应的,本实施例也可以增加在图形用户界面13上渲染并显示目标点位的过程,同样用于显示送餐指令以及对应关系,确保送餐指令的识别正确无误。
根据本发明的一个实施例,如图6所示,其中所述语音控制***11包括语音采集单元101、音频处理单元102和后台控制单元103,具体的,其中语音采集单元101可以是传声器。其中所述步骤S101通过所述语音采集单元101执行。如图4所示,所述步骤S102还包括:
S1021:通过所述音频处理单元102对所述语音采集单元101获取的送餐指令进行数字化处理,获取数字信号;
S1022:通过所述音频处理单元102基于所述数字信号进行语音识别,获得所述送餐指令对应的文本信息;和
S1023:通过所述后台控制单元103根据所述文本信息获得目标点位信息。
图5示出了根据本发明一个实施例的语音识别的方法,其可以由音频处理单元102执行。如图5所示,音频处理单元102在进行语音识别前可以对语音采集单元101获取的送餐指令进行初步处理,处理手段包括杂音过滤、回音消除、超波优化和低波增强等,以获取更为准确的送餐指令,然后进行步骤S1021。
根据本发明的一个实施例,其中所述步骤S1023还包括:
从所述文本信息中识别出送餐意图关键字;和
根据所述送餐意图关键字,获得所述目标点位信息。
具体的,送餐指令的识别可以按照如图5所示的过程进行。语音采集单元101用于获取操作人员发出的送餐指令,经由音频处理单元102的数字化处理后,送餐指令的数字信号被拆分成小段波形,并进行编码。所述音频处理单元102对小段波形进行特征提取,并在声学模型数据库中进行匹配,获得对应的单个单词或汉字,进一步的,对单词或汉字进行校准,将所述单个单词或汉字在语音模型库中进行匹配,获得单词或汉字的语音模型,通过音频处理单元102对语音模型进行语言规范化和矫正,获取单词或汉字的语音识别文本信息。通过后台控制单元103对语音识别文本信息进行分词、去停用词等处理,将分词结果与预设的送餐意图关键字进行匹配,其中送餐意图关键字可以包括例如“送到”、“送餐到”、“送去”等,对后续的,包含目标点位的信息进行识别,最后通过诸如同音纠正、正则匹配、预设送餐点位匹配过滤出所述送餐指令中的目标点位。
根据本发明的一个实施例,所述控制方法还包括:当所述目标点位的数量大于所述食品容置层12的数量时,忽略超出所述食品容置层12数量的目标点位。此处提出了所述控制方法中的一种特殊情况,识别到的目标点位数量大于食品容置层12的数量,例如本实施例中送餐机器人共有3个食品容置层12,单接收到的送餐指令中包含有4个可识别的目标点位,此时超出食品容置层12数量的目标点位认为是无效点位,予以忽略并不执行,后续新增加的目标点位均视为无效。至于符合操作人员真实意图的对应关系,可以在图形用户界面13或预设语音播报中进行验证。
根据本发明的一个实施例,如下表所示,预设了在语音识别过程中可能出现的异常情况,并针对各种不同的异常情况,设置可供直接调用的处理方式,处理方式包括后台处理单元103的处理逻辑,还包括播放针对异常情况的预设语音,对用户进行提醒。
Figure BDA0003267705910000121
Figure BDA0003267705910000131
在本实施例中,提供了上表中列出的异常情况以及异常情况对应的处理方式,其中后端指语音控制***11的后台控制单元103,当发生上述异常情况时,后台控制单元103调用与异常情相对应的处理方式,直接控制送餐机器人10按照预设的处理方式播放语音并执行相应的动作。其中当用户发出的语音无法识别时,例如语音模糊或语音采集不全,此时播放用于提示用户异常情况的预设语音,进一步的,还可以播放能够被识别的语音范例。当用户发出的送餐指令中包含不属于预设目标点位,即在词典库中无对应时,控制送餐机器人播放用于提示用户目标点位错误的预设语音,对于无法获取完整送餐信息的语音不进行记录。
当接收到多个对应相同食品容置层编号的送餐指令时,更新任务列表,将该食品容置层编号对应的目标点位替换为最新接收到送餐指令中的目标点位,覆盖原有任务,不进行预设语音提示。
本发明还提供了一种送餐机器人的实施例,如图1所示,所述送餐机器人包括:
主体14,所述主体14上设置有多个食品容置层12,其中盛放有等待配送的食品;
驱动***15,所述驱动***15设置在所述主体14上,并可受控以驱动所述送餐机器人移动,使送餐机器人能够完成出餐口与目标点位之间的移动;
语音控制***11,所述语音控制***11设置在所述主体14上,并且配置成可执行如前所述的控制方法,接收操作人员发出的送餐指令,并对送餐指令进行识别,获取目标点位,控制所述送餐机器人执行所述送餐指令。
根据本发明的一个实施例,所述送餐机器人还包括图形用户界面13,图形用户界面13可以固定设置在主体14上,图形用户界面13与所述语音控制***11通讯,所述语音控制***11配置成可控制所述图形用户界面13渲染并显示所述目标点位。图形用户界面13能够显示目标点位与食品容置层12之间的对应关系,用于操作人员对送餐指令的识别进行核验。
本发明还提供了一种计算机可读存储介质的实施例,所述计算机可读存储介质包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如前所述的控制方法。
最后应说明的是:以上所述仅为本发明的实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种送餐机器人的控制方法,所述送餐机器人包括语音控制***和多个食品容置层,所述控制方法包括:
接收操作人员发出的送餐指令;
通过所述语音控制***对所述送餐指令进行语音识别,以确定所述送餐指令的内容,所述送餐指令的内容至少包括目标点位;
当所述送餐指令涵盖了所述多个食品容置层中的每个食品容置层时,控制所述送餐机器人执行所述送餐指令。
2.根据权利要求1所述的控制方法,其中所述确定送餐指令的内容的步骤包括:确定所述送餐指令包含的目标点位的数量,
其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤包括:当所述目标点位的数量与所述食品容置层的数量相等时,控制所述送餐机器人执行所述送餐指令。
3.根据权利要求1所述的控制方法,其中所述确定送餐指令的内容的步骤包括:确定所述送餐指令包含的目标点位的数量,
其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤包括:当所述目标点位的数量少于所述食品容置层的数量、同时至少其中两个食品容置层对应于同一个目标点位时,控制所述送餐机器人执行所述送餐指令。
4.根据权利要求2所述的控制方法,其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤还包括:当所述目标点位的数量与所述食品容置层的数量相等时,将所述目标点位与所述食品容置层按照预设对应关系一一对应,并控制所述送餐机器人执行所述送餐指令。
5.根据权利要求1-4中任一项所述的控制方法,其中所述当送餐指令涵盖了多个食品容置层中的每个食品容置层时控制送餐机器人执行送餐指令的步骤还包括:控制所述送餐机器人播放第一预设音频,所述第一预设音频至少包括所述送餐机器人的当前任务数;同时监控所述第一预设音频播放完毕后,控制所述送餐机器人执行所述送餐任务。
6.根据权利要求4所述的控制方法,还包括:当确定所述送餐指令仅包括一个目标点位时,控制所述送餐机器人播放第二预设音频,监控所述第二预设音频播放完毕后,控制所述送餐机器人执行所述送餐任务,其中所述第二预设音频至少指示所述送餐机器人接收到送餐任务。
7.根据权利要求1-4中任一项所述的控制方法,其中所述语音控制***包括语音采集单元、音频处理单元和后台控制单元,其中所述接收操作人员发出的送餐指令的步骤通过所述语音采集单元执行,所述通过语音控制***对送餐指令进行语音识别以确定所述送餐指令的内容的步骤还包括:
通过所述音频处理单元对所述语音采集单元获取的送餐指令进行数字化处理,获取数字信号;
通过所述音频处理单元基于所述数字信号进行语音识别,获得所述送餐指令对应的文本信息;和
通过所述后台控制单元根据所述文本信息获得目标点位信息。
8.根据权利要求1-4中任一项所述的控制方法,还包括:当所述目标点位的数量大于所述食品容置层的数量时,忽略超出所述食品容置层数量的目标点位。
9.根据权利要求7所述的控制方法,其中所述通过后台控制单元根据所述文本信息获得目标点位信息的步骤包括:
从所述文本信息中识别出送餐意图关键字;和
根据所述送餐意图关键字,获得所述目标点位信息。
10.一种送餐机器人,包括:
主体,所述主体上设置有多个食品容置层;
驱动***,所述驱动***设置在所述主体上,并可受控以驱动所述送餐机器人移动;
语音控制***,所述语音控制***设置在所述主体上,并且配置成可执行如权利要求1-9中任一项所述的控制方法。
11.根据权利要求10所述的送餐机器人,还包括图形用户界面,所述图形用户界面与所述语音控制***通讯,所述语音控制***配置成可控制所述图形用户界面渲染并显示所述目标点位。
12.一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如权利要求1-9中任一项所述的控制方法。
CN202111091597.1A 2021-09-17 2021-09-17 一种控制方法、送餐机器人及计算机可读存储介质 Pending CN113936654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111091597.1A CN113936654A (zh) 2021-09-17 2021-09-17 一种控制方法、送餐机器人及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111091597.1A CN113936654A (zh) 2021-09-17 2021-09-17 一种控制方法、送餐机器人及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113936654A true CN113936654A (zh) 2022-01-14

Family

ID=79276042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111091597.1A Pending CN113936654A (zh) 2021-09-17 2021-09-17 一种控制方法、送餐机器人及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113936654A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107645566A (zh) * 2017-11-03 2018-01-30 广东工业大学 一种基于云平台的送餐机器人语音交互方法及***
CN109366507A (zh) * 2018-12-26 2019-02-22 南京英维尔科技服务有限公司 一种送餐机器人
CN109886839A (zh) * 2019-01-11 2019-06-14 杭州火小二科技有限公司 一种智能送餐***和方法
CN111390924A (zh) * 2020-04-03 2020-07-10 上海明略人工智能(集团)有限公司 送餐机器人控制方法及装置
CN111775160A (zh) * 2020-06-12 2020-10-16 上海擎朗智能科技有限公司 一种物品的自主配送方法、装置、介质及机器人
CN112835365A (zh) * 2020-12-31 2021-05-25 深圳市普渡科技有限公司 机器人配送目标点的设置方法、装置、机器人和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107645566A (zh) * 2017-11-03 2018-01-30 广东工业大学 一种基于云平台的送餐机器人语音交互方法及***
CN109366507A (zh) * 2018-12-26 2019-02-22 南京英维尔科技服务有限公司 一种送餐机器人
CN109886839A (zh) * 2019-01-11 2019-06-14 杭州火小二科技有限公司 一种智能送餐***和方法
CN111390924A (zh) * 2020-04-03 2020-07-10 上海明略人工智能(集团)有限公司 送餐机器人控制方法及装置
CN111775160A (zh) * 2020-06-12 2020-10-16 上海擎朗智能科技有限公司 一种物品的自主配送方法、装置、介质及机器人
CN112835365A (zh) * 2020-12-31 2021-05-25 深圳市普渡科技有限公司 机器人配送目标点的设置方法、装置、机器人和存储介质

Similar Documents

Publication Publication Date Title
US8145494B2 (en) Voice response system
CN103646646B (zh) 一种语音控制方法及电子设备
CN105009204B (zh) 语音识别功率管理
WO2008060834B1 (en) Method and system for a user interface using higher order commands
CN113655938B (zh) 一种用于智能座舱的交互方法、装置、设备和介质
CN107134279A (zh) 一种语音唤醒方法、装置、终端和存储介质
CN105895093A (zh) 语音信息处理方法及装置
CN106997762A (zh) 家用电器的语音控制方法以及装置
WO2018023106A1 (en) System and method of disambiguating natural language processing requests
CN109410952A (zh) 一种语音唤醒方法、装置及***
CN109086276B (zh) 数据翻译方法、装置、终端及存储介质
CN107799120A (zh) 服务机器人识别唤醒方法及装置
CN106898349A (zh) 一种语音控制计算机的方法和智能语音助手***
JP2015069600A (ja) 音声翻訳システム、方法およびプログラム
CN107886944A (zh) 一种语音识别方法、装置、设备及存储介质
JPWO2018186445A1 (ja) 対話システム
CN104575499B (zh) 移动终端的声控方法及移动终端
CN109686368B (zh) 语音唤醒应答处理方法及装置、电子设备及存储介质
CN111292744B (zh) 语音指令识别方法、***及计算机可读存储介质
CN109979474A (zh) 语音设备及其用户语速修正方法、装置和存储介质
CN110111789A (zh) 语音交互方法、装置、计算设备和计算机可读介质
CN111309876A (zh) 一种服务请求的处理方法、装置、电子设备及存储介质
CN105227557A (zh) 一种帐号处理方法及装置
KR20190139489A (ko) 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치
CN109434827B (zh) 陪伴机器人控制方法、***、移动终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination