CN114360515A - 信息处理方法、装置、电子设备、介质及计算机程序产品 - Google Patents

信息处理方法、装置、电子设备、介质及计算机程序产品 Download PDF

Info

Publication number
CN114360515A
CN114360515A CN202111501494.8A CN202111501494A CN114360515A CN 114360515 A CN114360515 A CN 114360515A CN 202111501494 A CN202111501494 A CN 202111501494A CN 114360515 A CN114360515 A CN 114360515A
Authority
CN
China
Prior art keywords
voice
elevator taking
taking instruction
recognition model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111501494.8A
Other languages
English (en)
Inventor
黄丽莉
李良斌
陈孝良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202111501494.8A priority Critical patent/CN114360515A/zh
Publication of CN114360515A publication Critical patent/CN114360515A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Indicating And Signalling Devices For Elevators (AREA)

Abstract

本申请公开了一种信息处理方法、装置、电子设备、介质及计算机程序产品。通过获取电梯处的语音信息,将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,在识别结果中的第一语音信息包含乘梯指令的情况下,保存第一语音信息,如此使得电梯只保存含有乘梯指令的第一语音信息,不对所有的语音信息进行保存,节省了存储空间,并且标注员可以在后台获取含有乘梯指令的第一语音信息,然后对含有乘梯指令的第一语音信息进行标注,减少了对不含有乘梯指令的语音信息的标注,缩短了标注过程,提升了标注效率。

Description

信息处理方法、装置、电子设备、介质及计算机程序产品
技术领域
本申请属于智慧电梯领域,尤其涉及一种信息处理方法、装置、电子设备、介质及计算机程序产品。
背景技术
现有的智慧电梯可以通过语音识别模型对用户发出的乘梯指令进行识别,从而完成用户的乘梯需求,为了使语音识别更加完善,需要通过训练样本对语音识别模型进行训练,而训练样本的数据源是在电梯处一段时间内所有的音频数据。
为了保证数据源的完整,需要后台维护人员将智慧电梯所有的音频数据进行提取,而这些音频数据中包括了很多与乘梯指令无关的音频数据,在对提取的音频进行保存的时候,这些与乘梯指令无关的音频数据也被保存了下来,如此就会过多的占用存储空间,并且标注人员也要对所有的数据进行标注,这就导致标注的时间会被拉长,标注效率较低。
发明内容
本申请实施例提供一种信息处理方法、装置、电子设备、介质及计算机程序产品,使标注员可以在后台获取保存后的有效数据然后进行标注,缩短了标注过程,提升了标注效率。
第一方面,本申请实施例提供一种信息处理方法,方法包括:
获取电梯处的语音信息;
将所述语音信息输入至预先训练好的语音识别模型,通过所述语音识别模型对所述语音信息进行识别,得到与所述语音信息对应的识别结果,其中,所述语音识别模型是基于所述语音识别模型的训练样本训练得到,所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
在所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息,其中,所述第一语音信息用于乘梯指令识别模型的训练样本。
在一种可能的实现方式中,在所述获取电梯处的语音信息之前,所述方法还包括:
接收用户对预设保存控件的第一输入指令;
响应于所述第一输入指令,开启语音信息保存功能。
在一种可能的实现方式中,在所述保存所述第一语音信息之后,所述方法还包括:
对所述第一语音信息中的所述乘梯指令进行标注,得到用于训练所述乘梯指令识别模型的训练样本。
在一种可能的实现方式中,在所述对所述第一语音信息中的所述乘梯指令进行标注,得到用于训练所述乘梯指令识别模型的所述训练样本,包括:
所述乘梯指令被标注为正确乘梯指令、错误乘梯指令及无效乘梯指令,所述正确乘梯指令用于表征所述第一语音信息中的乘梯指令与标注的乘梯指令一致,所述错误乘梯指令用于表征所述第一语音信息中的乘梯指令与标注后的乘梯指令不一致,所述无效乘梯指令用于表征所述第一语音信息中的乘梯指令为无效;
所述乘梯指令识别模型包括第一子模型和第二子模型,将所述正确乘梯指令和所述错误乘梯指令对应的第一语音信息作为所述第一子模型的训练样本,将所述无效乘梯指令对应的第一语音信息作为所述第二子模型的训练样本,所述第一子模型用于识别所述乘梯指令,所述第二子模型用于将所述乘梯指令中的无效乘梯指令剔除。
在一种可能的实现方式中,所述对所述第一语音信息中的所述乘梯指令进行标注,包括:
响应于所述用户对所述第一语音信息中的所述乘梯指令的标注操作,对所述第一语音信息中的所述乘梯指令进行标注。
在一种可能的实现方式中,在所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息之后,所述方法还包括:
获取电梯响应于所述第一语音信息中的乘梯指令的响应操作,以基于所述响应操作对所述乘梯指令识别模型进行优化。
在一种可能的实现方式中,在所述获取电梯处的语音信息之前,所述方法还包括:
获取多个所述语音识别模型的训练样本,每个所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
根据多个所述语音识别模型的训练样本,训练所述语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
在一种可能的实现方式中,所述根据多个所述语音识别模型的训练样本,训练所述语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型,包括:
对每个所述语音识别模型的训练样本,分别执行如下步骤:
将所述历史语音信息样本输入至预设的语音识别模型,得到所述语音识别模型的训练样本的预测识别结果;
根据所述预测识别结果和所述语音识别模型的训练样本对应的标签样本,确定所述语音识别模型的损失函数值;
在所述损失函数值不满足训练停止条件的情况下,调整所述语音识别模型的模型参数,并利用所述语音识别模型的训练样本训练参数调整后的语音识别模型,直至满足所述训练停止条件,得到训练后的语音识别模型。
第二方面,本申请实施例提供了一种信息处理装置,该装置包括:
获取模块,用于获取电梯处的语音信息;
识别模块,用于将所述语音信息输入至预先训练好的语音识别模型,通过所述语音识别模型对所述语音信息进行识别,得到与所述语音信息对应的识别结果,其中,所述语音识别模型是基于所述语音识别模型的训练样本训练得到,所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
保存模块,用于所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息,其中,所述第一语音信息用于乘梯指令识别模型的训练样本。
第三方面,本申请实施例提供了一种电子设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如本申请实施例提供的信息处理方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如本申请实施例提供的信息处理方法。
第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如本申请实施例提供的信息处理方法。
本申请实施例的信息处理方法、装置、电子设备、介质及计算机程序产品,通过获取电梯处的语音信息,将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,在识别结果中的第一语音信息包含乘梯指令的情况下,保存第一语音信息,如此使得电梯只保存含有乘梯指令的第一语音信息,不对所有的语音信息进行保存,节省了存储空间,并且标注员可以在后台获取含有乘梯指令的第一语音信息,然后对含有乘梯指令的第一语音信息进行标注,减少了对不含有乘梯指令的语音信息的标注,缩短了标注过程,提升了标注效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息处理方法的流程示意图;
图2是本申请实施例提供的又一种信息处理方法的流程示意图;
图3是本申请实施例提供的又一种信息处理方法的流程示意图;
图4是本申请又一个实施例提供的信息处理装置的结构示意图;
图5是本申请又一个实施例提供的信息处理电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
现有的智慧电梯由于需要后台维护人员将智慧电梯所有的音频数据进行提取,而这些音频数据中包括了很多与乘梯指令无关的音频数据,如此就会过多的占用存储空间,并且标注人员也要对所有的数据进行标注,这就导致标注的时间会被拉长,标注效率较低,为了解决现有技术中的问题,本申请实施例提供了一种信息处理方法。通过获取电梯处的语音信息,将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,在识别结果中的第一语音信息包含乘梯指令的情况下,保存第一语音信息,如此使得电梯只保存含有乘梯指令的第一语音信息,不用对所有的语音信息进行保存,节省了存储空间,并且标注员可以在后台获取含有乘梯指令的第一语音信息,然后对含有乘梯指令的第一语音信息进行标注,减少了对不含有乘梯指令的语音信息的标注,缩短了标注过程,提升了标注效率。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的信息处理方法进行详细地说明。
下面先介绍本申请实施例提供的信息处理方法中所采用的语音识别模型的训练过程进行详细说明。
图1是本申请实施例提供的一种信息处理方法的流程示意图,具体的可以是本申请实施例提供的信息处理方法中所采用的语音识别模型的训练方法。
如图1所示,本申请实施例提供的信息处理方法中所采用的语音识别模型的训练方法包括以下步骤:
步骤110、获取多个语音识别模型的训练样本,每个语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本。
步骤120、根据多个语音识别模型的训练样本,训练语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
在本申请的一些实施例中,通过获取多个语音识别模型的训练样本,每个语音识别模型的训练样本包括历史语音信息样本以及对历史语音信息样本中的乘梯指令进行标注过的标签样本,然后根据多个语音识别模型的训练样本,训练语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型,如此可以得到训练后的语音识别模型,训练后的语音识别模型可以精准识别出语音信息中是否含有乘梯指令。
下面介绍上述各个步骤的具体实现方式。
在一些实施例中,在步骤110中,获取多个语音识别模型的训练样本,其中每个语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本。
在一些实施例中,历史语音信息样本可以是由人进行手动提取的,一段时间内电梯处产生的语音信息。
在一些实施例中,乘梯指令可以是用户对电梯发出的使电梯进行工作的指令,示例的,乘梯指令可以是用户发出的“我要去10楼”的语音信息,将历史语音信息中的“10楼”标注为乘梯指令,在此不做限定。
在一些实施例中,含有乘梯指令的标签样本可以是历史语音信息样本对应的识别结果,具体的,历史语音信息样本可以是“我要去10楼”的语音信息,识别历史语音样本中的“10楼”为乘梯指令,与标签样本中含有“10楼”的乘梯指令对应。
在一些实施例中,可以将包括历史语音信息样本以及标签样本的多个训练样本作为语音识别模型的训练样本对语音识别模型进行训练。
在一些实施例中,在步骤120中,根据多个语音识别模型的训练样本,训练语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
在一些实施例中,训练停止条件可以是预先设置的语音识别模型训练停止的条件,具体的训练停止条件可以根据用户需求自行选取,此处不做限定。
在本申请的一些实施例中,步骤120具体可以包括:
对每个语音识别模型的训练样本,分别执行如下步骤:
将历史语音信息样本输入至预设的语音识别模型,得到语音识别模型的训练样本的预测识别结果。
根据预测识别结果和语音识别模型的训练样本对应的标签样本,确定语音识别模型的损失函数值。
在损失函数值不满足训练停止条件的情况下,调整语音识别模型的模型参数,并利用语音识别模型的训练样本训练参数调整后的语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
在一些实施例中,预测识别结果可以是将历史语音信息输入至语音识别模型之后,预测出来的与历史语音信息对应的识别结果,示例的,预测识别结果可以是历史语音信息中有“10楼”的乘梯指令。
在一些实施例中,根据预测识别结果和语音识别模型的训练样本对应的标签样本可以确定语音识别模型的损失函数值,损失函数值可以是训练时对历史语音信息中乘梯指令的识别率。
在一些实施例中,在损失函数值不满足训练条件的情况下,可以对语音识别模型的参数进行调整,然后使用调整后的语音识别模型继续进行训练,直至满足训练停止条件,得到训练后的语音识别模型。
在本申请的一些实施例中,通过将历史语音信息输入至预设的语音识别模型,可以得到语音识别模型的训练样本的预测识别结果,然后根据预测识别结果和语音识别模型的训练样本对应的标签样本,确定语音识别模型的损失函数值,在损失函数值不满足训练停止条件的情况下,对语音识别模型的模型参数进行调整,并利用语音识别模型的训练样本训练参数调整后的语音识别模型,直至满足训练停止条件,如此得到训练后的语音识别模型,以便利用训练后的语音识别模型对语音信息进行识别,得到含有乘梯指令的语音信息。
下面结合附图2对本申请实施例提供的信息处理方法进行详细说明。
图2是本申请实施例提供的又一种信息处理方法的流程示意图,如图2所示,本申请实施例提供的数据处理方法可以包括以下步骤:
步骤210,获取电梯处的语音信息。
步骤220,将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果。
其中,语音识别模型是基于语音识别模型的训练样本训练得到,语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本。
步骤230,在识别结果中的第一语音信息中包含乘梯指令的情况下,保存第一语音信息。
其中,第一语音信息用于乘梯指令识别模型的训练样本。
在本申请的实施例中,通过获取电梯处的语音信息,将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,在识别结果中的第一语音信息包含乘梯指令的情况下,保存第一语音信息,如此使得电梯只保存含有乘梯指令的第一语音信息,不对所有的语音信息进行保存,节省了存储空间,并且标注员可以在后台获取含有乘梯指令的第一语音信息,然后对含有乘梯指令的第一语音信息进行标注,减少了对不含有乘梯指令的语音信息的标注,缩短了标注过程,提升了标注效率。
下面介绍上述各个步骤的具体实现方式。
在一些实施例中,在步骤210中,获取电梯处的语音信息。
其中,电梯处语音信息可以是由用户在乘电梯时发出的语音信息,此处不做限制,示例的,用户可以说出“我要去10楼”、“今天天气很好”等语音信息,电梯可以通过语音识别获取到用户发出的语音信息,在此不做限定。
在一些实施例中,步骤210之前,还可以包括以下步骤:
接收用户对预设保存控件的第一输入指令;
响应于所述第一输入指令,开启语音信息保存功能。
其中,预设保存控件可以是预先在电梯后台添加的保存功能的控制部分,具体的,预设保存控件可以是控制保存功能开启的后台界面按钮,在此不做限定。
在一些实施例中,用户的第一输入指令可以是对预设保存控件的进行开启的操作,使预设保存控件在用户的第一输入指令下可以打开。
在一些实施例中,为了响应用户的第一输入指令,电梯的语音信息保存功能将被打开,此时,用户发出的语音信息可以被保存。
在一些实施例中,在步骤220中,将语音信息输入至预先训练好的语音识别模型,得到与语音信息对应的识别结果。
其中,语音识别模型是基于语音识别模型的训练样本训练得到,语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本。
在一些实施例中,将获取到的电梯处的语音信息输入至预先训练好的语音识别模型,语音识别模型可以对语音信息进行识别,得出与语音信息对应的识别结果,具体的如何通过语音识别模型得到与语音信息对应的识别结果,可参考上述语音识别模型的训练过程,在此不再赘述。
在一些实施例中,电梯处的语音信息可以是用户说出“我要去10楼”、“今天天气很好”等语音信息。
在一些实施例中,将用户说出“我要去10楼”的语音信息输入至语音识别模型时,语音识别模型对“我要去10楼”进行识别,识别结果可以是含有乘梯指令的语音信息,将用户说出“今天天气很好”的语音信息输入至语音识别模型时,语音识别模型对“今天天气很好”进行识别,识别结果可以是不含有乘梯指令的其他语音信息,
在一些实施例中,在步骤230中,在识别结果中的第一语音信息中包含乘梯指令的情况下,保存第一语音信息。
其中,第一语音信息用于乘梯指令识别模型的训练样本。
在一些实施例中,第一语音信息可以是用户在乘电梯时发出的包含乘梯指令的语音信息,示例的,用户说“我要去10楼”,语音识别模型识别“我要去10楼”这个语音信息包含乘梯指令“10楼”,即第一语音信息。
在一些实施例中,第一语音信息含有乘梯指令,因此可以用作乘梯指令识别模型的训练样本。
在一些实施例中,对含有乘梯指令的第一语音信息进行保存,用户可以获取保存后的第一语音信息。
在一些实施例中,在步骤230后,还可以进一步包括以下步骤:
获取电梯响应于第一语音信息中的乘梯指令的响应操作。
在一些实施例中,可以获取电梯响应于第一语音信息中的乘梯指令的响应操作,具体的,第一语音信息可以是用户说出的“我要去10楼”,当语音识别模型识别为“10楼”,电梯对应的响应操作可以是运行至10楼,当语音识别模型识别为“4楼”,电梯对应的响应操作可以是运行至4楼,第一语音信息还可以是用户说出的“今天10楼的公司有活动”,语音识别模型识别为“10楼”,电梯对应的响应操作可以是运行至10楼。如此可基于该响应操作,确定电梯的中控***的运行状态,即确定电梯的中控***对乘梯指令是否进行了正确的响应。
为了方便用户对第一语音信息进行标注,图3为本申请实施例提供的又一种信息处理方法的流程示意图。
如图3所示,该信息处理方法在上述图2步骤230之后,还可以进一步包括以下步骤:
步骤310,对第一语音信息中的所述乘梯指令进行标注,得到用于训练乘梯指令识别模型的训练样本。
在一些实施例中,第一语音信息是已经保存好包括乘梯指令的语音信息,用于乘梯指令识别模型的训练样本,第一语音信息可以是包含用户说出的“我要去10楼”的语音信息。
在一些实施例中,响应于用户对第一语音信息中的乘梯指令的标注操作,对第一语音信息中的乘梯指令进行标注。
在一些实施例中,用户对第一语音信息中的乘梯指令的标注操作可以是用户将“10楼”标注为“10楼”。
在一些实施例中,在步骤310中,可以包括:
乘梯指令被标注为正确乘梯指令、错误乘梯指令及无效乘梯指令,正确乘梯指令用于表征第一语音信息中的乘梯指令与标注的乘梯指令一致,错误乘梯指令用于表征第一语音信息中的乘梯指令与标注后的乘梯指令不一致,无效乘梯指令用于表征第一语音信息中的乘梯指令为无效。
乘梯指令识别模型包括第一子模型和第二子模型,将正确乘梯指令和错误乘梯指令对应的第一语音信息作为第一子模型的训练样本,将无效乘梯指令对应的第一语音信息作为第二子模型的训练样本,第一子模型用于识别乘梯指令,第二子模型用于将乘梯指令中的无效乘梯指令剔除。
在一些实施例中,语音识别模型识别出用户A说出的“我要去10楼”的乘梯指令后,将“我要去10楼”的乘梯指令输入到乘梯指令识别模型的第一子模型中,第一子模型对“我要去10楼”的乘梯指令进行识别,可能识别出“我要去10楼”的指令,也可能识别出“我要去4楼”的乘梯指令,在识别出“我要去10楼”的指令时,将该指令标注为正确乘梯指令,在识别出“我要去4楼”的指令时,将该指令标注为错误乘梯指令。
在一些示例中,语音识别模型识别出用户A说出的“我要去10楼”的乘梯指令后,将“我要去10楼”的乘梯指令输入到乘梯指令识别模型的第一子模型中,第一子模型对“我要去10楼”的乘梯指令进行识别,可能识别出“我要去10楼”的指令,也可能识别出“我要去4楼”的乘梯指令。故第一子模型可以是相当于一种语言识别模型,其仅为识别出输入第一子模型中的乘梯指令的发音是否准确,确保识别出的乘梯指令的准确性。其用于将正确乘梯指令和错误乘梯指令进行区分。
在一些示例中,语音识别模型识别出用户B说出的“今天10楼有活动”的乘梯指令后,将“今天10楼有活动”的乘梯指令输入到乘梯指令识别模型的第一子模型中,第一子模型对“今天10楼有活动”的乘梯指令进行识别,识别出的结果为“今天10楼有活动”(即针对“10楼”的识别是没有错误的,发音识别是正确的),然后将该识别结果“今天10楼有活动”继续输入至第二子模型中,第二子模型对识别结果“今天10楼有活动”进行语义的分析,分析出该指令并非是要乘坐电梯的指令,即是无效乘梯指令,则第二子模型可将该指令“今天10楼有活动”进行删除。
在另一些实施例中,第二子模型还可以将正确的乘梯指令进行保留。具体的,语音识别模型识别出用户C说出的“去4楼”的乘梯指令后,将“去4楼”的乘梯指令输入到乘梯指令识别模型的第一子模型中,第一子模型对“去4楼”的乘梯指令进行识别,识别出的结果为“去4楼”,然后将该识别结果“去4楼”继续输入至第二子模型中,第二子模型对识别结果“去4楼”进行前后语义的分析,分析出该指令是要乘坐电梯的指令,具体是要去4楼的乘梯指令,该指令为正确的乘梯指令,则第二子模型可将该指令“去4楼”进行输出,以将该“去4楼”的指令给电梯的中控***,以使电梯的中控***基于该“去4楼”的指令控制电梯运行至4楼。故第二子模型可以是相当于是意图识别模型,即识别出指令的具体意图,以避免电梯的中控***根据无效乘梯指令控制电梯运行。
在一些实施例中,通过对第一子模型和第二子模型的训练,提高对乘梯指令的识别准确性。
具体地,上述步骤中的其它相关技术方案可以参见上文步骤210至步骤230的相关描述,此处不做过多赘述。
基于上述实施例提供的信息处理方法,相应地,本申请实施例还提供了一种信息处理装置的具体实现方式,请参见以下实施例。
具体参见图4,本申请实施例提供的信息处理装置包括以下单元:
获取模块410,用于获取电梯处的语音信息;
识别模块420,用于将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,其中,语音识别模型是基于语音识别模型的训练样本训练得到,语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本;
保存模块430,用于识别结果中的第一语音信息中包含乘梯指令的情况下,保存第一语音信息,其中,第一语音信息用于乘梯指令识别模型的训练样本。
在本申请的实施例中,获取模块获取电梯处的语音信息,识别模块将语音信息输入至预先训练好的语音识别模型,通过语音识别模型对语音信息进行识别,得到与语音信息对应的识别结果,保存模块在识别结果中的第一语音信息包含乘梯指令的情况下,保存第一语音信息,如此使得信息处理装置只保存含有乘梯指令的第一语音信息,不对所有的语音信息进行保存,节省了存储空间,并且标注员可以在后台获取含有乘梯指令的第一语音信息,然后对含有乘梯指令的第一语音信息进行标注,减少了对不含有乘梯指令的语音信息的标注,缩短了标注过程,提升了标注效率。
在本申请的一些实施例中,上述信息处理装置还可以包括:
第一接收模块,用于在获取电梯处的语音信息之前,接收用户对预设保存控件的第一输入指令;
第一开启模块,响应于所述第一输入指令,开启语音信息保存功能。
在本申请的一些实施例中,上述信息处理装置还可以包括:
乘梯指令标注模块,用于在保存第一语音信息之后,对第一语音信息中的乘梯指令进行标注,得到用于训练乘梯指令识别模型的训练样本。
在本申请的一些实施例中,乘梯指令标注模块具体用于:
所述乘梯指令被标注为正确乘梯指令、错误乘梯指令及无效乘梯指令,所述正确乘梯指令用于表征所述第一语音信息中的乘梯指令与标注的乘梯指令一致,所述错误乘梯指令用于表征所述第一语音信息中的乘梯指令与标注后的乘梯指令不一致,所述无效乘梯指令用于表征所述第一语音信息中的乘梯指令为无效;
所述乘梯指令识别模型包括第一子模型和第二子模型,将所述正确乘梯指令和所述错误乘梯指令对应的第一语音信息作为所述第一子模型的训练样本,将所述无效乘梯指令对应的第一语音信息作为所述第二子模型的训练样本,所述第一子模型用于识别所述乘梯指令,所述第二子模型用于将所述乘梯指令中的无效乘梯指令剔除。乘梯指令标注模块,可以具体用于:
响应于用户对第一语音信息中的乘梯指令的标注操作,对第一语音信息中的乘梯指令进行标注。
在本申请的一些实施例中,上述信息处理装置还可以包括:
响应操作获取模块,用于获取电梯响应于所述第一语音信息中的乘梯指令的响应操作。
在本申请的一些实施例中,上述信息处理装置还可以包括:
训练样本获取模块,用于获取电梯处的语音信息之前,获取多个语音识别模型的训练样本,每个语音识别模型的训练样本包括历史语音信息样本,以及对历史语音信息样本中的乘梯指令进行标注过的标签样本;
语音识别模型训练模块,用于根据多个语音识别模型的训练样本,训练语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
语音识别模型训练模块,可以具体用于:
对每个语音识别模型的训练样本,分别执行如下步骤:
将历史语音信息样本输入至预设的语音识别模型,得到语音识别模型的训练样本的预测识别结果;
根据预测识别结果和语音识别模型的训练样本对应的标签样本,确定语音识别模型的损失函数值;
在损失函数值不满足训练停止条件的情况下,调整语音识别模型的模型参数,并利用语音识别模型的训练样本训练参数调整后的语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
基于上述实施例提供的方法,本申请实施例还提供了信息处理电子设备的具体实施方式。图5示出了本申请实施例提供的信息处理电子设备的硬件结构示意图。
在信息处理电子设备可以包括处理器501以及存储有计算机程序指令的存储502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种信息处理方法。
在一个示例中,信息处理电子设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的在线数据流量计费方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种信息处理方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
获取电梯处的语音信息;
将所述语音信息输入至预先训练好的语音识别模型,通过所述语音识别模型对所述语音信息进行识别,得到与所述语音信息对应的识别结果,其中,所述语音识别模型是基于所述语音识别模型的训练样本训练得到,所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
在所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息,其中,所述第一语音信息用于乘梯指令识别模型的训练样本。
2.根据权利要求1所述的信息处理方法,其特征在于,在所述获取电梯处的语音信息之前,所述方法还包括:
接收用户对预设保存控件的第一输入指令;
响应于所述第一输入指令,开启语音信息保存功能。
3.根据权利要求1所述的信息处理方法,其特征在于,在所述保存所述第一语音信息之后,所述方法还包括:
对所述第一语音信息中的所述乘梯指令进行标注,得到用于训练所述乘梯指令识别模型的训练样本。
4.根据权利要求3所述的信息处理方法,其特征在于,所述对所述第一语音信息中的所述乘梯指令进行标注,得到用于训练所述乘梯指令识别模型的训练样本,包括:
所述乘梯指令被标注为正确乘梯指令、错误乘梯指令及无效乘梯指令,所述正确乘梯指令用于表征所述第一语音信息中的乘梯指令与标注的乘梯指令一致,所述错误乘梯指令用于表征所述第一语音信息中的乘梯指令与标注后的乘梯指令不一致,所述无效乘梯指令用于表征所述第一语音信息中的乘梯指令为无效;
所述乘梯指令识别模型包括第一子模型和第二子模型,将所述正确乘梯指令和所述错误乘梯指令对应的第一语音信息作为所述第一子模型的训练样本,将所述无效乘梯指令对应的第一语音信息作为所述第二子模型的训练样本,所述第一子模型用于识别所述乘梯指令,所述第二子模型用于将所述乘梯指令中的无效乘梯指令剔除。
5.根据权利要求3所述的信息处理方法,其特征在于,所述对所述第一语音信息中的所述乘梯指令进行标注,包括:
响应于所述用户对所述第一语音信息中的所述乘梯指令的标注操作,对所述第一语音信息中的所述乘梯指令进行标注。
6.根据权利要求1所述的信息处理方法,其特征在于,在所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息之后,所述方法还包括:
获取电梯响应于所述第一语音信息中的乘梯指令的响应操作。
7.根据权利要求1所述的信息处理方法,其特征在于,在所述获取电梯处的语音信息之前,所述方法还包括:
获取多个所述语音识别模型的训练样本,每个所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
根据多个所述语音识别模型的训练样本,训练所述语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型。
8.根据权利要求7所述的信息处理方法,其特征在于,所述根据多个所述语音识别模型的训练样本,训练所述语音识别模型,直至满足训练停止条件,得到训练后的语音识别模型,包括:
对每个所述语音识别模型的训练样本,分别执行如下步骤:
将所述历史语音信息样本输入至预设的语音识别模型,得到所述语音识别模型的训练样本的预测识别结果;
根据所述预测识别结果和所述语音识别模型的训练样本对应的标签样本,确定所述语音识别模型的损失函数值;
在所述损失函数值不满足训练停止条件的情况下,调整所述语音识别模型的模型参数,并利用所述语音识别模型的训练样本训练参数调整后的语音识别模型,直至满足所述训练停止条件,得到训练后的语音识别模型。
9.一种信息处理装置,其特征在于,所述装置包括:
获取模块,用于获取电梯处的语音信息;
识别模块,用于将所述语音信息输入至预先训练好的语音识别模型,通过所述语音识别模型对所述语音信息进行识别,得到与所述语音信息对应的识别结果,其中,所述语音识别模型是基于所述语音识别模型的训练样本训练得到,所述语音识别模型的训练样本包括历史语音信息样本,以及对所述历史语音信息样本中的乘梯指令进行标注过的标签样本;
保存模块,用于在所述识别结果中的第一语音信息中包含乘梯指令的情况下,保存所述第一语音信息,其中,所述第一语音信息用于乘梯指令识别模型的训练样本。
10.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-8任意一项所述的信息处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的信息处理方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-8任意一项所述的信息处理方法。
CN202111501494.8A 2021-12-09 2021-12-09 信息处理方法、装置、电子设备、介质及计算机程序产品 Pending CN114360515A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111501494.8A CN114360515A (zh) 2021-12-09 2021-12-09 信息处理方法、装置、电子设备、介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111501494.8A CN114360515A (zh) 2021-12-09 2021-12-09 信息处理方法、装置、电子设备、介质及计算机程序产品

Publications (1)

Publication Number Publication Date
CN114360515A true CN114360515A (zh) 2022-04-15

Family

ID=81099705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111501494.8A Pending CN114360515A (zh) 2021-12-09 2021-12-09 信息处理方法、装置、电子设备、介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN114360515A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117219078A (zh) * 2023-10-20 2023-12-12 深圳市宏泰智能创意电子科技有限公司 基于人工智能的摆件语音识别方法及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932945A (zh) * 2018-03-21 2018-12-04 北京猎户星空科技有限公司 一种语音指令的处理方法及装置
CN111348499A (zh) * 2020-03-02 2020-06-30 北京声智科技有限公司 电梯控制方法、装置、电子设备及计算机可读存储介质
CN111377315A (zh) * 2020-03-04 2020-07-07 百度在线网络技术(北京)有限公司 电梯控制方法、装置、电子设备、存储介质及***
CN112233665A (zh) * 2020-10-16 2021-01-15 珠海格力电器股份有限公司 模型训练的方法和装置、电子设备和存储介质
CN112509563A (zh) * 2020-12-17 2021-03-16 中国科学技术大学 模型训练方法、装置及电子设备
CN112786003A (zh) * 2020-12-29 2021-05-11 平安科技(深圳)有限公司 语音合成模型训练方法、装置、终端设备及存储介质
CN113023512A (zh) * 2021-03-01 2021-06-25 北京电子科技职业学院 智能电梯语音控制方法、装置、电梯设备及存储介质
CN113327596A (zh) * 2021-06-17 2021-08-31 北京百度网讯科技有限公司 语音识别模型的训练方法、语音识别方法和装置
CN113428748A (zh) * 2021-08-09 2021-09-24 珠海格力电器股份有限公司 一种电梯控制方法、存储介质以及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932945A (zh) * 2018-03-21 2018-12-04 北京猎户星空科技有限公司 一种语音指令的处理方法及装置
CN111348499A (zh) * 2020-03-02 2020-06-30 北京声智科技有限公司 电梯控制方法、装置、电子设备及计算机可读存储介质
CN111377315A (zh) * 2020-03-04 2020-07-07 百度在线网络技术(北京)有限公司 电梯控制方法、装置、电子设备、存储介质及***
CN112233665A (zh) * 2020-10-16 2021-01-15 珠海格力电器股份有限公司 模型训练的方法和装置、电子设备和存储介质
CN112509563A (zh) * 2020-12-17 2021-03-16 中国科学技术大学 模型训练方法、装置及电子设备
CN112786003A (zh) * 2020-12-29 2021-05-11 平安科技(深圳)有限公司 语音合成模型训练方法、装置、终端设备及存储介质
CN113023512A (zh) * 2021-03-01 2021-06-25 北京电子科技职业学院 智能电梯语音控制方法、装置、电梯设备及存储介质
CN113327596A (zh) * 2021-06-17 2021-08-31 北京百度网讯科技有限公司 语音识别模型的训练方法、语音识别方法和装置
CN113428748A (zh) * 2021-08-09 2021-09-24 珠海格力电器股份有限公司 一种电梯控制方法、存储介质以及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117219078A (zh) * 2023-10-20 2023-12-12 深圳市宏泰智能创意电子科技有限公司 基于人工智能的摆件语音识别方法及***

Similar Documents

Publication Publication Date Title
US10643605B2 (en) Automatic multi-performance evaluation system for hybrid speech recognition
EP3709295B1 (en) Methods, apparatuses, and storage media for generating training corpus
CN112200273B (zh) 数据标注方法、装置、设备及计算机存储介质
CN109087667B (zh) 语音流利度识别方法、装置、计算机设备及可读存储介质
CN114360515A (zh) 信息处理方法、装置、电子设备、介质及计算机程序产品
CN111538823A (zh) 信息处理方法、模型训练方法、装置、设备及介质
CN111309876A (zh) 一种服务请求的处理方法、装置、电子设备及存储介质
CN113591463B (zh) 意图识别方法、装置、电子设备及存储介质
CN112699780A (zh) 对象识别方法、装置、设备及存储介质
CN110827827A (zh) 一种语音播报方法及电子设备
CN114229637A (zh) 电梯楼层确定方法、装置、设备及计算机可读存储介质
CN113948089B (zh) 声纹模型训练和声纹识别方法、装置、设备及介质
CN109871528A (zh) 语音数据的语义识别方法及装置、存储介质、计算机设备
CN115132192A (zh) 一种智能语音交互方法、装置、电子设备及存储介质
CN114220428A (zh) 一种语音识别方法、装置、设备及计算机存储介质
CN113470679A (zh) 基于无监督学习的语音唤醒方法、装置、电子设备及介质
CN114360508A (zh) 一种标记方法、装置、设备及存储介质
KR20220012473A (ko) 상호 정보량 추정을 이용한 화자 임베딩 추출 장치 및 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램
CN116978374A (zh) 语音指令响应方法、装置、设备、存储介质及车辆
CN112002325A (zh) 多语种语音交互方法和装置
CN117076596B (zh) 应用人工智能的数据存储方法、装置及服务器
CN112115229A (zh) 文本意图识别方法、装置、***以及文本分类***
CN117093972A (zh) 一种语音控制方法、装置、电子设备及可读存储介质
CN111488738A (zh) 非法信息的识别方法、装置
CN109785836B (zh) 交互方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination