CN110879839A - 一种热词识别方法、装置及*** - Google Patents

一种热词识别方法、装置及*** Download PDF

Info

Publication number
CN110879839A
CN110879839A CN201911181751.7A CN201911181751A CN110879839A CN 110879839 A CN110879839 A CN 110879839A CN 201911181751 A CN201911181751 A CN 201911181751A CN 110879839 A CN110879839 A CN 110879839A
Authority
CN
China
Prior art keywords
audio information
candidate
words
hot word
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911181751.7A
Other languages
English (en)
Inventor
刘佳磊
苏少炜
陈孝良
常乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sound Intelligence Technology Co Ltd
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing Sound Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sound Intelligence Technology Co Ltd filed Critical Beijing Sound Intelligence Technology Co Ltd
Priority to CN201911181751.7A priority Critical patent/CN110879839A/zh
Publication of CN110879839A publication Critical patent/CN110879839A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供一种热词识别方法、装置及***,该方法先获取音频信息中的备选热词,再调用预设打分模型对备选热词进行打分过滤,也就是说,对备选热词进行预处理,从备选热词筛选出候选热词,即减少了热词词库中的热词,然后根据上传的候选热词和音频信息进行转译处理,得到相应的文本信息,最终将候选热词与文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词,也就是说,由于减少了热词词库中的热词,在提高语音识别的准确率的同时,相应的,减少了进行热词匹配的时间,从而提高了热词的识别效率,进而也提高了语音的识别效率。

Description

一种热词识别方法、装置及***
技术领域
本申请涉及语音识别技术领域,尤其涉及一种热词识别方法、装置及***。
背景技术
随着自媒体的繁荣兴盛,带来的不仅仅是传播渠道和方式的改变,在语言表达上也出现了新的特点和趋势,每时每刻在世界的各个角落都有自媒体热词诞生,在"人人即媒体"时代,热词是自媒体逐渐普及和其参与者自觉适应、融入网络的必然产物。
热词,即热门词汇,在语音识别技术领域中,热词作为一种词汇现象,在进行语音识别时,为了提高语音识别的准确率,则可以在语音识别结果库中添加尽可能多的热词,例如:现有技术中,各个语音转文本的提供商通常会预先定义一部分热词词库,作为热词表,将热词表及其各个热词对应的权重上传至服务器,然后服务器通过热词的声学模型进行热词匹配,最终根据匹配结果来确定是否使用该热词。
这种通过将热词表进行语音识别的方式,若想要覆盖尽可能出现的热词,则需要预先提供大量的热词词库,虽然可以提高语音识别的准确率,但由于提供了大量的热词词库,那么服务器进行热词匹配的响应时间会相应的增加,反而会降低热词的识别效率,进而也降低了语音的识别效率。
发明内容
本申请提供了一种基于对话的热词识别方法、装置及***,目的在于如何解决在提高语音识别的准确率的同时,减少进行热词匹配的时间,从而提高热词的识别效率,进而也提高语音的识别效率。
为了实现上述目的,本申请提供了以下技术方案:
一种热词识别方法,包括:
接收音频信息,并获取所述音频信息中的备选热词集;
调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表;
根据所述音频信息和所述候选热词表进行转译处理得到所述音频信息对应的文本信息;
将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
优选的,所述获取所述音频信息中的备选热词集,具体为:
依据所述音频信息的上下文、所述音频信息的声纹图谱、用户设备上的认证信息中至少一种获取方式获取所述音频信息中的备选热词;
将所述备选热词生成备选热词集。
优选的,所述依据所述音频信息的上下文获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的上下文所对应的音频信息,得到第一音频信息;
接收反馈的所述第一音频信息对应的文本信息,并获取所述第一音频信息对应的文本信息中的关键词;
根据所述关键词在预设数据库中查找与所述关键词相关连的词作为所述备选热词,所述预设数据库中存储有所述关键词与所述关键词相关的词的关系列表。
优选的,所述依据所述音频信息的声纹图谱获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的声纹图谱;
根据所述声纹图谱的声纹ID从预设声纹数据库中查找与所述声纹ID对应的关键词列表,所述预设声纹数据库中存储有声纹ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
优选的,所述依据用户设备上的认证信息获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的设备ID;
根据所述设备ID从预设数据库中查找与所述设备ID对应的关键词列表,所述预设数据库中存储有所述设备ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
优选的,所述调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,具体为:
将所述备选热词集中的各个备选热词逐一输入预设打分计算公式,计算各个所述备选热词对应的分数值,所述预设打分计算公式为
Figure BDA0002291453040000031
其中,x1~xn为备选热词集中各个备选热词,w1~wn为备选热词集中各个备选热词对应的权重;
选取各个所述备选热词对应的分数值中满足预设条件的备选热词构建所述音频信息的候选热词表。
优选的,还包括:
依据所述候选热词表中的候选热词与所述文本信息的匹配结果,对所述候选热词所对应的获取方式进行命中率打分,得到命中率打分结果;
按照所述命中率打分结果调整所述候选热词所对应的获取方式相对应的权重;
根据所述权重对所述预设打分计算公式进行修正。
一种热词识别装置,包括:
第一处理单元,用于接收音频信息,并获取所述音频信息中的备选热词集;
第二处理单元,用于调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表;
第三处理单元,用于根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息;
第四处理单元,用于将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
一种热词识别***,包括:至少一个终端设备和文本转译设备,其中:
所述终端设备用于接收音频信息,并获取所述音频信息中的备选热词集,调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,将所述音频信息和所述候选热词表发送至所述文本转译设备;
所述文本转译设备用于接收所述终端设备发送的所述音频信息和所述候选热词表,并根据所述音频信息和所述候选热词表对所述音频信息进行转译,得到所述音频信息对应的文本信息,并将所述文本信息反馈至所述终端设备;
所述终端设备接收所述音频信息对应的文本信息,并将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行如上述所述的热词识别方法。
一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述所述的热词识别方法。
本申请提供的一种热词识别方法、装置及***,该方法先获取音频信息中的备选热词,再调用预设打分模型对备选热词进行打分过滤,也就是说,对备选热词进行预处理,从备选热词筛选出候选热词,即减少了热词词库中的热词,然后根据上传的候选热词和音频信息进行转译处理,得到相应的文本信息,最终将候选热词与文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词,也就是说,由于减少了热词词库中的热词,在提高语音识别的准确率的同时,相应的,减少了进行热词匹配的时间,从而提高了热词的识别效率,进而也提高了语音的识别效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种热词识别***结构示意图;
图2为本申请实施例公开的一种热词识别方法流程图;
图3为本申请实施例公开的依据所述音频信息的上下文获取所述音频信息中的备选热词的具体实现方式流程图;
图4为本申请实施例公开的依据所述音频信息的声纹图谱获取所述音频信息中的备选热词的具体实现方式流程图;
图5为本申请实施例公开的依据用户设备上的认证信息获取所述音频信息中的备选热词的具体实现方式流程图;
图6为本申请实施例公开的调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表的具体实现方式流程图;
图7为本申请实施例提供的一种热词识别装置结构示意图;
图8为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
本申请提供的一种热词识别方法,应用于热词识别***的终端设备,如图1所示,该热词识别***包括至少一个终端设备10和文本转译设备20,终端设备10用于获取音频信息,并对音频信息进行处理,将得到的处理结果和音频信息上传至文本转译设备20,文本转译设备20用于接收终端设备10处理后的处理结果和音频信息,并对音频信息进行转译,得到音频信息对应的文本信息,并将文本信息反馈至终端设备10,终端设备10根据文本信息确定是否使用该热词。
本申请的发明目的在于:如何解决在提高语音识别的准确率的同时,减少进行热词匹配的时间,从而提高热词的识别效率,进而也提高语音的识别效率。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图2所示,本申请实施例提供了一种热词识别方法流程图,该方法应用于上述热词识别***中的终端设备,具体包括如下步骤:
S201:接收音频信息,并获取所述音频信息中的备选热词集。
上述音频信息可以为用户上传的音频信息,也可以是通过其他多种方式上传的音频信息。
如图1所示,用户上传的对话的音频信息至终端设备10,终端设备10接收用户上传的音频信息,用户使用的平台上存在多种终端设备10,该终端设备10可以为智能电视、智能音频、PAD等智能家居。
需要说明的是,获取所述音频信息中的备选热词集可以依据所述音频信息的上下文、所述音频信息的声纹图谱以及用户设备上的认证信息中至少一种获取方式获取所述音频信息中的备选热词,将获取的备选热词生成备选热词集。
S202:调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表。
上述候选热词表中包含需要上传至文本转译设备的候选热词,在上传文本转译设备之前,需要先对各个备选热词进行打分和过滤,最终确定出打分分数值较高的备选热词作为候选热词构成候选热词表。
其中的文本转译设备可以是本地的数据处理中心,也可以是远程的终端服务器,也可以是集成在终端的处理模块,在此不做具体的限定。
S203:根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息。
S204:将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
需要说明的是,上述描述说预设打分计算公式是可以自我纠正的,具体如何纠正的,可以通过对转译程序转译的结果中热词命中率进行打分来实现预设打分计算公式的纠正。
本申请实施例提供的一种热词识别方法,先获取音频信息中的备选热词,再调用预设打分模型对备选热词进行打分过滤,也就是说,对备选热词进行预处理,从备选热词筛选出候选热词,即减少了热词词库中的热词,然后根据候选热词和音频信息进行转译处理,得到相应的文本信息,最终将候选热词与文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词,也就是说,由于减少了热词词库中的热词,在提高语音识别的准确率的同时,相应的,减少了进行热词匹配的时间,从而提高了热词的识别效率,进而也提高了语音的识别效率。
如图3所示,上述依据所述音频信息的上下文获取所述音频信息中的备选热词的具体实现方式,具体包括如下步骤:
S301:依据所述音频信息,获取所述音频信息的上下文所对应的音频信息,得到第一音频信息。
S302:接收反馈的所述第一音频信息对应的文本信息,并获取所述第一音频信息对应的文本信息中的关键词。
S303:根据所述关键词在预设数据库中查找与所述关键词相关联的词作为所述备选热词,所述预设数据库中存储有所述关键词与所述关键词相关的词的关系列表。
具体的,由于一段对话的每一句并不是独立存在的,是有连续性的,例如:用户上一句说的是一个电影的名字,那么可以考虑将该电影中的主演的名字、电影类型作为备选热词,这些备选热词构成备选热词集。
具体实现方式可以通过现有技术中的转译程序获取每一句话的关键词,再通过在互联网上爬取与关键词相关度高的词,然后将爬取的与关键词相关度高的词作为备选热词,这些备选热词构成备选热词集存储在预设数据库中。因此,上述依据所述音频信息的上下文获取所述音频信息中的备选热词可以先获取对话的关键词,然后根据关键词查找预设数据库中存储的备选热词,从而得到备选热词集。
本申请实施例通过上下文获取所述音频信息中的备选热词,以上下文作为依靠,音频信息所对应的对话中有默认的语境,在对用户对话识别时,会存在一部分的默认信息,因此,将这些默认信息获取出来作为备选热词,涵盖了较为多的热词。
如图4所示,上述依据所述音频信息的声纹图谱获取所述音频信息中的备选热词的具体实现方式,具体包括如下步骤:
S401:依据所述音频信息,获取所述音频信息的声纹图谱。
S402:根据所述声纹图谱的声纹ID从预设声纹数据库中查找与所述声纹ID对应的关键词列表,所述预设声纹数据库中存储有声纹ID与关键词列表的对应关系。
S403:将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
由于任何两个用户的声纹图谱是具有差异性的,然而一个人在一段时间内的声纹图谱是不会变化的,因此,可以通过声纹ID绑定一系列的关键词作为备选热词,比如:声纹1对应的用户特别喜欢体育话题,则可以确认为热词,并在备选热词集中加入部分体育类的关键词。
具体实现方式可以在预设声纹数据库中维护声纹ID与关键词列表的对应关系,现有技术中的转译程序可以反馈某段音频信息对应声纹ID以及转译出来的文字,获取音频信息中的关键词放入数据库中,若出现相同的关键词,则增加该关键词的权重,通过声纹ID可以获取权重高的关键词列表,以确定的关键词列表作为音频信息对应的备选热词。
本申请实施例通过音频信息的声纹图谱获取所述音频信息中的备选热词,需要预先维护一个声纹ID和热词列表的数据库,以声纹图谱中的声纹ID绑定一系列的关键词作为备选热词,在获取声纹图谱时,会存在一部分与声纹ID对应的关键词,因此,将这些关键词获取出来作为备选热词,进一步涵盖了较为多的热词。
如图5所示,上述依据用户设备上的认证信息获取所述音频信息中的备选热词的具体实现方式,具体包括如下步骤:
S501:依据所述音频信息,获取所述音频信息的设备ID。
S502:根据所述设备ID从预设数据库中查找与所述设备ID对应的关键词列表,所述预设数据库中存储有所述设备ID与关键词列表的对应关系。
S503:将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
用户使用的平台要求不同设备,如:智能电视、智能音频、PAD等智能家居,每个设备对应不同的设备ID,用来对不同的设备进行区分。因此,可以通过给声音收集装置设置统一的编号,通过编号关联一系列的热词作为备选热词。
本申请实施例通过用户设备上的认证信息获取所述音频信息中的备选热词,需要预先维护一个设备ID和热词列表的数据库,以用户设备上的认证信息绑定一系列的关键词作为备选热词,在用户设备上的认证信息时,会存在一部分与设备ID对应的关键词,因此,将这些关键词获取出来作为备选热词,进一步涵盖了较为多的热词。
本申请在获取音频信息中的备选热词后,先调用预设打分模型对备选热词进行打分过滤,也就是说,需要预先对备选热词进行预处理,从备选热词中筛选出候选热词,从而减少热词词库中的热词。
如图6所示,上述调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表的具体实现方式,具体包括如下步骤:
S601:将所述备选热词集中的各个备选热词逐一输入预设打分计算公式,计算各个所述备选热词对应的分数值。
需要说明的是,预设打分计算公式是可以自我纠正的,将现有的信息包括但不限于,用户上一句话的内容,用户的声纹,设备信息等多种信息x,理论上模型考虑的因素越多,预测的越准确。
上述预设打分计算公式为
Figure BDA0002291453040000101
其中,x1~xn为备选热词集中各个备选热词,w1~wn为备选热词集中各个备选热词对应的权重。
本申请实施例中,假设现在有三个影响因素:1为上一句话的内容、2为声纹、3为设备信息,暂将这三个的权重分别对应设置为w1=4,w2=2,w3=1,具体的,若一句话中的候选热词及权重x1=3,x2=2,x3=1,声纹的候选热词及权重为x2=1,x4=3,x5=2,设备信息的候选热词及权重为x3=1,x6=1,由此可知,针对热词x2的打分即为(x2*w1+w2*x2)/(w1+w2+w1)=(4*2+2*1)/(4+2+1)≈1.43。
S602:选取各个所述备选热词对应的分数值中满足预设条件的备选热词构建所述音频信息的候选热词表。
由于热词的数量越多匹配识别所需要的时间就越长,因此,需要控制候选热词在一定的数量范围内是有必要的,用户需要在转译的准确率和转译的时间做一个均衡,根据均衡的取舍来舍弃掉评分较低的热词。
可以理解的,可以选取计算得到的分数值中大于或等于预设值的备选热词,构建所述音频信息的候选热词表,也可以先将计算得到分数值从大到小进行排序,选取排序中前N个备选热词,构成所述音频信息的候选热词表。
如果备选热词有200个,即x1~x200,现在确定候选热词的数量设置为100个,通过上述计算各个备选热词对应的分数值对x1~x200进行打分,对打分进行排序,获取打分最高的前一百个备选热词作为候选热词。
具体的,上述预设打分计算公式的纠正过程包括:
依据所述候选热词表中的候选热词与所述文本信息的匹配结果,对所述候选热词所对应的获取方式进行命中率打分,得到命中率打分结果。按照所述命中率打分结果调整所述候选热词所对应的获取方式相对应的权重。根据所述权重对所述预设打分计算公式进行修正。
在本申请实施例中,若转译的结果中出现的候选的热词表示为命中(1分),如果输入的音频数据没有热词表示为正常(0分),如果有输入热词但是没有出现在候选热词表中表示为未命中(-1分),增加命中词和未命中词的领域(xi)的对应的权重(wi),减少其他领域得权重。例如:若转译结果中出现了x1,而x1属于上一句话的内容方面w1,则可以适当增加w1的值,如可以将w1变为4.2,那么下次就会有更多的上一句话的内容进入热词列表,从而达到预设打分计算公式调整的目的。
请参阅图7,基于上述实施例公开的一种热词识别方法,本实施例对应公开了一种热词识别装置,具体包括:第一处理单元701、第二处理单元702、第三处理单元703和第四处理单元704,其中:
第一处理单元701,用于接收音频信息,并获取所述音频信息中的备选热词集。
第二处理单元702,用于调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表。
第三处理单元703,用于根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息。
第四处理单元704,用于将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
所述基于对话的热词识别装置包括处理器和存储器,上述第一处理单元、第二处理单元、第三处理单元和第四处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过对备选热词进行预处理,从备选热词筛选出候选热词,即减少了热词词库中的热词,由于减少了热词词库中的热词,在提高语音识别的准确率的同时,相应的,减少了进行热词匹配的时间,从而提高了热词的识别效率,进而也提高了语音的识别效率。
本发明实施例还提供了一种热词识别***,该热词识别***的结构可参考图1所示,在该热词识别***中,包括至少一个终端设备10和文本转译设备20,其中:
所述终端设备10用于接收音频信息,并获取所述音频信息中的备选热词集,调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,将所述音频信息和所述候选热词表发送至所述文本转译设备20。
所述文本转译设备20用于接收所述终端设备10发送的所述音频信息和所述候选热词表,并根据所述音频信息和所述候选热词表对所述音频信息进行转译,得到所述音频信息对应的文本信息,并将所述文本信息反馈至所述终端设备10。
所述终端设备10接收所述音频信息对应的文本信息,并将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
本申请实施例提供一种热词识别***,由于在终端设备对备选热词进行预处理,从备选热词筛选出候选热词,即减少了热词词库中的热词,在进行热词匹配时,在提高语音识别的准确率的同时,相应的,减少了进行热词匹配的时间,从而提高了热词的识别效率,进而也提高了语音的识别效率。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述热词识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述热词识别方法。
本发明实施例提供了一种电子设备,如图8所示,该电子设备80包括至少一个处理器801、以及与所述处理器连接的至少一个存储器802、总线803;其中,所述处理器801、所述存储器802通过所述总线803完成相互间的通信;处理器801用于调用所述存储器802中的程序指令,以执行上述的所述热词识别方法。
本文中的电子设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
接收音频信息,并获取所述音频信息中的备选热词集;
调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表;
根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息;
将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
优选的,所述获取所述音频信息中的备选热词集,具体为:
依据所述音频信息的上下文、所述音频信息的声纹图谱、用户设备上的认证信息中至少一种获取方式获取所述音频信息中的备选热词;
将所述备选热词生成备选热词集。
优选的,所述依据所述音频信息的上下文获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的上下文所对应的音频信息,得到第一音频信息;
接收反馈的所述第一音频信息对应的文本信息,并获取所述第一音频信息对应的文本信息中的关键词;
根据所述关键词在预设数据库中查找与所述关键词相关连的词作为所述备选热词,所述预设数据库中存储有所述关键词与所述关键词相关的词的关系列表。
优选的,所述依据所述音频信息的声纹图谱获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的声纹图谱;
根据所述声纹图谱的声纹ID从预设声纹数据库中查找与所述声纹ID对应的关键词列表,所述预设声纹数据库中存储有声纹ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
优选的,所述依据用户设备上的认证信息获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的设备ID;
根据所述设备ID从预设数据库中查找与所述设备ID对应的关键词列表,所述预设数据库中存储有所述设备ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
优选的,所述调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,具体为:
将所述备选热词集中的各个备选热词逐一输入预设打分计算公式,计算各个所述备选热词对应的分数值,所述预设打分计算公式为
Figure BDA0002291453040000141
其中,x1~xn为备选热词集中各个备选热词,w1~wn为备选热词集中各个备选热词对应的权重;
选取各个所述备选热词对应的分数值中满足预设条件的备选热词构建所述音频信息的候选热词表。
优选的,该方法还包括:
依据所述候选热词表中的候选热词与所述文本信息的匹配结果,对所述候选热词所对应的获取方式进行命中率打分,得到命中率打分结果;
按照所述命中率打分结果调整所述候选热词所对应的获取方式相对应的权重;
根据所述权重对所述预设打分计算公式进行修正。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种热词识别方法,其特征在于,包括:
接收音频信息,并获取所述音频信息中的备选热词集;
调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表;
根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息;
将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
2.根据权利要求1所述的方法,其特征在于,所述获取所述音频信息中的备选热词集,具体为:
依据所述音频信息的上下文、所述音频信息的声纹图谱、用户设备上的认证信息中至少一种获取方式获取所述音频信息中的备选热词;
将所述备选热词生成备选热词集。
3.根据权利要求2所述的方法,其特征在于,所述依据所述音频信息的上下文获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的上下文所对应的音频信息,得到第一音频信息;
接收反馈的所述第一音频信息对应的文本信息,并获取所述第一音频信息对应的文本信息中的关键词;
根据所述关键词在预设数据库中查找与所述关键词相关连的词作为所述备选热词,所述预设数据库中存储有所述关键词与所述关键词相关的词的关系列表。
4.根据权利要求2所述的方法,其特征在于,所述依据所述音频信息的声纹图谱获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的声纹图谱;
根据所述声纹图谱的声纹ID从预设声纹数据库中查找与所述声纹ID对应的关键词列表,所述预设声纹数据库中存储有声纹ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
5.根据权利要求2所述的方法,其特征在于,所述依据用户设备上的认证信息获取所述音频信息中的备选热词,具体为:
依据所述音频信息,获取所述音频信息的设备ID;
根据所述设备ID从预设数据库中查找与所述设备ID对应的关键词列表,所述预设数据库中存储有所述设备ID与关键词列表的对应关系;
将所述关键词列表中的关键词作为所述音频信息对应的备选热词。
6.根据权利要求1所述的方法,其特征在于,所述调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,具体为:
将所述备选热词集中的各个备选热词逐一输入预设打分计算公式,计算各个所述备选热词对应的分数值,所述预设打分计算公式为
Figure FDA0002291453030000021
其中,x1~xn为备选热词集中各个备选热词,w1~wn为备选热词集中各个备选热词对应的权重;
选取各个所述备选热词对应的分数值中满足预设条件的备选热词构建所述音频信息的候选热词表。
7.根据权利要求6所述的方法,其特征在于,还包括:
依据所述候选热词表中的候选热词与所述文本信息的匹配结果,对所述候选热词所对应的获取方式进行命中率打分,得到命中率打分结果;
按照所述命中率打分结果调整所述候选热词所对应的获取方式相对应的权重;
根据所述权重对所述预设打分计算公式进行修正。
8.一种热词识别装置,其特征在于,包括:
第一处理单元,用于接收音频信息,并获取所述音频信息中的备选热词集;
第二处理单元,用于调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表;
第三处理单元,用于根据所述音频信息和所述候选热词表进行转译处理,得到所述音频信息对应的文本信息;
第四处理单元,用于将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
9.一种热词识别***,其特征在于,包括:至少一个终端设备和文本转译设备,其中:
所述终端设备用于接收音频信息,并获取所述音频信息中的备选热词集,调用预设打分模型对所述备选热词集中的备选热词进行打分过滤,确定所述音频信息的候选热词表,将所述音频信息和所述候选热词表发送至所述文本转译设备;
所述文本转译设备用于接收所述终端设备发送的所述音频信息和所述候选热词表,并根据所述音频信息和所述候选热词表对所述音频信息进行转译,得到所述音频信息对应的文本信息,并将所述文本信息反馈至所述终端设备;
所述终端设备接收所述音频信息对应的文本信息,并将所述候选热词表中的候选热词与所述文本信息进行匹配,并将存在于所述文本信息中的所述候选热词确定为所述音频信息中包含的热词。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行如权利要求1至7中任一项所述的热词识别方法。
11.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至7中任一项所述的热词识别方法。
CN201911181751.7A 2019-11-27 2019-11-27 一种热词识别方法、装置及*** Pending CN110879839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911181751.7A CN110879839A (zh) 2019-11-27 2019-11-27 一种热词识别方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911181751.7A CN110879839A (zh) 2019-11-27 2019-11-27 一种热词识别方法、装置及***

Publications (1)

Publication Number Publication Date
CN110879839A true CN110879839A (zh) 2020-03-13

Family

ID=69729293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911181751.7A Pending CN110879839A (zh) 2019-11-27 2019-11-27 一种热词识别方法、装置及***

Country Status (1)

Country Link
CN (1) CN110879839A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508478A (zh) * 2020-04-08 2020-08-07 北京字节跳动网络技术有限公司 语音识别方法和装置
CN111583909A (zh) * 2020-05-18 2020-08-25 科大讯飞股份有限公司 一种语音识别方法、装置、设备及存储介质
CN111930949A (zh) * 2020-09-11 2020-11-13 腾讯科技(深圳)有限公司 搜索串处理方法、装置、计算机可读介质及电子设备
CN111951793A (zh) * 2020-08-13 2020-11-17 北京声智科技有限公司 唤醒词识别的方法、装置及存储介质
CN112489651A (zh) * 2020-11-30 2021-03-12 科大讯飞股份有限公司 语音识别方法和电子设备、存储装置
CN113450803A (zh) * 2021-06-09 2021-09-28 上海明略人工智能(集团)有限公司 会议录音转写方法、***、计算机设备和可读存储介质
CN113470619A (zh) * 2021-06-30 2021-10-01 北京有竹居网络技术有限公司 语音识别方法、装置、介质及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN107330022A (zh) * 2017-06-21 2017-11-07 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
CN107423444A (zh) * 2017-08-10 2017-12-01 世纪龙信息网络有限责任公司 热词词组提取方法和***
CN107577151A (zh) * 2017-08-25 2018-01-12 谢锋 一种语音识别的方法、装置、设备和存储介质
US20180182390A1 (en) * 2016-12-27 2018-06-28 Google Inc. Contextual hotwords
CN108257601A (zh) * 2017-11-06 2018-07-06 广州市动景计算机科技有限公司 用于语音识别文本的方法、设备、客户端装置及电子设备
CN110415705A (zh) * 2019-08-01 2019-11-05 苏州奇梦者网络科技有限公司 一种热词识别方法、***、装置及存储介质
CN110442855A (zh) * 2019-04-10 2019-11-12 北京捷通华声科技股份有限公司 一种语音分析方法和***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
US20180182390A1 (en) * 2016-12-27 2018-06-28 Google Inc. Contextual hotwords
CN107330022A (zh) * 2017-06-21 2017-11-07 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
CN107423444A (zh) * 2017-08-10 2017-12-01 世纪龙信息网络有限责任公司 热词词组提取方法和***
CN107577151A (zh) * 2017-08-25 2018-01-12 谢锋 一种语音识别的方法、装置、设备和存储介质
CN108257601A (zh) * 2017-11-06 2018-07-06 广州市动景计算机科技有限公司 用于语音识别文本的方法、设备、客户端装置及电子设备
CN110442855A (zh) * 2019-04-10 2019-11-12 北京捷通华声科技股份有限公司 一种语音分析方法和***
CN110415705A (zh) * 2019-08-01 2019-11-05 苏州奇梦者网络科技有限公司 一种热词识别方法、***、装置及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508478A (zh) * 2020-04-08 2020-08-07 北京字节跳动网络技术有限公司 语音识别方法和装置
CN111583909A (zh) * 2020-05-18 2020-08-25 科大讯飞股份有限公司 一种语音识别方法、装置、设备及存储介质
CN111583909B (zh) * 2020-05-18 2024-04-12 科大讯飞股份有限公司 一种语音识别方法、装置、设备及存储介质
CN111951793A (zh) * 2020-08-13 2020-11-17 北京声智科技有限公司 唤醒词识别的方法、装置及存储介质
CN111930949A (zh) * 2020-09-11 2020-11-13 腾讯科技(深圳)有限公司 搜索串处理方法、装置、计算机可读介质及电子设备
CN112489651A (zh) * 2020-11-30 2021-03-12 科大讯飞股份有限公司 语音识别方法和电子设备、存储装置
CN113450803A (zh) * 2021-06-09 2021-09-28 上海明略人工智能(集团)有限公司 会议录音转写方法、***、计算机设备和可读存储介质
CN113450803B (zh) * 2021-06-09 2024-03-19 上海明略人工智能(集团)有限公司 会议录音转写方法、***、计算机设备和可读存储介质
CN113470619A (zh) * 2021-06-30 2021-10-01 北京有竹居网络技术有限公司 语音识别方法、装置、介质及设备
CN113470619B (zh) * 2021-06-30 2023-08-18 北京有竹居网络技术有限公司 语音识别方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
CN110879839A (zh) 一种热词识别方法、装置及***
JP7150770B2 (ja) 対話方法、装置、コンピュータ可読記憶媒体、及びプログラム
JP2020505643A (ja) 音声認識方法、電子機器、及びコンピュータ記憶媒体
CN111694940A (zh) 一种用户报告的生成方法及终端设备
US20220261545A1 (en) Systems and methods for producing a semantic representation of a document
CN110738061B (zh) 古诗词生成方法、装置、设备及存储介质
US20210151038A1 (en) Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media
CN107368489B (zh) 一种资讯数据处理方法及装置
CN114143479B (zh) 视频摘要的生成方法、装置、设备以及存储介质
CN112650842A (zh) 基于人机交互的客服机器人意图识别方法及相关设备
JP2021096847A (ja) ユーザの発言に基づくマルチメディア推奨
CN106815190B (zh) 一种词语识别方法、装置及服务器
CN109326284A (zh) 语音搜索的方法、装置和存储介质
WO2021051877A1 (zh) 人工智能面试中获取输入文本和相关装置
CN116150306A (zh) 问答机器人的训练方法、问答方法及装置
CN110716767B (zh) 模型组件调用、生成方法、装置和存储介质
CN115858776B (zh) 一种变体文本分类识别方法、***、存储介质和电子设备
CN110276070B (zh) 一种语料处理方法、装置及存储介质
CN107423307A (zh) 一种互联网信息资源的分配方法及装置
CN110825859A (zh) 检索方法、装置、可读存储介质和电子设备
CN109960752A (zh) 应用程序内的查询方法、装置、计算机设备和存储介质
CN116028626A (zh) 文本匹配方法、装置、存储介质以及电子设备
CN114625922A (zh) 一种构建词库的方法、装置、电子设备及存储介质
CN113407815B (zh) 生成场景主题的方法和装置
CN110688472A (zh) 一种自动筛选问题答案的方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200313

RJ01 Rejection of invention patent application after publication