CN115169334A - 意图识别模型训练方法、装置、计算机设备及存储介质 - Google Patents

意图识别模型训练方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115169334A
CN115169334A CN202210920972.7A CN202210920972A CN115169334A CN 115169334 A CN115169334 A CN 115169334A CN 202210920972 A CN202210920972 A CN 202210920972A CN 115169334 A CN115169334 A CN 115169334A
Authority
CN
China
Prior art keywords
intention
preset
categories
target
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210920972.7A
Other languages
English (en)
Inventor
孙梓淇
张智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202210920972.7A priority Critical patent/CN115169334A/zh
Publication of CN115169334A publication Critical patent/CN115169334A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种意图识别模型训练方法、装置、计算机设备及存储介质,该方法包括:将样本文本输入至意图识别模型,得到N个意图概率值;根据实际意图类别确定N个预设意图类别中的K个目标意图类别和N‑K个非目标意图类别;根据K个目标意图类别、N‑K个非目标意图类别和预设的概率阈值计算损失函数,根据损失函数调整意图识别模型的参数,直至损失函数收敛;计算预设的概率阈值的准确率并判断是否满足预设条件,若准确率满足预设条件,输出参数更新后的意图识别模型。可通过网络模型提高意图识别的速度和效率,降低人力成本和时间成本,可通过调整意图识别模型的参数以及判断预设的概率阈值的准确率是否满足预设条件来提升意图识别模型的准确率。

Description

意图识别模型训练方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种意图识别模型训练方法、装置、计算机设备及存储介质。
背景技术
与客户的交流沟通始终占据着业务的一席之地,在交流沟通过程中,及时、准确地针对客户的回复识别出客户的意图是十分重要的。大型企业由于业务***十分复杂,业务***包含大量业务场景,每个业务场景包含多种备选意图,且每个客户的回复内容中包含多种意图。传统的深度学习模型根据预设的概率阈值进行意图识别,无法在大量意图中准确识别出客户的多种意图,使得现有技术方法所构建的多目标意图识别模型的识别准确率较低,影响业务员对客户意图进行及时正确地响应和服务。
发明内容
本发明实施例提供一种意图识别模型训练方法、装置、计算机设备及存储介质,以解决多目标意图识别模型的识别准确率较低的问题。
一种意图识别模型训练方法,包括:
获取待识别意图的样本文本,将所述样本文本输入至意图识别模型,得到所述样本文本属于N个预设意图类别的N个意图概率值,其中,所述样本文本包括客户的回复文本,所述预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
获取所述样本文本的实际意图类别,根据所述实际意图类别确定所述N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,所述实际意图类别包括所述预设意图类别中的K个,K为大于1的整数,K≤N;
根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,根据所述损失函数调整所述意图识别模型的参数,直至所述损失函数收敛;
确定大于所述预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据所述预测目标意图类别和所述实际意图类别计算所述预设的概率阈值的准确率;
判断所述准确率是否满足预设条件,若所述准确率满足预设条件,输出参数更新后的意图识别模型。
一种意图识别模型训练装置,包括:
概率值确定模型,用于获取待识别意图的样本文本,将所述样本文本输入至意图识别模型,得到所述样本文本属于N个预设意图类别的N个意图概率值,其中,所述样本文本包括客户的回复文本,所述预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
目标意图类别确定模块,用于获取所述样本文本的实际意图类别,根据所述实际意图类别确定所述N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,所述实际意图类别包括所述预设意图类别中的K个,K为大于1的整数,K≤N;
参数调整模块,用于根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,根据所述损失函数调整所述意图识别模型的参数,直至所述损失函数收敛;
样本文本信息计算模块,用于确定大于所述预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据所述预测目标意图类别和所述实际意图类别计算所述预设的概率阈值的准确率;
意图识别模型确定模块,用于判断所述准确率是否满足预设条件,若所述准确率满足预设条件,输出参数更新后的意图识别模型。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述意图识别模型训练方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述意图识别模型训练方法。
上述意图识别模型训练方法、装置、计算机设备及存储介质,将样本文本输入至意图识别模型,得到样本文本属于N个预设意图类别的N个意图概率值,通过网络模型提高意图识别的速度和效率,降低意图识别的人力成本和时间成本;根据实际意图类别确定N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别;根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,根据损失函数调整意图识别模型的参数,直至损失函数收敛,基于实际意图类别调整意图识别模型的参数,以提升意图识别模型的准确率;计算预设的概率阈值的准确率;判断准确率是否满足预设条件,若准确率满足预设条件,输出参数更新后的意图识别模型,进一步通过判断预设的概率阈值的准确率是否满足预设条件来保障意图识别模型的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中意图识别模型训练方法的一应用环境示意图;
图2是本发明一实施例中意图识别模型训练方法的一流程图;
图3是本发明一实施例中意图识别模型训练方法的另一流程图;
图4是本发明一实施例中意图识别模型训练方法的另一流程图;
图5是本发明一实施例中意图识别模型训练方法的另一流程图;
图6是本发明一实施例中意图识别模型训练方法的另一流程图;
图7是本发明一实施例中意图识别模型训练方法的另一流程图;
图8是本发明一实施例中意图识别模型训练方法的另一流程图;
图9是本发明一实施例中意图识别模型训练装置的一示意图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的意图识别模型训练方法,该意图识别模型训练方法可应用如图1所示的应用环境中。具体地,该意图识别模型训练方法应用在意图识别处理***中,该意图识别处理***包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,可基于标准意图识别代码,实现对客户的回复文本进行快速意图识别,有助于提高对客户意图的识别准确率,保障业务员可以及时准确地对客户的意图进行响应和服务,满足业务需求。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种意图识别模型训练方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S201:获取待识别意图的样本文本,将样本文本输入至意图识别模型,得到样本文本属于N个预设意图类别的N个意图概率值,其中,样本文本包括客户的回复文本,预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
S202:获取样本文本的实际意图类别,根据实际意图类别确定N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,实际意图类别包括预设意图类别中的K个,K为大于1的整数,K≤N;
S203:根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,根据损失函数调整意图识别模型的参数,直至损失函数收敛;
S204:确定大于预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据预测目标意图类别和实际意图类别计算预设的概率阈值的准确率;
S205:判断准确率是否满足预设条件,若准确率满足预设条件,输出参数更新后的意图识别模型。
其中,待识别意图的样本文本包括客户的回复文本,客户的回复文本可以从业务员与客户的多种沟通方式中获得,例如,在业务员与客户的电话沟通中,通过获取客户的回复语音,并根据语音识别技术将回复语音转变为相应的回复文本;在业务员与客户的文字沟通中,可直接获取客户的回复文本。意图类别表示客户在与业务员的沟通过程中可能出现的与业务相关的意图,且业务领域不同时,对应的意图类别也存在不同,例如,在保险业务领域,意图类别包括退保、续保、出险、进度、产品咨询、流程咨询。
作为一示例,步骤S201中,在业务员与客户的沟通过程中获取待识别意图的样本文本后,将样本文本输入至意图识别模型,得到样本文本属于N个预设意图类别的N个意图概率值。其中,N为大于1的整数,N个预设意图类别为退保、续保、出险、进度、产品咨询、流程咨询中的N个意图类别,具体选用哪几种意图类别可根据实际情况进行确定,并根据意图识别模型输出N个意图概率值,用来表示该客户在沟通过程中具备对应N个预设意图类别的可能性。
作为一示例,步骤S202中,对于意图识别模型训练中的样本文本,首先获取样本文本的实际意图类别,并将该样本文本的实际意图类别数量记为K,其中,在保险业务领域,实际意图是客户在样本文本中表现出的真实意图,可由业务员人工判断和确定,实际意图类别包括N个预设意图类别中的K个意图类别,则对于N个预设意图类别,将其中属于对应实际意图类别的K个预设意图类别记为K个目标意图类别,并将其中不属于对应实际意图类别的N-K个预设意图类别记为N-K个非目标意图类别,从而根据样本文本的实际意图类别确定N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别。
其中,K为大于1的整数,K≤N,不同样本文本对应的实际意图类别的数量和类别均不一致,因此,不同样本文本的数值K不一致,K个目标意图类别和N-K个非目标意图类别也不一致。
作为一示例,步骤S203中,为了提升意图识别模型的识别准确率,根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数时,具体地,可以计算K个目标意图类别对应的K个意图概率值、N-K个非目标意图类别对应的N-K个意图概率值与预设的概率阈值之间的差异,并希望使得每个目标意图类别对应的意图概率值均大于每个非目标意图类别对应的意图概率值,来保证该意图识别模型的识别准确率,并根据损失函数调整意图识别模型的参数,直至损失函数收敛,以逐步提升意图识别模型的识别准确率。
其中,预设的概率阈值为根据实际情况预先设定的,对于意图识别模型输出的N个意图概率值,在确定样本文本的预测目标意图类别时,可以将大于预设的概率阈值的意图概率值对应的预设意图类别作为该样本文本的预测目标意图类别,将不大于预设的概率阈值的意图概率值对应的预设意图类别作为该样本文本的预测非目标意图类别,因此,在意图识别模型的训练过程中,通过计算K个目标意图类别对应的K个意图概率值与预设的概率阈值之间的差异,结合预设的概率阈值与N-K个非目标意图类别对应的N-K个意图概率值之间的差异,来表征N个意图概率值的准确率,并根据损失函数调整意图识别模型的参数,直至损失函数收敛,通过使得每个目标意图类别对应的意图概率值均大于每个非目标意图类别对应的意图概率值,来逐步提升意图识别模型的识别准确率。
作为一示例,步骤S204中,对于意图识别模型输出的N个意图概率值,当意图概率值大于预设的概率阈值时,该意图概率值对应的预设意图类别可以看作是样本文本的预测目标意图类别。本示例中,根据预测目标意图类别和实际意图类别可以计算预设的概率阈值的准确率,且在实际意图类别确定的情况下,预测目标意图类别与实际意图类别一致的数量越多,表示根据对应预设的概率阈值确定的预测目标意图类别的准确率越高,表示使用该预设的概率阈值的意图识别模型的识别准确率越高,因此,通过预测目标意图类别和实际意图类别计算预设的概率阈值对应的准确率,以提升意图识别模型的识别准确率。
作为一示例,步骤S205中,首先判断准确率是否满足预设条件,若准确率满足预设条件,表明使用对应预设的概率阈值的意图识别模型的识别准确率较高,不需要再通过调整预设的概率阈值的数值来优化该意图识别模型,则可输出参数更新后的意图识别模型,作为训练好的意图识别模型,用于识别待意图识别的文本,以使得业务员可以及时准确地响应该客户的意图,提高业务效率。本示例中,预设条件可以根据实际情况进行设定,例如,预设条件是准确率阈值,当准确率不小于准确率阈值时,判定准确率满足预设条件,则可得到训练好的意图识别模型。
本实施例所提供的意图识别模型训练方法中,将样本文本输入至意图识别模型,得到样本文本属于N个预设意图类别的N个意图概率值,通过网络模型提高意图识别的速度和效率,降低意图识别的人力成本和时间成本;根据实际意图类别确定N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别;根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,根据损失函数调整意图识别模型的参数,直至损失函数收敛,基于实际意图类别调整意图识别模型的参数,以提升意图识别模型的准确率;计算预设的概率阈值的准确率;判断准确率是否满足预设条件,若准确率满足预设条件,输出参数更新后的意图识别模型,进一步通过判断预设的概率阈值的准确率是否满足预设条件来保障意图识别模型的准确率。
在一实施例中,如图3所示,意图识别模型包括编码器和全连接层,以待识别意图的样本文本为训练样本,以实际意图类别作为训练标签;
意图识别模型的训练过程包括:
S301:将样本文本输入至编码器进行特征提取,得到样本文本特征;
S302:将样本文本特征输入至全连接层进行特征映射,得到样本文本属于N个预设意图类别的N个意图概率值。
本示例中,训练样本为大量的待识别意图的样本文本,训练标签为样本文本的K个实际意图类别,实际意图类别用于对得到的N个意图概率值进行评价,使得可以根据评价结果对该意图识别模型进行训练,以得到训练好的意图识别模型。
作为一示例,步骤S301中,在意图识别模型的训练过程中,将样本文本输入至编码器进行特征提取,得到样本文本特征,该样本文本特征用于表征样本文本的意图特征。
作为一示例,步骤S302中,将样本文本特征输入至全连接层进行特征映射,特征映射结果通过归一化指数函数进行归一化处理,归一化处理结果即为样本文本属于N个预设意图类别的N个意图概率值。
本实施例所提供的意图识别模型训练方法中,意图识别模型包括编码器和解码器,以待识别意图的样本文本为训练样本,以实际意图类别作为训练标签,对意图识别模型进行训练,可以有效提升该对意图识别模型的识别准确率。
在一实施例中,如图4所示,步骤S203,即根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,包括:
S401:将迭代次数初始化为0,利用预设的概率阈值进行第一轮模型训练,第一轮模型训练完成后得到更新的概率阈值;
S402:将迭代次数加1,利用更新的概率阈值进行第二轮模型训练,第二轮模型训练完成后得到再次更新的概率阈值;
S403:以此类推,直至某次更新的概率阈值满足预设条件,输出训练好的意图识别模型。
其中,在意图识别模型的训练过程中,根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算的损失函数,可用来对意图识别模型的参数进行调整,其中,预设的概率阈值用于区分目标意图类别和非目标意图类别,并可以在损失函数的计算中用于衡量目标意图类别和非目标意图类别对应的意识概率值之间的差异,在意图识别模型的训练过程中,需要对预设的概率阈值进行训练优化,以提升意图识别模型的识别准确率,得到训练好的意图识别模型。
作为一示例,步骤S401中,在意图识别模型的训练过程中,首先将迭代次数初始化为0,利用预设的概率阈值进行第一轮模型训练,并在第一轮模型训练完成后得到更新的概率阈值。
其中,预设的概率阈值可根据实际情况进行设定,本实例中,预设的概率阈值为0.5。
作为一示例,步骤S402中,在完成了对意图识别模型的第一轮模型训练后,得到了更新的概率阈值,将迭代次数加1,此时迭代次数由0变为1,利用更新的概率阈值进行第二轮模型训练,并在第二轮模型训练完成后得到再次更新的概率阈值。
作为一示例,步骤S403中,在完成了对意图识别模型的第二轮模型训练后,再次得到了更新的概率阈值,以此类推,利用更新的概率阈值进行多轮模型训,不断得到更新的概率阈值,直至某次更新的概率阈值满足预设条件,则可结束对意图识别模型的训练,输出训练好的意图识别模型。
其中,当更新的概率阈值对应的准确率和满足预设条件,即可结束对意图识别模型的训练。
本实施例所提供的意图识别模型训练方法中,迭代次数初始化为0时,利用预设的概率阈值进行第一轮模型训练,得到更新的概率阈值,并将迭代次数加1,利用更新的概率阈值进行第二轮模型训练,得到再次更新的概率阈值,以此类推,直至某次更新的概率阈值满足预设条件,输出训练好的意图识别模型,通过对预设的概率阈值进行调整优化,可以提升目标意图类别和非目标意图类别的划分准确率,从而不断提升意图识别模型的识别准确率。
在一实施例中,如图5所示,步骤S203,即根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,包括:
S501:将K个目标意图类别对应的K个意图概率值作为目标意图概率值,将N-K个非目标意图类别对应的N-K个意图概率值作为非目标意图概率值;
S502:根据K个目标意图概率值、N-K个非目标意图概率值和预设的概率阈值计算损失函数,损失函数Loss为:
Figure BDA0003777567950000111
式中,p0为预设的概率阈值,K为目标意图概率值的数量,N-K为非目标意图概率值的数量,pi为第i个目标意图概率值,pj为第j个非目标意图概率值。
其中,根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算的损失函数,希望使得每个目标意图类别对应的意图概率值均大于每个非目标意图类别对应的意图概率值,来保障该意图识别模型的识别准确率。
作为一示例,步骤S501中,将K个目标意图类别对应的K个意图概率值作为目标意图概率值,将N-K个非目标意图类别对应的N-K个意图概率值作为非目标意图概率值。
作为一示例,步骤S502中,由于希望每个目标意图类别对应的意图概率值均大于每个非目标意图类别对应的意图概率值,因此,以预设的概率阈值作为中间标尺,根据K个目标意图概率值大于预设的概率阈值的程度,结合预设的概率阈值大于N-K个非目标意图概率值的程度,得到该意图识别模型的损失函数,记为Loss,则损失函数Loss为:
Figure BDA0003777567950000121
式中,p0为预设的概率阈值,K为目标意图概率值的数量,N-K为非目标意图概率值的数量,pi为第i个目标意图概率值,pj为第j个非目标意图概率值。
则可根据损失函数调整意图识别模型的参数,直至损失函数收敛,完成模型参数的调整,以提升该意图识别模型的识别准确率。
本实施例所提供的意图识别模型训练方法中,首先确定K个目标意图概率值和N-K个非目标意图概率值,并根据K个目标意图概率值、N-K个非目标意图概率值和预设的概率阈值计算损失函数,以损失函数为基础对意图识别模型的参数进行调整,大大提升了意图识别模型的识别准确率。
在一实施例中,如图6所示,步骤S204,即根据目标意图类别和实际意图类别计算预设的概率阈值的准确率,包括:
S601:根据实际意图类别确定预测目标意图类别中的正确类别数量;
S602:计算正确类别数量与目标意图类别的总数量的比值,将比值作为准确率。
作为一示例,步骤S601中,首先对实际意图类别和预测目标意图类别进行类别比较,确定预测目标意图类别中的正确类别数量,且正确类别数量越多,预设的概率阈值的准确率越高。
作为一示例,步骤S602中,计算正确类别数量与实际意图类别的总数量的比值,将比值作为准确率,该准确率用来表征根据预设的概率阈值确定的目标意图类别中的正确类别含量,准确率越高,表明使用该预设的概率阈值的意图识别模型的识别准确率越高。
作为一示例,步骤S602中,计算正确类别数量与预设意图类别的总数量的比值,将比值作为准确率,该准确率用来表征根据预设的概率阈值确定的目标意图类别中的正确类别含量,准确率越高,表明使用该预设的概率阈值的意图识别模型的识别准确率越高。
本实施例所提供的意图识别模型训练方法中,根据实际意图类别确定预测目标意图类别中的正确类别数量;计算正确类别数量与目标意图类别的总数量的比值,将比值作为准确率,根据准确率表示使用对应预设的概率阈值的意图识别模型的识别准确率,提高意图识别模型的训练灵活性和多样性。
在一实施例中,如图7所示,步骤S602,即判断准确率是否满足预设条件,包括:
S701:若准确率不小于预设的准确率阈值,则判定准确率满足预设条件;
S702:若准确率小于预设的准确率阈值,则判定准确率不满足预设条件。
其中,准确率阈值可根据实际情况进行预设,本实施例中根据实际情况预设准确率阈值为0.8。
作为一示例,步骤S701中,若准确率不小于预设的准确率阈值,表征根据预设的概率阈值确定的目标意图类别中的正确类别含量较高,表明使用该预设的概率阈值的意图识别模型的识别准确率越高,则判定准确率满足预设条件。
作为一示例,步骤S702中,若准确率小于预设的准确率阈值,表征根据预设的概率阈值确定的目标意图类别中的正确类别含量较低,表明使用该预设的概率阈值的意图识别模型的识别准确率越低,则判定准确率不满足预设条件。
本实施例所提供的意图识别模型训练方法中,若准确率不小于预设的准确率阈值,则判定准确率满足预设条件;若准确率小于预设的准确率阈值,则判定准确率不满足预设条件,通过表征目标意图类别中的正确类别含量来表明意图识别模型的识别准确率,大大提高了意图识别模型的训练灵活性和多样性。
在一实施例中,如图8所示,步骤S702中,即若准确率小于预设的准确率阈值,则判定准确率不满足预设条件,包括:
S801:若准确率不满足预设条件,采用随机游走策略调整预设的概率阈值;
S802:根据调整后的预设的概率阈值重新计算准确率,直至准确率满足预设条件,确定调整后的预设的概率阈值对应的意图识别模型为训练好的意图识别模型。
其中,预设的概率阈值用来根据N个意图概率值从N个预设意图类别中确定出预测目标意图类别,当预设的概率阈值改变时,预测目标意图类别随之改变,因此,当准确率不满足预设条件时,可通过调节预设的概率阈值的数值,改变预测目标意图类别,从而提升预设的概率阈值对应的准确率。
作为一示例,步骤S801中,若准确率不满足预设条件,则采用随机游走策略调整意图识别模型中的预设的概率阈值,其中,随机游走策略可以是指对预设的概率阈值的增加和减少进行随机采样,增加和减少的步长为预设值,例如0.1,在本示例中,增加预设的概率阈值的概率和减少预设的概率阈值的概率均设置为0.5。
作为一示例,步骤S802中,根据调整后的预设的概率阈值重新确定预测目标意图类别,并重新计算准确率,直至准确率满足预设条件,从而确定调整后的预设的概率阈值对应的意图识别模型为训练好的意图识别模型,据此来大幅提升该意图识别模型的识别准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种意图识别模型训练装置,该意图识别模型训练装置与上述实施例中意图识别模型训练方法一一对应。如图9所示,该意图识别模型训练装置包括概率值确定模型901、目标意图类别确定模块902、参数调整模块903、样本文本信息计算模块904和意图识别模型确定模块905。各功能模块详细说明如下:
概率值确定模型901,用于获取待识别意图的样本文本,将样本文本输入至意图识别模型,得到样本文本属于N个预设意图类别的N个意图概率值,其中,样本文本包括客户的回复文本,预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
目标意图类别确定模块902,用于获取样本文本的实际意图类别,根据实际意图类别确定N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,实际意图类别包括预设意图类别中的K个,K为大于1的整数,K≤N;
参数调整模块903,用于根据K个目标意图类别、N-K个非目标意图类别和预设的概率阈值计算损失函数,根据损失函数调整意图识别模型的参数,直至损失函数收敛;
样本文本信息计算模块904,用于确定大于预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据预测目标意图类别和实际意图类别计算预设的概率阈值的准确率;
意图识别模型确定模块905,用于判断准确率是否满足预设条件,若准确率满足预设条件,输出参数更新后的意图识别模型。
在一实施例中,概率值确定模型901,包括:
样本文本特征提取子模块,用于将样本文本输入至编码器进行特征提取,得到样本文本特征;
意图概率值确定子模块,用于将样本文本特征输入至全连接层进行特征映射,得到样本文本属于N个预设意图类别的N个意图概率值。
在一实施例中,参数调整模块903,包括:
第一模型训练子模块,用于将迭代次数初始化为0,利用预设的概率阈值进行第一轮模型训练,第一轮模型训练完成后得到更新的概率阈值;
第二模型训练子模块,用于将迭代次数加1,利用更新的概率阈值进行第二轮模型训练,第二轮模型训练完成后得到再次更新的概率阈值;
第三模型训练子模块,用于以此类推,直至某次更新的概率阈值满足预设条件,输出训练好的意图识别模型。
在一实施例中,参数调整模块903,包括:
意图概率值划分子模块,用于将K个目标意图类别对应的K个意图概率值作为目标意图概率值,将N-K个非目标意图类别对应的N-K个意图概率值作为非目标意图概率值;
损失函数确定子模块,用于根据K个目标意图概率值、N-K个非目标意图概率值和概率阈值计算损失函数,损失函数Loss为:
Figure BDA0003777567950000171
式中,p0为概率阈值,K为目标意图概率值的数量,N-K为非目标意图概率值的数量,pi为第i个目标意图概率值,pj为第j个非目标意图概率值。
在一实施例中,样本文本信息计算模块904,包括:
正确类别数量确定子模块,用于根据实际意图类别确定预测目标意图类别中的正确类别数量;
准确率计算子模块,用于计算正确类别数量与目标意图类别的总数量的比值,将比值作为准确率。
在一实施例中,准确率计算子模块,包括:
第一准确率比较单元,用于若准确率不小于预设的准确率阈值,则判定准确率满足预设条件;
第二准确率比较单元,用于若准确率小于预设的准确率阈值,则判定准确率不满足预设条件。
在一实施例中,第二准确率比较单元,包括:
第一概率阈值调整子单元,用于若准确率不满足预设条件,采用随机游走策略调整预设的概率阈值;
第二概率阈值调整子单元,用于根据调整后的预设的概率阈值重新计算准确率,直至准确率满足预设条件,确定调整后的预设的概率阈值对应的意图识别模型为训练好的意图识别模型。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于意图识别模型训练方法过程中形成的数据库。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种意图识别模型训练方法。
在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中意图识别模型训练方法,例如图2所示S201-S205,或者图3至图8中所示,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现意图识别模型训练装置这一实施例中的各模块/单元的功能,例如图9所示的概率值确定模型901、目标意图类别确定模块902、参数调整模块903、样本文本信息计算模块904和意图识别模型确定模块905的功能,为避免重复,这里不再赘述。
在一实施例中,提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中意图识别模型训练方法,例如图2所示S201-S205,或者图3至图8中所示,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述意图识别模型训练方法这一实施例中的各模块/单元的功能,例如图9所示的概率值确定模型901、目标意图类别确定模块902、参数调整模块903、样本文本信息计算模块904和意图识别模型确定模块905的功能,为避免重复,这里不再赘述。所述计算机可读存储介质可以是非易失性,也可以是易失性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种意图识别模型训练方法,其特征在于,包括:
获取待识别意图的样本文本,将所述样本文本输入至意图识别模型,得到所述样本文本属于N个预设意图类别的N个意图概率值,其中,所述样本文本包括客户的回复文本,所述预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
获取所述样本文本的实际意图类别,根据所述实际意图类别确定所述N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,所述实际意图类别包括所述预设意图类别中的K个,K为大于1的整数,K≤N;
根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,根据所述损失函数调整所述意图识别模型的参数,直至所述损失函数收敛;
确定大于所述预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据所述预测目标意图类别和所述实际意图类别计算所述预设的概率阈值的准确率;
判断所述准确率是否满足预设条件,若所述准确率满足预设条件,输出参数更新后的意图识别模型。
2.如权利要求1所述的意图识别模型训练方法,其特征在于,所述意图识别模型包括编码器和全连接层,以待识别意图的样本文本为训练样本,以实际意图类别作为训练标签;
所述意图识别模型的训练过程包括:
将样本文本输入至所述编码器进行特征提取,得到样本文本特征;
将所述样本文本特征输入至所述全连接层进行特征映射,得到样本文本属于N个预设意图类别的N个意图概率值。
3.如权利要求1所述的意图识别模型训练方法,其特征在于,所述根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,包括:
将迭代次数初始化为0,利用所述预设的概率阈值进行第一轮模型训练,所述第一轮模型训练完成后得到更新的概率阈值;
将迭代次数加1,利用所述更新的概率阈值进行第二轮模型训练,所述第二轮模型训练完成后得到再次更新的概率阈值;
以此类推,直至某次更新的概率阈值满足预设条件,输出训练好的意图识别模型。
4.如权利要求1所述的意图识别模型训练方法,其特征在于,所述根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,包括:
将K个所述目标意图类别对应的K个意图概率值作为目标意图概率值,将N-K个所述非目标意图类别对应的N-K个意图概率值作为非目标意图概率值;
根据K个所述目标意图概率值、N-K个所述非目标意图概率值和所述预设的概率阈值计算损失函数,所述损失函数Loss为:
Figure FDA0003777567940000021
式中,p0为所述预设的概率阈值,K为所述目标意图概率值的数量,N-K为所述非目标意图概率值的数量,pi为第i个目标意图概率值,pj为第j个非目标意图概率值。
5.如权利要求1所述的意图识别模型训练方法,其特征在于,所述根据所述预测目标意图类别和所述实际意图类别计算所述预设的概率阈值的准确率,包括:
根据所述实际意图类别确定所述预测目标意图类别中的正确类别数量;
计算所述正确类别数量与所述实际意图类别的总数量的比值,将所述比值作为所述准确率。
6.如权利要求1所述的意图识别模型训练方法,其特征在于,所述判断所述准确率是否满足预设条件,包括:
若所述准确率不小于预设的准确率阈值,则判定所述准确率满足预设条件;
若所述准确率小于预设的准确率阈值,则判定所述准确率不满足预设条件。
7.如权利要求6所述的意图识别模型训练方法,其特征在于,在若所述准确率小于预设的准确率阈值,则判定所述准确率不满足预设条件之后,包括:
若所述准确率不满足预设条件,采用随机游走策略调整所述预设的概率阈值;
根据调整后的所述预设的概率阈值重新计算所述准确率,直至所述准确率满足预设条件,确定调整后的所述预设的概率阈值对应的意图识别模型为训练好的意图识别模型。
8.一种意图识别模型训练装置,其特征在于,包括:
概率值确定模型,用于获取待识别意图的样本文本,将所述样本文本输入至意图识别模型,得到所述样本文本属于N个预设意图类别的N个意图概率值,其中,所述样本文本包括客户的回复文本,所述预设意图类别包括退保、续保、出险、进度、产品咨询、流程咨询中的N个,N为大于2的整数;
目标意图类别确定模块,用于获取所述样本文本的实际意图类别,根据所述实际意图类别确定所述N个预设意图类别中的K个目标意图类别和N-K个非目标意图类别,所述实际意图类别包括所述预设意图类别中的K个,K为大于1的整数,K≤N;
参数调整模块,用于根据K个所述目标意图类别、N-K个所述非目标意图类别和预设的概率阈值计算损失函数,根据所述损失函数调整所述意图识别模型的参数,直至所述损失函数收敛;
样本文本信息计算模块,用于确定大于所述预设的概率阈值的意图概率值对应的预设意图类别为预测目标意图类别,根据所述预测目标意图类别和所述实际意图类别计算所述预设的概率阈值的准确率;
意图识别模型确定模块,用于判断所述准确率是否满足预设条件,若所述准确率满足预设条件,输出参数更新后的意图识别模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述意图识别模型训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述意图识别模型训练方法。
CN202210920972.7A 2022-08-02 2022-08-02 意图识别模型训练方法、装置、计算机设备及存储介质 Pending CN115169334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210920972.7A CN115169334A (zh) 2022-08-02 2022-08-02 意图识别模型训练方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210920972.7A CN115169334A (zh) 2022-08-02 2022-08-02 意图识别模型训练方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN115169334A true CN115169334A (zh) 2022-10-11

Family

ID=83476867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210920972.7A Pending CN115169334A (zh) 2022-08-02 2022-08-02 意图识别模型训练方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115169334A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116028880A (zh) * 2023-02-07 2023-04-28 支付宝(杭州)信息技术有限公司 训练行为意图识别模型的方法、行为意图识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116028880A (zh) * 2023-02-07 2023-04-28 支付宝(杭州)信息技术有限公司 训练行为意图识别模型的方法、行为意图识别方法及装置

Similar Documents

Publication Publication Date Title
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN109345374B (zh) 风险控制方法、装置、计算机设备和存储介质
CN110413730B (zh) 文本信息匹配度检测方法、装置、计算机设备和存储介质
CN110569500A (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN108520041B (zh) 文本的行业分类方法、***、计算机设备和存储介质
CN110888911A (zh) 样本数据处理方法、装置、计算机设备及存储介质
CN111583911B (zh) 基于标签平滑的语音识别方法、装置、终端及介质
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN113297366B (zh) 多轮对话的情绪识别模型训练方法、装置、设备及介质
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN111611383A (zh) 用户意图的识别方法、装置、计算机设备及存储介质
CN112016318A (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
CN112699923A (zh) 文档分类预测方法、装置、计算机设备及存储介质
CN113886550A (zh) 基于注意力机制的问答匹配方法、装置、设备及存储介质
CN113963205A (zh) 基于特征融合的分类模型训练方法、装置、设备及介质
CN110598210A (zh) 实体识别模型训练、实体识别方法、装置、设备及介质
CN112995414A (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
CN115169334A (zh) 意图识别模型训练方法、装置、计算机设备及存储介质
CN113239697B (zh) 实体识别模型训练方法、装置、计算机设备及存储介质
CN114626524A (zh) 目标业务网络确定方法、业务处理方法及装置
CN114266252A (zh) 命名实体识别方法、装置、设备及存储介质
WO2021217619A1 (zh) 基于标签平滑的语音识别方法、终端及介质
CN112395857A (zh) 基于对话***的语音文本处理方法、装置、设备及介质
CN116523019A (zh) 文本分类模型训练方法、装置、计算机设备及存储介质
CN115374278A (zh) 文本处理模型蒸馏方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination