CN116662555A - 一种请求文本处理方法、装置、电子设备及存储介质 - Google Patents
一种请求文本处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116662555A CN116662555A CN202310935962.5A CN202310935962A CN116662555A CN 116662555 A CN116662555 A CN 116662555A CN 202310935962 A CN202310935962 A CN 202310935962A CN 116662555 A CN116662555 A CN 116662555A
- Authority
- CN
- China
- Prior art keywords
- intention
- probability
- request text
- category
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 5
- 238000013145 classification model Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000011156 evaluation Methods 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 7
- 238000012805 post-processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请提供了一种请求文本处理方法、装置、电子设备及存储介质。该方法包括:获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率;比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;将请求文本在最大概率意图类别的概率与第一置信度、第二置信度进行比较,获得比较结果,其中,第一置信度大于第二置信度;根据比较结果,对用户的语义模糊的请求文本进行处理,以得到语义明确的请求文本,从而提高请求文本意图识别的准确率。
Description
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种请求文本处理方法、装置、电子设备及存储介质。
背景技术
随着智能设备和智能语音助手的普及,用户与这些设备之间的交互变得越来越频繁。在这些交互过程中,准确识别用户输入的自然语言文本中的意图变得至关重要。现有的意图识别技术通常基于文本意图分类和意图槽位填充来实现。文本意图分类旨在将给定的文本划分为预定义的意图类别,其目标是理解文本所传达的意图或目的,以便***可以相应地做出响应或执行相应的操作。槽位填充是指从文本中提取关键信息并将其填充到特定的槽位中。槽位表示了与特定意图相关的参数或变量。通过槽位填充,***可以更好地理解用户的意图和需求,从而提供更准确的响应或执行相应的操作。
然而,文本意图分类在处理清晰、准确的文本时效果较好,但在面对***输入存在部分错误或者模糊的文本时,意图分类模型推理得到的意图标签概率值会降低。
发明内容
有鉴于此,本申请实施例提供了一种请求文本处理方法、装置、电子设备及计算机可读存储介质,以解决现有技术中对请求文本的意图识别的准确率较低的问题。
本申请实施例的第一方面,提供了一种请求文本处理方法,包括:获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中;比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;将请求文本在最大概率意图类别的概率与预设的第一置信度和第二置信度进行比较,获得比较结果,其中,第一置信度大于第二置信度;根据比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。
本申请实施例的第二方面,提供了一种请求文本处理装置,包括:意图分类模块,被配置为获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中;最大概率确定模块,被配置为比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;概率比较模块,被配置为将请求文本在最大概率意图类别的概率与预设的第一置信度和第二置信度进行比较,获得比较结果,其中,第一置信度大于第二置信度;意图执行模块,被配置为根据比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例通过获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率;比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;将请求文本在最大概率意图类别的概率与预设的第一置信度和第二置信度进行比较,获得比较结果;根据比较结果,对用户的请求文本进行处理,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。本申请实施例中针对意图模糊的请求文本,提出了通过语义引导进行交互将原来语义模糊的请求文本修正为语义明确的请求文本,从而得到准确的用户意图,进而执行更贴合用户真实需求的意图响应,带来更人性化的用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例提供的一种请求文本处理方法的流程示意图;
图2是本申请实施例提供的另一种请求文本处理方法的流程示意图;
图3是本申请实施例提供的一种请求文本处理装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
下面将结合附图详细说明根据本申请实施例的一种请求文本处理方法和装置。
图1是本申请实施例提供的一种请求文本处理方法的流程示意图。如图1所示,该请求文本处理方法包括:
S101,获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中,意图分类模型是根据模型训练语料集进行训练得到的;
S102,比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;
S103,将请求文本在最大概率意图类别的概率与第一置信度和第二置信度进行比较,获得比较结果,其中,第一置信度和第二置信度是根据意图分类模型对模型评估语料集进行分类预测获得的,第一置信度大于第二置信度,模型评估语料集和模型训练语料集是通过对获取的文本语料随机划分得到的;
S104,根据比较结果,对用户的请求文本进行处理。
示例性地,根据比较结果,对用户的请求文本进行处理,例如,比较结果包括三种,第一种是请求文本在最大概率意图类别的概率大于等于第一置信度;第二种是请求文本在最大概率意图类别的概率小于第一置信度,且大于等于第二置信度;第三种是请求文本在最大概率意图类别的概率小于第二置信度。当出现第一种情况时,说明请求文本的意图识别是明确的,因此可以直接对请求文本进行意图识别输出;当出现第二种情况时,说明请求文本的意图识别是模糊的,需要对用户进行语义引导,以获取意图识别更明确的请求文本;当出现第三种情况时,说明此时对请求文本进行意图识别极容易出现错误,因此可以拒绝执行请求文本的内容。
具体地,本申请实施例可以应用于分析用户输入的请求文本,并从用户的请求文本中识别出用户的需求和目标的场景中。通过获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中,意图分类模型是根据模型训练语料集进行训练得到的;比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;将请求文本在最大概率意图类别的概率与第一置信度和第二置信度进行比较,获得比较结果,其中,第一置信度和第二置信度是根据意图分类模型对模型评估语料集进行分类预测获得的,第一置信度大于第二置信度,模型评估语料集和模型训练语料集是通过对获取的文本语料随机划分得到的;根据比较结果,对用户的请求文本进行处理,从而提高对用户请求文本的意图识别的准确率。
在步骤S101中,示例性地说明,获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中,意图分类模型是根据模型训练语料集进行训练得到的,例如,用户的请求文本可以通过对用户输入的文本或语音数据进行解析获得。智能设备、智能语音助手等需要通过特定的意图输出协议来实现交互,例如,在智能车载语音对话***中,用户请求“帮我将空调打开”需要意图识别输出“打开空调”的协议。可见,该协议会涉及到意图设备、意图功能、意图操作和意图操作的数值这四个信息,因此意图分类模型主要根据意图设备、意图功能、意图操作和意图操作的具体值这四个信息进行分类,将请求文本进行划分。其中,意图分类模型可以通过获取到的用户的文本语料进行训练得到,进一步地,根据用户的文本语料获得的相应模型训练语料集进行训练得到。在一些实施过程中,该意图分类模型的网络结构可以是TextCNN神经网络模型和线性层和softmax层,bert预训语言模型和线性层和softmax层等。
在步骤S102中,示例性地说明,比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率,例如,根据比较请求文本在各个意图类别中的概率,其中最大的概率对应的意图类别为该请求文本对应的最大概率意图类别,该最大的概率为请求文本在最大概率意图类别的概率,例如,意图类别共有V类,请求文本在这V类中对应的概率分别为、/>、...、/>,如果/>为最大的概率,那么请求文本的最大概率意图类别为/>对应的第V类,也就是说,请求文本的意图类别最有可能为第V类。
在步骤S103中,示例性地说明,将请求文本在最大概率意图类别的概率与第一置信度和第二置信度进行比较,获得比较结果,其中,第一置信度和第二置信度是根据意图分类模型对模型评估语料集进行分类预测获得的,第一置信度大于第二置信度,模型评估语料集和模型训练语料集是通过对获取的文本语料随机划分得到的,例如,文本语料的获取方式包括但不限于:对话***产品设计人员编写,基于常规对话***用户潜在意图操作编写,基于开源对话***语料库清洗获取等,将该文本语料划分为两类:模型评估语料集和模型训练语料集,划分的方式可以是随机划分,例如,可以按各意图类别对应的模型训练语料集:模型评估语料集=7:3的方式切分,并将一些存在部分错误或者模糊的文本语料如“空调温度调高两斗”加入模型评估语料集进行预测,从而通过预测得到的概率获取相应的第一置信度和第二置信度。
在一些实施例中,在将请求文本输入训练完成的意图分类模型中之前,还包括:基于用户与相关设备的交互信息确定用户关于相关设备的意图识别内容;根据意图识别内容,确定意图标签体系,其中,意图标签体系包括意图设备、意图功能、意图操作、意图操作的数值;获取与意图标签体系对应的文本语料,并对文本语料按照预设比例随机进行分类,获得模型训练语料集和模型评估语料集;基于意图标签体系,通过模型训练语料集对初始模型进行分类训练,获得意图分类模型。
具体地,这里交互信息指的是用户与相关设备交互时的语音信息等;意图识别内容指的是意图输出协议,即意图设备、意图功能、意图操作、意图操作的数值。根据该意图识别内容建立意图标签体系,该意图标签体系就包括意图设备、意图功能、意图操作、意图操作的数值,例如,以“打开空调”的意图为例,将意图标签设计为空调-o-打开-o,其中,意图设备=空调,意图功能=o代表意图功能缺省,意图操作=打开,意图操作的数值=o代表意图操作的数值缺省。进一步地,以“调空调风量档位”的意图为例,将意图标签设计为空调-档位-调节-档位的数值。基于该意图标签体系请求相应的文本语料,以得到意图分类模型训练语料与评估语料。
在一些实施例中,在将请求文本在最大概率意图类别的概率与第一置信度、第二置信度进行比较之前,方法还包括:将模型评估语料集输入意图分类模型中,获得模型评估语料集中的各个模型评估语料在各个意图类别中的概率;比较模型评估语料在各个意图类别中的概率,获得各个模型评估语料在最大概率意图类别中的概率;基于各个模型评估语料在最大概率意图类别中的概率,获得第一置信度和第二置信度,其中,第一置信度大于第二置信度。
具体地,例如,假设该意图类别共有V={,/>,…,/>}类,评估语料集为E={/>,/>,…,...,/>},其中/>代表第i个评估样本。基于该意图分类模型得到/>所属的意图类别的概率分布为/>,其中/>代表/>在意图类别/>上的概率,记/>为/>所属最大概率意图类别的概率值,对模型评估语料集均计算该最大概率意图类别的概率值,得到各模型评估语料分类到最大概率意图类别的概率分布为/>,然后根据该最大概率意图类别的概率分布得到第一置信度和第二置信度。
在一些实施例中,基于各个模型评估语料在最大概率意图类别中的概率,获得第一置信度和第二置信度,包括:基于各个模型评估语料在最大概率意图类别中的概率建立概率分布直方图;根据概率分布直方图比较概率分布直方图的横坐标远离原点的方向上的峰值,获得第一峰值;确定第一峰值对应的横坐标的概率为第一置信度;根据概率分布直方图比较概率分布直方图的横坐标在靠近原点的方向上对应的峰值,获得第二峰值;确定第二峰值对应的横坐标的概率为第二置信度。
具体地,对进行直方图统计,根据直方图的形状,选择最靠左的梯度绝对值最大峰值的横坐标概率值作为模糊置信度阈值T1,即第二置信度。选择最靠右的梯度绝对值最大峰值的横坐标概率值作为高置信度阈值T2,即第一置信度。
在一些实施例中,根据比较结果,对用户的请求文本进行处理,包括:若请求文本在最大概率意图类别的概率小于第一置信度,且大于等于第二置信度,则根据请求文本所属的最大概率意图类别获得请求文本对应的意图标签体系;通过意图标签体系对用户进行关于意图设备、意图功能、意图操作、意图操作的数值的语义引导,以使用户在最大概率意图类别的概率大于或等于第一置信度。
具体地,意图分类模型对请求文本进行意图分类,若分类到最大概率类别的概率大于模糊置信度阈值T1小于高置信度阈值T2,则基于对应的意图标签进行回复引导用户,进行多轮对话再输出具体的意图识别输出。在一些实施过程中,例如,用户请求“空调温度调高两度”被自动语音识别错误识别成“空调温度调高两斗”,分类到最大概率类别的概率值为0.8,大于第二置信度小于第一置信度,则基于意图标签体系可回复用户“您是要调高空调温度吗”,若用户回答肯定,则进行槽位后处理,得到意图设备为空调,意图功能为温度,意图操作为增加,意图操作的数值为2的意图标签,将该意图标签生成相应的指令下发给对应的设备即可实现意图响应。
在一些实施例中,根据比较结果,对用户的请求文本进行处理,包括:若请求文本在最大概率意图类别的概率小于第二置信度,则相关设备拒绝对用户的请求文本的响应;若请求文本在最大概率意图类别的概率大于等于第一置信度,则根据请求文本输出相应的意图识别内容。
具体地,意图分类模型对请求文本进行意图分类,若分类到最大概率类别的概率大于高置信度阈值T2,则进行槽位后输出具体的意图识别输出协议,若分类到最大概率类别的概率小于模糊置信度阈值T1,则不进行响应,以避免误判。其中,槽位后处理指的是在相关设备中,意图设备、意图功能、意图操作、意图操作的数值所对应的槽位,当进行槽位后处理之后,相关设备才能对用户的请求文本进行响应执行相应功能。
在一些实施例中,若请求文本在最大概率意图类别的概率大于等于第一置信度,则根据请求文本输出相应的意图识别内容,包括:若请求文本在最大概率意图类别的概率大于等于第一置信度,则根据请求文本所属的最大概率意图类别确定请求文本对应的意图标签体系;根据请求文本对应的意图标签体系,相关设备执行意图标签体系对应的意图设备、意图功能、意图操作、意图操作的数值。
在一些实施例中,如图2所示,用户请求文本输入进意图分类模型,然后得到请求文本的最大概率意图类别概率值,判断该最大概率意图类别概率值与高置信度阈值(第一置信度)和模糊置信度阈值(第二置信度)的大小,如果该最大概率意图类别概率值大于高置信度阈值,则对该请求文本进行槽位后处理然后进行意图响应;如果该最大概率意图类别概率值大于模糊置信度阈值且小于高置信度阈值,则通过相关设备与用户进行多轮互动来实现语义引导,得到用户肯定回复后,再对该请求文本进行槽位后处理,然后进行意图响应,或,没有得到用户肯定回复,则拒绝进行意图识别;当该最大概率意图类别概率值小于该模糊置信度阈值时,则拒绝进行意图识别。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图3是本申请实施例提供的一种请求文本处理装置的示意图。如图3所示,该请求文本处理装置包括:
意图分类模块301,被配置为获取用户的请求文本,将请求文本输入训练完成的意图分类模型中,获得请求文本在各个意图类别中的概率,其中,意图分类模型是根据模型训练语料集进行训练得到的;
最大概率确定模块302,被配置为比较请求文本在各个意图类别的概率,获得请求文本在最大概率意图类别的概率;
概率比较模块303,被配置为将请求文本在最大概率意图类别的概率与第一置信度、第二置信度进行比较,获得比较结果,其中,第一置信度和第二置信度是根据意图分类模型对模型评估语料集进行分类预测获得的,第一置信度大于第二置信度,模型评估语料集和模型训练语料集是通过对获取的文本语料随机划分得到的;
意图执行模块304,被配置为根据比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。
在一些实施例中,意图分类模块301,被配置为基于用户与相关设备的交互信息确定用户关于相关设备的意图识别内容;根据意图识别内容,确定意图标签体系,其中,意图标签体系包括意图设备、意图功能、意图操作、意图操作的数值;获取与意图标签体系对应的文本语料,并对文本语料按照预设比例随机进行分类,获得模型训练语料集和模型评估语料集;基于意图标签体系,通过模型训练语料集对初始模型进行分类训练,获得意图分类模型。
在一些实施例中,概率比较模块303,被配置为将模型评估语料集输入意图分类模型中,获得模型评估语料集中的各个模型评估语料在各个意图类别中的概率;比较模型评估语料在各个意图类别中的概率,获得各个模型评估语料在最大概率意图类别中的概率;基于各个模型评估语料在最大概率意图类别中的概率,获得第一置信度和第二置信度,其中,第一置信度大于第二置信度。
在一些实施例中,概率比较模块303,被配置为基于各个模型评估语料在最大概率意图类别中的概率建立概率分布直方图;根据概率分布直方图比较概率分布直方图的横坐标远离原点的方向上的峰值,获得第一峰值;确定第一峰值对应的横坐标的概率为第一置信度;根据概率分布直方图比较概率分布直方图的横坐标在靠近原点的方向上对应的峰值,获得第二峰值;确定第二峰值对应的横坐标的概率为第二置信度。
在一些实施例中,意图执行模块304,被配置为若请求文本在最大概率意图类别的概率小于第一置信度,且大于等于第二置信度,则根据请求文本所属的最大概率意图类别获得请求文本对应的意图标签体系;通过意图标签体系对用户进行关于意图设备、意图功能、意图操作、意图操作的数值的语义引导,以使用户在最大概率意图类别的概率大于等于第一置信度。
在一些实施例中,意图执行模块304,被配置为若请求文本在最大概率意图类别的概率大于等于第一置信度,则根据请求文本所属的最大概率意图类别确定请求文本对应的意图标签体系;将所述意图标签体系生成相应的指令下发给相关设备,以使所述相关设备执行所述请求文本的意图响应。具体的:根据请求文本对应的意图标签体系,相关设备执行意图标签体系对应的意图设备、意图功能、意图操作、意图操作的数值。
在一些实施例中,意图执行模块304,被配置为若请求文本在最大概率意图类别的概率小于第二置信度,则相关设备拒绝对用户的请求文本的意图响应。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4是本申请实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种请求文本处理方法,其特征在于,包括:
获取用户的请求文本,将所述请求文本输入训练完成的意图分类模型中,获得所述请求文本在各个意图类别中的概率;
比较所述请求文本在各个意图类别的概率,获得所述请求文本在最大概率意图类别的概率;
将所述请求文本在所述最大概率意图类别的所述概率与预设的第一置信度和第二置信度进行比较,获得比较结果,其中,所述第一置信度大于所述第二置信度;
根据所述比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。
2.根据权利要求1所述的方法,其特征在于,在将所述请求文本输入训练完成的意图分类模型中之前,还包括:
基于用户与相关设备的交互信息确定所述用户关于所述相关设备的意图识别内容;
根据所述意图识别内容,确定意图标签体系,其中,所述意图标签体系包括意图设备、意图功能、意图操作、所述意图操作的数值;
获取与所述意图标签体系对应的文本语料,并对所述文本语料按照预设比例随机进行分类,获得模型训练语料集和模型评估语料集;
基于所述意图标签体系,通过所述模型训练语料集对初始模型进行分类训练,获得所述意图分类模型。
3.根据权利要求2所述的方法,其特征在于,在将所述请求文本在所述最大概率意图类别的所述概率与第一置信度和第二置信度进行比较之前,所述方法还包括:
将所述模型评估语料集输入所述意图分类模型中,获得所述模型评估语料集中的各个模型评估语料在各个意图类别中的概率;
比较所述模型评估语料在各个意图类别中的概率,获得所述各个模型评估语料在最大概率意图类别中的概率;
基于所述各个模型评估语料在最大概率意图类别中的概率,获得所述第一置信度、所述第二置信度,其中,所述第一置信度大于所述第二置信度。
4.根据权利要求3所述的方法,其特征在于,基于所述各个模型评估语料在最大概率意图类别中的概率,获得所述第一置信度和所述第二置信度,包括:
基于所述各个模型评估语料在最大概率意图类别中的概率建立概率分布直方图;
根据所述概率分布直方图比较所述概率分布直方图的横坐标远离原点的方向上的峰值,获得第一峰值;
确定所述第一峰值对应的横坐标的概率为所述第一置信度;
根据所述概率分布直方图比较所述概率分布直方图的横坐标在靠近原点的方向上对应的峰值,获得第二峰值;
确定所述第二峰值对应的横坐标的概率为所述第二置信度。
5.根据权利要求2所述的方法,其特征在于,所述通过所述意图标签体系对所述用户进行语义引导,包括:
通过所述意图标签体系对所述用户进行关于所述意图设备、所述意图功能、所述意图操作、所述意图操作的数值的语义引导,以使所述用户在所述最大概率意图类别的所述概率大于等于所述第一置信度。
6.根据权利要求2所述的方法,其特征在于,还包括:
根据所述比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第二置信度,则所述相关设备拒绝对所述用户的请求文本的意图响应;
若所述请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度,则根据所述最大概率意图类别确定所述请求文本对应的所述意图标签体系,将所述意图标签体系生成相应的指令下发给相关设备,以使所述相关设备执行所述请求文本的意图响应。
7.根据权利要求6所述的方法,其特征在于,将所述意图标签体系生成相应的指令下发给相关设备,以使所述相关设备执行所述请求文本的意图响应,包括:
根据所述请求文本对应的所述意图标签体系,所述相关设备执行所述意图标签体系对应的所述意图设备、所述意图功能、所述意图操作、所述意图操作的数值的意图响应。
8.一种请求文本处理装置,其特征在于,包括:
意图分类模块,被配置为获取用户的请求文本,将所述请求文本输入训练完成的意图分类模型中,获得所述请求文本在各个意图类别中的概率;
最大概率确定模块,被配置为比较所述请求文本在各个意图类别的概率,获得所述请求文本在最大概率意图类别的概率;
概率比较模块,被配置为将所述请求文本在所述最大概率意图类别的所述概率与预设的第一置信度和第二置信度进行比较,获得比较结果,其中,所述第一置信度大于所述第二置信度;
意图执行模块,被配置为根据所述比较结果,若所述请求文本在所述最大概率意图类别的所述概率小于所述第一置信度,且大于等于所述第二置信度,则根据所述请求文本所属的所述最大概率意图类别获得所述请求文本对应的意图标签体系;通过所述意图标签体系对所述用户进行语义引导,基于语义引导结果,确定新的请求文本,以使所述新的请求文本在所述最大概率意图类别的所述概率大于等于所述第一置信度。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310935962.5A CN116662555B (zh) | 2023-07-28 | 2023-07-28 | 一种请求文本处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310935962.5A CN116662555B (zh) | 2023-07-28 | 2023-07-28 | 一种请求文本处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116662555A true CN116662555A (zh) | 2023-08-29 |
CN116662555B CN116662555B (zh) | 2023-10-20 |
Family
ID=87717416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310935962.5A Active CN116662555B (zh) | 2023-07-28 | 2023-07-28 | 一种请求文本处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662555B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116959433A (zh) * | 2023-09-18 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备和存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097563A1 (en) * | 2018-09-21 | 2020-03-26 | Salesforce.Com, Inc. | Intent classification system |
CN111352348A (zh) * | 2018-12-24 | 2020-06-30 | 北京三星通信技术研究有限公司 | 设备控制方法、装置、电子设备及计算机可读存储介质 |
CN111860462A (zh) * | 2020-08-07 | 2020-10-30 | 多点(深圳)数字科技有限公司 | 货架陈列反馈方法和装置 |
CN111930854A (zh) * | 2020-10-10 | 2020-11-13 | 北京福佑多多信息技术有限公司 | 意图预测的方法及装置 |
US20210042372A1 (en) * | 2019-08-09 | 2021-02-11 | Microsoft Technology Licensing, Llc | Query entity-experience classification |
WO2021120631A1 (zh) * | 2019-12-19 | 2021-06-24 | 深圳壹账通智能科技有限公司 | 智能交互方法、装置、电子设备及存储介质 |
CN113220839A (zh) * | 2021-05-13 | 2021-08-06 | 湖北亿咖通科技有限公司 | 一种意图识别方法、电子设备及计算机可读存储介质 |
CN113672696A (zh) * | 2021-07-08 | 2021-11-19 | 浙江一山智慧医疗研究有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
CN113886577A (zh) * | 2021-09-10 | 2022-01-04 | 润联软件***(深圳)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN114254111A (zh) * | 2021-12-21 | 2022-03-29 | 北京小鹏汽车有限公司 | 语音交互方法、车辆、服务器、语音***和存储介质 |
CN114564964A (zh) * | 2022-02-24 | 2022-05-31 | 杭州中软安人网络通信股份有限公司 | 一种基于k近邻对比学习的未知意图检测方法 |
CN114676689A (zh) * | 2022-03-09 | 2022-06-28 | 青岛海尔科技有限公司 | 语句文本的识别方法和装置、存储介质及电子装置 |
CN114694646A (zh) * | 2020-12-31 | 2022-07-01 | 华为技术有限公司 | 一种语音交互处理方法及相关装置 |
CN114925158A (zh) * | 2022-03-15 | 2022-08-19 | 青岛海尔科技有限公司 | 语句文本的意图识别方法和装置、存储介质及电子装置 |
CN115470796A (zh) * | 2022-09-14 | 2022-12-13 | 四川大学 | 一种面向空管模拟培训的文本指令生成方法及设备 |
CN115689672A (zh) * | 2022-09-29 | 2023-02-03 | 广州欢聚时代信息科技有限公司 | 聊天式商品导购方法及其装置、设备、介质 |
CN116187335A (zh) * | 2022-12-22 | 2023-05-30 | 深圳绿米联创科技有限公司 | 意图识别方法、装置、存储介质及电子设备 |
-
2023
- 2023-07-28 CN CN202310935962.5A patent/CN116662555B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097563A1 (en) * | 2018-09-21 | 2020-03-26 | Salesforce.Com, Inc. | Intent classification system |
CN111352348A (zh) * | 2018-12-24 | 2020-06-30 | 北京三星通信技术研究有限公司 | 设备控制方法、装置、电子设备及计算机可读存储介质 |
US20210042372A1 (en) * | 2019-08-09 | 2021-02-11 | Microsoft Technology Licensing, Llc | Query entity-experience classification |
WO2021120631A1 (zh) * | 2019-12-19 | 2021-06-24 | 深圳壹账通智能科技有限公司 | 智能交互方法、装置、电子设备及存储介质 |
CN111860462A (zh) * | 2020-08-07 | 2020-10-30 | 多点(深圳)数字科技有限公司 | 货架陈列反馈方法和装置 |
CN111930854A (zh) * | 2020-10-10 | 2020-11-13 | 北京福佑多多信息技术有限公司 | 意图预测的方法及装置 |
CN114694646A (zh) * | 2020-12-31 | 2022-07-01 | 华为技术有限公司 | 一种语音交互处理方法及相关装置 |
CN113220839A (zh) * | 2021-05-13 | 2021-08-06 | 湖北亿咖通科技有限公司 | 一种意图识别方法、电子设备及计算机可读存储介质 |
CN113672696A (zh) * | 2021-07-08 | 2021-11-19 | 浙江一山智慧医疗研究有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
CN113886577A (zh) * | 2021-09-10 | 2022-01-04 | 润联软件***(深圳)有限公司 | 一种文本分类方法、装置、设备及存储介质 |
CN114254111A (zh) * | 2021-12-21 | 2022-03-29 | 北京小鹏汽车有限公司 | 语音交互方法、车辆、服务器、语音***和存储介质 |
CN114564964A (zh) * | 2022-02-24 | 2022-05-31 | 杭州中软安人网络通信股份有限公司 | 一种基于k近邻对比学习的未知意图检测方法 |
CN114676689A (zh) * | 2022-03-09 | 2022-06-28 | 青岛海尔科技有限公司 | 语句文本的识别方法和装置、存储介质及电子装置 |
CN114925158A (zh) * | 2022-03-15 | 2022-08-19 | 青岛海尔科技有限公司 | 语句文本的意图识别方法和装置、存储介质及电子装置 |
CN115470796A (zh) * | 2022-09-14 | 2022-12-13 | 四川大学 | 一种面向空管模拟培训的文本指令生成方法及设备 |
CN115689672A (zh) * | 2022-09-29 | 2023-02-03 | 广州欢聚时代信息科技有限公司 | 聊天式商品导购方法及其装置、设备、介质 |
CN116187335A (zh) * | 2022-12-22 | 2023-05-30 | 深圳绿米联创科技有限公司 | 意图识别方法、装置、存储介质及电子设备 |
Non-Patent Citations (1)
Title |
---|
魏志强 等: "面向智能家庭的动态自适应软件基础平台研究", 中国海洋大学学报(自然科学版), no. 05, pages 1056 - 1060 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116959433A (zh) * | 2023-09-18 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备和存储介质 |
CN116959433B (zh) * | 2023-09-18 | 2023-12-08 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116662555B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN109165291B (zh) | 一种文本匹配方法及电子设备 | |
CN111931049B (zh) | 基于大数据和人工智能的业务处理方法及区块链金融*** | |
CN116662555B (zh) | 一种请求文本处理方法、装置、电子设备及存储介质 | |
WO2022042297A1 (zh) | 文本聚类方法、装置、电子设备及存储介质 | |
CN110955766A (zh) | 一种自动扩充智能客服标准问题对的方法和*** | |
CN110543637A (zh) | 一种中文分词方法及装置 | |
CN116542297A (zh) | 基于文本数据训练生成对抗网络的方法及装置 | |
CN110059743B (zh) | 确定预测的可靠性度量的方法、设备和存储介质 | |
CN115858776B (zh) | 一种变体文本分类识别方法、***、存储介质和电子设备 | |
CN114218381B (zh) | 立场识别方法、装置、设备及介质 | |
CN114254622B (zh) | 一种意图识别方法和装置 | |
CN117523218A (zh) | 标签生成、图像分类模型的训练、图像分类方法及装置 | |
CN111382265A (zh) | 搜索方法、装置、设备和介质 | |
CN111831823B (zh) | 一种语料生成、模型训练方法 | |
CN112735395B (zh) | 语音识别方法及电子设备、存储装置 | |
CN113673237A (zh) | 模型训练、意图识别方法、装置、电子设备及存储介质 | |
CN115329751B (zh) | 针对网络平台发文的关键词提取方法、装置、介质及设备 | |
CN117874239B (zh) | 内容生成方法、装置、设备及存储介质 | |
CN118070775B (zh) | 摘要生成模型的性能评测方法、装置、计算机设备 | |
CN109284374B (zh) | 用于确定实体类别的方法、装置、设备以及计算机可读存储介质 | |
CN115563990A (zh) | 信息分类方法、信息分类装置以及可读存储介质 | |
CN117725172A (zh) | 多意图识别支持大模型qa问答方法及装置 | |
CN116796254A (zh) | 电信反诈方法、装置、电子设备和存储介质 | |
CN117539984A (zh) | 一种回复文本的生成方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240117 Address after: No. 13 Xingxiang Road, Zengjia Town, High tech Zone, Shapingba District, Chongqing, 400039 Patentee after: Chongqing Selis Phoenix Intelligent Innovation Technology Co.,Ltd. Address before: No. 801, 8th Floor, Building 2, No. 168 Tianfu Fifth Street, Chengdu High tech Zone, China (Sichuan) Pilot Free Trade Zone, Chengdu City, Sichuan Province, 610095 Patentee before: Chengdu Thalys Technology Co.,Ltd. |