CN109492104A - 意图分类模型的训练方法、分类方法、***、设备和介质 - Google Patents
意图分类模型的训练方法、分类方法、***、设备和介质 Download PDFInfo
- Publication number
- CN109492104A CN109492104A CN201811333427.8A CN201811333427A CN109492104A CN 109492104 A CN109492104 A CN 109492104A CN 201811333427 A CN201811333427 A CN 201811333427A CN 109492104 A CN109492104 A CN 109492104A
- Authority
- CN
- China
- Prior art keywords
- data
- intent classifier
- training
- user
- classifier model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种意图分类模型的训练方法、分类方法、***、设备和介质,其中,训练方法包括:获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;标注每组原始数据中输入内容的意图类别;根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。本发明综合了用户各维度的特征,并基于深度学习训练了意图分类模型。根据该意图分类模型,可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户意图的识别方法、***、电子设备和存储介质。
背景技术
随着互联网技术的快速发展,网上购物逐渐渗透到人们生活的方方面面,因此,互联网用户对于客服人员的需求也越来越多。又由于人工客服存在培训周期长且人力成本高的问题,智能客服机器人因其无需培训、无需人力成本且能够持续不间断地工作而已经越来越多地替代了人工客服。
目前,智能客服机器人的核心工作在于,对用户输入进行预处理(包括纠错、分词、命名实体识别等),然后对预处理结果进行意图识别分类,再根据分类结果进行应答。然而,由于上述工作过程仅考虑用户输入而不涉及用户自身特征(例如用户画像、历史订单信息等),从而容易导致智能客服机器人未能准确进行意图识别,进而也就不能准确对于用户输入进行应答。
例如,用户输入为“为什么我买的东西还没到?”,对于该种场景存在两种可能性,其一,未发货,其二,货品仍处于配送中,因此,智能客服机器人仅基于用户输入难以正确就用户意图进行识别,也就难以针对性地应答用户输入。
发明内容
本发明要解决的技术问题是为了克服现有技术中智能客服机器人仅基于用户输入来识别用户意图的缺陷,提供一种用户意图的识别方法、***、电子设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种意图分类模型的训练方法,其特点在于,所述训练方法包括:
获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;
标注每组原始数据中输入内容的意图类别;
根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;
根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。
较佳地,所述构造多组训练数据的步骤包括:
对于每组原始数据,将行为数据输入决策树;
所述决策树输出所述行为数据的组合特征;
将所述组合特征转换成组合特征向量;
利用所述组合特征向量构造训练数据。
较佳地,所述将所述组合特征转换成组合特征向量的步骤包括:
利用one-hot转换所述组合特征,得到组合特征向量。
较佳地,构造训练数据的步骤包括:
对于每组原始数据,对输入内容进行命名实体识别,得到若干实体;
将所述若干实体转换成实体特征向量;
对行为数据进行清洗,得到行为特征;
将所述行为特征转换成行为特征向量;
利用所述实体特征向量和所述行为特征向量构造训练数据。
较佳地,所述行为数据包括实时行为数据和历史行为数据;
所述实时行为数据包括用户在输入内容之前访问过的URL;
所述历史行为数据包括用户个人信息、用户订单数据、用户画像中的至少一个。
较佳地,所述将所述行为特征转换成行为特征向量的步骤包括:
利用word2vec转换经清洗的实时行为数据,得到行为特征向量;
利用one-hot转换经清洗的历史行为数据,得到行为特征向量;
和/或,所述将所述若干实体转换成实体特征向量的步骤包括:
利用word2vec转换所述若干实体,得到实体特征向量。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现上述任一种意图分类模型的训练方法。
一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现上述任一种意图分类模型的训练方法的步骤。
一种意图分类方法,其特点在于,所述意图分类方法包括:
利用上述任一种意图分类模型的训练方法训练意图分类模型;
获取用户的输入内容;
对所述输入内容进行命名实体识别,得到若干实体;
将所述若干实体转换成实体特征向量;
获取所述用户的行为数据;
对所述行为数据进行清洗,得到行为特征;
将所述行为特征转换成行为特征向量;
将所述实体特征向量和所述行为特征向量输入所述意图分类模型;
输出所述输入内容的意图类别。
较佳的,在所述获取所述用户的行为数据的步骤之后,所述意图分类方法还包括:
将所述行为数据输入决策树;
所述决策树输出所述行为数据的组合特征;
将所述组合特征转换成组合特征向量;
将所述组合特征向量同所述实体特征向量、所述行为特征向量一起输入意图分类模型。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现上述任一种意图分类方法。
一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现上述任一种意图分类方法的步骤。
一种意图分类模型的训练***,其特点在于,所述训练***包括:
获取模块,用于获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;
标注模块,用于标注每组原始数据中输入内容的意图类别;
构造模块,用于根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;
训练模块,用于根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。
较佳地,所述构造模块包括:
决策树单元,对于每组原始数据,所述决策树单元用于接收行为数据并输出所述行为数据的组合特征;
第三转换单元,用于将所述组合特征转换成组合特征向量;
构造单元,用于利用所述组合特征向量构造训练数据。
较佳地,所述第三转换单元利用one-hot转换所述组合特征,得到组合特征向量。
较佳地,所述构造模块包括:
实体识别单元,对于每组原始数据,用于对输入内容进行命名实体识别,得到若干实体;
第一转换单元,用于将所述若干实体转换成实体特征向量;
清洗单元,用于对行为数据进行清洗,得到行为特征;
第二转换单元,用于将所述行为特征转换成行为特征向量;
构造单元,用于利用所述实体特征向量和所述行为特征向量构造训练数据。
较佳地,所述行为数据包括实时行为数据和历史行为数据;
所述实时行为数据包括用户在输入内容之前访问过的URL;
所述历史行为数据包括用户个人信息、用户订单数据、用户画像中的至少一个。
较佳地,所述第二转换单元利用word2vec转换经清洗的实时行为数据,得到行为特征向量;
所述第二转换单元利用one-hot转换经清洗的历史行为数据,得到行为特征向量;
和/或,所述第一转换单元利用word2vec转换所述若干实体,得到实体特征向量。
一种意图分类***,其特点在于,所述意图分类***包括:
上述任一种意图分类模型的训练***,用于训练意图分类模型;
第一获取模块,用于获取用户的输入内容;
实体识别模块,用于对所述输入内容进行命名实体识别,得到若干实体;
第一转换模块,用于将所述若干实体转换成实体特征向量;
第二获取模块,用于获取所述用户的行为数据;
清洗模块,用于对所述行为数据进行清洗,得到行为特征;
第二转换模块,用于将所述行为特征转换成行为特征向量;
输入模块,用于将所述实体特征向量和所述行为特征向量输入所述意图分类模型;
输出模块,用于输出所述输入内容的意图类别。
较佳地,所述意图分类***还包括:
决策树模块,用于接收所述行为数据并输出所述行为数据的组合特征;
第三转换模块,用于将所述组合特征转换成组合特征向量;
所述输入模块用于将所述组合特征向量同所述实体特征向量、所述行为特征向量一起输入意图分类模型。
本发明的积极进步效果在于:本发明综合了用户各维度的特征,并基于深度学习训练了一种意图分类模型。根据该意图分类模型,可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答,以提升用户体验。
附图说明
图1为根据本发明实施例1的意图分类模型的训练方法的流程图。
图2为根据本发明实施例1的意图分类模型的训练方法中步骤S3的流程图。
图3为根据本发明实施例2的电子设备的硬件结构示意图。
图4为根据本发明实施例4的意图分类方法的流程图。
图5为根据本发明实施例7的意图分类模型的训练***的模块示意图。
图6为根据本发明实施例7的意图分类模型的训练***中构造模块的模块示意图。
图7为根据本发明实施例8的意图分类***的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种意图分类模型的训练方法,图1示出了本实施例的流程图。参照图1,本实施例的训练方法包括:
S1、获取多组原始数据;
S2、标注每组原始数据中输入内容的意图类别;
S3、根据该多组原始数据以及该多组原始数据中输入内容的意图类别构造多组训练数据;
S4、根据该多组训练数据训练意图分类模型。
在本实施例中,每组原始数据包括用户的输入内容以及该用户的行为数据。其中,用户的输入内容可以表现为人机交互过程中输入的一条或者多条信息,例如,“为什么我买的东西还没到?”。用户的行为数据根据用户行为发生的时间,可以包括实时行为数据和历史行为数据。
具体地,实时行为数据包括用户访问当前网络站点时,在人机交互页面输入内容之前所访问过的URL(Uniform Resource Locator,统一资源定位符),例如,输入内容之前访问过的URL可以是“网站主页面、订单页面、人机交互页面”,也可以是“网站主页面、搜索页面、商品详情页面、人机交互页面”。
历史行为数据包括用户访问当前网络站点之前,在该网络站点上已然生成的数据,可以包括但不限于用户个人信息、用户订单数据、用户画像,其中,用户个人信息包括用户的年龄、性别、职业等,用户订单数据包括订单付款状态、订单库存状态、订单出库状态、订单配送状态、订单售后状态等,用户画像包括描述用户的一系列标签。
在步骤S2中标注每组原始数据中输入内容的意图分类,在步骤S3中,以原始数据以及为其标注的意图类别为一组训练数据,构造多组训练数据。参照图2,步骤S3具体包括:
S31、对输入内容进行命名实体识别,得到若干实体;
S32、将若干实体转换成实体特征向量。
在上述步骤中,可以首先对输入内容进行泛化,以进行命名实体识别,待识别的命名实体可以包括但不限于日期、时间、地址、品牌、订单号等。再将识别出来的若干实体转换成实体特征向量,如此,既能够避免出现未登录词,又能够减小转换的计算复杂度。其中,具体地,可以利用word2vec来转换上述若干实体,以得到实体特征向量。
S33、对行为数据进行清洗,得到行为特征;
S34、将行为特征转换成行为特征向量。
在本实施例中,上述行为数据可以从网络站点的数据库中拉取。清洗行为数据的步骤例如可以包括去除异常数据,预设数据格式等。
当行为数据包括实时行为数据时,由于用户的实时行为具有时序上的先后关系,可以利用word2vec来转换上述经清洗的实时行为数据,以得到行为特征向量。例如,对于用户在输入内容之前访问过的URL,可以将这些URL转换成行为特征向量。
当行为数据包括历史行为数据时,又有这些历史行为数据大都是离散数据,进而可以利用one-hot来转换上述经清洗的历史行为数据,以得到行为特征向量。例如,对于用户年龄,可以划分不同的年龄分段之后,再进行转换;对于用户性别,包括男性和女性;对于订单付款状态,包括已付款和未付款。
S35、将行为数据输入决策树;
S36、决策树输出行为数据的组合特征;
S37、将组合特征转换成组合特征向量。
为了进一步利用行为数据,以挖掘更多的用户个性化特征,在本实施例的训练方法中,还可以包括构造决策树的步骤,根据该决策树来组合用户的行为数据,具体地,根节点到所有叶节点之间经过的节点可以构成一个组合特征。
应当理解,上述组合特征包括大量的特征,从而导致决策树模型的结构复杂,转换所需计算量大,进而,可以选择信息增益最高的若干特征来构成组合特征,至于所选特征的数量,则可以根据实际应用自定义进行设置。
将行为数据输入该决策树之后,即可得到该行为数据的组合特征,进一步地,可以利用one-hot来转换该组合特征,以得到组合特征向量。
S38、利用实体特征向量、行为特征向量、组合特征向量构造训练数据。
根据上述步骤,可以根据获取的多组原始数据,构造多组训练数据。在步骤S4中,则根据该多组训练数据训练意图分类模型,该意图分类模型用于根据原始数据生成该原始数据中输入内容的意图类别。
具体地,在步骤S4中,一方面,对于利用word2vec转换获得的特征向量,包括实体特征向量和部分行为特征向量,可以分别经由卷积层、池化层、连接层的处理,另一方面,对于利用one-hot转换获得的特征向量,包括部分行为特征向量和组合特征向量,可以经由连接层的处理,最后,再经由连接层合并上述两方面获得的特征向量,以得到各分类的概率。
在本实施例中,综合了用户各维度的特征,并基于深度学习训练了一种意图分类模型。根据该意图分类模型,可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答,以提升用户体验。
实施例2
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1提供的意图分类模型的训练方法。
图3示出了本实施例的硬件结构示意图,如图3所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同***组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的意图分类模型的训练方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)***、磁带驱动器以及数据备份存储***等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例3
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1提供的意图分类模型的训练方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1中的意图分类模型的训练方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
实施例4
本实施例提供一种意图分类方法,图4示出了本实施例的流程图。参照图4,本实施例的意图分类方法包括:
S101、训练意图分类模型;
S102、获取用户的输入内容;
S103、对输入内容进行命名实体识别,得到若干实体;
S104、将若干实体转换成实体特征向量;
S105、获取该用户的行为数据;
S106、对行为数据进行清洗,得到行为特征;
S107、将行为特征转换成行为特征向量;
S108、将行为数据输入决策树;
S109、决策树输出行为数据的组合特征;
S110、将组合特征转换成组合特征向量;
S111、将实体特征向量、行为特征向量、组合特征向量输入意图分类模型;
S112、输出输入内容的意图类别。
具体地,在本实施例中,步骤S101利用实施例1提供的意图分类模型的训练方法来训练意图分类模型,进而在后续步骤中基于用户的输入内容和行为数据获取意图分类模型的输入数据,实现对用户输入内容的意图类别的识别。由于本实施例综合了用户各维度的特征,从而可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答,以提升用户体验。
实施例5
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例4提供的意图分类方法。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例4提供的意图分类方法的步骤。
实施例7
本实施例提供一种意图分类模型的训练***,图5示出了本实施例的模块示意图。参照图5,本实施例的训练***1包括:
获取模块11,用于获取多组原始数据;
标注模块12,用于标注每组原始数据中输入内容的意图类别;
构造模块13,用于根据该多组原始数据以及该多组原始数据中输入内容的意图类别构造多组训练数据;
训练模块14,用于根据该多组训练数据训练意图分类模型。
在本实施例中,每组原始数据包括用户的输入内容以及该用户的行为数据。其中,用户的输入内容可以表现为人机交互过程中输入的一条或者多条信息,例如,“为什么我买的东西还没到?”。用户的行为数据根据用户行为发生的时间,可以包括实时行为数据和历史行为数据。
具体地,实时行为数据包括用户访问当前网络站点时,在人机交互页面输入内容之前所访问过的URL(Uniform Resource Locator,统一资源定位符),例如,输入内容之前访问过的URL可以是“网站主页面、订单页面、人机交互页面”,也可以是“网站主页面、搜索页面、商品详情页面、人机交互页面”。
历史行为数据包括用户访问当前网络站点之前,在该网络站点上已然生成的数据,可以包括但不限于用户个人信息、用户订单数据、用户画像,其中,用户个人信息包括用户的年龄、性别、职业等,用户订单数据包括订单付款状态、订单库存状态、订单出库状态、订单配送状态、订单售后状态等,用户画像包括描述用户的一系列标签。
标注模块12标注每组原始数据中输入内容的意图分类,构造模块13以原始数据以及为其标注的意图类别为一组训练数据,构造多组训练数据。参照图6,构造模块13具体包括:
实体识别单元131,对输入内容进行命名实体识别,得到若干实体;
第一转换单元132,用于将若干实体转换成实体特征向量。
实体识别单元131可以首先对输入内容进行泛化,以进行命名实体识别,待识别的命名实体可以包括但不限于日期、时间、地址、品牌、订单号等。第一转换单元132再将识别出来的若干实体转换成实体特征向量,如此,既能够避免出现未登录词,又能够减小转换的计算复杂度。其中,具体地,第一转换单元132可以利用word2vec来转换上述若干实体,以得到实体特征向量。
清洗单元133,用于对行为数据进行清洗,得到行为特征;
第二转换单元134,用于将行为特征转换成行为特征向量。
在本实施例中,上述行为数据可以从网络站点的数据库中拉取。清洗单元133可以通过去除异常数据,预设数据格式等来清洗数据。
当行为数据包括实时行为数据时,由于用户的实时行为具有时序上的先后关系,第二转换单元134可以利用word2vec来转换上述经清洗的实时行为数据,以得到行为特征向量。例如,对于用户在输入内容之前访问过的URL,第二转换单元134可以将这些URL转换成行为特征向量。
当行为数据包括历史行为数据时,又有这些历史行为数据大都是离散数据,进而第二转换单元134可以利用one-hot来转换上述经清洗的历史行为数据,以得到行为特征向量。例如,对于用户年龄,可以划分不同的年龄分段之后,再进行转换;对于用户性别,包括男性和女性;对于订单付款状态,包括已付款和未付款。
决策树单元135,用于接收行为数据并输出所述行为数据的组合特征;
第三转换单元136,用于将组合特征转换成组合特征向量。
为了进一步利用行为数据,以挖掘更多的用户个性化特征,决策树单元135根据决策树来组合用户的行为数据,具体地,根节点到所有叶节点之间经过的节点可以构成一个组合特征。
应当理解,上述组合特征包括大量的特征,从而导致决策树模型的结构复杂,转换所需计算量大,进而,可以选择信息增益最高的若干特征来构成组合特征,至于所选特征的数量,则可以根据实际应用自定义进行设置。
将行为数据输入决策树单元135之后,即可得到该行为数据的组合特征,进一步地,第三转换单元136可以利用one-hot来转换该组合特征,以得到组合特征向量。
构造单元137,用于利用实体特征向量、行为特征向量、组合特征向量构造训练数据。
在本实施例中,可以根据获取的多组原始数据,构造多组训练数据。训练模块4根据该多组训练数据训练意图分类模型,该意图分类模型用于根据原始数据生成该原始数据中输入内容的意图类别。
具体地,一方面,对于利用word2vec转换获得的特征向量,包括实体特征向量和部分行为特征向量,训练模块4可以分别经由卷积层、池化层、连接层进行处理,另一方面,对于利用one-hot转换获得的特征向量,包括部分行为特征向量和组合特征向量,训练模块4可以经由连接层进行处理,最后,训练模块4再经由连接层合并上述两方面获得的特征向量,以得到各分类的概率。
在本实施例中,综合了用户各维度的特征,并基于深度学习训练了一种意图分类模型。根据该意图分类模型,可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答,以提升用户体验。
实施例8
本实施例提供一种意图分类***,图7示出了本实施例的模块示意图。参照图7,本实施例的意图分类***2包括:
实施例7中的意图分类模型的训练***1,用于训练意图分类模型;
第一获取模块201,用于获取用户的输入内容;
实体识别模块202,用于对输入内容进行命名实体识别,得到若干实体;
第一转换模块203,用于将若干实体转换成实体特征向量;
第二获取模块204,用于获取该用户的行为数据;
清洗模块205,用于对行为数据进行清洗,得到行为特征;
第二转换模块206,用于将行为特征转换成行为特征向量;
决策树模块207,用于接收所述行为数据并输出所述行为数据的组合特征;
第三转换模块208,用于将组合特征转换成组合特征向量;
输入模块209,用于将实体特征向量、行为特征向量、组合特征向量输入意图分类模型;
输出模块210,用于输出输入内容的意图类别。
具体地,在本实施例中,基于实施例7中的训练***1得到的意图分类模型,并基于用户的输入内容和行为数据获取的意图分类模型的输入数据,实现了对用户输入内容的意图类别的识别。由于本实施例综合了用户各维度的特征,从而可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答,以提升用户体验。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (20)
1.一种意图分类模型的训练方法,其特征在于,所述训练方法包括:
获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;
标注每组原始数据中输入内容的意图类别;
根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;
根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。
2.如权利要求1所述的意图分类模型的训练方法,其特征在于,所述构造多组训练数据的步骤包括:
对于每组原始数据,将行为数据输入决策树;
所述决策树输出所述行为数据的组合特征;
将所述组合特征转换成组合特征向量;
利用所述组合特征向量构造训练数据。
3.如权利要求2所述的意图分类模型的训练方法,其特征在于,所述将所述组合特征转换成组合特征向量的步骤包括:
利用one-hot转换所述组合特征,得到组合特征向量。
4.如权利要求1所述的意图分类模型的训练方法,其特征在于,构造训练数据的步骤包括:
对于每组原始数据,对输入内容进行命名实体识别,得到若干实体;
将所述若干实体转换成实体特征向量;
对行为数据进行清洗,得到行为特征;
将所述行为特征转换成行为特征向量;
利用所述实体特征向量和所述行为特征向量构造训练数据。
5.如权利要求4所述的意图分类模型的训练方法,其特征在于,所述行为数据包括实时行为数据和历史行为数据;
所述实时行为数据包括用户在输入内容之前访问过的URL;
所述历史行为数据包括用户个人信息、用户订单数据、用户画像中的至少一个。
6.如权利要求5所述的意图分类模型的训练方法,其特征在于,所述将所述行为特征转换成行为特征向量的步骤包括:
利用word2vec转换经清洗的实时行为数据,得到行为特征向量;
利用one-hot转换经清洗的历史行为数据,得到行为特征向量;
和/或,所述将所述若干实体转换成实体特征向量的步骤包括:
利用word2vec转换所述若干实体,得到实体特征向量。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的意图分类模型的训练方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的意图分类模型的训练方法的步骤。
9.一种意图分类方法,其特征在于,所述意图分类方法包括:
利用如权利要求1-6中任一项所述的意图分类模型的训练方法训练意图分类模型;
获取用户的输入内容;
对所述输入内容进行命名实体识别,得到若干实体;
将所述若干实体转换成实体特征向量;
获取所述用户的行为数据;
对所述行为数据进行清洗,得到行为特征;
将所述行为特征转换成行为特征向量;
将所述实体特征向量和所述行为特征向量输入所述意图分类模型;
输出所述输入内容的意图类别。
10.如权利要求9所述的意图分类方法,其特征在于,在所述获取所述用户的行为数据的步骤之后,所述意图分类方法还包括:
将所述行为数据输入决策树;
所述决策树输出所述行为数据的组合特征;
将所述组合特征转换成组合特征向量;
将所述组合特征向量同所述实体特征向量、所述行为特征向量一起输入意图分类模型。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求9或10所述的意图分类方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9或10所述的意图分类方法的步骤。
13.一种意图分类模型的训练***,其特征在于,所述训练***包括:
获取模块,用于获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;
标注模块,用于标注每组原始数据中输入内容的意图类别;
构造模块,用于根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;
训练模块,用于根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。
14.如权利要求13所述的意图分类模型的训练***,其特征在于,所述构造模块包括:
决策树单元,对于每组原始数据,所述决策树单元用于接收行为数据并输出所述行为数据的组合特征;
第三转换单元,用于将所述组合特征转换成组合特征向量;
构造单元,用于利用所述组合特征向量构造训练数据。
15.如权利要求14所述的意图分类模型的训练***,其特征在于,所述第三转换单元利用one-hot转换所述组合特征,得到组合特征向量。
16.如权利要求13所述的意图分类模型的训练***,其特征在于,所述构造模块包括:
实体识别单元,对于每组原始数据,用于对输入内容进行命名实体识别,得到若干实体;
第一转换单元,用于将所述若干实体转换成实体特征向量;
清洗单元,用于对行为数据进行清洗,得到行为特征;
第二转换单元,用于将所述行为特征转换成行为特征向量;
构造单元,用于利用所述实体特征向量和所述行为特征向量构造训练数据。
17.如权利要求16所述的意图分类模型的训练***,其特征在于,所述行为数据包括实时行为数据和历史行为数据;
所述实时行为数据包括用户在输入内容之前访问过的URL;
所述历史行为数据包括用户个人信息、用户订单数据、用户画像中的至少一个。
18.如权利要求17所述的意图分类模型的训练***,其特征在于,所述第二转换单元利用word2vec转换经清洗的实时行为数据,得到行为特征向量;
所述第二转换单元利用one-hot转换经清洗的历史行为数据,得到行为特征向量;
和/或,所述第一转换单元利用word2vec转换所述若干实体,得到实体特征向量。
19.一种意图分类***,其特征在于,所述意图分类***包括:
如权利要求13-18中任一项所述的意图分类模型的训练***,用于训练意图分类模型;
第一获取模块,用于获取用户的输入内容;
实体识别模块,用于对所述输入内容进行命名实体识别,得到若干实体;
第一转换模块,用于将所述若干实体转换成实体特征向量;
第二获取模块,用于获取所述用户的行为数据;
清洗模块,用于对所述行为数据进行清洗,得到行为特征;
第二转换模块,用于将所述行为特征转换成行为特征向量;
输入模块,用于将所述实体特征向量和所述行为特征向量输入所述意图分类模型;
输出模块,用于输出所述输入内容的意图类别。
20.如权利要求19所述的意图分类***,其特征在于,所述意图分类***还包括:
决策树模块,用于接收所述行为数据并输出所述行为数据的组合特征;
第三转换模块,用于将所述组合特征转换成组合特征向量;
所述输入模块用于将所述组合特征向量同所述实体特征向量、所述行为特征向量一起输入意图分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811333427.8A CN109492104B (zh) | 2018-11-09 | 2018-11-09 | 意图分类模型的训练方法、分类方法、***、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811333427.8A CN109492104B (zh) | 2018-11-09 | 2018-11-09 | 意图分类模型的训练方法、分类方法、***、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492104A true CN109492104A (zh) | 2019-03-19 |
CN109492104B CN109492104B (zh) | 2023-01-31 |
Family
ID=65695429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811333427.8A Active CN109492104B (zh) | 2018-11-09 | 2018-11-09 | 意图分类模型的训练方法、分类方法、***、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492104B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN111309817A (zh) * | 2020-01-16 | 2020-06-19 | 秒针信息技术有限公司 | 行为识别方法、装置及电子设备 |
CN112102013A (zh) * | 2020-11-06 | 2020-12-18 | 北京读我科技有限公司 | 一种基于特征融合的电销用户意图识别方法和*** |
CN112732846A (zh) * | 2021-01-27 | 2021-04-30 | 深圳市科荣软件股份有限公司 | 水务运营分析***、方法、电子设备及存储介质 |
CN112966828A (zh) * | 2021-03-01 | 2021-06-15 | 海南大学 | 面向意图计算与推理的可编程智能控制方法、装置及介质 |
CN114531334A (zh) * | 2020-11-04 | 2022-05-24 | 南京中兴新软件有限责任公司 | 意图处理方法、装置、电子设备和可读存储介质 |
CN117689311A (zh) * | 2023-12-04 | 2024-03-12 | 朴道征信有限公司 | 物品库存调整方法、装置、电子设备和计算机可读介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
US20140201120A1 (en) * | 2013-01-17 | 2014-07-17 | Apple Inc. | Generating notifications based on user behavior |
CN104951428A (zh) * | 2014-03-26 | 2015-09-30 | 阿里巴巴集团控股有限公司 | 用户意图识别方法及装置 |
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
CN106372132A (zh) * | 2016-08-25 | 2017-02-01 | 北京百度网讯科技有限公司 | 基于人工智能的查询意图预测方法和装置 |
CN107578294A (zh) * | 2017-09-28 | 2018-01-12 | 北京小度信息科技有限公司 | 用户行为预测方法、装置及电子设备 |
CN107886366A (zh) * | 2017-11-22 | 2018-04-06 | 深圳市金立通信设备有限公司 | 性别分类模型的生成方法、性别填充方法、终端及存储介质 |
CN108230007A (zh) * | 2017-11-28 | 2018-06-29 | 北京三快在线科技有限公司 | 一种用户意图的识别方法、装置、电子设备及存储介质 |
CN108427722A (zh) * | 2018-02-09 | 2018-08-21 | 卫盈联信息技术(深圳)有限公司 | 智能交互方法、电子装置及存储介质 |
-
2018
- 2018-11-09 CN CN201811333427.8A patent/CN109492104B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140201120A1 (en) * | 2013-01-17 | 2014-07-17 | Apple Inc. | Generating notifications based on user behavior |
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN104951428A (zh) * | 2014-03-26 | 2015-09-30 | 阿里巴巴集团控股有限公司 | 用户意图识别方法及装置 |
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
CN106372132A (zh) * | 2016-08-25 | 2017-02-01 | 北京百度网讯科技有限公司 | 基于人工智能的查询意图预测方法和装置 |
CN107578294A (zh) * | 2017-09-28 | 2018-01-12 | 北京小度信息科技有限公司 | 用户行为预测方法、装置及电子设备 |
CN107886366A (zh) * | 2017-11-22 | 2018-04-06 | 深圳市金立通信设备有限公司 | 性别分类模型的生成方法、性别填充方法、终端及存储介质 |
CN108230007A (zh) * | 2017-11-28 | 2018-06-29 | 北京三快在线科技有限公司 | 一种用户意图的识别方法、装置、电子设备及存储介质 |
CN108427722A (zh) * | 2018-02-09 | 2018-08-21 | 卫盈联信息技术(深圳)有限公司 | 智能交互方法、电子装置及存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN110245348B (zh) * | 2019-05-17 | 2023-11-24 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN111309817A (zh) * | 2020-01-16 | 2020-06-19 | 秒针信息技术有限公司 | 行为识别方法、装置及电子设备 |
CN111309817B (zh) * | 2020-01-16 | 2023-11-03 | 秒针信息技术有限公司 | 行为识别方法、装置及电子设备 |
CN114531334A (zh) * | 2020-11-04 | 2022-05-24 | 南京中兴新软件有限责任公司 | 意图处理方法、装置、电子设备和可读存储介质 |
CN112102013A (zh) * | 2020-11-06 | 2020-12-18 | 北京读我科技有限公司 | 一种基于特征融合的电销用户意图识别方法和*** |
CN112732846A (zh) * | 2021-01-27 | 2021-04-30 | 深圳市科荣软件股份有限公司 | 水务运营分析***、方法、电子设备及存储介质 |
CN112966828A (zh) * | 2021-03-01 | 2021-06-15 | 海南大学 | 面向意图计算与推理的可编程智能控制方法、装置及介质 |
CN117689311A (zh) * | 2023-12-04 | 2024-03-12 | 朴道征信有限公司 | 物品库存调整方法、装置、电子设备和计算机可读介质 |
CN117689311B (zh) * | 2023-12-04 | 2024-05-17 | 朴道征信有限公司 | 物品库存调整方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109492104B (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492104A (zh) | 意图分类模型的训练方法、分类方法、***、设备和介质 | |
CN106326248B (zh) | 数据库数据的存储方法和装置 | |
CN109359812A (zh) | 理财产品推荐方法、服务器及计算机可读存储介质 | |
JP2019215778A (ja) | サービス提供システム、広告関連サービス提供システム、ユーザ側設備及びユーザ側広告設備 | |
CN113761219A (zh) | 基于知识图谱的检索方法、装置、电子设备及存储介质 | |
CN104992348A (zh) | 一种信息展示的方法和装置 | |
CN110795613B (zh) | 商品搜索方法、装置、***及电子设备 | |
CN106649739A (zh) | 多轮交互信息继承识别方法、装置以及交互*** | |
CN111080417A (zh) | 用于提高预订顺畅率的处理方法、模型训练方法及*** | |
CN103440199A (zh) | 测试引导方法和装置 | |
CN113868507A (zh) | 结合rpa和ai的招投标信息获取方法、装置及电子设备 | |
CN115860880A (zh) | 基于多层异质图卷积模型的个性化商品推荐方法及*** | |
CN112241785B (zh) | 一种基于深度强化学习的图书采访方法 | |
CN116821516B (zh) | 资源推荐方法、装置、设备及存储介质 | |
Simons et al. | A cross-disciplinary technology transfer for search-based evolutionary computing: from engineering design to software engineering design | |
CN116662307A (zh) | 一种基于多源数据融合的智能预警方法、***及设备 | |
CN108921213B (zh) | 一种实体分类模型训练方法及装置 | |
Lo et al. | An emperical study on application of big data analytics to automate service desk business process | |
CN117112775A (zh) | 自动填写输入表单以生成列表的技术 | |
CN114385921B (zh) | 一种标书推荐方法、***、设备及存储介质 | |
CN116029757A (zh) | 一种基于深度学习的运营策略触发方法、装置和电子设备 | |
CN111507366B (zh) | 推荐概率模型的训练方法、智能补全方法及相关装置 | |
CN113344687A (zh) | 结合大数据的业务数据分析方法及数字金融服务平台 | |
CN110517069A (zh) | 一种多模态的用户画像方法及*** | |
CN111105258A (zh) | 商品定价的方法、装置和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210521 Address after: 100176 room 1004, 10th floor, building 1, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing Applicant after: Beijing Huijun Technology Co.,Ltd. Address before: 100086 8th Floor, 76 Zhichun Road, Haidian District, Beijing Applicant before: BEIJING JINGDONG SHANGKE INFORMATION TECHNOLOGY Co.,Ltd. Applicant before: BEIJING JINGDONG CENTURY TRADING Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |