CN110197188A

CN110197188A - 业务场景预测、分类的方法、***、设备和存储介质

Info

Publication number: CN110197188A
Application number: CN201810160035.XA
Authority: CN
Inventors: 王颖帅; 李晓霞; 苗诗雨
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2018-02-26
Filing date: 2018-02-26
Publication date: 2019-09-03

Abstract

本发明公开了一种业务场景预测、分类的方法、***、设备和存储介质。其中业务场景的预测方法包括：预设自定义词库，自定义词库包括N个词语，其中N为正整数；获取所有用户的历史输入信息；为每一历史输入信息添加标签数据，标签数据包括多个业务场景；对每一历史输入信息进行分词；用特征向量表示每一历史输入信息，特征向量包括N个分量，N个分量分别对应于自定义词库中的每一词语，N个分量的值分别表示每一词语在经分词的历史输入信息中出现的频次；将训练数据输入支持向量机，训练数据包括特征向量和标签数据，训练得到预测模型，预测模型用于根据用户输入信息预测目标业务场景。

Description

业务场景预测、分类的方法、***、设备和存储介质

技术领域

本发明涉及机器学习领域，特别涉及一种业务场景预测、分类的方法、***、设备和存储介质。

背景技术

随着人工智能的快速发展，机器学习算法在互联网技术领域取得了很大进步。在人机交互界面中，根据用户输入内容，预测并将用户分至用户最想浏览的业务场景，是未来互联网技术发展的趋势。

当前实现业务场景分类的技术方案采用斯坦福CoreNLP处理工具，首先进行基础语言底层分词、词性标注等分析，然后编写正则匹配模板，进而提取出特定话术中的特定业务场景。该技术方案提取业务场景的方法比较死板，只有存在相应的正则匹配模板，才能从特定话术中提取特定业务场景。而随着业务场景的扩大，为了提取特定话术中的特定业务场景，则需要编写越来越多的正则匹配模板，于是比较浪费人力与程序资源，应用起来也不够灵活。

发明内容

本发明要解决的技术问题是为了克服现有技术中实现业务场景分类的方法比较死板的缺陷，提供一种业务场景预测、分类的方法、***、设备和存储介质。

本发明是通过下述技术方案来解决上述技术问题：

一种业务场景的预测方法，其特点在于，所述预测方法包括：

预设自定义词库，所述自定义词库包括N个词语，其中N为正整数；

获取所有用户的历史输入信息；

为每一所述历史输入信息添加标签数据，所述标签数据包括多个业务场景；

对每一所述历史输入信息进行分词；

用特征向量表示每一所述历史输入信息，所述特征向量包括N个分量，所述N个分量分别对应于所述自定义词库中的每一词语，所述N个分量的值分别表示所述每一词语在经分词的所述历史输入信息中出现的频次；

将训练数据输入支持向量机，所述训练数据包括所述特征向量和所述标签数据，训练得到预测模型，所述预测模型用于根据用户输入信息预测目标业务场景。

较佳地，获取所有用户的历史输入信息的步骤具体包括：

获取并根据预设规则清洗所有用户的输入日志，得到历史输入信息。

较佳地，所述输入日志包括语音输入日志。

较佳地，所述业务场景包括以下至少一种：

特定对象查询业务场景、订单查询业务场景、模糊优惠查询业务场景、特定优惠查询业务场景、售后服务业务场景、全站直达业务场景、未知业务场景。

较佳地，所述特征向量还包括第N+1个分量，若所述N个分量的值均为0，则所述第N+1个分量的值为1；否则，所述第N+1个分量的值为0。

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特点在于，所述处理器执行所述计算机程序时实现上述任一种业务场景的预测方法。

一种计算机可读存储介质，其上存储有计算机程序，其特点在于，所述计算机程序被处理器执行时实现上述任一种业务场景的预测方法。

一种业务场景分类方法，其特点在于，所述业务场景分类方法包括：

利用上述任一种业务场景的预测方法获得预测模型；

获取用户语音输入信息；

利用所述预测模型根据所述用户语音输入信息预测目标业务场景。

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特点在于，所述处理器执行所述计算机程序时实现上述业务场景分类方法。

一种计算机可读存储介质，其上存储有计算机程序，其特点在于，所述计算机程序被处理器执行时实现上述业务场景分类方法。

一种业务场景的预测***，其特点在于，所述预测***包括：

词库预设模块，用于预设自定义词库，所述自定义词库包括N个词语，其中N为正整数；

历史信息获取模块，用于获取所有用户的历史输入信息；

标注模块，用于为每一所述历史输入信息添加标签数据，所述标签数据包括多个业务场景；

分词模块，用于对每一所述历史输入信息进行分词；

特征向量表示模块，用于用特征向量表示每一所述历史输入信息，所述特征向量包括N个分量，所述N个分量分别对应于所述自定义词库中的每一词语，所述N个分量的值分别表示所述每一词语在经分词的所述历史输入信息中出现的频次；

训练模块，用于将训练数据输入支持向量机，所述训练数据包括所述特征向量和所述标签数据，训练得到预测模型，所述预测模型用于根据用户输入信息预测目标业务场景。

较佳地，所述历史信息获取模块还用于获取并根据预设规则清洗所有用户的输入日志，得到历史输入信息。

较佳地，所述输入日志包括语音输入日志。

较佳地，所述业务场景包括以下至少一种：

一种业务场景分类***，其特点在于，所述业务场景分类***包括语音信息输入模块和上述任一种业务场景的预测***；

所述语音信息输入模块用于获取用户语音输入信息；

所述预测模型用于根据所述用户语音输入信息预测目标业务场景。

本发明的积极进步效果在于：本发明基于支持向量机模型，对输入的特征向量和标签数据进行训练，能够得到根据用户输入预测目标业务场景的预测模型，相比传统的斯坦福正则匹配模板，应用灵活且覆盖度广。

附图说明

图1为根据本发明实施例1的业务场景的预测方法的流程图。

图2为根据本发明实施例1的业务场景的预测方法的部分流程图。

图3为根据本发明实施例2的电子设备的硬件结构示意图。

图4为根据本发明实施例4的业务场景分类方法的流程图。

图5为根据本发明实施例7的业务场景的预测***的结构示意图。

图6为根据本发明实施例8的业务场景分类***的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例提供一种业务场景的预测方法，图1示出了本实施例的流程图。如图1所示，本实施例的业务场景的预测方法包括以下步骤：

步骤101、预设自定义词库；

步骤102、获取所有用户的历史输入信息；

步骤103、为每一历史输入信息添加标签数据；

步骤104、对每一历史输入信息进行分词；

步骤105、用特征向量表示每一历史输入信息

步骤106、将特征向量和标签数据输入支持向量机，训练得到预测模型。

具体地，在步骤101中，自定义词库包括N个词语(N为正整数)。应当理解，自定义词库可以根据实际需要进行设置，诸如可以包括中文常见词典、以及当前市售的产品词词典和品牌词词典，以期能够覆盖用户的所有生活场景。

如图2所示，步骤102可以进一步包括以下步骤：

步骤1021、获取所有用户的输入日志；

步骤1022、根据预设规则清洗所有用户的输入日志。

在步骤1021中，获取的输入日志既可以包括用户通过文字形式输入而生成的文字输入日志，也可以包括用户通过语音形式输入而生成的语音输入日志，以期全面了解用户的需求。在步骤1022中，通过预设规则，可以将诸如“啊啊啊”、“。。。”此类毫无意义的输入内容清洗出去，进而得到待进一步处理的具有价值的历史输入信息。

在步骤103中，通过人工标注的方式为每一历史输入信息添加标签数据，以标识出每一历史输入信息所属的业务场景，故而本实施例中的标签数据包括多个业务场景。

具体地，可以用标签数据ACT_COMMODITY来标识特定对象查询业务场景，该场景意指用户的购买意图或者查找商品，该场景对应的历史输入信息可以为：我想买小孩的平面拼图；你好请问有没有不加碘的盐；碎花连衣裙等。

可以用标签数据ACT_ORDER来标识订单查询业务场景，该场景意指与订单或者物流相关，该场景对应的历史输入信息可以为：我买的东西到哪儿了；我买的豆奶粉什么快递；我们东西都到哪里呢等。

可以用标签数据ACT_DISCOUNT来标识模糊优惠查询业务场景，该场景意指优惠活动查询或者优惠券信息查询，该场景对应的历史输入信息可以为：数码满3000减300的优惠券我怎么领不到；优惠券怎么领；有什么优惠等。

可以用标签数据ACT_SPECIFY_DISCOUNT来标识特定优惠查询业务场景，该场景意指对特定对象的优惠查询，该场景对应的历史输入信息可以为：我想买便宜打折的小米手机；请推荐一款现在正在搞活动有优惠的护眼台灯等。

可以用标签数据ACT_AFTER_SALES来标识售后服务业务场景，该场景意指与退换货、报修等售后服务相关，该场景对应的历史输入信息可以为：华为畅玩5屏幕坏了多少钱；我要退货；我要换货等。

可以用标签数据ACT_SHORT_CUT来标识全站直达业务场景，该场景意指特定的服务模块，该场景对应的历史输入信息可以为：购物车；客服等。

可以用标签数据UN_KNOWN来标识未知业务场景，该场景意指此历史输入信息不属于上述所有业务场景，此种历史输入信息可以为：你猜我想问你什么；怎么进行团购等。

在步骤104中，根据步骤101中预设的自定义词库，对每一历史输入信息进行分词，进而在步骤105中，用特征向量表示每一历史输入信息。具体地，在步骤105中，特征向量包括N个分量，该N个分量分别对应于自定义词库中的每一词语，该N个分量的值分别表示每一词语在经分词的历史输入信息中出现的频次。例如，自定义词库为{小米，白色，送货，美的，空调，电子烟}，包括6个词语，历史输入信息为“给我来件白色的美的空调”，则该历史输入信息用特征向量可以表示为[0,1,0,1,1,0]。

进一步地，考虑到自定义词库中词语的数量是有限的，存在历史输入信息不包括自定义词库中词语的情形，此时特征向量可以增设第N+1分量，若N个分量的值均为0，则第N+1个分量的值为1；否则，第N+1个分量的值为0。例如，自定义词库为{小米，白色，送货，美的，空调，电子烟}，历史输入信息为“给我来件白色的美的空调”，则该历史输入信息用特征向量可以表示为[0,1,0,1,1,0,0]，历史输入信息为“你好请问有没有不加碘的盐”，则该历史输入信息用特征向量可以表示为[0,0,0,0,0,0,1]。

在步骤106中，将步骤103得到的标签数据和步骤105得到的特征向量作为训练数据输入支持向量机，对支持向量机训练后得到预测模型，该预测模型用于根据用户输入信息预测目标业务场景。

具体地，在本实施例中的支持向量机中，对于给定的训练数据集{(X⁽¹⁾,y⁽¹⁾),(X⁽²⁾,y⁽²⁾),…,(X⁽ⁿ⁾,y⁽ⁿ⁾)}(其中X⁽ⁱ⁾可以表示特征向量，y⁽ⁱ⁾可以表示标签数据)和分隔超平面，定义分隔超平面关于样本点(X⁽ⁱ⁾,y⁽ⁱ⁾)的函数间隔为：γ_i＝y⁽ⁱ⁾(W.X⁽ⁱ⁾+b)，定义分隔超平面关于训练数据集的函数间隔为分隔超平面关于训练数据集中所有样本点的函数间隔的最小值。函数间隔可以表示分类预测的正确性和确定性，但是在分隔超平面中，如果其参数W和b同时扩大为原来的2倍，这对于分隔超平面来说，并没有任何改变，但是对于间隔函数，扩大为原来的2倍，为了解决这样的问题，可以引入几何间隔。

为了能够使得间隔是一个确定的值，可以对分隔超平面的参数W加上某些约束，如归一化，当W.X⁽ⁱ⁾+b与y⁽ⁱ⁾同号时，表示预测正确，样本到分隔超平面之间的几何间隔S可以表示为：

对于几何间隔最大的分隔超平面，每一个样本，需要满足：

在函数间隔中，函数间隔的值并不影响到最优问题的解。

满足上面间隔最大化的数学公式，条件比较苛刻，要求所有的样本都是线性可分的，但是在实际情况中，数据集很难满足这样的条件，对于一个数据集，其中存在部分的特异点，但是将这些特异点除去后，剩下的大部分的样本点组成的集合是线性可分的。

对分隔超平面的求解可以转化为对带约束的最小优化问题的求解，在本实施例中，对于带约束的优化问题求解，使用拉格朗日乘数法，将其转化为无约束优化问题的求解。

对于一个非线性的可分问题，可以采用核函数(诸如高斯核函数)的方式将非线性的问题转化成线性问题。

通过拉格朗日的对偶性，本实施例将原始的带约束的优化问题转化成其对偶问题，并通过对对偶问题的求解，得到对偶问题的最优解，最终得到原始问题的最优解。序列最小最优化算法的思想是将一个大的问题划分成一系列小的问题，通过对这些子问题的求解，达到对对偶问题的求解过程。

本实施例在已有的用户的输入日志的基础上获取历史输入信息，对每一历史输入信息添加标识业务场景的标签数据，并用特征向量表示每一历史数据，进而每一历史输入信息的特征向量以及标签数据形成一组训练数据，将得到的多组训练数据输入支持向量机训练之后，可以得到根据用户输入预测目标业务场景的预测模型。进而面对不断扩大的业务场景，无需相应地编写越来越多的正则匹配模板，相比传统的斯坦福正则匹配模板，本实施例的应用更加灵活且覆盖度更广。

实施例2

本实施例提供一种电子设备，电子设备可以通过计算设备的形式表现(诸如可以为服务器设备)，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中处理器执行计算机程序时可以实现实施例1提供的业务场景的预测方法。

图3示出了本实施例的硬件结构示意图，如图3所示，电子设备9具体包括：

至少一个处理器91、至少一个存储器92以及用于连接不同***组件(包括处理器91和存储器92)的总线93，其中：

总线93包括数据总线、地址总线和控制总线。

存储器92包括易失性存储器，例如随机存取存储器(RAM)921和/或高速缓存存储器922，还可以进一步包括只读存储器(ROM)923。

存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925，这样的程序模块924包括但不限于：操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器91通过运行存储在存储器92中的计算机程序，从而执行各种功能应用以及数据处理，例如本发明实施例1所提供的业务场景的预测方法。

电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且，电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备9使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)***、磁带驱动器以及数据备份存储***等。

应当注意，尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例3

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现实施例1提供的业务场景的预测方法。

其中，可读存储介质可以采用的更具体可以包括但不限于：便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中，本发明还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行实现实施例1中的业务场景的预测方法中的步骤。

其中，可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码，所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

实施例4

本实施例提供一种业务场景分类方法，图4示出了本实施例的流程图。如图4所示，本实施例的业务场景分类方法包括以下步骤：

步骤201、利用实施例1提供的业务场景的预测方法获得预测模型；

步骤202、获取用户语音输入信息；

步骤203、利用预测模型根据用户语音输入信息预测目标业务场景。

具体地，在人机交互界面中，用户可以通过语音的方式与终端设备沟通以表达自己的需求。遍历用户的输入日志可知，用户与终端设备交互的第一句话往往集中表达了用户的需求，因而在本实施例中，可以提取用户与终端设备交互的第一句话作为预测模型的输入，进而预测模型可以根据该输入内容输出预测的用户想要浏览的目标业务场景。因此，本实施例提供的业务场景分类方法能够切合用户的需求，提高用户的体验度。

实施例5

本实施例提供一种电子设备，电子设备可以通过计算设备的形式表现(诸如可以为服务器设备)，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中处理器执行计算机程序时可以实现实施例4提供的业务场景分类方法。

实施例6

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现实施例4提供的业务场景分类方法。

实施例7

实施例7提供一种业务场景的预测***，图5示出了本实施例的结构示意图。如图5所示，本实施例的业务场景的预测***10具体包括：词库预设模块1、历史信息获取模块2、标注模块3、分词模块4、特征向量表示模块5以及训练模块6。

具体地，词库预设模块1用于预设自定义词库，该自定义词库包括N个词语(N为正整数)。应当理解，自定义词库可以根据实际需要进行设置，诸如可以包括中文常见词典、以及当前市售的产品词词典和品牌词词典，以期能够覆盖用户的所有生活场景。

历史信息获取模块2用于获取所有用户的历史输入信息，具体地，历史信息获取模块2可以用于获取并根据预设规则清洗所有用户的输入日志，进而得到历史输入信息。其中，获取的输入日志既可以包括用户通过文字形式输入而生成的文字输入日志，也可以包括用户通过语音形式输入而生成的语音输入日志，以期全面了解用户的需求。此外，通过预设规则，可以将诸如“啊啊啊”、“。。。”此类毫无意义的输入内容清洗出去，进而得到待进一步处理的具有价值的历史输入信息。

标注模块3用于为每一历史输入信息添加标签数据，具体可以通过人工标注的方式为每一历史输入信息添加标签数据，以标识出每一历史输入信息所属的业务场景，故而本实施例中的标签数据包括多个业务场景。

分词模块4用于对每一历史输入信息进行分词，具体地，分词模块4根据词库预设模块1预设的自定义词库，对每一历史输入信息进行分词，进而特征向量表示模块5用特征向量表示每一历史输入信息。其中，特征向量包括N个分量，该N个分量分别对应于自定义词库中的每一词语，该N个分量的值分别表示每一词语在经分词的历史输入信息中出现的频次。例如，自定义词库为{小米，白色，送货，美的，空调，电子烟}，包括6个词语，历史输入信息为“给我来件白色的美的空调”，则该历史输入信息用特征向量可以表示为[0,1,0,1,1,0]。

训练模块6用于将训练数据输入支持向量机，具体地，训练模块6将标注模块3添加的标签数据和特征向量表示模块5得到的特征向量作为训练数据输入支持向量机，对支持向量机训练后得到预测模型，该预测模型用于根据用户输入信息预测目标业务场景。

对于几何间隔最大的分隔超平面，每一个样本，需要满足：

在函数间隔中，函数间隔的值并不影响到最优问题的解。

实施例8

本实施例提供一种业务场景分类***，图6示出了本实施例的结构示意图。如图6所示，本实施例的业务场景分类***具体包括：语音信息输入模块7和实施例7提供的业务场景的预测***10。其中，语音信息输入模块7用于获取用户语音输入信息，预测***10获得的预测模型用于根据用户语音输入信息预测目标业务场景。

具体地，在人机交互界面中，用户可以通过语音的方式与终端设备沟通以表达自己的需求。遍历用户的输入日志可知，用户与终端设备交互的第一句话往往集中表达了用户的需求，因而在本实施例中，可以提取用户与终端设备交互的第一句话作为预测模型的输入，进而预测模型可以根据该输入内容输出预测的用户想要浏览的目标业务场景。因此，本实施例提供的业务场景分类***能够切合用户的需求，提高用户的体验度。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。

Claims

1.一种业务场景的预测方法，其特征在于，所述预测方法包括：

获取所有用户的历史输入信息；

对每一所述历史输入信息进行分词；

2.如权利要求1所述的业务场景的预测方法，其特征在于，获取所有用户的历史输入信息的步骤具体包括：

3.如权利要求2所述的业务场景的预测方法，其特征在于，所述输入日志包括语音输入日志。

4.如权利要求1所述的业务场景的预测方法，其特征在于，所述业务场景包括以下至少一种：

5.如权利要求1所述的业务场景的预测方法，其特征在于，所述特征向量还包括第N+1个分量，若所述N个分量的值均为0，则所述第N+1个分量的值为1；否则，所述第N+1个分量的值为0。

6.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的业务场景的预测方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的业务场景的预测方法。

8.一种业务场景分类方法，其特征在于，所述业务场景分类方法包括：

利用如权利要求1-5中任一项所述的业务场景的预测方法获得预测模型；

获取用户语音输入信息；

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求8所述的业务场景分类方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求8所述的业务场景分类方法。

11.一种业务场景的预测***，其特征在于，所述预测***包括：

历史信息获取模块，用于获取所有用户的历史输入信息；

分词模块，用于对每一所述历史输入信息进行分词；

12.如权利要求11业务场景的预测***，其特征在于，所述历史信息获取模块还用于获取并根据预设规则清洗所有用户的输入日志，得到历史输入信息。

13.如权利要求12业务场景的预测***，其特征在于，所述输入日志包括语音输入日志。

14.如权利要求11业务场景的预测***，其特征在于，所述业务场景包括以下至少一种：

15.如权利要求11业务场景的预测***，其特征在于，所述特征向量还包括第N+1个分量，若所述N个分量的值均为0，则所述第N+1个分量的值为1；否则，所述第N+1个分量的值为0。

16.一种业务场景分类***，其特征在于，所述业务场景分类***包括语音信息输入模块和如权利要求11-15中任一项所述的业务场景的预测***；

所述语音信息输入模块用于获取用户语音输入信息；