CN111754062B

CN111754062B - 物品质量检测模型建立的方法和装置

Info

Publication number: CN111754062B
Application number: CN201911185615.5A
Authority: CN
Inventors: 李银锋; 黄明星; 刘婷婷; 周彬; 黄建杰; 赖晨东
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2023-01-31
Anticipated expiration: 2039-11-27
Also published as: CN111754062A

Abstract

本发明公开了物品质量检测模型建立的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：对物品的文本信息进行预处理，生成所述物品的第一信息；根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量；根据所述特征向量，建立物品质量检测模型。该实施方式解决了现有技术中存在的词库维护成本高、召回率低、需要耗费大量人力资源的技术缺陷，进而达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。

Description

物品质量检测模型建立的方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种物品质量检测模型建立的方法和装置。

背景技术

为了保证物品的质量，需要建立准确可靠的模型对物品质量进行检测，从而指导物品生产者改善商品质量。现有技术采用：业务相关的工作人员，通过阅读物品的文本信息确定物品的质量。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

1.词库维护成本高，召回率低，需要耗费大量人力资源从历史文本里提取关键词；

2.现有技术准确率低，开发成本高。

发明内容

有鉴于此，本发明实施例提供一种物品质量检测模型建立，能够达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。

为实现上述目的，根据本发明实施例的一个方面，提供了物品质量检测模型建立的方法，包括：

对物品的文本信息进行预处理，生成所述物品的第一信息；

根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量；

根据所述特征向量，建立物品质量检测模型。

可选地，对物品的文本信息进行预处理，生成所述物品的第一信息，包括：

剔除所述物品的文本信息中的特殊字符，生成第一文本信息；

将所述第一文本信息转换为按照文本顺序排列的字符序列；

根据预设序列长度截取所述字符序列，并在截取的所述字符序列的首尾添加分隔符，生成所述物品的第二文本信息；

将所述第二文本信息进行向量化，生成所述物品的第一信息。

可选地，将所述第二文本信息进行向量化，生成所述物品的第一信息，包括：

对所述第二文本信息中的每个字符对应的数值进行编码，生成数值编码；

对所述字符在所述第二文本信息中的位置进行编码，生成位置编码；

其中，所述数值编码和所述位置编码的维度相同；

将所述数值编码和所述位置编码按对应的维度进行加和的结果，确定为将所述第二文本信息进行向量化生成的第一信息。

可选地，根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量，包括：

对所述第一信息进行特征提取，生成文本特征向量；

将所述文本特征向量与所述物品的属性信息进行拼接，生成所述物品的特征向量。

可选地，对所述第一信息进行特征提取，生成文本特征向量，包括：

将所述第一信息中每个字符向量输入至自然语言理解预训练模型中；其中，所述自然语言理解预训练模型包含预设个数的隐藏层；

循环预设个数的隐藏层，对所述第一信息进行特征提取，生成文本特征向量；

其中，所述特征向量每个维度的取值范围为-1至1。

可选地，所述每个隐藏层包含第一子层和第二子层；

针对每一隐藏层，对所述第一信息进行特征提取，包括：

计算所述第一信息中每个字符向量与所述第一信息中的其他字符向量的相关关系；

将所述相关关系放入自然语言理解预训练模型的全连接层的输出，与所述相关关系相加后，进归一化操作，获取第一子层的输出；

确定所述第一子层的输出进行升维经过激活函数后进行降维的输出，与所述第一子层的输出相加后，进归一化操作，获取第二子层的输出。

可选地，根据所述特征向量，建立物品质量检测模型，包括：

将所述特征向量划分为测试集和训练集；

根据所述训练集，训练物品质量检测模型；

根据所述测试集，对训练好的所述物品质量检测模型进行评估。

可选地，根据所述训练集，训练物品质量检测模型，包括：

将所述训练集中的数据输入至强分类器模型进行训练；

利用网格搜索算法对所述强分类器模型的参数进行优化；

将训练好的强分类器模型结合完成优化后的参数，生成物品质量检测模型。

可选地，根据所述测试集，对训练好的所述物品质量检测模型进行评估，包括：

将所述测试集中的数据输入至训练好的物品质量检测模型，得到所述物品质量检测模型确定的第一差品率；

根据预设差品率阈值和第一差品率，确定所述物品质量检测模型得出的判断物品是否存在质量问题；

根据所述训练集中已知的存在质量问题的物品数量，确定所述物品质量检测模型的准确率和召回率。

根据本发明实施例的再一个方面，提供了一种物品质量检测模型建立的装置，包括：

第一信息生成模块，由于对物品的文本信息进行预处理，生成所述物品的第一信息；

特征向量建立模块，用于根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量；

模型建立模块，用于根据所述特征向量，建立物品质量检测模型。

根据本发明实施例的另一个方面，提供了一种物品质量检测模型建立电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明提供的物品质量检测模型建立方法。

根据本发明实施例的还一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明提供的物品质量检测模型建立方法。

上述发明中的一个实施例具有如下优点或有益效果：

本申请提取生成物品的特征向量，再根据特征向量建立物品质量检测模型的技术手段，解决了现有技术中存在的词库维护成本高、召回率低、需要耗费大量人力资源的技术缺陷，进而达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例的物品质量检测模型建立的方法的主要流程的示意图；

图2是根据本发明具体实施例的特征提的详细流程的示意图；

图3是根据本发明实施例的物品质量检测模型建立的方法的详细流程的示意图；

图4是根据本发明实施例的物品质量检测模型建立的装置的主要模块的示意图；

图5是本发明实施例可以应用于其中的示例性***架构图；

图6是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明实施例的物品质量检测模型建立的方法的主要流程的示意图，如图1所示，包括：

步骤S101、对物品的文本信息进行预处理，生成所述物品的第一信息；

步骤S102、根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量；

步骤S103、根据所述特征向量，建立物品质量检测模型。

所述物品的文本信息包括物品相关的描述信息，例如所述物品的用户对物品的评价、测评等。

由于物品的文本信息是由文字组成的，在本申请中可以采用对物品的文本信息进行预处理的技术手段，进而达到方便利用所述文本信息建立特征向量的有益效果。

可选地，在步骤S101对物品的文本信息进行预处理，生成所述物品的第一信息，包括：

剔除所述物品的文本信息中的特殊字符，生成第一文本信息，进而达到对文本信息做初步的数据清洗的目的；

将所述第一文本信息转换为按照文本顺序排列的字符序列；通过将字符顺序设定为按照文本顺序排列的技术手段，使得在后续将字符序列转化为向量时更为准确；

根据预设序列长度截取所述字符序列，并在截取的所述字符序列的首尾添加分隔符，生成所述物品的第二文本信息，具体地，可以在所述字符序列的首位添加“cls”作为所述序列起始位置的标识、在所述字符序列的末尾添加“sep”作为所述序列结束位置的标识，其中在首尾添加的分隔符没有实际意义；其中，由于在一段文本信息内取一部分信息就可以表达出用户对物品的态度，本申请具体实施例采用根据预设序列长度截取所述字符序列的技术手段，可以大幅度减少计算的压力，并且能够达到方便后续生成物品的第一信息更准确的技术效果；具体地，所述预设序列长度可以设置为350，故可以将长度大于348(除去首尾字符)的字符序列截取前348个字符；

将所述第二文本信息进行向量化，生成所述物品的第一信息，通过将所述第二文本信息进行向量化可以方便后续生成文本特征向量，进而方便模型的训练。

其中，将所述第二文本信息进行向量化，生成所述物品的第一信息，可以包括：

对所述第二文本信息中的每个字符对应的数值进行编码，生成数值编码；对所述字符在所述第二文本信息中的位置进行编码，生成位置编码；其中，所述数值编码和所述位置编码的维度相同，具体地，此处的编码维度可以设置为600维，进而达到在减少计算量的同时能够准确地包含每个字符的位置信息和数值信息

可选地，在步骤S102中根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量，包括：

对所述第一信息进行特征提取，生成文本特征向量；

其中，所述物品的属性信息可以包括：经过清洗后物品的类目，产地，店铺等信息。

将所述第一信息中每个字符向量输入至自然语言理解预训练模型中(bert模型)；其中，所述Bert模型(Bidirectional Encoder Representation from Transformers)是一种开源的中文版自然语言理解预训练模型。BERT是基于注意力机制的模型，相比于传统的神经网络，在长文本语境理解有很大的提升；其中，所述自然语言理解预训练模型包含预设个数的隐藏层；通常情况下所述隐藏层的个数为12层，在本申请中可以采用其他层数的隐藏层进行训练，例如10个隐藏层，进而在提高训练效率的同时不会影响生成的文本特征向量的准确性。

其中可选地，所述特征向量每个维度的取值范围为-1至1。

本申请具体实施例可以将Bert模型原有的12个隐藏层改为10个隐藏层，和/或，把编码的维度从768维降为600维，对原有模型结构的调整，可以达到大大减少了模型的参数量，提高模型训练预测速度的技术效果。

图2是根据本发明具体实施例的特征提的详细流程的示意图；如图2所示，所述每个隐藏层包含第一子层和第二子层；

具体地，针对每一隐藏层，对所述第一信息进行特征提取，包括：将所述的第一信息作为输入，放置在每一隐藏层中；

然后计算所述第一信息中每个字符向量与所述第一信息中的其他字符向量的相关关系(Attention)；

确定所述第一子层的输出进行升维经过gelu激活函数后进行降维的输出，与所述第一子层的输出相加后，进归一化操作，获取第二子层的输出。

将第一隐藏层的输出作为第二隐藏层的输入执行下一层的特征提取，当完成全部隐藏层的特征提取后，即可得到所述物品的文本特征向量。

在步骤S301根据所述特征向量，建立物品质量检测模型中，可选地包括：

将所述特征向量划分为测试集和训练集；其中设置测试集和训练集的比例可以为2：8，也可以更具实际情况调整所述比例；

根据所述训练集，训练物品质量检测模型；

可选地，根据所述训练集，训练物品质量检测模型，包括：

将所述训练集中的数据输入至强分类器模型进行训练；

利用网格搜索算法对所述强分类器模型的参数进行优化；

所述强分类器模型(Xgboost)是将许多弱分类器集成的强分类器模型，是boosting算法的一种，本发明采用Xgboost工具包是python第三方模块。通过训练，可以得到所述物品质量检测模型。

所述准确率是指模型预测商品存在质量问题且商品存在质量问题的数量除以模型预测商品存在质量问题的数量；召回率是指模型预测商品存在质量问题且商品存在质量问题的数量除以商品存在质量问题的数量。

在实际生产中，生成物品质量检测模型之前可以先对环境进行安装及模型下载：安装模型所依赖得环境python3，TensorFlow1.12，xgboost，下载预训练的中文bert模型。

在生成物品质量检测模型之后，包括模型的部署，也就是将所述物品质量检测模型部署在服务器上，以服务的形式供外部调用。

下面以一具体实施例说明本申请的方案，图3是根据本发明实施例的物品质量检测模型建立的方法的详细流程的示意图，如图3所示，包括如下步骤：其中，在本实施例中物品为电商平台中的商品。

首先，获取商品类目、商品产地、店铺名称、商品名称等属性信息，和商品的文本信息，并分别对所述属性信息和文本信息分别进行数据清洗；

然后将完成数据清洗的文本进行特征提取，并将完成特征提取的文本信息和属性信息进行特征整合；

再后，将完成特征整合的数据输入至Xgboost进行训练和评估，生成物品质量检测模型；

最后，将完成训练的物品质量检测模型在线上部署。

图4是根据本发明实施例的物品质量检测模型建立的装置的主要模块的示意图；如图4所示，提供了一种物品质量检测模型立的装置400，包括：

第一信息生成模块401，由于对物品的文本信息进行预处理，生成所述物品的第一信息；

特征向量建立模块402，用于根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量；

模型建立模块403，用于根据所述特征向量，建立物品质量检测模型。

图5示出了可以应用本发明实施例的物品质量检测模型建立方法或物品质量检测模型建立装置的示例性***架构500。

如图5所示，***架构500可以包括终端设备501、502、503，网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备501、502、503通过网络504与服务器505交互，以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器505可以是提供各种服务的服务器，例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理，并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的物品质量检测模型建立方法一般由服务器505执行，相应地，物品质量检测模型建立装置一般设置于服务器505中。

应该理解，图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图6，其示出了适于用来实现本发明实施例的终端设备的计算机***600的结构示意图。图6示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机***600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本发明的***中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括发送模块、获取模块、确定模块和第一处理模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，发送模块还可以被描述为“向所连接的服务端发送图片获取请求的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：

对物品的文本信息进行预处理，生成所述物品的第一信息；

根据所述特征向量，建立物品质量检测模型。

根据本发明实施例的技术方案，可以达到如下有益效果：

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种物品质量检测模型建立的方法，其特征在于，包括：

对物品的文本信息进行预处理，生成所述物品的第一信息，包括：剔除所述物品的文本信息中的特殊字符，生成第一文本信息；将所述第一文本信息转换为按照文本顺序排列的字符序列；根据预设序列长度截取所述字符序列，并在截取的所述字符序列的首尾添加分隔符，生成所述物品的第二文本信息；将所述第二文本信息进行向量化，生成所述物品的第一信息，包括：对所述第二文本信息中的每个字符对应的数值进行编码，生成数值编码；对所述字符在所述第二文本信息中的位置进行编码，生成位置编码；将所述数值编码和所述位置编码按对应的维度进行加和的结果，确定为将所述第二文本信息进行向量化生成的第一信息；

根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量，包括：对所述第一信息进行特征提取，生成文本特征向量；将所述文本特征向量与所述物品的属性信息进行拼接，生成所述物品的特征向量；其中，所述对所述第一信息进行特征提取，生成文本特征向量，包括：将所述第一信息中每个字符向量输入至自然语言理解预训练模型中；其中，所述自然语言理解预训练模型包含预设个数的隐藏层；循环预设个数的所述隐藏层，对所述第一信息进行特征提取，生成文本特征向量；

根据所述物品的特征向量，建立物品质量检测模型。

2.根据权利要求1所述的方法，其特征在于，所述数值编码和所述位置编码的维度相同。

3.根据权利要求1所述的方法，其特征在于，所述文本特征向量每个维度的取值范围为-1至1。

4.根据权利要求1所述的方法，其特征在于，所述每个隐藏层包含第一子层和第二子层；

针对每一隐藏层，对所述第一信息进行特征提取，包括：

5.根据权利要求1所述的方法，其特征在于，根据所述特征向量，建立物品质量检测模型，包括：

将所述特征向量划分为测试集和训练集；

根据所述训练集，训练物品质量检测模型；

6.根据权利要求5所述的方法，其特征在于，根据所述训练集，训练物品质量检测模型，包括：

将所述训练集中的数据输入至强分类器模型进行训练；

利用网格搜索算法对所述强分类器模型的参数进行优化；

7.根据权利要求5所述的方法，其特征在于，根据所述测试集，对训练好的所述物品质量检测模型进行评估，包括：

8.一种物品质量检测模型建立的装置，其特征在于，包括：

第一信息生成模块，由于对物品的文本信息进行预处理，生成所述物品的第一信息，包括：剔除所述物品的文本信息中的特殊字符，生成第一文本信息；将所述第一文本信息转换为按照文本顺序排列的字符序列；根据预设序列长度截取所述字符序列，并在截取的所述字符序列的首尾添加分隔符，生成所述物品的第二文本信息；将所述第二文本信息进行向量化，生成所述物品的第一信息，包括：对所述第二文本信息中的每个字符对应的数值进行编码，生成数值编码；对所述字符在所述第二文本信息中的位置进行编码，生成位置编码；将所述数值编码和所述位置编码按对应的维度进行加和的结果，确定为将所述第二文本信息进行向量化生成的第一信息；

特征向量建立模块，用于根据所述第一信息和所述物品的属性信息，建立所述物品的特征向量，包括：对所述第一信息进行特征提取，生成文本特征向量；将所述文本特征向量与所述物品的属性信息进行拼接，生成所述物品的特征向量；其中，所述对所述第一信息进行特征提取，生成文本特征向量，包括：将所述第一信息中每个字符向量输入至自然语言理解预训练模型中；其中，所述自然语言理解预训练模型包含预设个数的隐藏层；循环预设个数的所述隐藏层，对所述第一信息进行特征提取，生成文本特征向量；

模型建立模块，用于根据所述物品的特征向量，建立物品质量检测模型。

9.一种物品质量检测模型建立的电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。