CN113361787A - 商品归类***、方法、存储介质及终端 - Google Patents
商品归类***、方法、存储介质及终端 Download PDFInfo
- Publication number
- CN113361787A CN113361787A CN202110654273.8A CN202110654273A CN113361787A CN 113361787 A CN113361787 A CN 113361787A CN 202110654273 A CN202110654273 A CN 202110654273A CN 113361787 A CN113361787 A CN 113361787A
- Authority
- CN
- China
- Prior art keywords
- classification
- prediction
- data
- unit
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000004891 communication Methods 0.000 claims abstract description 29
- 238000013145 classification model Methods 0.000 claims description 48
- 239000013598 vector Substances 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 40
- 238000011156 evaluation Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000011144 upstream manufacturing Methods 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 239000000047 product Substances 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008676 import Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/381—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using identifiers, e.g. barcodes, RFIDs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0831—Overseas transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种商品归类***、方法、存储介质及终端,所述商品归类***包括:用户信息模块,用于采集用户提供的用户信息;商品预测分类模块,与所述用户信息模块通信连接,用于根据所述用户信息中商品的文本描述信息进行分类预测,以得到商品预归类的预测结果;数据库模块,与所述商品预测分类模块通信连接,用于存储所述用户信息和编码数据;其中,所述商品预测分类模块根据所述文本描述信息进行分类预测,以从所述数据库模块中取出所述编码数据作为预测结果,所述商品预测分类模块将所述预测结果存储至所述数据库模块,有效提高了商品编码分类的准确性,解决了商品编码分类时流程复杂和时效慢的问题。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种商品归类***、方法、存储介质及终端。
背景技术
HS编码即海关编码,是海关合作理事会,现名世界海关组织主持制定的一部供海关、统计、进出口管理及与国际贸易有关各方共同使用的商品分类编码体系。在我国适用于税则、统计、生产、运输、贸易管制、检验检疫等多方面。我国进出口税则采用十位编码,前八位等效采用HS编码,后两位是我国的子目。现有的HS编码涵盖类目22个,将近12万个。
为了实现货物的进出通关,电商一般是将自己货物情况提交到有预归类咨询资质的企业进行HS编码分类。预归类企业将商品信息交由商品归类专家进行人工归类,并出具归类证明。但是这对于小微跨境电商无疑是加重了申报支出和申报时间。为了帮助小微跨境电商减负,因此提出了HS编码的智能归类***。
比如在公开号为CN112529420A的专利中公开了“海关商品编码智能归类方法及***”,其智能归类方法包括以下步骤:根据商品类目对商品数据进行分类后建立商品参数模型;根据所述商品参数模型采集商品参数,并将所述商品参数添加到商品物料库;基于所述商品参数对所述商品物料库中各商品根据分类规则添加海关商品编码;当收到海关申报时,获取待申报商品型号,并从所述商品物料库中获取对应的海关商品编码;根据海关商品编码确定所需要的申报要素,并根据申报商品型号获取对应的申报要素值。
但目前的分类***在针对超大类别标签分类及类别标签的在线修改时,实现难度较大,并且在样本数据缺少多样性的情况下,无法获得精确度较高的模型,从而影响分类结果的准确性。
因此,有必要提供一种新型的商品归类***、方法、存储介质及终端以解决现有技术中存在的上述问题。
发明内容
本发明的目的在于提供一种商品归类***、方法、存储介质及终端,有效提高了商品编码分类的准确性,解决了商品编码分类时流程复杂和时效慢的问题。
为实现上述目的,本发明的所述一种商品归类***,所述商品归类***包括:
用户信息模块,用于采集用户提供的用户信息;
商品预测分类模块,与所述用户信息模块通信连接,用于根据所述用户信息中商品的文本描述信息进行分类预测,以得到商品预归类的预测结果;
数据库模块,与所述商品预测分类模块通信连接,用于存储所述用户信息和编码数据;
其中,所述商品预测分类模块根据所述文本描述信息进行分类预测,以从所述数据库模块中取出所述编码数据作为预测结果,所述商品预测分类模块将所述预测结果存储至所述数据库模块。
本发明的所述商品归类***的有益效果在于:通过用户信息模块采集用户提供的用户信息,利用商品预测分类模块对用户信息中的商品的文本描述信息进行分类预测,从而得到商品预归类的预测结果,从数据库模块中取出所述编码信息作为预测结果,从而完成对商品的预测归类,提高了商品归类的高效性和准确性,而且用户信息和编码数据都存储在数据库模块之中,商品预测分类模块将预测结果实时存入数据库模块以更新数据库模块中的数据,从而实现数据库模块的实时更新,有效提高了预测结果的准确性。
在一种可能的实现方式中,所述商品预测分类模块包括编码预测单元,所述编码预测单元与所述用户信息模块通信连接,所述用户信息包括商品的文本描述信息,所述编码预测单元通过编码分类模型对所述商品的文本描述信息进行编码预测以得到所述商品的预测结果。其有益效果在于:编码预测单元通过编码分类模型对把文本描述信息进行编码预测以得到商品的预测结果,以编码分类模型实现预测,有效提高了预测结果的准确性。
在一种可能的实现方式中,所述编码预测单元包括上游任务组、下游任务组和合并任务组,所述上游任务组和下游任务组均与所述合并任务组通信连接,所述上游任务组通过编码分类模型对所述文本描述信息进行预处理以得到特征向量,所述下游任务组包括相似度对比任务部和编码分类任务部,所述相似度对比任务部用于将所述特征向量输入局部分类模型中获取位于第一阈值之前的第一预测值,并根据所述特征向量和所述第一预测值从所述数据库模块中获取召回编码数据,并对所述召回编码数据和所述特征向量进行相似度计算以得到相似度结果,根据所述相似度结果对所述召回编码数据进行排序,输出排序后的所述召回编码数据,所述编码分类任务部用于根据所述特征向量从所述数据库模块中获取编码数据并分类,输出经过分类排序后的分类编码数据,所述合并任务组用于对所述相似度对比任务部输出的排序后的所述召回编码数据和所述编码分类任务部输出的所述分类编码数据进行合并处理以得到合并结果,并将所述合并结果作为所述预测结果。其有益效果在于:上游任务组根据商品的文本描述信息获取商品的特征向量,而下游任务组的相似度对比任务部根据特征向量根据获取,根据特征向量和预测值从所述数据库模块中获取召回编码数据,之后对特征向量和召回编码数据进行相似度计算,并输出经过相似度排序后的召回编码数据,而下游任务组的编码分类部则根据特征向量直接获取经过分类排序后的分类编码数据,之后通过合并任务组队召回编码数据和分类编码数据进行合并,以得到合并结果作为最终的预测结果,从而完成商品的编码预测,以得到准确的预测结果。
在一种可能的实现方式中,所述商品预测分类模块还包括与所述编码预测单元通信连接的神经网络训练单元,所述相似度对比任务部采用相似度比对模型进行相似度计算,所述编码分类任务部采用编码分类模型对所述相似数据进行分类,所述神经网络训练单元通过从所述数据库模块中抽取数据对所述局部分类模型、所述编码分类模型、所述相似度比对模型和所述编码分类模型进行优化更新。其有益效果在于:通过神经网络训练单元对编码预测单元中用到的编码分类模型、所述相似度比对模型和所述编码分类模型进行模型优化。
在一种可能的实现方式中,所述商品预测分类模块包括数据召回单元,所述数据召回单元与所述编码预测单元通信连接,所述编码预测单元通过所述数据召回单元调用所述数据库模块中的数据。
在一种可能的实现方式中,所述数据召回单元包括信息修改部,所述信息修改部用于对所述数据库模块中的数据分类和编码信息进行修改。
在一种可能的实现方式中,所述数据库模块包括知识库单元和训练库单元,所述知识库单元用于存储商品的数据集,所述数据集为所述商品的编码和要素的集合,所述训练库单元用于存储所述神经网络训练单元使用的训练数据。
在一种可能的实现方式中,所述数据库模块还包括用户库单元和抽取单元,所述用户库单元用于存储所述用户信息、***权限信息、商品历史归类信息和用户评价信息中的至少一种,所述抽取单元输入端与所述用户库单元通信连接,所述抽取单元输出端分别与所述知识库单元和所述训练库单元通信连接,所述抽取单元将所述用户库中的数据和跨境通关数据抽取并分别传输到所述知识库单元和所述训练库单元。
在一种可能的实现方式中,所述用户信息模块包括用户管理单元、用户操作记录单元和用户评价单元中的至少一个,所述用户管理单元、所述用户操作记录单元和所述用户评价单元均与用户库单元通信连接,所述用户管理单元用于记录用户信息和用户权限信息,所述用户操作记录单元用于记录所述用户的操作记录信息和归类信息,所述用户评价单元用于收集所述用户对所述归类信息的评价信息。
本发明公开了一种商品归类方法,应用于上述的商品归类***,所述商品归类方法包括如下步骤:
通过用户信息模块获取用户输入的商品的文本描述信息;
通过商品预测分类模块调用所述数据库模块中的数据,根据所述文本描述信息对商品进行分类预测,以得到商品预归类的预测结果;
根据所述预测结果对所述商品进行归类。
本发明所述的商品归类方法的有益效果在于:通过上述的商品归类方法对商品进行预测分类,以得到最终的预测结果,从而有效提高了预测结果的准确性,能够有效缩短商品编码预测的时间,降低成本。
在一种可能的实现方式中,所述根据所述文本描述信息对商品进行分类预测,以得到商品预归类的预测结果,包括:
对所述商品的文本描述信息进行预处理以去除特殊字符;
提取去除特殊字符后的所述文本描述信息中的特征向量,将所述特征向量输入到局部分类模型中以获取预测值,根据所述预测值和所述特征向量从所述数据库模块中获取召回编码数据;
通过相似度比对模型对所述召回编码数据和所述特征向量进行相似度计算以得到相似度计算结果,根据所述相似度计算结果对所述召回编码数据排序得到第一排序结果;
将所述特征向量输入所述编码分类模型得到编码数据,并对所述编码数据进行分类得到分类编码数据,按照分类得分对所述分类编码数据进行排序得到第二排序结果;
将所述第一排序结果和所述第二排序结果合并处理得到合并结果,将所述合并结果作为所述商品预归类的预测结果。
在一种可能的实现方式中,所述将所述第一排序结果和所述第二排序结果合并处理得到合并结果,将所述合并结果作为所述商品预归类的预测结果,包括:
根据预设阈值对所述第一排序结果进行过滤,以滤除低于所述预设阈值的编码数据;
判断所述第一排序结果中是否存在大于所述预设阈值的编码数据;
如果存在,将所述第一排序结果中大于所述预设阈值的编码数据作为所述预测结果,如果不存在,将所述第二排序结果中的编码数据作为所述预测结果。
本发明进一步公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
本发明还提供了一种终端,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述的方法。
上述计算机可读存储介质和终端的有益效果参照前述的商品归类***和商品归类方法的有益效果。
附图说明
图1为本发明实施例的商品归类***的结构框图;
图2为本发明实施例的商品归类***的商品预测分类模块的结构框图;
图3为本发明实施例的商品归类***的编码预测单元的结构框图;
图4为本发明实施例的商品归类***的数据召回单元的结构框图;
图5为本发明实施例的商品归类***的数据库模块的结构框图;
图6为本发明实施例的商品归类***的用户信息模块的结构框图;
图7为本发明实施例的商品归类***的内部结构框图;
图8为本发明实施例的商品归类方法的流程图;
图9为本发明实施例的商品归类方法的步骤S2的流程图;
图10为本发明实施例的商品归类方法的步骤S25的流程图;
图11为本发明实施例的商品归类方法的归类过程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。除非另外定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本文中使用的“包括”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
针对现有技术存在的问题,本发明的实施例提供了一种商品归类***,如图1所示,所述商品归类***包括顺次通信连接的用户信息模块1、商品预测分类模块2和数据库模块3,其中:
所述用户信息模块1用于采集用户提供的用户信息;
所述商品预测分类模块2与所述用户信息模块1通信连接,用于根据所述用户信息中商品的文本描述信息进行分类预测,以得到商品预归类的预测结果;
数据库模块3,与所述商品预测分类模块2通信连接,用于存储所述用户信息和编码数据;
其中,所述商品预测分类模块2根据所述文本描述信息进行分类预测,以从所述数据库模块3中取出所述编码数据作为预测结果,所述商品预测分类模块2将所述预测结果存储至所述数据库模块3。
通过上述的商品归类***,在用户将商品的信息输入到商品归类***之后,通过用户信息模块1采集用户提供的用户信息,包括商品的文本描述信息,而商品预测分类模块2根据商品的文本描述信息对商品的编码进行分类预测,从而从数据库模块3中得到商品预归类的预测结果,以便于后续根据所述预测结果对商品进行分类。
而商品预测分类***中的数据库模块3不仅存储用户信息和编码数据,还将商品预测分类模块2的预测结果存储在数据库模块3之中,从而实时更新数据库模块3中的数据,以提高商品归类***最终预测结果的准确性。
在一些实施例中,图2为本发明实施例的商品归类***的商品预测分类模块的结构框图,如图2所示,所述商品预测分类模块2包括编码预测单元21,所述编码预测单元21与所述用户信息模块1通信连接,所述用户信息包括商品的文本描述信息,所述编码预测单元21通过编码分类模型对所述商品的文本描述信息进行编码预测以得到所述商品的预测结果,在用户将用户信息输入到用户信息模块1之中后,由于用户信息包括商品的文本描述信息,商品预测分类模块2根据文本描述信息对商品的分类进行预测,从而就可以从数据库模块3中的数据库中取出编码数据作为预测结果,以便于后续根据预测结果对商品进行分类处理。
在一些实施例中,图3为本发明实施例的商品归类***的编码预测单元的结构框图,如图3所示,所述编码预测单元21包括上游任务组211、下游任务组212和合并任务组213,所述上游任务组211和下游任务组212均与所述合并任务组213通信连接,所述上游任务组211通过编码分类模型对所述文本描述信息进行预处理以得到特征向量,所述下游任务组212包括相似度对比任务部2121和编码分类任务部2122,所述相似度对比任务部2121用于将所述特征向量输入局部分类模型中获取位于第一阈值之前的第一预测值,并根据所述特征向量和所述第一预测值从所述数据库模块3中获取召回编码数据,并对所述召回编码数据和所述特征向量进行相似度计算以得到相似度结果,根据所述相似度结果对所述召回编码数据进行排序,输出排序后的所述召回编码数据,所述编码分类任务部2122用于根据所述特征向量从所述数据库模块3中获取编码数据并分类,输出经过分类排序后的分类编码数据,所述合并任务组213用于对所述相似度对比任务部2121输出的排序后的所述召回编码数据和所述编码分类任务部2122输出的所述分类编码数据进行合并处理以得到合并结果,并将所述合并结果作为所述预测结果。
具体的,所述编码预测单元21的处理过程为:
在用户通过用户信息模块1输入用户信息之后,编码预测单元21根据用户信息中商品的文本描述信息,整个编码预测单元21采用编码分类模型对商品进行预测分类的过程中,首先上游任务组211通过编码分类模型对文本描述信息进行预处理,从而得到商品的特征向量。
在一些实施例中,所述上游任务组211通过编码分类模型的ERNIE的Embedding获取特征向量,由于上述过程为现有技术的内容,本申请方案不涉及对获取特征向量的改进,此处不再赘述。
之后下游任务组212的相似度对比任务部2121将特征向量输入到局部分类模型模型获取多个预测值,之后将预测值与第一阈值进行对比,从而得到大于第一阈值的第一预测值,之后相似度对比任务部2121根据特征向量和第一预测值从所述数据库模块3中获取召回编码数据,并将召回编码数据和特征向量进行相似度计算以得到相似度结果,根据相似度计算结果对每一个召回编码数据进行排序,并按照从高到低的顺序将排序后的召回编码数据输出;而另一方面,在获取到商品的特征向量之后,编码分类任务部2122则将特征向量输入编码分类模型中,从而从所述数据库模块3中获取编码数据并分类,输出经过分类排序后的分类编码数据,之后召回编码数据和分类编码数据分别输入到合并任务组213内部,通过合并任务组213进行合并处理,以得到最终的编码数据。
在一些实施例中,所述相似度对任务部2121获取排名在前5位的预测值作为第一预测值;所述编码分类任务部2122也是输出排名在前5位的数据作为分类编码数据。
在合并任务组213对召回编码数据和分类编码数据进行合并处理的过程中,合并任务组213对排序后的召回编码数据进行与预设阈值进行比较,滤除低于预设阈值大小的召回编码数据,以判断是否存在大于预设阈值的召回编码数据,如果存在,则将大于预设阈值的召回编码数据作为最终的预测结果,即商品的编码分类结果;而如果不存在,则将分类编码数据直接作为最终的预测结果,即商品的编码分类结果。
在一些实施例中,所述商品预测分类模块2还包括与所述编码预测单元21通信连接的神经网络训练单元22,所述相似度对比任务部2121采用相似度比对模型进行相似度计算,所述编码分类任务部2122采用编码分类模型对所述相似数据进行分类,所述神经网络训练单元22通过从所述数据库模块3中抽取数据对所述局部分类模型、所述编码分类模型、所述相似度比对模型和所述编码分类模型进行优化更新。
在商品归类***进行分类处理的过程中,通过神经网络训练单元22对编码预测单元21对所述局部分类模型、所述编码分类模型、所述相似度比对模型和所述编码分类模型进行优化更新,从而提高编码预测单元21的预测结果的准确性,满足数据实时更新的要求。
在一些实施例中,所述商品预测分类模块2包括数据召回单元23,所述数据召回单元23与所述编码预测单元21通信连接,所述编码预测单元21通过所述数据召回单元23调用所述数据库模块3中的数据。
在编码预测单元21完成编码预测之后,通过数据召回单元23提供召回算法,将数据库模块3中的编码数据召回,从而便于所述编码预测单元21快速调取数据库模块3中的编码数据。
在一些实施例中,图4为本发明实施例的商品归类***的数据召回单元的结构框图,如图4所示,所述数据召回单元23包括信息修改部231,所述信息修改部231用于对所述数据库模块3中的数据分类和编码信息进行修改,通过信息修改部231对数据库模块3中的数据分类和编码信息进行修改,以便于对数据库模块3中的数据进行调整。
具体的,所述信息修改部231提供了数据库模块3中的数据修改接口,包括人工修改数据库模块3中的数据大类、编码信息,以便于实现商品类别标签的在线修改。
需要说明的是,所述信息修改部231通过提供召回算法调用数据库模块3中的数据,具体的,召回算法首先是通过HS编码数据的编码前四位(等同于商品大类)在知识库中进行第一层的过滤,然后通过特征向量进行第二层的搜索,最后将召回结果从所述数据库模块3中召回。
在一些实施例中,图5为本发明实施例的商品归类***的数据库模块的结构框图,如图5所示,所述数据库模块3包括知识库单元31和训练库单元32,所述知识库单元31用于存储商品的数据集,所述数据集为所述商品的编码和要素的集合,以便于为所述编码分类单元21提供编码数据,所述训练库单元32用于存储所述神经网络训练单元22使用的训练数据。
其中,所述知识库单元31提供的数据集是经过处理后的商品的编码数据和要素的结合,具体的,所述数据集包括商品的商品名称,商品产地,商品规格,商品型号,商品大小,商品成分,功能,企业名称,特征值向量和商品HS编码;所述数据集是从跨境通关数据和用户评价分类正确的数据之中产生。
进一步的,所述知识库单元31中的数据集会定时更新,以定时清理掉数据集中的错误数据,以保证整个知识库单元31的数据集的实时性。
在一些实施例中,数据集的获取流程是通过数据仓库工具ETL从跨境通关数据源和用户库中抽取数据,然后对抽取数据使用预处理偶像进行特征向量的计算,将大类相同,HS编码相同,并且词向量距离小于10的数据合并,最后保存到知识库单元31中,从而得到完整的数据集。
进一步的,所述训练库单元32用于存储所述神经网络训练单元22使用的训练数据,所述训练数据来源于商品的跨境通关数据和用户库,不仅包括用户判断为正确的数据,还包括用户判断为错误的数据,以便于保证训练数据能够从各个方面对各个模型进行训练,以提高神经网络训练单元22的训练的高效性。
在一些实施例中,所述数据库模块3还包括用户库单元33和抽取单元34,所述用户库单元33用于存储所述用户信息、***权限信息、商品历史归类信息和用户评价信息中的至少一种,在本实施例中,所述用户库单元33包括用户信息、***权限信息、商品历史归类信息和用户评价信息,其中用户信息和***权限信息作为持久化组件,商品归类历史信息记录了用户曾经的归类记录,方便用户快速查询,以便于结合用户评价为***构建用户的评价体系,为***的质量提供可跟踪、有过程的提升轨迹。
所述抽取单元34输入端与所述用户库单元33通信连接,所述抽取单元33输出端分别与所述知识库单元31和所述训练库单元32通信连接,所述抽取单元34将所述用户库中的数据和跨境通关数据抽取并分别传输到所述知识库单元31和所述训练库单元32。
具体的,所述抽取单元34采用数据仓库工具ETL,由SPARK框架搭建,定时从用户库单元33和商品跨境通关数据中抽取数据到知识库单元31和训练库单元32,以便于对知识库单元31和训练库单元32中的数据进行及时更新。
在一些实施例中,所述用户信息模块1包括用户管理单元11、用户操作记录单元12和用户评价单元13中的至少一个。
在本实施例中,图6为本发明实施例的商品归类***的用户信息模块的结构框图,如图6所示,所述用户信息模块1包括用户管理单元11、用户操作记录单元12和用户评价单元13,所述用户操作记录单元12和用户评价单元13均与所述用户管理单元11通信连接;其中,所述用户管理单元11、所述用户操作记录单元12和所述用户评价单元13均与用户库单元33通信连接,以便于用户库单元33及时获取用户管理单元11、用户操作记录单元12和用户评价单元13中的信息。
在一些实施例中,所述用户信息模块1包含网页版和微信小程序两部分,分别适配桌面电脑和微信上操作。并且交互界面提供用户认证功能,保护个人操作记录不被泄漏,在使用时,用户可以通过交互界面进行输入要归类的商品信息,并且获得HS编码的归类结果。同时用户可以查询HS编码的有效信息和历史归类结果。
所述用户管理单元11用于记录用户信息和用户权限信息,至少包括用户信息和用户权限两个功能;具体是提供用户注册,用户信息收集,用户权限配置和用户鉴权的功能,其中用户信息、权限信息都会持久化存储到到用户库单元33中。
所述用户操作记录单元12用于记录所述用户的操作记录信息和归类信息,即用于记录用户每次的操作记录和归类的反馈;它主要提供两个功能。一是记录用户进行过的商品归类,凡是用户通过交互界面进行的商品归类,用户操作记录单元12都将把用户信息,用户输入的商品信息以及当时的归类结果记录到用户库单元33中。二是展示用户曾经在交互界面输入的商品名称,商品描述信息,包括商品规格,商品型号,商品大小,商品成份,商品重量,商品产地等多个特征描述文本,以及HS编码归类的结果,并提供基于商品描述的中文检索功能,由于上述实现过程为现有技术的内容,本发明不涉及其本身的改进,对此处不再赘述。
所述用户评价单元13用于收集所述用户对所述归类信息的评价信息,其作用是收集归类结果评价,为神经网络训练单元22和知识库单元31提供了部分的数据来源,用户可以在商品归类页面和历史归类页面中对归类结果进行评价,评价为两类,正确和错误。用户评价单元13会将评价结果会保存到用户库单元33中。并会定期统计评价结果生成***评价分数,该分数会作为***的衡量指标之一。
另一方面,商品归类***会对积极评价的数据进行周期性的清洗,将得到正确反馈的数据通过抽取单元34,比如ETL工具,进行特殊字符的过滤,提取HS编码前四位,使用局部分类模型向量化,最终补充到知识库单元31当中,保证知识库的时效性。
在一些实施例中,所述局部分类模型为HS编码前四位分类模型,所述编码分类模型为HS编码分类模型。
在一些实施例中,所述知识库单元31中的知识库的搭建过程为:
利用SPARK框架搭建ETL工具程序从多个数据源收集数据源到知识库中,通过ETL工具对数据源进行预处理,预处理内容包括特殊字符的过滤、缺失数据的处理、HS编码前4位的截取、基于ERNIE的特征向量生成、相近词归并等操作;其中数据源由两部分组成,一是用户评价正确的历史归类数据,二是收集的商品跨境通关数据。
在又一些实施例中,所述训练库单元32中的训练库的搭建过程为:
利用SPARK框架搭建ETL工具程序从多个数据源收集数据源到训练库中,ETL工具需要对数据进行预处理,预处理内容包括特殊字符的过滤、缺失数据的处理、HS编码前4位的截取等操作,数据源由两部分组成,一是用户评价正确和错误的历史归类数据,二是收集跨境通关数据,其中训练库按年进行分库。
在一些实施例中,本方案的商品归类***的内部结构框图如图7所示,由于其原理在前述内容已经说明,此处不再赘述。
需要说明的是,本发明采用的编码为HS编码,但是本发明的编码分类过程包括但不限于HS编码,任何能够采用其余编码能够实现本发明技术方案的技术手段均包含在本发明的保护范围之内。
通过本申请方案的商品归类***,有效解决了广大跨境电商进行商品HS编码的分类时,遇到的流程复杂、成本高和时效慢的问题,有效提高了商品编码分类的高效性和准确性,有着巨大的实用价值和经济利益。同时也为类似的分类程序提供了具有实际操作性的程序框架和参考价值;而且分类标签的在线修改的功能为深度学习模型可解释性的实际运用。
本***支持1万多个HS编码的文本分类任务,同时支持HS编码的在线新增、删除和修改,加强了分类模型的可解释性,并能保证在训练数据缺乏多样性的情况下,获得高准确度和高通用性的分类预测模型,避免长尾效应,而且方便用户在不同场景下便捷使用。
本发明还公开了一种商品归类方法,应用于上述的商品归类***,如图8所示,所述商品归类方法包括如下步骤:
S1、通过用户信息模块获取用户输入的商品的文本描述信息。
S2、通过商品预测分类模块调用所述数据库模块中的数据,根据所述文本描述信息对商品进行分类预测,以得到商品预归类的预测结果。
在一些实施例中,所述步骤S2的流程图如图9所示,包括如下步骤:
S21、对所述商品的文本描述信息进行预处理以去除特殊字符。
在一些实施例中,所述特殊字符包括“\t”、“\n”等对分类无关的字符。
S22、提取去除特殊字符后的所述文本描述信息中的特征向量,将所述特征向量输入到局部分类模型中以获取预测值,根据所述预测值和所述特征向量从所述数据库模块中获取召回编码数据。
在另一些实施例中,在提取文本描述信息中的特征向量之后,将所述特征向量输入到局部分类模型,所述局部分类模型为HS编码前4为的分类模型,并根据特征向量获取预测值的前4位,之后根据获得的预测值和特征向量从数据库模块中召回得到召回编码数据。
S23、通过相似度比对模型对所述召回编码数据和所述特征向量进行相似度计算以得到相似度计算结果,根据所述相似度计算结果对所述召回编码数据排序得到第一排序结果。
通过相似度计算得到相似度计算结果,根据相似度计算结果对召回编码数据进行排序,得到排序后的第一排序结构为S1。
S24、将所述特征向量输入所述编码分类模型得到编码数据,并对所述编码数据进行分类得到分类编码数据,按照分类得分对所述分类编码数据进行排序得到第二排序结果。
在一些实施例中,所述分类得分为分类编码数据与所述商品之间关联程度,所述第二排序结果记为S2。
S25、将所述第一排序结果和所述第二排序结果合并处理得到合并结果,将所述合并结果作为所述商品预归类的预测结果。
通过将第一排序结果和第二排序结果进行合并处理以得到合并结果,从而便于得到准确的预测分类结果。
在一些实施例中,所述步骤S25的流程图如图10所示,包括如下步骤:
S251、根据预设阈值对所述第一排序结果进行过滤,以滤除低于所述预设阈值的编码数据;
S252、判断所述第一排序结果中是否存在大于所述预设阈值的编码数据;
S253、如果存在,将所述第一排序结果中大于所述预设阈值的编码数据作为所述预测结果,如果不存在,将所述第二排序结果中的编码数据作为所述预测结果。
S3、根据所述预测结果对所述商品进行归类。
在一些实施例中,图11为本发明实施例的商品归类方法的归类过程示意图,由于上述的商品归类方法的工作过程和原理与前述的商品归类***基本相同,此处不再赘述。
本发明还公开了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法。
本发明的存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的方法。所述存储介质包括:只读存储器(Read-Only Memory,ROM)、随机访问存储器(Random Access Memory,RAM)、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
本发明还公开了一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述的方法。
一种可能的实施例中,所述存储器用于存储计算机程序;优选地,所述存储器包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述终端执行上述的几何形态分析方法。
优选地,所述处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
虽然在上文中详细说明了本发明的实施方式,但是对于本领域的技术人员来说显而易见的是,能够对这些实施方式进行各种修改和变化。但是,应理解,这种修改和变化都属于权利要求书中所述的本发明的范围和精神之内。而且,在此说明的本发明可有其它的实施方式,并且可通过多种方式实施或实现。
Claims (14)
1.一种商品归类***,其特征在于,所述商品归类***包括:
用户信息模块,用于采集用户提供的用户信息;
商品预测分类模块,与所述用户信息模块通信连接,用于根据所述用户信息中商品的文本描述信息进行分类预测,以得到商品预归类的预测结果;
数据库模块,与所述商品预测分类模块通信连接,用于存储所述用户信息和编码数据;
其中,所述商品预测分类模块根据所述文本描述信息进行分类预测,以从所述数据库模块中取出所述编码数据作为预测结果,所述商品预测分类模块将所述预测结果存储至所述数据库模块。
2.根据权利要求1所述的商品归类***,其特征在于,所述商品预测分类模块包括编码预测单元,所述编码预测单元与所述用户信息模块通信连接,所述用户信息包括商品的文本描述信息,所述编码预测单元通过编码分类模型对所述商品的文本描述信息进行编码预测以得到所述商品的预测结果。
3.根据权利要求2所述的商品归类***,其特征在于,所述编码预测单元包括上游任务组、下游任务组和合并任务组,所述上游任务组和下游任务组均与所述合并任务组通信连接,所述上游任务组通过编码分类模型对所述文本描述信息进行预处理以得到特征向量,所述下游任务组包括相似度对比任务部和编码分类任务部,所述相似度对比任务部用于将所述特征向量输入局部分类模型中获取位于第一阈值之前的第一预测值,并根据所述特征向量和所述第一预测值从所述数据库模块中获取召回编码数据,并对所述召回编码数据和所述特征向量进行相似度计算以得到相似度结果,根据所述相似度结果对所述召回编码数据进行排序,输出排序后的所述召回编码数据,所述编码分类任务部用于根据所述特征向量从所述数据库模块中获取编码数据并分类,输出经过分类排序后的分类编码数据,所述合并任务组用于对所述相似度对比任务部输出的排序后的所述召回编码数据和所述编码分类任务部输出的所述分类编码数据进行合并处理以得到合并结果,并将所述合并结果作为所述预测结果。
4.根据权利要求3所述的商品归类***,其特征在于,所述商品预测分类模块还包括与所述编码预测单元通信连接的神经网络训练单元,所述相似度对比任务部采用相似度比对模型进行相似度计算,所述编码分类任务部采用编码分类模型对所述相似数据进行分类,所述神经网络训练单元通过从所述数据库模块中抽取数据对所述局部分类模型、所述编码分类模型、所述相似度比对模型和所述编码分类模型进行优化更新。
5.根据权利要求2所述的商品归类***,其特征在于,所述商品预测分类模块包括数据召回单元,所述数据召回单元与所述编码预测单元通信连接,所述编码预测单元通过所述数据召回单元调用所述数据库模块中的数据。
6.根据权利要求5所述的商品归类***,其特征在于,所述数据召回单元包括信息修改部,所述信息修改部用于对所述数据库模块中的数据分类和编码信息进行修改。
7.根据权利要求4所述的商品归类***,其特征在于,所述数据库模块包括知识库单元和训练库单元,所述知识库单元用于存储商品的数据集,所述数据集为所述商品的编码和要素的集合,所述训练库单元用于存储所述神经网络训练单元使用的训练数据。
8.根据权利要求7所述的商品归类***,其特征在于,所述数据库模块还包括用户库单元和抽取单元,所述用户库单元用于存储所述用户信息、***权限信息、商品历史归类信息和用户评价信息中的至少一种,所述抽取单元输入端与所述用户库单元通信连接,所述抽取单元输出端分别与所述知识库单元和所述训练库单元通信连接,所述抽取单元将所述用户库中的数据和跨境通关数据抽取并分别传输到所述知识库单元和所述训练库单元。
9.根据权利要求7所述的商品归类***,其特征在于,所述用户信息模块包括用户管理单元、用户操作记录单元和用户评价单元中的至少一个,所述用户管理单元、所述用户操作记录单元和所述用户评价单元均与用户库单元通信连接,所述用户管理单元用于记录用户信息和用户权限信息,所述用户操作记录单元用于记录所述用户的操作记录信息和归类信息,所述用户评价单元用于收集所述用户对所述归类信息的评价信息。
10.一种商品归类方法,其特征在于,应用于权利要求1至9任一项所述的商品归类***,所述商品归类方法包括如下步骤:
通过用户信息模块获取用户输入的商品的文本描述信息;
通过商品预测分类模块调用所述数据库模块中的数据,根据所述文本描述信息对商品进行分类预测,以得到商品预归类的预测结果;
根据所述预测结果对所述商品进行归类。
11.根据权利要求10所述的商品归类方法,其特征在于,所述根据所述文本描述信息对商品进行分类预测,以得到商品预归类的预测结果,包括:
对所述商品的文本描述信息进行预处理以去除特殊字符;
提取去除特殊字符后的所述文本描述信息中的特征向量,将所述特征向量输入到局部分类模型中以获取预测值,根据所述预测值和所述特征向量从所述数据库模块中获取召回编码数据;
通过相似度比对模型对所述召回编码数据和所述特征向量进行相似度计算以得到相似度计算结果,根据所述相似度计算结果对所述召回编码数据排序得到第一排序结果;
将所述特征向量输入所述编码分类模型得到编码数据,并对所述编码数据进行分类得到分类编码数据,按照分类得分对所述分类编码数据进行排序得到第二排序结果;
将所述第一排序结果和所述第二排序结果合并处理得到合并结果,将所述合并结果作为所述商品预归类的预测结果。
12.根据权利要求11所述的商品归类方法,其特征在于,所述将所述第一排序结果和所述第二排序结果合并处理得到合并结果,将所述合并结果作为所述商品预归类的预测结果,包括:
根据预设阈值对所述第一排序结果进行过滤,以滤除低于所述预设阈值的编码数据;
判断所述第一排序结果中是否存在大于所述预设阈值的编码数据;
如果存在,将所述第一排序结果中大于所述预设阈值的编码数据作为所述预测结果,如果不存在,将所述第二排序结果中的编码数据作为所述预测结果。
13.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求10至12中任一项所述的商品归类方法。
14.一种终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行权利要求10至12中任一项所述的商品归类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654273.8A CN113361787A (zh) | 2021-06-11 | 2021-06-11 | 商品归类***、方法、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654273.8A CN113361787A (zh) | 2021-06-11 | 2021-06-11 | 商品归类***、方法、存储介质及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113361787A true CN113361787A (zh) | 2021-09-07 |
Family
ID=77533976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110654273.8A Pending CN113361787A (zh) | 2021-06-11 | 2021-06-11 | 商品归类***、方法、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113361787A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521906A (zh) * | 2023-04-28 | 2023-08-01 | 广州商研网络科技有限公司 | 元描述生成方法及其装置、设备、介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778205A (zh) * | 2014-01-13 | 2014-05-07 | 北京奇虎科技有限公司 | 一种基于互信息的商品分类方法和*** |
CN105354194A (zh) * | 2014-08-19 | 2016-02-24 | 上海中怡通信息科技有限公司 | 商品智能归类方法和*** |
CN108595418A (zh) * | 2018-04-03 | 2018-09-28 | 上海透云物联网科技有限公司 | 一种商品分类方法及*** |
CN109213866A (zh) * | 2018-09-19 | 2019-01-15 | 浙江诺诺网络科技有限公司 | 一种基于深度学习的税务商品编码分类方法和*** |
CN109598517A (zh) * | 2017-09-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 商品通关处理、对象的处理及其类别预测方法和装置 |
WO2020073507A1 (zh) * | 2018-10-11 | 2020-04-16 | 平安科技(深圳)有限公司 | 一种文本分类方法及终端 |
-
2021
- 2021-06-11 CN CN202110654273.8A patent/CN113361787A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778205A (zh) * | 2014-01-13 | 2014-05-07 | 北京奇虎科技有限公司 | 一种基于互信息的商品分类方法和*** |
CN105354194A (zh) * | 2014-08-19 | 2016-02-24 | 上海中怡通信息科技有限公司 | 商品智能归类方法和*** |
CN109598517A (zh) * | 2017-09-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 商品通关处理、对象的处理及其类别预测方法和装置 |
CN108595418A (zh) * | 2018-04-03 | 2018-09-28 | 上海透云物联网科技有限公司 | 一种商品分类方法及*** |
CN109213866A (zh) * | 2018-09-19 | 2019-01-15 | 浙江诺诺网络科技有限公司 | 一种基于深度学习的税务商品编码分类方法和*** |
WO2020073507A1 (zh) * | 2018-10-11 | 2020-04-16 | 平安科技(深圳)有限公司 | 一种文本分类方法及终端 |
Non-Patent Citations (1)
Title |
---|
张成虎著: "《Python金融大数据风控建模实战》", vol. 1, 中国金融出版社, pages: 158 - 51 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521906A (zh) * | 2023-04-28 | 2023-08-01 | 广州商研网络科技有限公司 | 元描述生成方法及其装置、设备、介质 |
CN116521906B (zh) * | 2023-04-28 | 2023-10-24 | 广州商研网络科技有限公司 | 元描述生成方法及其装置、设备、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bazan et al. | Dynamic reducts as a tool for extracting laws from decisions tables | |
WO2022257459A1 (zh) | 用户行为异常分析方法、装置、设备及存储介质 | |
US20070299855A1 (en) | Detection of attributes in unstructured data | |
CN108664538B (zh) | 一种输变电设备疑似家族性缺陷的自动辨识方法及*** | |
CN110471948A (zh) | 一种基于历史数据挖掘的海关报关商品智能归类方法 | |
Liu et al. | X2R: A fast rule generator | |
CN111581956B (zh) | 基于bert模型和k近邻的敏感信息识别方法及*** | |
CN113239268B (zh) | 一种商品推荐方法、装置及*** | |
CN113407644A (zh) | 一种基于深度学习算法的企业行业二级行业多标签分类器 | |
CN114398891B (zh) | 基于日志关键词生成kpi曲线并标记波段特征的方法 | |
Tabassum et al. | Detecting online recruitment fraud using machine learning | |
CN113361787A (zh) | 商品归类***、方法、存储介质及终端 | |
Hossain et al. | Reducing the effect of imbalance in text classification using SVD and GloVe with ensemble and deep learning | |
CN110969015A (zh) | 一种基于运维脚本的标签自动化识别方法和设备 | |
CN105677888A (zh) | 一种基于用户时间碎片的业务偏好识别方法 | |
CN115310869B (zh) | 一种督查事项的联合督查方法、***、设备以及存储介质 | |
KR20080053103A (ko) | 연관규칙 탐사 기법을 이용하여 추출한 다수의 연관분류규칙에 의한 다중범주 문서의 자동 분류 방법 및 장치 | |
CN110647845A (zh) | 一种***数据识别装置、相关方法及相关装置 | |
CN113065329A (zh) | 数据的处理方法和装置 | |
CN112800219B (zh) | 客服日志反馈回流数据库的方法及*** | |
CN115687788A (zh) | 一种智能化商机推荐方法和*** | |
CN115544112A (zh) | 一种基于大数据人工智能的双创成果高价值专利筛选方法 | |
CN114637917A (zh) | 基于人工智能的资讯头条推荐方法及装置 | |
Wardak et al. | Noise presence detection in QR code images | |
CN109614489B (zh) | 一种基于迁移学习和特征提取的Bug报告严重程度识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |