CN110647845A - 一种***数据识别装置、相关方法及相关装置 - Google Patents

一种***数据识别装置、相关方法及相关装置 Download PDF

Info

Publication number
CN110647845A
CN110647845A CN201910900739.0A CN201910900739A CN110647845A CN 110647845 A CN110647845 A CN 110647845A CN 201910900739 A CN201910900739 A CN 201910900739A CN 110647845 A CN110647845 A CN 110647845A
Authority
CN
China
Prior art keywords
data
ftrl
model
invoice
invoice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910900739.0A
Other languages
English (en)
Inventor
钱力扬
王培勇
陈宏仁
杨岱川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SERVYOU SOFTWARE GROUP Co Ltd
Original Assignee
SERVYOU SOFTWARE GROUP Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SERVYOU SOFTWARE GROUP Co Ltd filed Critical SERVYOU SOFTWARE GROUP Co Ltd
Priority to CN201910900739.0A priority Critical patent/CN110647845A/zh
Publication of CN110647845A publication Critical patent/CN110647845A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种***数据识别装置,其特征在于,包括:特征提取模块,用于根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;模型训练模块,用于采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;数据识别模块,用于采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。通过并行线路对特征数据进行训练,提高了训练的效率。本申请还公开了一种***数据识别方法、服务器以及计算机可读存储介质,具有以上有益效果。

Description

一种***数据识别装置、相关方法及相关装置
技术领域
本申请涉及计算机技术领域,特别涉及一种***数据识别装置、***数据识别方法、服务器以及计算机可读存储介质。
背景技术
随着信息技术的不断发展,计算机可以帮助用户完成更多的数据处理操作,提高数据信息的处理能力。具体来说,通常可以采用训练出的分类模型对数据进行分类。
目前常用数据处理中的分类模型对企业的***数据进行分类识别,例如,采用聚类分类模型,或者采用非监督模型对***数据进行训练,得到进行分类识别的分类模型。但是,在当前的***数据的数据量巨大,为了保持训练效果,而需要增加模型训练的时长,降低了对企业***数据进行分类识别的效率。并且,在企业运行的时间内,***数据会不断的增加。而新增加的***数据也会增加模型训练的工作量,严重的延长对企业***数据的处理周期。
因此,如何提高企业***数据处理的效率,缩短其处理的周期是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种***数据识别装置、***数据识别方法、服务器以及计算机可读存储介质,通过并行线路对特征数据进行训练,提高了训练的效率。
为解决上述技术问题,本申请提供一种***数据识别方法,包括:
根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;
采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
可选的,根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据,包括:
获取所述***数据和对应的实际经营行业数据;
根据所述商品类别识别算法对所述***数据的内容进行类别识别,得到商品类别数据;
将所述商品类别数据和所述实际经营行业数据进行格式转换处理,得到所述特征数据。
可选的,采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型,包括:
对每个所述并行线路进行参数设置;
每个所述并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
将所述多个FTRL子模型进行归并处理,得到所述FTRL模型。
可选的,采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果,包括:
对所述待识别***数据进行特征提取处理,得到待识别特征数据;
采用所述FTRL模型对所述待识别特征数据进行识别处理,得到所述经营行业识别结果。
本申请还提供一种***数据识别装置,包括:
特征提取模块,用于根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
模型训练模块,用于采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;
数据识别模块,用于采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
可选的,所述特征提取模块,包括:
经营数据获取单元,用于获取所述***数据和对应的实际经营行业数据;
内容类别识别单元,用于根据所述商品类别识别算法对所述***数据的内容进行类别识别,得到商品类别数据;
格式转换单元,用于将所述商品类别数据和所述实际经营行业数据进行格式转换处理,得到所述特征数据。
可选的,所述模型训练模块,包括:
参数设置单元,用于对每个所述并行线路进行参数设置;
自模型训练单元,用于每个所述并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
归并处理单元,用于将所述多个FTRL子模型进行归并处理,得到所述FTRL模型。
可选的,所述数据识别模块,包括:
特征提取单元,用于对所述待识别***数据进行特征提取处理,得到待识别特征数据;
数据识别单元,用于采用所述FTRL模型对所述待识别特征数据进行识别处理,得到所述经营行业识别结果。
本申请还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的***数据识别方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的***数据识别方法的步骤。
本申请所提供的一种***数据识别方法,包括:根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
通过先在获取到的***数据和对应的实际经营行业数据中提取出可以进行训练的特征数据,并且,通过多个并行线路进行FTRL模型训练处理,得到FERL模型,由于采用了并行线路进行训练数据,提高了模型训练的效率,最后,采用FTRL模型对待识别***数据进行识别处理,得到该待识别***数据对应的企业的行业,可见,提高了模型处理的效率,可以及时对大量企业***数据进行处理,缩短了企业***数据的处理周期。
本申请还提供一种***数据识别装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不作赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种***数据识别方法的流程图;
图2为本申请实施例所提供的一种***数据识别装置的结构示意图。
具体实施方式
本申请的核心是提供一种***数据识别装置、***数据识别方法、服务器以及计算机可读存储介质,通过并行线路对特征数据进行训练,提高了训练的效率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,常用数据处理中的分类模型对企业的***数据进行分类识别,例如,采用聚类分类模型,或者采用非监督模型对***数据进行训练,得到进行分类识别的分类模型。但是,在当前的***数据的数据量巨大,为了保持训练效果,而需要增加模型训练的时长,降低了对企业***数据进行分类识别的效率。并且,在企业运行的时间内,***数据会不断的增加,而新增加的***数据也会增加模型训练的工作量,严重的延长对企业***数据的处理周期。
因此,本申请提供了一种***数据识别方法,通过先在获取到的***数据和对应的实际经营行业数据中提取出可以进行训练的特征数据,并且,通过多个并行线路进行FTRL模型训练处理,得到FERL模型,由于采用了并行线路进行训练数据,提高了模型训练的效率,最后,采用FTRL模型对待识别***数据进行识别处理,得到该待识别***数据对应的企业的行业,可见,提高了模型处理的效率,可以及时对大量企业***数据进行处理,缩短了企业***数据的处理周期。
请参考图1,图1为本申请实施例所提供的一种***数据识别方法的流程图。
本实施例中,该方法可以包括:
S101,根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
本步骤旨在对企业的***数据和该企业对应的实际经营行业进行特征提取处理,得到可以通过模型训练的特征数据。具体来说,获取到的***数据中具体记录的都是购买商品的内容,但是,由于商品数量本身多种多样,如果不对***数据的具体内容做处理,得到的特征数据会十分离散,并且没有没有实际意义。因此,本步骤中采用商品类别识别算法对获取到的***数据和实际经营行业进行特征提取处理,得到特征数据。
因此,本步骤中进行特征提取的过程,可以包括:
获取***数据和对应的实际经营行业数据;
根据商品类别识别算法对***数据的内容进行类别识别,得到商品类别数据;
将商品类别数据和实际经营行业数据进行格式转换处理,得到特征数据。
可见,本可选方案中主要是先对***数据的内容首先进行类别识别,然后,将识别得到的商品类别数据和对应的实际经营行业数据进行格式转换处理,得到最后的特征数据。
S102,采用多个并行线路和特征数据进行FTRL模型训练处理,得到FTRL模型;
在S101的基础上,本步骤旨在采用该特征数据进行FTRL模型训练处理,得到FTRL模型。由于采用到的特征数据的数据量较大,会拖累模型训练的效率,为了提高模型训练的效率,本步骤中采用多个并行线路进行对应的模型训练处理。例如,将所有的特征数据分配至多个数据子集,然后每个并行线路采用该数据子集单独进行模型训练,得到子模型,最后,将所有的子模型整合为FTRL模型。
因此,在本步骤中进行模型训练的方法,可以包括:
对每个并行线路进行参数设置;
每个并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
将多个FTRL子模型进行归并处理,得到FTRL模型。
可见,本可选方案中对每个并行线路进行配置操作,然后通过抓取的方式,将每个并行线路从所有的特征数据中抓取到一部分特征数据,然后每个并行线路均再进行模型训练,得到对应的FTRL子模型,最后,将所有的FTRL子模型进行归并处理,得到该FTRL模型。
S103,采用FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
在S102的基础上,本步骤旨在采用训练出的FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果,也就是应用训练好的模型。
具体的,本步骤中进行识别的过程,可以包括:
对待识别***数据进行特征提取处理,得到待识别特征数据;
采用FTRL模型对待识别特征数据进行识别处理,得到经营行业识别结果。
综上,本实施例通过先在获取到的***数据和对应的实际经营行业数据中提取出可以进行训练的特征数据,并且,通过多个并行线路进行FTRL模型训练处理,得到FERL模型,由于采用了并行线路进行训练数据,提高了模型训练的效率,最后,采用FTRL模型对待识别***数据进行识别处理,得到该待识别***数据对应的企业的行业,可见,提高了模型处理的效率,可以及时对大量企业***数据进行处理,缩短了企业***数据的处理周期。
以下通过另一个具体的实施例,对本申请提供的一种***数据识别方法做进一步说明。
本实施例中,该方法可以包括:
步骤一,全流程分为模型训练和模型应用两个环节。先要使用大规模的数据对模型进行训练,让模型学习到数据中知识之后才可以拿来进行应用。
步骤二,模型训练时,除了企业的***数据,也需要企业的实际经营行业。这是为了让模型掌握不同购销***金额占比与不同行业之间的联系。
步骤三,***商品类别识别模型是独立的模型。用于将不同的商品名称按照国家税务总局编码表进行分类。例如:“农夫山泉矿泉水500ml24瓶一箱装”在经过***商品名学习之后就会转换为“包装饮用水”。国家税务总局编码表总共有4262个种类。
步骤四,特征转换是将不同企业的***数据处理为同一个格式。例如A企业买了苹果,B企业买了汽油柴油润滑油,但是,该数据不能直接交给FTRL模型处理的,因此,利用上文提到的税务总局编码表就可以处理成等长的数组。因此,一家企业的***数据在经过这个转换之后会变成一个很长的数组。
步骤五,FTRL模型的训练流程:1,设置模型的学习率、正则化参数等数值;2,设置模型的并行学习数;3,往数据池里持续填充数据;4,与此同时不同的并行线路会从数据池里取数据进行训练;5,数据池取完之后,不同线路的模型归并,保存模型。
步骤六,模型应用时,输入只有企业的***数据,输出的是模型预测的行业的值。
可见,本实施例通过先在获取到的***数据和对应的实际经营行业数据中提取出可以进行训练的特征数据,并且,通过多个并行线路进行FTRL模型训练处理,得到FERL模型,由于采用了并行线路进行训练数据,提高了模型训练的效率,最后,采用FTRL模型对待识别***数据进行识别处理,得到该待识别***数据对应的企业的行业,可见,提高了模型处理的效率,可以及时对大量企业***数据进行处理,缩短了企业***数据的处理周期。
下面对本申请实施例提供的一种***数据识别装置进行介绍,下文描述的一种***数据识别装置与上文描述的一种***数据识别方法可相互对应参照。
请参考图2,图2为本申请实施例所提供的一种***数据识别装置的结构示意图。
本实施例中,该装置可以包括:
特征提取模块100,用于根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
模型训练模块200,用于采用多个并行线路和特征数据进行FTRL模型训练处理,得到FTRL模型;
数据识别模块300,用于采用FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
可选的,该特征提取模块100,可以包括:
经营数据获取单元,用于获取***数据和对应的实际经营行业数据;
内容类别识别单元,用于根据商品类别识别算法对***数据的内容进行类别识别,得到商品类别数据;
格式转换单元,用于将商品类别数据和实际经营行业数据进行格式转换处理,得到特征数据。
可选的,该模型训练模块200,可以包括:
参数设置单元,用于对每个并行线路进行参数设置;
自模型训练单元,用于每个并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
归并处理单元,用于将多个FTRL子模型进行归并处理,得到FTRL模型。
可选的,该数据识别模块300,可以包括:
特征提取单元,用于对待识别***数据进行特征提取处理,得到待识别特征数据;
数据识别单元,用于采用FTRL模型对待识别特征数据进行识别处理,得到经营行业识别结果。
本申请实施例还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如以上实施例所述的***数据识别方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的***数据识别方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种***数据识别装置、***数据识别方法、服务器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种***数据识别装置,其特征在于,包括:
特征提取模块,用于根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
模型训练模块,用于采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;
数据识别模块,用于采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
2.根据权利要求1所述的***数据识别装置,其特征在于,所述特征提取模块,包括:
经营数据获取单元,用于获取所述***数据和对应的实际经营行业数据;
内容类别识别单元,用于根据所述商品类别识别算法对所述***数据的内容进行类别识别,得到商品类别数据;
格式转换单元,用于将所述商品类别数据和所述实际经营行业数据进行格式转换处理,得到所述特征数据。
3.根据权利要求1所述的***数据识别装置,其特征在于,所述模型训练模块,包括:
参数设置单元,用于对每个所述并行线路进行参数设置;
自模型训练单元,用于每个所述并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
归并处理单元,用于将所述多个FTRL子模型进行归并处理,得到所述FTRL模型。
4.根据权利要求1所述的***数据识别装置,其特征在于,所述数据识别模块,包括:
特征提取单元,用于对所述待识别***数据进行特征提取处理,得到待识别特征数据;
数据识别单元,用于采用所述FTRL模型对所述待识别特征数据进行识别处理,得到所述经营行业识别结果。
5.一种***数据识别方法,其特征在于,包括:
根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据;
采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型;
采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果。
6.根据权利要求5所述的***数据识别方法,其特征在于,根据商品类别识别算法对获取到的***数据和对应的实际经营行业数据进行特征提取处理,得到特征数据,包括:
获取所述***数据和对应的实际经营行业数据;
根据所述商品类别识别算法对所述***数据的内容进行类别识别,得到商品类别数据;
将所述商品类别数据和所述实际经营行业数据进行格式转换处理,得到所述特征数据。
7.根据权利要求5所述的***数据识别方法,其特征在于,采用多个并行线路和所述特征数据进行FTRL模型训练处理,得到FTRL模型,包括:
对每个所述并行线路进行参数设置;
每个所述并行线路分别对从特征数据中抓取到的部分特征数据进行FTRL模型训练处理,得到多个FTRL子模型;
将所述多个FTRL子模型进行归并处理,得到所述FTRL模型。
8.根据权利要求5所述的***数据识别方法,其特征在于,采用所述FTRL模型对待识别***数据进行识别处理,得到经营行业识别结果,包括:
对所述待识别***数据进行特征提取处理,得到待识别特征数据;
采用所述FTRL模型对所述待识别特征数据进行识别处理,得到所述经营行业识别结果。
9.一种服务器,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求5至8任一项所述的***数据识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求5至8任一项所述的***数据识别方法的步骤。
CN201910900739.0A 2019-09-23 2019-09-23 一种***数据识别装置、相关方法及相关装置 Pending CN110647845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910900739.0A CN110647845A (zh) 2019-09-23 2019-09-23 一种***数据识别装置、相关方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910900739.0A CN110647845A (zh) 2019-09-23 2019-09-23 一种***数据识别装置、相关方法及相关装置

Publications (1)

Publication Number Publication Date
CN110647845A true CN110647845A (zh) 2020-01-03

Family

ID=68992363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910900739.0A Pending CN110647845A (zh) 2019-09-23 2019-09-23 一种***数据识别装置、相关方法及相关装置

Country Status (1)

Country Link
CN (1) CN110647845A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695979A (zh) * 2020-06-18 2020-09-22 税友软件集团股份有限公司 一种原材料与成品的关系分析方法、装置及设备
CN115809887A (zh) * 2022-12-09 2023-03-17 蔷薇大树科技有限公司 一种基于***数据确定企业主要经营范围的方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184321A (zh) * 2015-09-10 2015-12-23 北京金山安全软件有限公司 一种针对于ftrl模型的数据处理方法及装置
CN108268880A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种行业类别的识别方法及装置
CN108710610A (zh) * 2018-05-17 2018-10-26 北京东港瑞宏科技有限公司 一种基于电子***的数据挖掘方法
CN109740642A (zh) * 2018-12-19 2019-05-10 北京邮电大学 ***类别识别方法、装置、电子设备及可读存储介质
CN109871861A (zh) * 2018-12-27 2019-06-11 航天信息股份有限公司 一种用于为目标数据提供编码的***及方法
CN109993644A (zh) * 2017-12-29 2019-07-09 航天信息股份有限公司 一种画像确定方法、装置、电子设备及存储介质
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 ***类别识别方法、装置、电子设备及可读存储介质
CN110059692A (zh) * 2019-04-16 2019-07-26 厦门商集网络科技有限责任公司 一种识别企业所属行业的方法及终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184321A (zh) * 2015-09-10 2015-12-23 北京金山安全软件有限公司 一种针对于ftrl模型的数据处理方法及装置
CN108268880A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种行业类别的识别方法及装置
CN109993644A (zh) * 2017-12-29 2019-07-09 航天信息股份有限公司 一种画像确定方法、装置、电子设备及存储介质
CN108710610A (zh) * 2018-05-17 2018-10-26 北京东港瑞宏科技有限公司 一种基于电子***的数据挖掘方法
CN109740642A (zh) * 2018-12-19 2019-05-10 北京邮电大学 ***类别识别方法、装置、电子设备及可读存储介质
CN109871861A (zh) * 2018-12-27 2019-06-11 航天信息股份有限公司 一种用于为目标数据提供编码的***及方法
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 ***类别识别方法、装置、电子设备及可读存储介质
CN110059692A (zh) * 2019-04-16 2019-07-26 厦门商集网络科技有限责任公司 一种识别企业所属行业的方法及终端

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695979A (zh) * 2020-06-18 2020-09-22 税友软件集团股份有限公司 一种原材料与成品的关系分析方法、装置及设备
CN115809887A (zh) * 2022-12-09 2023-03-17 蔷薇大树科技有限公司 一种基于***数据确定企业主要经营范围的方法和装置
CN115809887B (zh) * 2022-12-09 2023-10-10 蔷薇大树科技有限公司 一种基于***数据确定企业主要经营范围的方法和装置

Similar Documents

Publication Publication Date Title
CN110597995B (zh) 一种商品名称分类方法、装置、设备及可读存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN109492104A (zh) 意图分类模型的训练方法、分类方法、***、设备和介质
CN109815480B (zh) 一种数据处理方法和装置、及存储介质
CN113177700B (zh) 一种风险评估方法、***、电子设备及存储介质
CN110647845A (zh) 一种***数据识别装置、相关方法及相关装置
CN112732786A (zh) 金融数据处理方法、装置、设备及存储介质
CN109376147A (zh) 一种数据处理方法及***
CN111506595A (zh) 一种数据查询方法、***及相关设备
CN114860941A (zh) 一种基于数据大脑的行业数据治理方法及***
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
CN113869456A (zh) 采样监测方法、装置、电子设备及存储介质
CN111126038A (zh) 信息获取模型生成方法、装置及信息获取方法、装置
CN115545809A (zh) 电商商品的标品库构建方法、数据对齐方法、装置和设备
CN116451125A (zh) 一种新能源车车主识别方法、装置、设备及存储介质
CN108629356B (zh) 一种面向用电负荷分类应用的数据存储方法和装置
CN114741592A (zh) 一种基于多模型融合的产品推荐方法、设备及介质
CN115617790A (zh) 数据仓库创建方法、电子设备及存储介质
CN113361787A (zh) 商品归类***、方法、存储介质及终端
CN109558582B (zh) 基于视角的句子情感分析方法及装置
CN117591951A (zh) 一种商品编码获取方法、***、电子设备及介质
CN116542801B (zh) 一种财务数据分析方法及***
CN110955816B (zh) 基于内容标签的聚合主题内容的方法
CN117422321A (zh) 专利价值评估方法、装置、电子设备和存储介质
CN117349509A (zh) 信息推送方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200103

RJ01 Rejection of invention patent application after publication