CN116010609B - 一种物料数据归类方法、装置、电子设备及存储介质 - Google Patents

一种物料数据归类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116010609B
CN116010609B CN202310286304.8A CN202310286304A CN116010609B CN 116010609 B CN116010609 B CN 116010609B CN 202310286304 A CN202310286304 A CN 202310286304A CN 116010609 B CN116010609 B CN 116010609B
Authority
CN
China
Prior art keywords
material data
generator
value
classifying
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310286304.8A
Other languages
English (en)
Other versions
CN116010609A (zh
Inventor
段效亮
马乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhonghan Software Co ltd
Original Assignee
Shandong Zhonghan Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Zhonghan Software Co ltd filed Critical Shandong Zhonghan Software Co ltd
Priority to CN202310286304.8A priority Critical patent/CN116010609B/zh
Publication of CN116010609A publication Critical patent/CN116010609A/zh
Application granted granted Critical
Publication of CN116010609B publication Critical patent/CN116010609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据处理技术领域,具体提供一种物料数据归类方法、装置、电子设备及存储介质,旨在提高物料数据归类效率。其中,物料数据归类方法包括:接收用户输入的关键词;基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。

Description

一种物料数据归类方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理领域,具体地,涉及一种物料数据归类方法、装置、电子设备及存储介质。
背景技术
企业为了追求高质量和高效率发展,通常会引入精细化管理理念,对企业运营期间产生的海量数据进行分类和管理。对于大型的生产型企业而言,在生产端所需管理的数据包括物料数据、产品数据、人员数据等。其中,由于大型的生产型企业针对同一物料通常会选择多个供应商,由多个供应商同时供应同一种物料,但是由于不同供应商各自对物料的命名方式或文字说明(以下统称为物料数据)存在差异,导致企业从各个供应商搜集的物料数据难以归类。
现有技术中,为了对物料数据进行归类,通常的做法是人工对关键词进行扩展,然后基于关键词和人工扩展的近义词对物料数据进行查询,然后将查询结果划归为一类。但是人工扩展近义词时需要消耗较大人力,并且人工扩展的近义词虽然可能与关键词的相似度高,但是人工扩展的近义词可能与物料数据库的关联性低,导致同一类的物料数据仅能查询出一小部分,影响物料数据的归类效率。
发明内容
本申请实施例中提供了一种物料数据归类方法、装置、电子设备及存储介质,旨在提高物料数据的归类效率。
根据本申请实施例的第一个方面,提供了一种物料数据归类方法,该方法包括:
接收用户输入的用于查询物料数据的关键词;
基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;
接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
可选地,该方法还包括:
根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练。
可选地,根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练的步骤包括:
重复N次执行以下步骤S1至S3:S1.将随机噪声和样本关键词输入生成器,获得生成器生成的序列;S2.基于蒙特卡洛搜索方法对序列进行补全,得到完整序列,并通过判别器对完整序列进行判别,得到判别结果,以及根据判别结果生成奖励值;S3.利用序列对物料数据进行查询,得到物料查询结果;
计算N个奖励值的平均值,作为第一奖励值;
统计N个物料查询结果对目标物料数据的查询命中率,并根据查询命中率计算第二奖励值;其中,目标物料数据是与样本关键词匹配的物料数据;
根据第一奖励值的平均值和第二奖励值更新生成器,并根据第一奖励值更新判别器。
可选地,N次中的每一次执行步骤S1时,输入生成器的随机噪声是不一致的,输入生成器的样本关键词是一致的。
可选地,根据第一奖励值和第二奖励值更新生成器的步骤包括:
根据第一奖励值和第二奖励值两者各自的权重,对第一奖励值和第二奖励值进行加权求和;
根据加权求和结果更新生成器;
其中,在训练期间,第一奖励值的权重和第二奖励值的权重随第一奖励值的变化幅度而调整,第一奖励值的变化幅度越平缓,第一奖励值的权重越小,第二奖励值的权重越大。
可选地,第一奖励值的权重随着训练轮次的增加而逐渐减小,第二奖励值的权重随着训练轮次的增加而逐渐增大,第一奖励值的权重具有预设下限值,第二奖励值的权重具有预设上限值,预设下限值与预设上限值的相加结果等于1。
可选地,该方法还包括:
显示未被查询到的剩余物料数据;
接收用户对剩余物料数据的手动归类操作,并根据用户对剩余物料数据的手动归类操作,将剩余物料数据划归至相应类别。
根据本申请实施例的第二个方面,提供了一种物料数据归类装置,该装置包括:
关键词接收模块,用于接收用户输入的用于查询物料数据的关键词;
近义词生成模块,用于基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率;
物料数据查询模块,用于接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
根据本申请实施例的第三个方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述任一项所述的物料数据归类方法。
根据本申请实施例的第四个方面,提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的物料数据归类方法。
采用本申请实施例中提供的物料数据归类方法,用户仅需要输入用于查询物料数据的关键词,就可以利用预先训练的生成式对抗网络中的生成器为关键词生成多个近义词,接着用户从多个近义词选择一部分或全部近义词进行查询操作,就能查询出相应的物料数据并归类,从而有效节省物料数据归类任务所需消耗的人力,提升物料数据归类效率。并且,由于生成式对抗网络是根据判别结果和物料数据命中率训练得到的,其中,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率,因此利用生成式对抗网络的生成器所生成的近义词不仅与关键词的相似度高,而且与物料数据库的关联性也较,利用这些近义词进行查询时,能使得同一类的物料数据具有更高的查询命中率,进一步提升物料数据的归类效率。此外,本申请中用户需要从生成器生成的多个近义词中选择近义词对物料数据进行查询,从而能对用户行为进行约束,提升数据管理的规范性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请一实施例提供的物料数据归类方法的流程示意图;
图2是本申请一实施例提供的SseqGAN的结构示意图;
图3是本申请提供的物料归类装置的结构示意图。
图中:310关键词接收模块,320近义词生成模块,330物料数据查询模块。
具体实施方式
在介绍本公开实施例之前,应当说明的是:本公开部分实施例被描述为处理流程,虽然流程的各个操作步骤可能被冠以顺序的步骤编号,但是其中的操作步骤可以被并行地、并发地或者同时实施。
本公开实施例中可能使用了术语“第一”、“第二”等等来描述各个特征,但是这些特征不应当受这些术语限制。使用这些术语仅仅是为了将一个特征与另一个特征进行区分。
本公开实施例中可能使用了术语“和/或”,“和/或”包括其中一个或更多所列出的相关联特征的任意和所有组合。
应当理解的是,当描述两个部件的连接关系或通信关系时,除非明确指明两个部件之间直接连接或直接通信,否则,两个部件的连接或通信可以理解为直接连接或通信,也可以理解为通过中间部件间接连接或通信。
为了使本公开实施例中的技术方案及优点更加清楚明白,以下结合附图对本公开的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本公开的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
目前,企业为了追求高质量和高效率发展,通常会引入精细化管理理念,对企业运营期间产生的海量数据进行分类和管理。对于大型的生产型企业而言,在生产端所需管理的数据包括物料数据、产品数据、人员数据等。其中,由于大型的生产型企业针对同一物料通常会选择多个供应商,由多个供应商同时供应同一种物料,但是由于不同供应商各自对物料的命名方式或文字说明(以下统称为物料数据)存在差异,导致企业从各个供应商搜集的物料数据难以归类。
为便于理解,例如仅针对六角螺栓这一物料而言,有的供应商将该物料命名为“六角螺栓”,有的供应商将该物料命名为“六角头螺栓”,还有的供应商将该物料命名为“六角全螺纹螺栓”。企业在物料进场时会将这些物料数据录入企业的物料数据库,导致同一物料在物理数据库中有多种命名方式,不利于物料数据的归类和管理。
现有技术中,为了对物料数据进行归类,通常的做法是人工对关键词进行扩展,然后基于关键词和人工扩展的近义词对物料数据进行查询,然后将查询结果划归为一类。但是人工扩展近义词时需要消耗较大人力,并且人工扩展的近义词虽然可能与关键词的相似度高,但是人工扩展的近义词可能与物料数据库的关联性低,导致同一类的物料数据仅能查询出一小部分,影响物料数据的归类效率。
有鉴于此,本申请实施例提供一种物料数据归类方法、装置、电子设备及存储介质,旨在提高物料数据的归类效率。
参考图1,图1是本申请一实施例提供的物料数据归类方法的流程示意图。如图1所示,该物料数据归类方法包括以下步骤:
S110:接收用户输入的用于查询物料数据的关键词。
本申请中,当用户需要对物料数据进行归类时,可以属于与类别相关的关键词。为便于理解,例如当用户需要查询出物料数据库中与“六角螺栓”相关的物理数据并归类时,用户可以输入关键词“六角螺栓”,或者输入关键词“六角头螺栓”。
S120:基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率。
本申请中,每次调用生成器时,将关键词和一个随机噪声输入至生成器,由生成器生成关键词的一个近义词,通过多次调用生成器,可以生成关键词的多个近义词。为了使得每次生成的近义词不同,每次调用生成器时输入的随机噪声互不相同,但每次调用生成器时输入的关键词都是相同的,也就是在步骤S110中接收的关键词。其中,随机噪声可以是白噪声。在一些具体实施方式中,如果用户输入的关键词较长,则可以先采用n-gram语言模型对关键词进行分词,然后将每个分词表示为独热向量,最后将多个独热向量拼接成更长的二进制向量,并将拼接成的二进制向量与二进制的随机噪声拼接或相加,最后将拼接结果或相加结果输入至生成器,通过生成器生成关键词的一个近义词。
S130:接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
本申请中,可以将生成的多个近义词显示给用户,用户可以通过输入设备(例如鼠标或触摸屏)选择部分或全部近义词。
本申请中,用户仅需要输入用于查询物料数据的关键词,就可以利用预先训练的生成式对抗网络中的生成器为关键词生成多个近义词,接着用户从多个近义词选择一部分或全部近义词进行查询操作,就能查询出相应的物料数据并归类,从而有效节省物料数据归类任务所需消耗的人力,提升物料数据归类效率。并且,由于生成式对抗网络是根据判别结果和物料数据命中率训练得到的,其中,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率,因此利用生成式对抗网络的生成器所生成的近义词不仅与关键词的相似度高,而且与物料数据库的关联性也较,利用这些近义词进行查询时,能使得同一类的物料数据具有更高的查询命中率,进一步提升物料数据的归类效率。此外,本申请中用户需要从生成器生成的多个近义词中选择近义词对物料数据进行查询,从而能对用户行为进行约束,提升数据管理的规范性。
在本申请的一些具体实施方式中,数据归类方法还包括:根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练。
本申请具体实现时,可以选用序列对抗网络SseqGAN作为生成式对抗网络,基于SseqGAN中包含的强化学习算法来解决生成器在文本类任务(即离散数据类任务)中难以被训练的问题。
参考图2,图2是本申请一实施例提供的SseqGAN的结构示意图。生成器和判别器的训练过程可以分为初始训练阶段和正式训练阶段。在初始训练阶段,首先随机初始化生成器和判别器的网络参数,然后通过极大似然估计方法预训练生成器,目的是提高生成器的搜索效率,再使用预训练的生成器生成部分序列,并通过最小化交叉来预训练判别器。在正式训练阶段,才根据判别结果和物料数据命中率对生成式对抗网络的生成器进行训练,并根据判别结果对生成式对抗网络的判别器进行训练。具体地,在正式训练阶段,首先重复N次执行以下步骤S1至S3(即循环N次执行步骤S1至S3):S1.将随机噪声和样本关键词输入生成器,获得生成器生成的序列;S2.基于蒙特卡洛搜索方法对序列进行补全,得到完整序列,并通过判别器对完整序列进行判别,得到判别结果,以及根据判别结果生成奖励值;S3.利用序列对物料数据进行查询,得到物料查询结果。
然后计算N个奖励值的平均值,作为第一奖励值;并统计N个物料查询结果对目标物料数据的查询命中率,以及根据查询命中率计算第二奖励值;其中,目标物料数据是与样本关键词匹配的物料数据;最后根据第一奖励值和第二奖励值更新生成器,并根据第一奖励值更新判别器。
如图2所示,位于生成器生成的序列右侧的圆点,表示基于蒙特卡洛搜索方法补充的序列。在基于蒙特卡洛搜索方法补充序列时,也可以理解成基于蒙特卡洛搜索方法对每个动作进行补全,所谓每个动作就是指生成每个序列的动作。在通过判别器对完整序列进行判别时,具体是利用判别器对完整序列中的每个序列分别进行判别(即判别该序列是否是真实序列),得到每个序列的判别结果,每个序列的判别结果是一个0到1之间的小数,用于表示判别器认为该序列是真实序列的概率。将多个序列的判别结果计算平均值,将平均值作为完整序列的判别结果。此外,由于每个序列都并不是真实序列,因此完整序列的判别结果越接近于1,说明生成器生成的序列越接近于真实序列,越具有欺骗性,因此可以直接将完整序列的判别结果作为奖励值。接着计算N个奖励值的平均值,作为第一奖励值。
此外,还统计N个物料查询结果中目标物料数据的数量,将统计出的数量除以目标物料数据在物料数据库中的总数量,得到目标物料数据的查询命中率。由于目标物料数据的查询命中率越高,说明生成器生成的序列越匹配物料数据库,因此可以直接将计算出的查询命中率作为第二奖励值。
最后,根据第一奖励值和第二奖励值更新生成器,使得生成器生成的序列更接近于真实序列,同时使得生成器生成的序列更匹配物料数据库。还根据第一奖励值更新判别器,使得判别器提升判别序列真伪的能力。其中,在根据第一奖励值更新判别器时,可以将第一奖励值作为损失值,基于该损失值更新判别器。第一奖励值越大,则用于更新判别器的损失值越大。
在N次执行步骤S1时,每次输入生成器的随机噪声是不一致的,从而每次生成不同的序列,而每次输入生成器的样本关键词是一致的,从而使得每次生成的序列均是与样本关键词相关的。
在本申请的一些具体实施方式中,在根据第一奖励值和第二奖励值更新生成器时,具体可以根据第一奖励值和第二奖励值两者各自的权重,对第一奖励值和第二奖励值进行加权求和;然后根据加权求和结果更新生成器;其中,在训练期间,第一奖励值的权重和第二奖励值的权重随第一奖励值的变化幅度而调整,第一奖励值的变化幅度越平缓,第一奖励值的权重越小,第二奖励值的权重越大。具体地,第一奖励值的权重随着训练轮次的增加而逐渐减小,第二奖励值的权重随着训练轮次的增加而逐渐增大,第一奖励值的权重具有预设下限值(例如0.5),第二奖励值的权重具有预设上限值(例如0.5),预设下限值与预设上限值的相加结果等于1。
本申请中,在生成器的训练初期,由于第一奖励值的变化幅度较大,而在生成器的训练后期,第一奖励值的变化幅度较小,因此随着训练轮次的增加,第一奖励值的权重逐渐减小,而第二奖励值的权重逐渐增大。需要说明的是,通过在训练初期将第一奖励值的权重设计得较大,而将第一奖励值的权重设计得较小,可以使得生成器在训练初期能更快速地学习如何生成与关键词更接近的近义词。而在训练后期(即生成器已经具有一定的生成近义词的能力后)将第一奖励值的权重设计得较小,而将第一奖励值的权重设计得较大,可以使得生成器在具有一定的生成近义词的能力的基础上,更注重学习如何生成与物料数据库更匹配的近义词。按照本申请提出的方式设计第一奖励值和第二奖励值的权重,有助于帮助生成器在复杂训练任务中快速收敛。
此外,本申请中的物料数据归类方法还可以包括以下步骤:显示未被查询到的剩余物料数据;接收用户对剩余物料数据的手动归类操作,并根据用户对剩余物料数据的手动归类操作,将剩余物料数据划归至相应类别。
具体实现时,当用户已经通过多个关键词将物料数据库中的大部分物料数据分类后,用户可以调出少量的剩余物料数据,然后对剩余物料数据进行手动归类操作,从而将剩余物料数据划归至相应类别。
本公开基于上述实施例提供了一种物料数据归类方法,基于同一发明构思,本公开通过以下实施例提供一种物料数据归类装置。参考图3,图3是本申请提供的物料归类装置的结构示意图。如图3所示,该物料数据归类装置包括:
关键词接收模块310,用于接收用户输入的用于查询物料数据的关键词。
近义词生成模块320,用于基于预先训练的生成式对抗网络中的生成器为关键词生成多个近义词;其中,生成式对抗网络包括生成器和判别器,生成式对抗网络是根据判别结果和物料数据命中率训练得到的,判别结果是训练期间判别器对生成器生成的序列进行判别的结果,物料数据命中率是训练期间利用生成器生成的序列进行查询时目标物料数据的查询命中率。
物料数据查询模块330,用于接收用户对近义词的选择操作,分别利用关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
基于同一发明构思,本申请实施例还提供一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述任一项所述的物料数据归类方法。
基于同一发明构思,本申请实施例还提供一种计算机可读存储介质,该存储介质上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的物料数据归类方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (6)

1.一种物料数据归类方法,其特征在于,所述方法包括:
接收用户输入的用于查询物料数据的关键词;
基于预先训练的生成式对抗网络中的生成器为所述关键词生成多个近义词;其中,所述生成式对抗网络包括所述生成器和判别器,所述生成式对抗网络是根据判别结果和物料数据命中率训练得到的,所述判别结果是训练期间所述判别器对所述生成器生成的序列进行判别的结果,所述物料数据命中率是训练期间利用所述生成器生成的序列进行查询时目标物料数据的查询命中率;
接收用户对所述近义词的选择操作,分别利用所述关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别;
所述方法还包括:
根据所述判别结果和所述物料数据命中率对所述生成式对抗网络的生成器进行训练,并根据所述判别结果对所述生成式对抗网络的判别器进行训练;
所述根据所述判别结果和所述物料数据命中率对所述生成式对抗网络的生成器进行训练,并根据所述判别结果对所述生成式对抗网络的判别器进行训练的步骤包括:
重复N次执行以下步骤S1至S3:S1.将随机噪声和样本关键词输入所述生成器,获得所述生成器生成的序列;S2.基于蒙特卡洛搜索方法对所述序列进行补全,得到完整序列,并通过所述判别器对所述完整序列进行判别,得到判别结果,以及根据判别结果生成奖励值;S3.利用所述序列对物料数据进行查询,得到物料查询结果;
计算N个所述奖励值的平均值,作为第一奖励值;
统计N个物料查询结果对目标物料数据的查询命中率,并根据所述查询命中率计算第二奖励值;其中,所述目标物料数据是与所述样本关键词匹配的物料数据;
根据所述第一奖励值和所述第二奖励值更新所述生成器,并根据所述第一奖励值更新所述判别器;
所述根据所述第一奖励值和所述第二奖励值更新所述生成器的步骤包括:
根据所述第一奖励值和所述第二奖励值两者各自的权重,对所述第一奖励值和所述第二奖励值进行加权求和;
根据加权求和结果更新所述生成器;
其中,在训练期间,所述第一奖励值的权重和所述第二奖励值的权重随所述第一奖励值的变化幅度而调整,所述第一奖励值的变化幅度越平缓,所述第一奖励值的权重越小,所述第二奖励值的权重越大;
所述第一奖励值的权重随着训练轮次的增加而逐渐减小,所述第二奖励值的权重随着训练轮次的增加而逐渐增大,所述第一奖励值的权重具有预设下限值,所述第二奖励值的权重具有预设上限值,所述预设下限值与所述预设上限值的相加结果等于1。
2.根据权利要求1所述的方法,其特征在于,所述N次中的每一次执行步骤S1时,输入所述生成器的随机噪声是不一致的,输入所述生成器的样本关键词是一致的。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
显示未被查询到的剩余物料数据;
接收用户对剩余物料数据的手动归类操作,并根据用户对剩余物料数据的手动归类操作,将剩余物料数据划归至相应类别。
4.一种物料数据归类装置,用于执行权利要求1至3中任一项所述的物料数据归类方法,其特征在于,所述装置包括:
关键词接收模块,用于接收用户输入的用于查询物料数据的关键词;
近义词生成模块,用于基于预先训练的生成式对抗网络中的生成器为所述关键词生成多个近义词;其中,所述生成式对抗网络包括所述生成器和判别器,所述生成式对抗网络是根据判别结果和物料数据命中率训练得到的,所述判别结果是训练期间所述判别器对所述生成器生成的序列进行判别的结果,所述物料数据命中率是训练期间利用所述生成器生成的序列进行查询时目标物料数据的查询命中率;
物料数据查询模块,用于接收用户对所述近义词的选择操作,分别利用所述关键词和每个被选中的近义词对物料数据进行查询,将查询到的物料数据划归为一个类别。
5.一种电子设备,其特征在于,所述电子设备包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至3中任一项所述的物料数据归类方法。
6.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,该程序被处理器执行时实现如权利要求1至3中任一项所述的物料数据归类方法。
CN202310286304.8A 2023-03-23 2023-03-23 一种物料数据归类方法、装置、电子设备及存储介质 Active CN116010609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310286304.8A CN116010609B (zh) 2023-03-23 2023-03-23 一种物料数据归类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310286304.8A CN116010609B (zh) 2023-03-23 2023-03-23 一种物料数据归类方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116010609A CN116010609A (zh) 2023-04-25
CN116010609B true CN116010609B (zh) 2023-06-09

Family

ID=86035858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310286304.8A Active CN116010609B (zh) 2023-03-23 2023-03-23 一种物料数据归类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116010609B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787029A (zh) * 2016-02-25 2016-07-20 浪潮软件集团有限公司 一种基于solr的关键字词识别办法
CN110942101A (zh) * 2019-11-29 2020-03-31 湖南科技大学 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法
CN111582348A (zh) * 2020-04-29 2020-08-25 武汉轻工大学 条件生成式对抗网络的训练方法、装置、设备及存储介质
CN111651577A (zh) * 2020-06-01 2020-09-11 全球能源互联网研究院有限公司 跨媒体数据关联分析模型训练、数据关联分析方法及***
CN114897163A (zh) * 2022-05-23 2022-08-12 阿里巴巴(中国)有限公司 预训练模型数据处理方法、电子设备及计算机存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427686A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 文本数据查询方法及装置
US10642846B2 (en) * 2017-10-13 2020-05-05 Microsoft Technology Licensing, Llc Using a generative adversarial network for query-keyword matching
US10552714B2 (en) * 2018-03-16 2020-02-04 Ebay Inc. Generating a digital image using a generative adversarial network
CN110032734B (zh) * 2019-03-18 2023-02-28 百度在线网络技术(北京)有限公司 近义词扩展及生成对抗网络模型训练方法和装置
US11455306B2 (en) * 2020-01-21 2022-09-27 Oracle International Corporation Query classification and processing using neural network based machine learning
CN111428448B (zh) * 2020-03-02 2024-05-07 平安科技(深圳)有限公司 文本生成方法、装置、计算机设备及可读存储介质
CN112182155B (zh) * 2020-09-25 2023-08-18 中国人民大学 一种基于生成式对抗网络的搜索结果多样化方法
CN112884130A (zh) * 2021-03-16 2021-06-01 浙江工业大学 一种基于SeqGAN的深度强化学习数据增强防御方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787029A (zh) * 2016-02-25 2016-07-20 浪潮软件集团有限公司 一种基于solr的关键字词识别办法
CN110942101A (zh) * 2019-11-29 2020-03-31 湖南科技大学 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法
CN111582348A (zh) * 2020-04-29 2020-08-25 武汉轻工大学 条件生成式对抗网络的训练方法、装置、设备及存储介质
CN111651577A (zh) * 2020-06-01 2020-09-11 全球能源互联网研究院有限公司 跨媒体数据关联分析模型训练、数据关联分析方法及***
CN114897163A (zh) * 2022-05-23 2022-08-12 阿里巴巴(中国)有限公司 预训练模型数据处理方法、电子设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于生成对抗网络的小样本数据生成技术研究;杨懿男;齐林海;王红;苏林萍;;电力建设(第05期);第71-77页 *

Also Published As

Publication number Publication date
CN116010609A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
Jiao et al. Product portfolio identification based on association rule mining
CN109299344A (zh) 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN109903103B (zh) 一种推荐物品的方法和装置
CN109902823B (zh) 一种基于生成对抗网络的模型训练方法及设备
TWI752349B (zh) 風險識別方法及裝置
CN110827120A (zh) 基于gan网络的模糊推荐方法、装置、电子设备及存储介质
McRee Symbolic regression using nearest neighbor indexing
CN116680320A (zh) 一种基于大数据的混合匹配方法
US11972335B2 (en) System and method for improving classification in adversarial machine learning
Dewancker et al. Interactive preference learning of utility functions for multi-objective optimization
Vens et al. First order random forests with complex aggregates
CN116010609B (zh) 一种物料数据归类方法、装置、电子设备及存储介质
CN113204642A (zh) 文本聚类方法、装置、存储介质和电子设备
Basaran et al. A multi-criteria decision making to rank android based mobile applications for mathematics
Chow et al. A new feature selection scheme using a data distribution factor for unsupervised nominal data
CN106294416B (zh) Seo词库的分类模型建立方法、关键词选取方法及装置
CN111382265A (zh) 搜索方法、装置、设备和介质
US8175998B2 (en) Method and expert system with evolutionary algorithm for valuating an object
Jovanović et al. Evolutionary approach for automated component-based decision tree algorithm design
CN112328918A (zh) 商品排序方法、计算设备和计算机可读存储介质
JPWO2020201875A5 (zh)
De Moraes et al. An evolutive hybrid approach to cloud computing provider selection
CN111782940B (zh) 基于自然流量选择的推荐方法、装置、电子设备及介质
CN113033281B (zh) 一种对象重识别的方法、装置及设备
CN109446562B (zh) 曲柄压力机配置方案的检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant