CN109145938A - 一种使用分类器进行分类的方法和装置 - Google Patents

一种使用分类器进行分类的方法和装置 Download PDF

Info

Publication number
CN109145938A
CN109145938A CN201810668597.5A CN201810668597A CN109145938A CN 109145938 A CN109145938 A CN 109145938A CN 201810668597 A CN201810668597 A CN 201810668597A CN 109145938 A CN109145938 A CN 109145938A
Authority
CN
China
Prior art keywords
vector
arbiter
sample
classifier
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810668597.5A
Other languages
English (en)
Inventor
王立
李超
陈帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810668597.5A priority Critical patent/CN109145938A/zh
Publication of CN109145938A publication Critical patent/CN109145938A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种使用分类器进行分类的装置和方法,该方法包括:生成待分类对象的特征向量;以及使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。

Description

一种使用分类器进行分类的方法和装置
技术领域
本说明书涉及电子信息领域,尤其涉及一种使用分类器进行分类的方法和装置。
背景技术
随着移动互联技术的发展,用户之间的交互可以更多地借助数字化的信息来完成。
在一种应用场景下,服务提供方可以为用户生成数字化的服务码,该服务码与该用户绑定,用户在该服务提供方提供的平台上可以经由服务码与其他用户进行互动时。
例如,在电子贸易平台上,平台服务的提供方可以为用户提供收钱码作为服务码,该收钱码与该用户绑定,其他用户需要对该用户付款时,通过扫描该收钱码并进行转账操作,就可以将款项支付到该收钱码对应的账户。
为了便于对服务码进行推广和管理,服务提供方有时需要用户提交服务码与用户绑定的信息。这些绑定信息中可能存在虚假信息,因此,需要对虚假的绑定信息进行识别。
目前,已经存在基于梯度提升树(GBDT:Gradient Boosting Decision Tree)的分类器用于识别绑定信息的真伪模型。
应该注意,上面对技术背景的介绍只是为了方便对本说明书的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本说明书的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
本说明书的发明人发现,现有的基于GBDT的分类器虽然能够鉴别出来部分虚假的绑定信息,但是,这些分类器对训练样本的依赖性较强,在作为训练样本的虚假的绑定信息数量较少的情况下,随着分类准确率要求的提升,该分类器的覆盖率急剧下降。
本说明书实施例提供一种使用分类器进行分类的方法及装置,使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器来识别待分类对象的类别,由此,在训练样本数量有限的情况下,能够在维护较高精确度的同时,提升分类的覆盖率。
为了实现上述目的,本说明书提供一种使用分类器进行分类的方法,所述方法包括:生成待分类对象的特征向量;以及使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
本说明书还提供一种使用分类器进行分类的装置,包括:特征向量生成单元,其生成待分类对象的特征向量;以及分类器单元,其使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
本说明书的有益效果在于:在训练样本数量有限的情况下,能够在维护较高精确度的同时,提升分类的覆盖率。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是使用分类器进行分类的方法的一个示意图;
图2是InoGAN分类器的一个示意图
图3是实施例中对分类器的判别器和生成器进行训练的方法的一个示意图;
图4是步骤305的一个示意图;
图5是实施例的一个实例所示的方法的一个示意图;
图6是使用分类器进行分类的装置的一个示意图
图7是训练单元的一个示意图;
图8是本说明书实施例的电子设备的一个构成示意图。
具体实施方式
本说明书实施例提供一种使用分类器进行分类的方法。图1是该方法的一个示意图,如图1所示,该方法包括:
步骤101、生成待分类对象的特征向量;
步骤103、使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
根据本实施例,在训练样本数量有限的情况下,能够在维护较高精确度的同时,提升分类的覆盖率。
图2是InoGAN分类器的一个示意图。如图2所示,InoGAN分类器200具有生成器201和判别器202。
其中,生成器201可以根据输入的信息码生成对照样本F,即,伪造的样本;对照样本F和真实样本R被输入判别器202,该判别器202判别被输入的样本是对照样本F还是真实样本R,并输出判别结果,并且,判别器202还可以识别输入的样本的类别,并输出识别结果。
生成器201可以具有多个全连接层,例如3个,每个全连接层后都可以连接一个(drop-out)层用来防止过拟合,其中,每个全连接层都可以具有多个节点,各节点具有权值。
判别器202可以具有多个全连接层,例如3个,每个全连接层后都可以连接一个(drop-out)层用来防止过拟合,其中,每个全连接层都可以具有多个节点,各节点具有权值。
在本实施例中,判别器202的判别结果可以从最后一个全连接层输出,识别结果可以从中间的全连接层输出,也就是说,形成判别结果的过程和形成识别结果的过程可以共用部分的全连接层。
在本实施例中,在训练InoGAN分类器200的过程中,可以根据判别器202的输出的判别结果调整生成器201中各节点的权值,根据判别器202的输出的判别结果和识别结果,调整判别器202中各节点的权值。
在对分类器200进行训练的过程中,由于生成器201可以生成对照样本F,因而对于训练样本的数量的需求较少。
对训练完成的InoGAN分类器200而言,判别器202在判别被输入的样本是对照样本F还是真实样本R时,判别的正确率为50%,并且,判别器202能够识别输入的样本的类别。
在本实施例中,训练完成的InoGAN分类器200的判别器202用于识别待分类对象的特征向量的类别,能够在维护较高精确度的同时,提升分类的覆盖率。
在本实施例中,如图1所示,使用分类器进行分类的方法还可以在步骤101之前包括:
步骤105、获取待分类对象的信息,并生成与所述待分类对象的信息相关的数据。
在本实施例中,待分类对象的信息例如可以是用户的信息和服务码签约信息等,用户的信息例如可以是用户的地理信息或识别信息等,服务码签约信息例如可以是用户与服务提供方签约以获取服务码的时间、或签约的负责人等。在一个具体实例中,服务码例如可以是付款码,用户例如可以是接入该服务提供方平台的商户。
在本实施例中,步骤103可以基于步骤105所生成的数据生成该待分类对象的特征向量,其中,该特征向量中连续的值可以被归一化到[-1,1]之间,该特征向量的枚举类型可以是独热码(one-hot)形式。在本实施例中,对该特征向量中连续的值进行上述归一化的目的在于:深度神经网络对[-1,1]之间的值处理能力更强,因而能够提高基于深度神经网络的分类器的准确性,同时也防止向量值突变对分类器的训练和应用带来的负面影响。
在本实施例中,如图1所示,使用分类器进行分类的方法还可以在步骤103之前包括:
步骤107、根据训练样本对所述分类器的判别器和生成器进行训练。
由此,在步骤103中,可以使用步骤107训练完成的判别器来识别步骤101生成的该待分类对象的特征向量的类别。
图3是本实施例中对分类器的判别器和生成器进行训练的方法的一个示意图。
如图3所示,对分类器200的判别器201和生成器202进行训练的方法包括:
步骤301、获取训练样本的信息,并生成与所述训练样本的信息相关的数据;
步骤303、根据与所述训练样本的信息相关的数据,生成训练样本的特征向量,并且,生成与该训练样本的类别对应的标签向量,进而生成包含所述特征向量和所述标签向量的样本向量;
步骤305、基于所述样本向量和信息码(information code),对所述判别器和所述生成器进行训练。
在本实施例中,步骤301获取的训练样本的信息例如可以是训练样本中用户的信息和服务码信息等,用户的信息例如可以是用户的地理信息或识别信息等,服务码信息例如可以是用户与服务提供方签约以获取服务码的时间、或签约的负责人等。在一个具体实例中,服务码例如可以是付款码,用户例如可以是接入该服务提供方平台的商户。
在本实施例中,步骤303可以根据步骤301生成的与训练样本的信息相关的数据生成特征向量,其中,该特征向量中连续的值可以被归一化到[-1,1]之间,该特征向量的枚举类型可以是独热码(one-hot)形式。
在本实施例中,步骤303还可以生成与该训练样本的类别对应的标签向量,该标签向量例如可以表示4个类别:服务码虚假;服务码真实但是用户的信息虚假;服务码真实且用户的信息真实,但是服务码和用户的信息不匹配;服务码真实且用户的信息真实,并且服务码和用户的信息匹配。此外,对于待分类对象的信息是其它信息的情况,该训练样本的可以具有其它的类别,并且类别的数量也可以是其它数量。
在本实施例中,标签向量的枚举类型也可以是独热码(one-hot)形式。
在步骤303中,训练样本的特征向量以及该训练样本的标签向量可以被合成,以形成样本向量。此外,该样本向量中还可以具有其它信息。
在本实施例的步骤304中,可以基于所述样本向量和信息码,对判别器202和生成器201进行训练。图4是步骤305的一个示意图,如图4所示,步骤305可以包括如下步骤:
步骤401、生成器201根据信息码生成对照样本(即,伪造样本)向量,该对照样本向量与步骤303的样本向量的维度相同;
步骤403、对照样本向量或样本向量被输入判别器202,判别器202判别被输入的向量是对照样本向量还是样本向量,并识别输入的向量的类别;
步骤405、根据判别器202判别的结果调整生成器201中各节点的权值,根据判别器202判别的结果和判别器202对类别进行识别的结果调整判别器202中各节点的权值。
在上述步骤401中,信息码可以是随机序列,也可以是对大量样本向量学习后生成。生成器201根据信息码生成对照样本的方法可以参考现有技术。
在上述步骤403中,判别器202可以判别被输入判别器202的向量是对照样本向量还是样本向量,并输出判别结果;并且,判别器202还可以识别被输入判别器202的向量的类别。
在上述步骤405中,可以根据判别器202对于的向量是对照样本向量还是样本向量的判别的结果调整生成器201中各节点的权值,例如,该判别的结果是一个概率值(例如,第一概率值),将该概率值与真实情况(即,实际输入的向量是对照样本向量还是样本向量)进行比较,并根据比较结果调整生成器201中各节点的权值。
在上述步骤405中,还可以根据判别器202判别的结果和判别器202对类别进行识别的结果调整判别器202中各节点的权值,例如,该判别的结果是一个概率值(例如,第一概率值),该识别结果也是概率值(例如,第二概率值),将第一概率值与输入的向量真实情况(即,实际输入的向量是对照样本向量还是样本向量)进行比较,将第二概率值与输入的向量的类别的真实情况(即,实际输入的向量样本向量的情况下,该样本向量的标签向量是什么)进行比较,并根据两个比较结果调整判别器202中各节点的权值。
在步骤405中,当判别器202输出的判别的结果没有达到停止条件时,返回步骤401,再次进行从步骤401至步骤405的过程,直到判别器202输出的判别的结果达到该停止条件,完成对判别器202和生成器201的训练。
在一个实施方式中,该停止条件例如可以是:判别器202在判别被输入的向量是对照样本向量还是样本向量时,判别的结果的正确率为50%。此外,也可以有其它的停止条件。
在本实施例中,对于完成训练后的判别器202,在步骤103中,可以将待分类对象的特征向量输入该判别器202,判别器202能够识别该待分类对象的特征向量的类别。
图5是该实施例的一个实例所示的方法的一个示意图,如图5所示,该方法包括:训练阶段501和应用阶段502。
训练阶段501包括:
步骤5011、对应于步骤301,在该步骤中,针对训练样本,采集商户信息,例如地理信息等,以及收钱码签约信息,例如签约时间,签约负责人等,生成与训练样本的信息相关的数据。
步骤5013、对应于步骤303,在该步骤中,将步骤5011生成的数据转换成特征向量和标签向量。其中,需要将特征向量中连续的值归一化到[-1,1]之间,枚举类型变成one-hot形式;标签向量也成为one-hot形式,且为商户的真假标签,分为4类:虚假收钱码;收钱码真实但是商户不真实;收钱码和商户均真实但不匹配;收钱码和商户均真实,并且匹配。
步骤5015、对应于步骤305,在该步骤5015中,对InfoGAN分类器200进行训练,训练的方法可以与步骤401至步骤405相同。
应用阶段502包括:
步骤5021、对应于步骤105和步骤101,在该步骤5021中,收集商户的线上行为的信息并进行处理得到相应数据,并根据该数据生成商户和收钱码的特征向量作为待分类对象的特征向量。特征向量的归一化使用训练样本的均值和方差信息。
步骤5023、对应于步骤103,该步骤中,将步骤5021生成的商户和收钱码的特征向量输入到步骤5015训练完成的分类器200的判别器202中,判别器202商户和收钱码的特征向量的类别进行识别,当识别为虚假收钱码、收钱码真实但是商户不真实、收钱码和商户均真实但不匹配这三种类别时,认为该商户及其收钱码无效,当识别为收钱码和商户均真实并且匹配时,认为该商户及其收钱码真实有效。
在本实施例中,上述使用分类器进行分类的方法不仅可以用于识别用户和服务码,例如商户和收钱码,是否真实有效,也可以用于其它的待分类对象,例如,进行用户等级评定、用户行为判定等。
本说明书实施例还提供一种使用分类器进行分类的装置,与前述实施例的方法对应。
图6是使用分类器进行分类的装置的一个示意图,如图6所示,该装置600包括:特征向量生成单元601和分类器单元602。
其中,特征向量生成单元601生成待分类对象的特征向量;分类器单元602使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
如图6所示,装置600还包括:第一数据预处理单元603。第一数据预处理单元603用于获取所述待分类对象的信息,并生成与所述待分类对象的信息相关的数据。其中,所述特征向量生成单元601根据所述第一数据预处理单元603生成的所述数据,生成所述待分类对象的所述特征向量。
如图6所示,装置600还包括:训练单元604,其根据训练样本对所述分类器的所述判别器和生成器进行训练。其中,所述分类器单元602使用训练完成后的判别器识别所述待分类对象的所述特征向量的类别。
图7是训练单元的一个示意图,如图7所示,该训练单元700包括:
第二数据预处理单元701,其用于获取所述训练样本的信息,并生成与所述训练样本的信息相关的数据;
样本向量生成单元702,其生成训练样本的特征向量,以及与该训练样本的类别对应的标签向量,并生成包含所述特征向量和所述标签向量的样本向量;
分类器训练单元703,基于所述样本向量和信息码(information code),对所述判别器和所述生成器进行训练。
在本实施例中,生成器根据所述信息码生成对照样本(即,伪造样本)向量,所述对照样本向量与所述样本向量的维度相同;所述对照样本向量或所述样本向量被输入所述判别器,所述判别器判别被输入的向量是所述对照样本向量还是所述样本向量,并识别输入的向量的类别;所述分类器训练单元703根据所述判别器判别的结果调整所述生成器中各节点的权值,根据所述判别器判别的结果和所述判别器对类别进行识别的结果调整所述判别器中各节点的权值。
本实施例中关于各单元的说明,可以参考前述实施例中对于各步骤的说明。
根据本实施例,在训练样本数量有限的情况下,能够在维护较高精确度的同时,提升分类器分类的覆盖率。
本说明书实施例还提供一种电子设备,所述电子设备包括:如前述实施例所述的使用分类器进行分类的装置。
图8是本说明书实施例的电子设备的一个构成示意图。如图8所示,电子设备800可以包括:中央处理器(CPU)801和存储器802;存储器802耦合到中央处理器801。其中该存储器802可存储各种数据;此外,还存储用于执行使用分类器进行分类的方法的程序,并且在中央处理器801的控制下执行该程序。
在一个实施方式中,使用分类器进行分类的装置的功能可以被集成到中央处理器801中。
其中,中央处理器801可以被配置为:
生成待分类对象的特征向量;以及使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
其中,中央处理器801还可以被配置为:
获取所述待分类对象的信息,并生成与所述待分类对象的信息相关的数据,其中,所述待分类对象的所述特征向量基于与所述待分类对象的信息相关的数据生成。
其中,中央处理器801还可以被配置为:根据训练样本对所述分类器的所述判别器和生成器进行训练,其中,训练完成的所述判别器被用于识别所述待分类对象的所述特征向量的类别。
其中,中央处理器801还可以被配置为:
生成训练样本的特征向量,以及与该训练样本的类别对应的标签向量,并生成包含所述特征向量和所述标签向量的样本向量;基于所述样本向量和信息码(informationcode),对所述判别器和所述生成器进行训练。
其中,中央处理器801还可以被配置为:所述生成器根据所述信息码生成对照样本向量,所述对照样本向量与所述样本向量的维度相同;所述对照样本向量或所述样本向量被输入所述判别器,所述判别器判别被输入的向量是所述对照样本向量还是所述样本向量,并识别输入的向量的类别;以及根据所述判别器判别的结果调整所述生成器中各节点的权值,根据所述判别器判别的结果和所述判别器对类别进行识别的结果调整所述判别器中各节点的权值。
其中,中央处理器801还可以被配置为:获取所述训练样本的信息,并生成与所述训练样本的信息相关的数据,所述训练样本的特征向量基于与所述训练样本的信息相关的所述数据生成。
此外,如图8所示,电子设备800还可以包括:输入输出单元803和显示单元804等;其中,上述部件的功能与现有技术类似,此处不再赘述。值得注意的是,电子设备800也并不是必须要包括图8中所示的所有部件;此外,电子设备800还可以包括图8中没有示出的部件,可以参考现有技术。
本说明书实施例还提供一种计算机可读程序,其中当在使用分类器进行分类的装置或电子设备中执行所述程序时,所述程序使得使用分类器进行分类的装置或电子设备执行前述实施例所述的使用分类器进行分类的方法。
本说明书实施例还提供一种存储有计算机可读程序的存储介质,其中,所述存储介质存储上述计算机可读程序,所述计算机可读程序使得使用分类器进行分类的装置或电子设备执行前述实施例所述的使用分类器进行分类的方法。
结合本发明实施例描述的为视频监控***配置参数的装置可直接体现为硬件、由处理器执行的软件功能单元或二者组合。例如,图7和6中所示的功能框图中的一个或多个和/或功能框图的一个或多个组合,既可以对应于计算机程序流程的各个软件功能单元,亦可以对应于各个硬件模块。这些软件功能单元,可以分别对应于前述实施例所示的各个步骤。这些硬件模块例如可利用现场可编程门阵列(FPGA)将这些软件功能单元固化而实现。本说明书实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本说明书实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本说明书各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
针对图7和6描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,可以实现为用于执行本说明书所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件、或者其任意适当组合。针对图7和6描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,还可以实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP通信结合的一个或多个微处理器或者任何其它这种配置。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本说明书。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本说明书的精神或范围的情况下,在其它实施例中实现。因此,本说明书将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种使用分类器进行分类的方法,包括:
生成待分类对象的特征向量;以及
使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
2.如权利要求1所述的方法,其中,所述方法还包括:
获取所述待分类对象的信息,并生成与所述待分类对象的信息相关的数据,
其中,
所述待分类对象的所述特征向量基于与所述待分类对象的信息相关的数据生成。
3.如权利要求1所述的方法,其中,所述方法还包括:
根据训练样本对所述分类器的所述判别器和生成器进行训练,
其中,
训练完成的所述判别器被用于识别所述待分类对象的所述特征向量的类别。
4.如权利要求3所述的方法,其中,对所述分类器的所述判别器和生成器进行训练,包括:
生成训练样本的特征向量,以及与该训练样本的类别对应的标签向量,并生成包含所述特征向量和所述标签向量的样本向量;
基于所述样本向量和信息码(information code),对所述判别器和所述生成器进行训练。
5.如权利要求4所述的方法,其中,基于所述样本向量和信息码,对所述判别器和所述生成器进行训练,包括:
所述生成器根据所述信息码生成对照样本向量,所述对照样本向量与所述样本向量的维度相同;
所述对照样本向量或所述样本向量被输入所述判别器,所述判别器判别被输入的向量是所述对照样本向量还是所述样本向量,并识别输入的向量的类别;以及
根据所述判别器判别的结果调整所述生成器中各节点的权值,根据所述判别器判别的结果和所述判别器对类别进行识别的结果调整所述判别器中各节点的权值。
6.如权利要求4所述的方法,其中,对所述分类器的所述判别器和生成器进行训练,还包括:
获取所述训练样本的信息,并生成与所述训练样本的信息相关的数据,
其中,
所述训练样本的特征向量基于与所述训练样本的信息相关的所述数据生成。
7.一种使用分类器进行分类的装置,包括:
特征向量生成单元,其生成待分类对象的特征向量;以及
分类器单元,其使用信息最大化生成对抗神经网络(InoGAN)分类器的判别器识别所述待分类对象的所述特征向量的类别。
8.如权利要求7所述的装置,其中,所述装置还包括:
第一数据预处理单元,其用于获取所述待分类对象的信息,并生成与所述待分类对象的信息相关的数据,
其中,所述特征向量生成单元根据所述第一数据预处理单元生成的所述数据,生成所述待分类对象的所述特征向量。
9.如权利要求7所述的装置,其中,所述装置还包括:
训练单元,其根据训练样本对所述分类器的所述判别器和生成器进行训练,
所述分类器单元使用训练完成后的所述判别器识别所述待分类对象的所述特征向量的类别。
10.如权利要求9所述的装置,其中,所述训练单元包括:
样本向量生成单元,其生成训练样本的特征向量,以及与该训练样本的类别对应的标签向量,并生成包含所述特征向量和所述标签向量的样本向量;
分类器训练单元,基于所述样本向量和信息码(information code),对所述判别器和所述生成器进行训练,
其中,
所述生成器根据所述信息码生成对照样本(即,伪造样本)向量,所述对照样本向量与所述样本向量的维度相同,
所述对照样本向量或所述样本向量被输入所述判别器,所述判别器判别被输入的向量是所述对照样本向量还是所述样本向量,并识别输入的向量的类别,
所述分类器训练单元根据所述判别器判别的结果调整所述生成器中各节点的权值,根据所述判别器判别的结果和所述判别器对类别进行识别的结果调整所述判别器中各节点的权值。
11.如权利要求9所述的装置,其中,所述训练单元还包括:
第二数据预处理单元,其用于获取所述训练样本的信息,并生成与所述训练样本的信息相关的数据,
其中,所述样本向量生成单元根据所述第二数据预处理单元生成的所述数据,生成所述训练样本的特征向量。
CN201810668597.5A 2018-06-26 2018-06-26 一种使用分类器进行分类的方法和装置 Pending CN109145938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810668597.5A CN109145938A (zh) 2018-06-26 2018-06-26 一种使用分类器进行分类的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810668597.5A CN109145938A (zh) 2018-06-26 2018-06-26 一种使用分类器进行分类的方法和装置

Publications (1)

Publication Number Publication Date
CN109145938A true CN109145938A (zh) 2019-01-04

Family

ID=64802188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810668597.5A Pending CN109145938A (zh) 2018-06-26 2018-06-26 一种使用分类器进行分类的方法和装置

Country Status (1)

Country Link
CN (1) CN109145938A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633989A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种风险行为生成模型的确定方法及装置
CN113127872A (zh) * 2021-04-16 2021-07-16 国家计算机网络与信息安全管理中心浙江分中心 一种判别对抗网络的恶意应用检测方法和***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220600A (zh) * 2017-05-17 2017-09-29 清华大学深圳研究生院 一种基于深度学习的图片生成方法及生成对抗网络
CN107423701A (zh) * 2017-07-17 2017-12-01 北京智慧眼科技股份有限公司 基于生成式对抗网络的人脸非监督特征学习方法及装置
CN107943784A (zh) * 2017-11-02 2018-04-20 南华大学 基于生成对抗网络的关系抽取方法
CN108171266A (zh) * 2017-12-25 2018-06-15 中国矿业大学 一种多目标深度卷积生成式对抗网络模型的学习方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220600A (zh) * 2017-05-17 2017-09-29 清华大学深圳研究生院 一种基于深度学习的图片生成方法及生成对抗网络
CN107423701A (zh) * 2017-07-17 2017-12-01 北京智慧眼科技股份有限公司 基于生成式对抗网络的人脸非监督特征学习方法及装置
CN107943784A (zh) * 2017-11-02 2018-04-20 南华大学 基于生成对抗网络的关系抽取方法
CN108171266A (zh) * 2017-12-25 2018-06-15 中国矿业大学 一种多目标深度卷积生成式对抗网络模型的学习方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633989A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种风险行为生成模型的确定方法及装置
CN110633989B (zh) * 2019-08-16 2023-08-29 创新先进技术有限公司 一种风险行为生成模型的确定方法及装置
CN113127872A (zh) * 2021-04-16 2021-07-16 国家计算机网络与信息安全管理中心浙江分中心 一种判别对抗网络的恶意应用检测方法和***

Similar Documents

Publication Publication Date Title
Issa et al. Research ideas for artificial intelligence in auditing: The formalization of audit and workforce supplementation
CN111881968A (zh) 多任务分类方法、装置及相关设备
US11875409B1 (en) Systems and methods for identifying and curing anomalies in insurance claims
CN109376766B (zh) 一种画像预测分类方法、装置及设备
CN109583966B (zh) 一种高价值客户识别方法、***、设备及存储介质
CN110992167A (zh) 银行客户业务意图识别方法及装置
KR101782120B1 (ko) 상담정보 및 군집화에 기반한 금융상품추천장치 및 방법
Voican Credit Card Fraud Detection using Deep Learning Techniques.
CN111861174A (zh) 一种针对用户画像的信用评估方法
CN112215696A (zh) 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质
KR20220071875A (ko) 인공신경망 기반 보험 가입 예정자의 언더라이팅 장치 및 방법
CN110288085A (zh) 一种数据处理方法、装置、***及存储介质
CN113052703A (zh) 一种交易风险预警方法及装置
CN112634017A (zh) 远程开卡激活方法、装置、电子设备及计算机存储介质
CN109145938A (zh) 一种使用分类器进行分类的方法和装置
CN111899027A (zh) 一种反欺诈模型的训练方法及装置
CN111709845A (zh) 医保欺诈行为识别方法、装置、电子设备及存储介质
CN114639152A (zh) 基于人脸识别的多模态语音交互方法、装置、设备及介质
CN114662477A (zh) 基于中医对话的停用词表生成方法、装置及存储介质
Reddy et al. Machine Learning based Loan Eligibility Prediction using Random Forest Model
CN110543910A (zh) 信用状态监测***和监测方法
CN113706258B (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
Kuběnka The factors affecting the accuracy of business failure prediction models
CN108831487A (zh) 声纹识别方法、电子装置及计算机可读存储介质
CN113837595A (zh) 面签方式分配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: Greater Cayman, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190104

RJ01 Rejection of invention patent application after publication