CN114022699A - 图像分类方法、装置、计算机设备和存储介质 - Google Patents
图像分类方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114022699A CN114022699A CN202111203991.XA CN202111203991A CN114022699A CN 114022699 A CN114022699 A CN 114022699A CN 202111203991 A CN202111203991 A CN 202111203991A CN 114022699 A CN114022699 A CN 114022699A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- features
- feature
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种图像分类方法、装置、计算机设备和存储介质。方法包括:获取待处理图像;通过预先训练的特征提取模型对所述待处理图像进行处理得到至少两个分支的分支特征,并将所述分支对应的部分特征进行拼接得到目标特征;计算所述待处理图像的目标特征与历史图像的图像特征的相似度;根据所述相似度对所述待处理图像进行分类。采用本方法能够对待处理图像进行分类。
Description
技术领域
本申请涉及人工智能图像技术领域,特别是涉及一种背景相似度分析方法、装置、计算机设备和存储介质。
背景技术
随着人们经济水平的提高以及消费观念的改变,利用在线贷款,***等提前消费的方式如今已变得十分常见,因此许多公司都开展了相关的在线金融服务。
在线贷款只需要贷款者提供相应的身份信息及上传当前照片即可获得贷款资格,因此有许多不法分子利用在线贷款的便利,通过集体大量申请贷款的方式将贷来的钱款以更高的价格贷出或进行非法集资或进行恶意贷款即只贷不还等等,上述无论哪种情况,都会对公司产生一定的经济损失。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对图像进行分类的图像分类方法、装置、计算机设备和存储介质。
一种图像分类方法,所述图像分类方法包括:
获取待处理图像;
通过预先训练的特征提取模型对所述待处理图像进行处理得到至少两个分支的分支特征,并将所述分支特征进行拼接得到目标特征;
计算所述待处理图像的目标特征与历史图像的图像特征的相似度;
根据所述相似度对所述待处理图像进行分类。
在其中一个实施例中,所述通过预先训练的特征提取模型得到至少两个分支,包括:
通过预先训练的特征提取模型的整体特征提取网络提取所述待处理图像的整体特征;
通过预先训练的特征提取模型的至少一个部分特征提取分支从所述整体特征中选择部分特征,作为对应分支的分支特征。
在其中一个实施例中,所述计算所述待处理图像的目标特征与历史图像的图像特征的相似度,包括:
计算所述待处理图像的目标特征与所述历史图像的图像特征的余弦相似度,作为所述待处理图像的目标特征与所述历史图像的图像特征之间的相似度。
在其中一个实施例中,所述图像分类方法还包括:
获取样本图像,所述样本图像携带有分类标签;
将所述样本图像输入至初始模型中得到待处理特征;
根据所述分类标签以及所述待处理特征计算得到目标损失函数;
根据所述目标损失函数对所述初始模型进行优化以得到所述特征提取模型。
在其中一个实施例中,所述根据所述分类标签以及所述待处理特征计算得到目标损失函数,包括:
对所述待处理特征进行分割,得到至少两个所述分支对应的部分样本特征;
根据所述样本标签与所述待处理特征计算得到第一损失函数;
分别根据所述样本标签与每一所述分支对应的部分样本特征计算得到至少两个第二损失函数;
根据所述第一损失函数与所述第二损失函数得到所述目标损失函数。
一种风险图像识别方法,所述风险图像识别方法包括:
获取待处理图像;
根据上述任意一项实施中的图像分类方法将所述待处理图像进行分类;
统计所述待处理图像对应分类中的所述历史图像的数量;
当所述待处理图像对应分类中的所述历史图像的数量超过预设数值时,则判定所述待处理图像为风险图像。
一种图像分类装置,所述装置包括:
接收模块,用于获取待处理图像;
特征提取模块,用于对所述待处理图像进行特征提取;
相似度计算模块,计算所述待处理图像的特征与数据库中图像特征的相似度;
分析模块,用于根据所述相似度对所述待处理图像进行判断。
一种风险图像识别装置,所述装置包括:
数据接收模块:用于获取待处理图像;
图像分类模块:用于根据上述任意一项实施例中的图像分类方法将所述待处理图像进行分类;
图像统计模块:用于统计所述待处理图像对应分类中的所述历史图像的数量;
风险图像判定模块:用于当所述待处理图像对应分类中的所述历史图像的数量超过预设数值时,则判定所述待处理图像为风险图像。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
上述图像分类方法,通过特征提取模型可得到待处理图像至少两个分支的部分特征,并将分支进行拼接得到目标特征,然后根据目标特征计算与历史图像的相似度,并根据相似度对待处理图像进行分类,其中目标特征是通过分支特征进行拼接得到的,因此通过比较待处理图像的目标特征与历史图像的图像特征即可对待处理图像进行分类。其次,由于目标特征是通过分支特征进行拼接得到的,那么可以通过设置获取分支特征的规则,即可实现根据特定的区域对待处理图像进行分类。
附图说明
图1为一个实施例中图像分类方法的应用环境图;
图2为一个实施例中图像分类方法的流程示意图;
图3为一个实施例中用户上传的自拍照片;
图4为一个实施例中训练特征提取模型的流程示意图;
图5为一个实施例中计算目标损失函数的流程示意图;
图6为一个实施例中风险图像识别方法的流程示意图;
图7为一个实施例中基于背景相似度分析的金融风控方法的判别过程;
图8为一个实施例中一种图像分类装置的结构框图;
图9为一个实施例中一种风险图像识别装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的图像分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以将获取待处理***图像发送到服务器104,从而服务器104可以对该待处理***图像进行处理,例如服务器104将待处理图像输入至预先训练的特征提取模型中进行特征提取并得到至少两个分支所对应的部分特征,然后对分支所对应的部分特征进行拼接得到目标特征,最后计算待处理图像的目标特征与历史图像的图像之间的相似度并根据相似度对待处理图像进行分类,由于目标特征是由分支所对应的部分特征进行拼接得到的,那么可以通过设置获取分支所对应的部分特征的规则,即可实现根据特定的区域对待处理图像进行分类。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像分类方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202,获取待处理图像。
其中,待处理图像是服务器接收的与终端上传的照片。其中,可选地,终端可以批量上传待处理图像。服务器可以将终端上传的待处理图像进行存储,这样在处理的时候直接获取存储的待处理图像,优选地,服务器将待处理图像存储至缓存队列中。
可选地,若终端上传的是贷款者拍摄的个人照片,服务器可根据指令对贷款者拍摄的个人照片进行特征提取,并根据提取的特征对贷款者拍摄的个人照片进行分类。
S204,通过预先训练的特征提取模型对待处理图像进行处理得到至少两个分支所的分支特征,并将分支特征进行拼接得到目标特征。
具体地,特征提取模型是预先训练的用于提取待处理图像中的特征的模型。分支特征是指待处理图像整体特征中的部分特征,分支特征是可根据预设规则对整体特征进行分割得到。例如分支特征可以是待处理图像整体特征中前二分之一的特征、前三分之一的特征和/或前三分之一至三分之二的特征。其中分支特征可以是根据分类的目的来确定是提取整体特征的那一部分。例如一般背景特征在图像的上方,因此若是根据背景特征进行分类,则可以提取待处理图像整体特征中前二分之一的特征、前三分之一的特征和/或前三分之一至三分之二的特征。若是根据前景特征来进行分类,则可以提取整体特征中的后二分之一的特征、后三分之一的特征和/或后三分之一至三分之二的特征等等。因此可以预先根据经验来判断分类的特征所在的位置,再配置特征提取模型对应的分支所提取的特征的位置,进而再进行训练。
具体地,目标特征是用于表征待处理图像的特征,是用于对待处理图像进行分类的依据,其可以通过分支特征进行拼接后得到。其中可选地,可以将分支特征直接拼接获得目标特征,也可以对部分特征进行处理后将其拼接,例如先从部分特征中进行特征融合后将其拼接,本领域技术人员可以理解的是为了使后续计算过程更快、更准确对部分特征进行一定的处理后将其进行拼接,具体在此不做限定。
需要说明的一点是,从对所述待处理图像进行处理得到至少两个分支的分支特征可根据实际情况进行选取,例如若只需要对待处理图像的背景进行分类,那么分支特征可选择待处理图像整体特征中前二分之一、前三分之一以及前三分之一到三分之二处的特征作为分支特征,然后对这些分支特征进行拼接得到目标特征,再对目标特征做进一步处理例如进行相似度比较,对待处理图像中的背景进行分类。因此可以通过实际的应用场景对获取分支特征的规则进行限定,即可实现根据特定的区域对待处理图像进行分类。
S206,计算待处理图像的目标特征与历史图像的图像特征的相似度。
具体地,历史图像是指现有的图像,其可以是数据库中包括的任意一张图像;具体地,相似度是体现待处理图像的目标特征与历史图像的图像特征之间相似性的量化数值,若两者之间的相似度越高则表示待处理图像的目标特征与历史图像的图像特征之间越相似。
可选地,相似度可作为对图像进行分类的分类指标,若两者之间的相似度满足一定条件,则可以将两张图像分为同类照片。
其中可选地,在计算相似度的时候,服务器可以多线程进行计算,在此不限定计算的具体方式。
S208,根据相似度对待处理图像进行分类。
具体地,服务器根据待处理图像的目标特征与历史图像的图像特征的相似度进行分类,若待处理图像的目标特征与历史图像的图像特征的相似度满足条件,则将待处理图像与历史图像归为同类图像,其中预设阈值可根据实际情况进行调整。可选地,例如只需要根据待处理图像的背景进行分类,若待处理图中的背景与历史图像A中的背景之间的相似度为95%,与历史图像B中的背景之间的相似度为70%,且当前的相似度阈值为90%,其中历史图像A为A类背景图像,历史图像B为B类背景图像,那么服务器认为待处理图像与历史图像为同类图像,将待处理图像分为A类图像。
在上述实施例中,通过特征提取模型可得到待处理图像至少两个分支的分支所对应的特征,并将分支进行拼接得到目标特征,然后根据目标特征计算与历史图像的相似度,并根据相似度对待处理图像进行分类,因此通过比较待处理图像的目标特征与历史图像的图像特征即可对待处理图像进行分类,这样能使图像分类过程中耗时更短。其次,由于目标特征是通过分支特征进行拼接得到的,那么可以通过设置获取分支特征的规则,即可实现根据特定的区域对待处理图像进行分类。
在一个实施例中,通过预先训练的特征提取模型得到至少两个分支,包括:通过预先训练的特征提取模型的整体特征提取网络提取待处理图像的整体特征;通过预先训练的特征提取模型的至少一个部分特征提取分支从整体特征中选择部分特征作为对应分支的分支特征。
具体地,整体特征提取网络是指用于提取图像整体特征的网络,部分特征提取分支是指用于从图像整体特征中提取部分特征的网络,其中部分特征提取分支可以根据实际的应用场景进行设定,以背景分类为例,那么部分特征提取分支可提取图像整体特征的前二分之一、前三分之一以及前三分之一到三分之二处的部分特征作为背景特征即分支特征,具体结合图3所示,图3为一个实施例中用户上传的自拍照片,由于图片上半部分以及图片前三分之一处的背景像素比例是大于图片下方的背景像素比例的,也就是说上方图片上方部分在背景分类中的作用要大于图片下方部分,因此提取图像整体特征的前二分之一、前三分之一以及三分之一到三分之二处的部分特征作为分支特征,这些分支特征在图像背景分类中起关键性作用。
具体地,服务器在接收到待处理图像后将其输入至预先训练的特征提取模型并通过模型的整体特征提取网络得到待处理图像的整体特征,然后通过至少一个部分特征提取分支从整体特征中选择部分特征作为对应分支的分支特征,其中可选地分支特征可根据预设规则对待处理图像的整体特征进行分割得到整体特征的部分特征作为对应的分支特征,例如只对待处理图像的背景进行分类,那么部分特征提取分支可提取待处理图像整体特征的前二分之一或前三分之一的部分特征作为分支特征。
在上述实施例中,通过整体特征提取网络和至少一个部分特征提取分支可得到分支特征,其中分支特征可以根据实际的应用场景进行设定,因此可以通过设置获取分支特征的规则,即可有针对性的获取待处理图像具有代表性的特征。
在一个实施例中,计算待处理图像的目标特征与历史图像的图像特征的相似度,包括:计算待处理图像的目标特征与历史图像的图像特征的余弦相似度作为待处理图像的目标特征与历史图像的图像特征之间的相似度。
具体地,服务器在得到待处理图像的目标特征之后,通过计算目标特征与历史图像的图像特征的余弦相似度,得到待处理图像目标特征与历史图像的图像特征之间的相似度,其中可选地,目标特征与历史图像的图像特征的相似度可以通过计算待处理图像的目标特征与历史图像的图像特征之间每一个特征的余弦相似度,然后将所有特征之间的余弦相似度做一定处理后得到待处理图像的目标特征与历史图像的图像特征之间的相似度,其中对所有特征之间的余弦相似度做一定处理可以是将所有特征之间的余弦相似度累加、平均或者平方差等操作,在此不做具体限定。
在上述实施例中,通过计算待处理图像的目标特征与历史图像的图像特征之间的余弦相似度即可得到待处理图像的目标特征与历史图像的图像特征之间的相似度。
在一个实施例中,结合图4,图4为一个实施例中训练特征提取模型的流程示意图,该特征提取模型包括以下步骤:
S402:获取样本图像,样本图像携带有分类标签。
具体地,样本图像是用来训练特征提取模型的训练集,分类标签是对样本图像进行标注得到的,其中同一类样本图像的分类标签相同,其中以图像背景作为分类标签依据为例,样本图像中背景相同的图像的标签相同。
需要说明的是,样本图像的数量越大,其训练的特征提取模型的准确度越高,其中以背景特征提取模型为例,其数据集可以由两部分组成,其中一部分是从数据库中选取的一定批量(大约50000张以上)的用户上传的照片,并对照片进行打标,在同一背景下的图片认为是一类;另一部分是通过人像分割模型提取人像分割公共数据集中的所有人像后,随机将不同人像粘贴到公共场景数据集中相同场景的图片中生成的,这样就可以通过人工合成的方式获得大量的样本图像对背景特征提取模型进行训练,使得所训练的特征提取模型的准确度更精确。
S404:将样本图像输入至初始模型中得到待处理特征。
具体地,初始模型是对样本图像进行特征提取的机器学习模型,待处理特征是指初始模型对样本图像所提取的特征。其中可选地,初始模型可以是Resnest50、mobilenetv2、shufflenetv2等任意一种可以对图像进行特征提取的机器学习模型。
S406:根据分类标签以及待处理特征计算得到目标损失函数。
具体地,目标损失函数是指用于指导初始模型进行优化的,其中可选地可以通过最小化目标损失函数对初始模型进行优化。在其中一个实施例中,样本图像的分类标签为A,通过初始模型进行特征提取得到待处理特征后,将相同分类标签对应的待处理特征之间的差距作为损失函数,并以此作为优化条件不断迭代优化初始模型,直至损失函数满足要求,例如达到预设阈值,得到训练完成的特征提取模型。其中可选地服务器可以根据损失函数得到模型参数的优化方向及优化梯度对初始函数进行优化。
可选地,目标函数可根据不同分支特征的损失函数得到,例如服务器首先通过初始模型的整体特征提取网络得到样本图像的整体特征以及通过初始模型的部分特征提取分支得到至少两个分支特征,然后分别计算整体特征与分支特征所对应的损失函数,最后将整体特征和不同分支特征的损失函数叠加起来一直指导这个初始模型的训练。
S408:根据目标损失函数对初始模型进行优化以得到特征提取模型。
具体地,服务器根据目标损失函数对初始模型进行优化直至目标损失函数满足一定条件时,模型训练完毕即可得到特征提取模型。
其中,可选地服务器是根据每一次训练得到的目标损失函数对初始模型的参数进行优化,直至目标损失函数小于或等于预设阈值时,模型训练完毕即可得到能够精确提取待处理图像特征的特征提取模型,其中预设阈值可根据实际的应用场景进行调整。
在上述实施例中,通过对大量的样本图像进行训练以及目标损失函数的优化得到了能够对待处理图像进行精确提取特征的特征提取模型。
在一个实施例中,结合图5,图5为一个实施例中计算目标损失函数的流程示意图,具体步骤如下:
S502:对待处理特征进行分割,得到至少两个分支的样本特征;
具体地,服务器可以通过预设规则对待处理特征进行分割,以得到不同分支的样本特征,其中预设规则可以根据实际的应用场景进行设置,以图像背景提取为例,服务器采用二分之一和三分之一的规则对待处理特征进行分割,其中将待处理特征的前二分之一的特征作为第一分支特征、将前三分之一的特征作为第二分支特征以及将三分之一和三分之处所对应的特征作为第三分支特征。
S504:根据样本标签与待处理特征计算得到第一损失函数;
具体地,服务器在得到样本图像的待处理特征后,将相同样本标签对应的待处理特征之间的差距作为第一损失函数,并将该第一损失函数作为优化初始模型的优化条件之一。其中可选地,第一损失函数可以根据tripet loss计算得到的。
S506:分别根据样本标签与每一分支对应的部分样本特征计算得到至少两个第二损失函数;
具体地,服务器根据预设规则对待处理特征进行分割后得到不同分支对应的部分样本特征,并将相同样本标签对应的每一分支对应的部分样本特征的差距作为不同分支的对应的第二损失函数,并将该第二损失函数作为优化初始条件之一。其中可选地,第二损失函数可以根据softmax loss计算得到。
需要说明的是,其中计算每一分支对应的部分样本特征即分支特征的损失函数的方式可以是不同的,例如根据方式A计算得到相同样本标签对应的第一分支特征之间差距的第三损失函数,根据方式B计算等到相同样本标签对应的第二分支特征之间差距的第四损失函数,本领域技术人员可以理解的是为了使损失函数能够更精确的指导初始模型进行优化,对分支函数采用相同或不同的方式计算得到对应的损失函数,在此对不同分支特征所对应的损失函数的计算方式不做限定。
S508:根据第一损失函数与第二损失函数得到目标损失函数。
具体地,服务器根据待处理特征对应的第一损失函数以及分支特征所对应的第二损失函数进行叠加得到目标损失函数,并使用目标损失函数对初始模型进行优化。其中可选地,叠加操作是指可将第一损失函数及第二损失函数进行累加或平均等操作来获取对应的目标损失函数。在其他的实施例中,还可以根据用户的需要为第一损失函数及第二损失函数设置不同的权重等等,在此不做具体的限制。
在上述实施例中,通过计算待处理特征以及不同分支特征对应的损失函数得到目标损失函数,其中不同分支特征是根据实际的应用场景进行设置的,相比于采用整张图像的待处理特征对应的损失函数对初始模型进行优化,这样可以使目标函数对初始模型的优化方向更加精准,进而使通过特征提取模型获得的目标特征更加准确。
在一个实施例中,结合图6所示,图6为一种风险图像识别方法的流程示意图,具体步骤如下:
S602,获取待处理图像。
具体地,待处理图像是指借贷用户上传的个人照片,服务器将此待处理图像进行特征提取以及相似度比较后,对待处理图像与历史图像进行分类,其中历史图像是服务器已获取的为高风险用户的个人照片,并根据分类情况对待处理图像进行判断是否为高风险图像,若为高风险图像则将终止用户的贷款操作,并进行人工排查,否则服务器将待处理图像认为是信任图像,可以让贷款用户进行下一步的借贷操作。这样可以在一定程度上减少集体大量申请贷款情况的发生,同时也能减少人工审核成本的支出。
S604,根据上述任意一个实施例中的图像分类方法将待处理图像进行分类。
具体地,服务器将用户上传的图像输入至特征提取模型,通过特征提取模型得到待处理图像的整体特征以及至少两个分支的分支特征,在其中一个实施例中,在对风险图像识别过程中,可以通过对背景相似度进行分析进而判断待处理图像是否为高风险图像,因此在获取分支特征时,可选地将图像整体特征的上半部分作为第一分支特征,前三分之一处作为第二分支特征,三分之一到三分之二处所对应分支作为第三分支特征,再将上述分支特征进行拼接目标特征,其中可选地可将上述各个分支特征进行拼接,得到一个512维的向量;然后再计算待处理图像的目标特征与历史图像的图像特征之间的余弦相似度,其中历史照片可以是事先准备好的查询用数据集;若待处理图像与历史图像之间的相似度超过预设阈值时,则服务器判定两者为同类照片,其中预设阈值可以根据实际情况进行调整。
S606,统计待处理图像对应分类中的历史图像的数量。
其中可选地,若待处理图像为室内拍摄的图像则将待处理图像与历史图像中在室内拍摄的照片进行相似度比较,并记录与待处理图像相似度超过一定阈值的历史图像的数量。
S608,当待处理图像对应分类中的历史图像的数量超过预设数值时,则判定待处理图像为风险图像。
具体地,预设数值是事先设定的数值,服务器通过判断待处理图像对应分类中的历史图像的数量是否超过预设数值来进一步对待处理图像是否为风险图像进行判断。在一个实施例中,若预设数值为3,则当服务器在历史图像中找到与待处理图像分类为同类图像的数量超过3时,则将待处理图像判定为风险图像,则及时对***进行警醒并进一步进行人工排查,否则服务器将待处理图像判定为低风险图像。
在上述实施例中,通过对待处理图像进行分类并通过判断相同分类的历史图像的数量,进而判断待处理图像是否为风险图像,这样可以及时对***进行警醒并减少人工审核成本的支出;其次,本实施例在风控过程中通过不同分支拼接起来获得目标特征例如在特征提取完成后,分别提取整张图片,图片上半部分,图片前三分之一处、图片三分之一到三分之二处所对应的特征,并构成三个分支,对整张图片所对应的特征分支采用tripetloss进行训练,其余特征分支采用softmax loss进行训练,而传统技术中通过整张图像的特征进行训练并使用整张图像的特征进行风控,因此在本实施例中可以使得风控过程的耗时更短;第三,传统技术中需要通过语义分割模型将待测图像中的人像分割出来并置为相同的像素后再进行相似度分析聚类等过程,而本实施例在实际风控过程中并没有语义分割这一过程,仅仅是在数据准备阶段通过语义分割得到不同的人像,并将人像贴到不同的背景图像中来构成数据集,从而相较于传统技术,本实施例在实际风控过程中的耗时更短,步骤更简单。
在一个实施例中,结合图7所示,一种基于背景相似度分析的金融风控方法的判别过程如下:
服务器首先接收贷款用户上传的个人照片即待测图像,服务器在接收待测图像后将其输入至特征提取模型,通过特征提取模型对待测图像进行特征提取后可得到待测图像所对应的512维特征,其中512维特征是由待测图像中背景部分所对应的分支拼接而成的,其可以是图像前二分之一对应的第一分支特征、前三分之一对应的第二分支特征以及三分之一到三分之二处对应的第三分支特征拼接而成的,因为这些分支所占图像中背景像素的比例最大;然后计算待测图像与历史数据中所有图像所对应特征的余弦相似度,并对数据库中是否包括三张历史图像与待测图像的相似度超过了预设阈值进行判断,若数据库中包括三张历史图像与待测图像的相似度超过了预设阈值时服务器则判定待测图像为高风险图像,上传该图像的用户为高风险用户,这是则需要人工排查;否则则为低风险图像,对应地上传该图像的用户为低风险用户。
在上述实施例中,服务器可通过贷款者上传的个人照片进行特征提取后与历史数据库中所有图像进行相似度比较,并通过相似度比较对高风险用户判别,进而及时对高风险用户进行管控。
应该理解的是,虽然图1-2以及图3-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-2以及图3-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种图像分类装置,包括:接收模块100、特征提取模块200、相似度计算模块300、分析模块400,其中:
接收模块100,用于获取待处理图像。
特征提取模块200,用于通过预先训练的特征提取模型对待处理图像进行处理得到至少两个分支的分支特征,并将分支特征进行拼接得到目标特征。
相似度计算模块300,用于计算待处理图像的目标特征与历史图像的图像特征的相似度。
分析模块400,用于根据相似度对待处理图像进行分类。
在一个实施例中,上述特征提取模块200包括:
整体特征提取单元,用于通过预先训练的特征提取模型的整体特征提取网络提取待处理图像的整体特征。
分支特征提取单元,用于通过预先训练的特征提取模型的至少一个部分特征提取分支从整体特征中选择部分特征,作为对应分支的分支特征。
在一个实施例中,上述相似度计算模块300包括:
余弦相似度计算单元,计算待处理图像的目标特征与历史图像的图像特征的余弦相似度,作为待处理图像的目标特征与历史图像的图像特征之间的相似度。
在一个实施例中,上述图像分类装置还包括:
样本获取模块,用于获取样本图像,样本图像携带有分类标签。
待处理特征获取模块,用于将样本图像输入至初始模型中得到待处理特征。
目标损失函数计算模块,用于根据分类标签以及待处理特征计算得到目标损失函数。
目标损失函数优化模块,用于根据目标损失函数对初始模型进行优化以得到特征提取模型。
在一个实施例中,上述目标损失函数优化模块包括:
分割单元,用于对待处理特征进行分割,得到至少两个分支对应的部分样本特征。
第一损失函数获取单元,用于根据样本标签与待处理特征计算得到第一损失函数。
第二损失函数获取单元,用于分别根据样本标签与每一分支对应的部分样本特征计算得到至少两个第二损失函数。
目标损失函数获取单元,用于根据第一损失函数与第二损失函数得到目标损失函数。
在一个实施例中,如图9所示,提供了一种风险图像识别装置,包括:数据接收模块500、图像分类模块600、图像统计模块700、风险图像判别模块800,其中:
数据接收模块500,用于获取待处理图像。
图像分类模块600,用于根据上述任意一个实施例中所述的图像分类装置将所述待处理图像进行分类。
图像统计模块700,用于统计所述待处理图像对应分类中的所述历史图像的数量。
风险图像判别模块800,用于当所述待处理图像对应分类中的所述历史图像的数量超过预设数值时,则判定所述待处理图像为风险图像。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储待识别***图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像分类方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待处理图像;通过预先训练的特征提取模型对待处理图像进行处理得到至少两个分支的分支特征,并将分支特征进行拼接得到目标特征;计算待处理图像的目标特征与历史图像的图像特征的相似度;根据相似度对待处理图像进行分类。
在一个实施例中,处理器执行计算机程序时所实现的通过预先训练的特征提取模型得到至少两个分支,包括:通过预先训练的特征提取模型的整体特征提取网络提取待处理图像的整体特征;通过预先训练的特征提取模型的至少一个部分特征提取分支从整体特征中选择部分特征,作为对应分支的分支特征。
在一个实施例中,处理器执行计算机程序时所实现的通过计算待处理图像的目标特征与历史图像的图像特征的相似度,包括:计算待处理图像的目标特征与历史图像的图像特征的余弦相似度,作为待处理图像的目标特征与历史图像的图像特征之间的相似度。
在一个实施例中,处理器执行计算机程序时所实现的通过计算待处理图像的目标特征与历史图像的图像特征的相似度,包括:计算待处理图像的目标特征与历史图像的图像特征的余弦相似度,作为待处理图像的目标特征与历史图像的图像特征之间的相似度
在一个实施例中,处理器执行计算机程序时所实现的图像分类设备,包括:获取样本图像,样本图像携带有分类标签;将样本图像输入至初始模型中得到待处理特征;根据分类标签以及待处理特征计算得到目标损失函数;根据目标损失函数对初始模型进行优化以得到特征提取模型。
在一个实施例中,处理器执行计算机程序时所实现的根据分类标签以及待处理特征计算得到目标损失函数,包括:对待处理特征进行分割,得到至少两个分支对应的部分样本特征;根据样本标签与待处理特征计算得到第一损失函数;分别根据样本标签与每一分支对应的部分样本特征计算得到至少两个第二损失函数;根据第一损失函数与第二损失函数得到目标损失函数。
在一个实施例中,处理器执行计算机程序时所实现的风险图像识别设备,包括:获取待处理图像;根据上述任意一项实施例所述的图像分类方法将待处理图像进行分类;统计待处理图像对应分类中的历史图像的数量;当待处理图像对应分类中的历史图像的数量超过预设数值时,则判定待处理图像为风险图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理图像;通过预先训练的特征提取模型对待处理图像进行处理得到至少两个分支的分支特征,并将分支特征进行拼接得到目标特征;计算待处理图像的目标特征与历史图像的图像特征的相似度;根据相似度对待处理图像进行分类。
在一个实施例中,计算机程序被处理器执行时所实现的通过预先训练的特征提取模型得到至少两个分支,包括:通过预先训练的特征提取模型的整体特征提取网络提取待处理图像的整体特征;通过预先训练的特征提取模型的至少一个部分特征提取分支从整体特征中选择部分特征,作为对应分支的分支特征。
在一个实施例中,计算机程序被处理器执行时所实现的计算待处理图像的目标特征与历史图像的图像特征的相似度,包括:计算待处理图像的目标特征与历史图像的图像特征的余弦相似度,作为待处理图像的目标特征与历史图像的图像特征之间的相似度。
在一个实施例中,计算机程序被处理器执行时所实现的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取样本图像,样本图像携带有分类标签;将样本图像输入至初始模型中得到待处理特征;根据分类标签以及待处理特征计算得到目标损失函数;根据目标损失函数对初始模型进行优化以得到特征提取模型。
在一个实施例中,计算机程序被处理器执行时所实现的根据分类标签以及待处理特征计算得到目标损失函数,包括:对待处理特征进行分割,得到至少两个分支对应的部分样本特征;根据样本标签与待处理特征计算得到第一损失函数;分别根据样本标签与每一分支对应的部分样本特征计算得到至少两个第二损失函数;根据第一损失函数与第二损失函数得到目标损失函数。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理图像;根据上述任意一项实施例中的计算机可读存储介质将待处理图像进行分类;统计待处理图像对应分类中的历史图像的数量;当待处理图像对应分类中的历史图像的数量超过预设数值时,则判定待处理图像为风险图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像分类方法,其特征在于,所述图像分类方法包括:
获取待处理图像;
通过预先训练的特征提取模型对所述待处理图像进行处理得到至少两个分支的分支特征,并将所述分支特征进行拼接得到目标特征;
计算所述待处理图像的目标特征与历史图像的图像特征的相似度;
根据所述相似度对所述待处理图像进行分类。
2.根据权利要求1所述的方法,其特征在于,所述通过预先训练的特征提取模型得到至少两个分支,包括:
通过预先训练的特征提取模型的整体特征提取网络提取所述待处理图像的整体特征;
通过预先训练的特征提取模型的至少一个部分特征提取分支从所述整体特征中选择部分特征,作为对应分支的分支特征。
3.根据权利要求1所述的方法,其特征在于,所述计算所述待处理图像的目标特征与历史图像的图像特征的相似度,包括:
计算所述待处理图像的目标特征与所述历史图像的图像特征的余弦相似度,作为所述待处理图像的目标特征与所述历史图像的图像特征之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述图像分类方法还包括:
获取样本图像,所述样本图像携带有分类标签;
将所述样本图像输入至初始模型中得到待处理特征;
根据所述分类标签以及所述待处理特征计算得到目标损失函数;
根据所述目标损失函数对所述初始模型进行优化以得到所述特征提取模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述分类标签以及所述待处理特征计算得到目标损失函数,包括:
对所述待处理特征进行分割,得到至少两个所述分支对应的部分样本特征;
根据所述样本标签与所述待处理特征计算得到第一损失函数;
分别根据所述样本标签与每一所述分支对应的部分样本特征计算得到至少两个第二损失函数;
根据所述第一损失函数与所述第二损失函数得到所述目标损失函数。
6.一种风险图像识别方法,其特征在于,所述风险图像识别方法包括:
获取待处理图像;
根据权利要求1至5任意一项所述的图像分类方法将所述待处理图像进行分类;
统计所述待处理图像对应分类中的所述历史图像的数量;
当所述待处理图像对应分类中的所述历史图像的数量超过预设数值时,则判定所述待处理图像为风险图像。
7.一种图像分类装置,其特征在于,所述装置包括:
接收模块,用于获取待处理图像;
特征提取模块,用于对所述待处理图像进行特征提取;
相似度计算模块,计算所述待处理图像的特征与数据库中图像特征的相似度;
分析模块,用于根据所述相似度对所述待处理图像进行判断。
8.一种风险图像识别装置,其特征在于,所述装置包括:
数据接收模块:用于获取待处理图像;
图像分类模块:用于根据权利要求1至5任意一项所述的图像分类方法将所述待处理图像进行分类;
图像统计模块:用于统计所述待处理图像对应分类中的所述历史图像的数量;
风险图像判定模块:用于当所述待处理图像对应分类中的所述历史图像的数量超过预设数值时,则判定所述待处理图像为风险图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111203991.XA CN114022699A (zh) | 2021-10-15 | 2021-10-15 | 图像分类方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111203991.XA CN114022699A (zh) | 2021-10-15 | 2021-10-15 | 图像分类方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114022699A true CN114022699A (zh) | 2022-02-08 |
Family
ID=80056304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111203991.XA Pending CN114022699A (zh) | 2021-10-15 | 2021-10-15 | 图像分类方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022699A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116049358A (zh) * | 2023-03-31 | 2023-05-02 | 得分数字科技(珠海)有限公司 | ***信息近似度检测方法、存储介质及计算机设备 |
-
2021
- 2021-10-15 CN CN202111203991.XA patent/CN114022699A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116049358A (zh) * | 2023-03-31 | 2023-05-02 | 得分数字科技(珠海)有限公司 | ***信息近似度检测方法、存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110799B (zh) | 细胞分类方法、装置、计算机设备和存储介质 | |
CN111738244B (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
CN109614921B (zh) | 一种基于对抗生成网络的半监督学习的细胞分割方法 | |
CN110913243B (zh) | 一种视频审核的方法、装置和设备 | |
CN111191568B (zh) | 翻拍图像识别方法、装置、设备及介质 | |
EP3136292A1 (en) | Method and device for classifying an object of an image and corresponding computer program product and computer-readable medium | |
JP2011525012A (ja) | デジタルコンテンツ記録のための意味論的イベント検出 | |
CN113033519B (zh) | 活体检测方法、估算网络处理方法、装置和计算机设备 | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 | |
CN115223022B (zh) | 一种图像处理方法、装置、存储介质及设备 | |
CN112651333B (zh) | 静默活体检测方法、装置、终端设备和存储介质 | |
CN111814821A (zh) | 深度学习模型的建立方法、样本处理方法及装置 | |
CN116563868A (zh) | 文本图像的识别方法、装置、计算机设备及存储介质 | |
CN110135428B (zh) | 图像分割处理方法和装置 | |
CN115035347A (zh) | 图片识别方法、装置及电子设备 | |
CN114022699A (zh) | 图像分类方法、装置、计算机设备和存储介质 | |
CN114359993A (zh) | 模型训练方法、人脸识别方法、装置、设备、介质及产品 | |
CN114519863A (zh) | 人体重识别方法、人体重识别装置、计算机设备及介质 | |
CN112966687A (zh) | 图像分割模型训练方法、装置及通信设备 | |
CN113706550A (zh) | 图像场景识别和模型训练方法、装置和计算机设备 | |
CN115984588A (zh) | 图像背景相似度分析方法、装置、电子设备及存储介质 | |
CN113536845B (zh) | 人脸属性识别方法、装置、存储介质和智能设备 | |
US11087121B2 (en) | High accuracy and volume facial recognition on mobile platforms | |
CN114387496A (zh) | 一种目标检测方法和电子设备 | |
CN115797990A (zh) | 图像分类、图像处理方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |