CN116502173A - 一种状态识别方法、装置、存储介质及设备 - Google Patents

一种状态识别方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN116502173A
CN116502173A CN202210050467.1A CN202210050467A CN116502173A CN 116502173 A CN116502173 A CN 116502173A CN 202210050467 A CN202210050467 A CN 202210050467A CN 116502173 A CN116502173 A CN 116502173A
Authority
CN
China
Prior art keywords
information
target
state
feature
state recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210050467.1A
Other languages
English (en)
Inventor
樊鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210050467.1A priority Critical patent/CN116502173A/zh
Publication of CN116502173A publication Critical patent/CN116502173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种状态识别方法、装置、存储介质及设备,可以应用于人工智能和车联网领域。方法包括:根据目标对象关于目标业务的对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息;根据对象特征信息所包含的信息量和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息;对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息;根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。通过本申请,可以提高对象关于业务处理状态的识别准确度。

Description

一种状态识别方法、装置、存储介质及设备
技术领域
本申请涉及一种数据处理技术领域,尤其涉及一种状态识别方法、存储介质及设备。
背景技术
随着人们生活节奏加快,对象每天需要处理的业务也随之增加,用于向对象推荐业务的移动业务平台运用而生,被广泛用于金融、医疗、教育机构等领域,能够有效提升用户的业务处理效率。移动业务平台通过识别对象关于业务的处理状态信息,根据处理状态信息为对象推荐需处理的业务。
目前的移动业务平台,主要是通过人工经验设置识别规则,基于识别规则识别对象关于业务的处理状态信息,但人工经验容易受到主观等因素的影响,且人工经验有限,导致识别得到的处理状态信息的准确度比较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种状态识别方法、装置、存储介质及设备,可以提高对象关于业务处理状态的识别准确度。
本申请实施例一方面提供一种状态识别方法,包括:
获取目标对象关于目标业务的对象特征信息,以及对象特征信息所包含的信息量;
根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息;
根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息;
对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息;
根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
本申请实施例一方面提供一种状态识别装置,包括:
第一获取模块,用于获取目标对象关于目标业务的对象特征信息,以及对象特征信息所包含的信息量;
线性状态识别模块,用于根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息;
交叉状态识别模块,用于根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息;
融合模块,用于对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息;
组合状态识别模块,用于根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
其中,线性状态识别模块包括:
深度特征提取单元,用于调用线性状态识别模型的特征提取层,对对象特征信息进行深度特征提取,得到目标对象关于目标业务的深度特征信息;
线性状态识别单元,用于调用线性状态识别模型的状态识别层,根据深度特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。
其中,深度特征提取单元具体用于:
调用线性状态识别模型的特征提取层,对对象特征信息中各个维度上的对象特征信息进行关联关系识别,得到对象关联特征信息;
对对象关联特征信息进行线性处理,得到线性特征信息;
根据线性特征信息,确定目标对象关于目标业务的深度特征信息。
其中,交叉状态识别模块包括:
第一确定单元,用于调用交叉状态识别模型的影响度确定层,根据对象特征信息所包含的信息量,确定对象特征信息的影响度;
交叉状态识别单元,用于调用交叉状态识别模型的状态识别层,根据影响度和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
其中,交叉状态识别单元具体用于:
调用交叉状态识别模型的状态识别层,根据影响度确定对象特征信息的加权参数;
根据加权参数对对象特征信息进行加权处理,得到加权处理后的对象特征信息;
对加权处理后的对象特征信息和对象特征信息进行特征交叉组合,得到交叉组合特征信息;
对交叉组合特征信息进行状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
其中,组合状态识别模块包括:
获取单元,用于调用组合状态识别模型的权重预测层,获取目标融合特征信息中任意两个维度的特征信息之间的组合权重;
特征组合单元,用于调用组合状态识别模型的特征组合层,基于组合权重,对目标融合特征信息中任意两个维度的特征信息进行特征组合,得到特征组合后的目标融合特征信息;
组合状态识别单元,用于调用组合状态识别模型的状态识别层,对特征组合后的目标融合特征信息进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
其中,状态识别装置还包括:
第二获取模块,用于获取样本对象关于目标业务的样本对象特征信息以及样本对象关于目标业务的目标处理状态信息标签;
第一调用模块,用于调用线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态识别,得到用于反映样本对象关于目标业务的第一识别处理状态信息;
第二调用模块,用于调用交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二识别处理状态信息;
第三调用模块,用于调用初始组合状态识别模型,对样本对象特征信息、第一识别处理状态信息以及第二识别处理状态信息进行融合,得到目标样本融合特征信息,根据目标样本融合特征信息,对样本对象进行组合状态预测,得到用于反映样本对象关于目标业务的预测目标处理状态信息;
第一调整模块,用于根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,得到组合状态识别模型;组合状态识别模型用于根据目标对象的对象特征信息确定用于反映目标对象关于目标业务的目标处理状态信息。
其中,第一调整模块,用于根据目标处理状态信息标签和预测目标处理状态信息,确定初始组合状态识别模型的组合状态预测误差;若所述组合状态预测误差未处于收敛状态,根据所述组合状态预测误差对所述初始组合状态识别模型进行调整;将调整后的初始组合状态识别模型确定为组合状态识别模型。
其中,状态识别装置还包括:
第四调用模块,用于调用初始线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态预测,得到用于反映样本对象关于目标业务的第一预测处理状态信息;
第二调整模块,用于根据目标处理状态信息标签和第一预测处理状态信息,对初始线性状态识别模型进行调整,得到线性状态识别模型;线性状态识别模型用于对对象进行线性状态预测,得到对象关于业务的第一处理状态信息。
其中,第二调整模块包括:根据所述目标处理状态信息标签和所述第一预测处理状态信息,确定所述初始线性状态识别模型的线性状态预测误差;若所述线性状态预测误差未处于收敛状态,根据所述线性状态预测误差对所述初始线性状态识别模型进行调整;将调整后的初始线性状态识别模型确定为线性状态识别模型。
其中,状态识别装置还包括:
第五调用模块,用于调用初始交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态预测,得到用于反映样本对象关于目标业务的第二预测处理状态信息;
第三调整模块,用于根据目标处理状态信息标签和第二预测处理状态信息,确定第二损失函数,根据第二损失函数对初始交叉状态识别模型进行调整,得到交叉状态识别模型;交叉状态识别模型用于对对象进行交叉状态预测,得到对象关于业务的第二处理状态信息。
其中,第三调整模块,用于根据所述目标处理状态信息标签和所述第二预测处理状态信息,确定所述初始交叉状态识别模型的交叉状态预测误差;若所述交叉状态预测误差未处于收敛状态,根据所述交叉状态预测误差对所述初始交叉状态识别模型进行调整;用于将调整后的初始交叉状态识别模型确定为交叉状态识别模型。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
处理器与存储器相连,其中,存储器用于存储计算机程序,计算机程序被处理器执行时,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例中,通过根据目标对象的对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。同时根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。进一步地,将目标对象的对象特征信息与采用不同状态识别方式得到的状态信息(即第一处理状态信息和第二处理状态信息)进行融合,得到目标融合特征信息,根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。也就是说,根据目标融合特征信息对目标对象关于目标业务的处理状态进行优化识别,得到用于反映目标对象关于目标业务的目标处理状态信息,能够提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种状态识别***的架构示意图;
图2是本申请实施例提供的一种状态识别的应用场景示意图;
图3是本申请实施例提供的一种状态识别方法的流程示意图;
图4是本申请实施例提供的一种线性状态识别模型的网络结构的示意图;
图5是本申请实施例提供的一种交叉状态识别模型的结构的示意图;
图6是本申请实施例提供的一种特征交叉组合的示意图;
图7是本申请实施例提供的一种组合状态识别模型的结构的示意图;
图8是本申请实施例提供的一种获取目标处理状态信息的流程示意图;
图9是本申请实施例提供的一种状态识别方法的流程示意图;
图10是本申请实施例提供的一种模型训练的示意图;
图11是本申请实施例提供的一种组合状态识别模型训练的示意图;
图12是本申请实施例提供的一种模型预测效果的示意图;
图13是本申请实施例提供的一种模型业务效果的示意图;
图14是本申请实施例提供的一种状态识别装置的结构示意图;
图15是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请中,可以通过线性状态识别模型对目标对象的对象特征信息进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息,通过交叉状态识别模型对目标对象的对象特征信息进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。然后通过组合状态识别模型,根据第一处理状态信息、第二处理状态信息以及对象特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。通过本申请,可以通过线性状态识别模型、交叉状态识别模型以及组合状态识别模型,模拟或实现人类的学习行为对目标对象进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息,进而可以提高处理状态信息识别的准确性。
见图1,图1是本申请实施例提供的一种状态识别***的结构示意图。如图1所示,该状态识别***可以包括服务器10和用户终端集群。该用户终端集群可以包括一个或者多个用户终端,这里将不对用户终端的数量进行限制。如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端100c、…、用户终端100n。如图1所示,用户终端100a、用户终端100b、用户终端100c、…、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。
其中,该用户终端集群中的每个用户终端均可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、可穿戴设备、智能家居、头戴设备、车载终端等具有状态识别的智能终端。应当理解,如图1所示的用户终端集群中的每个用户终端均可以安装有目标应用(即应用客户端),当该应用客户端运行于各用户终端中时,可以分别与上述图1所示的服务器10之间进行数据交互。
其中,如图1所示,该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
为便于理解,本申请实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端,该目标用户终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视等携带状态识别功能的智能终端。例如,为便于理解,本申请实施例可以将图1所示的用户终端100a作为目标用户终端,用户终端100a可以获取目标对象关于目标业务的对象特征信息,该目标对象可以是指业务用户,该对象特征信息可以包括业务用户本身具有的对象属性信息和业务用户处理目标业务时的业务操作特征信息等。用户终端100a可以将目标对象关于目标业务的对象特征信息发送给服务器10,该服务器10中包括线性状态识别模型、交叉状态识别模型以及组合状态识别模型。服务器10可以调用线性状态识别模型,基于目标对象的对象特征信息,对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。例如,该目标业务可以是指公积金缴纳业务,该第一处理状态信息可以为目标对象处于正常缴纳公积金状态的概率,或者,目标对象处于异常缴纳公积金状态的概率。
进一步地,服务器10可以调用交叉状态识别模型,获取目标对象的对象特征信息所包含的信息量,基于目标对象的对象特征信息和该对象特征信息所包含的信息量,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。例如,目标业务也可以是指公积金缴纳业务,该第二处理状态信息可以为目标对象处于正常缴纳公积金状态的概率,或者,目标对象处于异常缴纳公积金状态的概率。
进一步地,服务器10可以调用组合状态识别模型,对第一处理状态信息、第二处理状态信息以及对象特征信息进行融合,得到目标融合特征信息,根据该目标融合特征信息对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。具体的,由于线性状态识别模型和交叉状态识别模型,对对象特征信息的处理方式不一样,所得到的处理状态信息也是不一样的。因此,通过组合状态识别模型,将线性状态识别模型输出的第一处理状态信息,以及交叉状态识别模型输出的第二处理状态信息作为目标对象的新增特征信息。将目标对象的新增特征信息和对象特征信息进行组合,并作为组合状态识别模型的输入,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。这样,相对于人工识别目标对象关于目标业务的目标处理状态信息,本方案可以通过组合状态识别模型,对线性状态识别模型和交叉状态识别模型的输出进行有监督的权重调优,可以提高目标对象关于目标业务的目标处理状态识别的准确性和效率。本申请实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
为便于理解,进一步地,请参见图2,图2是本申请实施例提供的一种状态识别的应用场景示意图。其中,如图2所示的服务器20b可以为上述的服务器10,如图2所示的目标用户终端20a可以为上述图1中所展示的用户终端集群中的任意一个用户终端,例如,目标用户终端20a可以为上述用户终端100b。如图2所示,目标用户终端20a获取到目标对象关于公积金缴纳业务的对象特征信息,该目标对象可以是指业务用户,该对象特征信息可以是指业务用户的用户基础属性信息(如年龄、职位、性别等)、用户设备属性信息(如业务用户所拥有的设备的类型、上网时间、用户连接Wi-Fi时长等)以及业务用户处理业务时的业务操作特征信息(如针对特定广告的点击率和转化率等等)。目标用户终端20a可以将目标对象的对象特征信息20c发送给服务器20b,通过服务器20b中的线性状态识别模型20d,对目标对象的对象特征信息20c进行线性状态识别,输出用于目标对象关于目标业务的第一处理状态信息。通过服务器20b中的交叉状态识别模型20e,对目标对象的对象特征信息20c进行交叉状态识别,输出用于反映目标对象关于目标业务的第二处理状态信息。进一步地,可以通过组合状态识别模型20f,对目标对象的对象特征信息20c、线性状态识别模型20d输出的第一处理状态信息以及交叉状态识别模型20e输出的第二处理状态信息进行特征融合,得到目标融合特征信息,并对该目标融合特征信息进行组合状态识别,输出用于反映目标对象关于目标业务的目标处理状态信息20g。
进一步地,服务器20b可以将用于反映目标对象关于目标业务的目标处理状态信息20g返回给目标用户终端20a。目标用户终端20a可以根据该用于反映目标对象关于目标业务的目标处理状态信息20g,对目标对象进行业务推荐,在业务推荐界面20h中输入推荐信息20i。例如,目标业务为婚恋推荐业务时,若目标处理状态信息20g指示目标对象未婚恋,则可以在推荐业务界面20h中,输入社交应用的推荐信息20i。通过本申请,可以准确识别出目标对象关于目标业务的目标处理状态信息,该目标处理状态信息可以为目标对象关联的业务处理提供参考依据。
请参见图3,图3是本申请实施例提供的一种状态识别方法的流程示意图。该状态识别方法可由计算机设备执行,该计算机设备可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),本申请对此不做限定。如图3所示,该状态识别方法可以包括但不限于以下步骤:
S101,获取目标对象关于目标业务的对象特征信息,以及对象特征信息所包含的信息量。
具体的,计算机设备可以根据目标对象关于目标业务的对象特征信息,对目标对象进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息,该目标处理状态信息可以为与目标业务相关联的业务处理提供参考依据。具体的,计算机设备可以获取目标对象关于目标业务的对象特征信息,该目标对象可以是指业务用户、车辆、物品、动物等,当目标对象为业务用户时,获取目标对象的对象特征信息是通过用户的授权情况下进行的。具体的,以下实施例以目标对象为业务用户为例进行阐述,目标对象关于目标业务的对象特征信息可以根据目标业务的业务领域和业务类型确定。
例如,若目标业务为公积金缴纳业务时,目标对象关于公积金缴纳业务的对象特征信息可以包括对象属性信息和目标对象处理相关业务(包括公积金缴纳业务和其他业务)时的业务处理特征信息。其中,该对象属性信息可以包括对象基础信息、设备基础属性信息以及网络连接属性信息等,业务处理特征信息可以包括目标对象针对特定业务(如特征广告)的点击率、转化率等。其中,对象基础信息可以包括用户本身具有的属性信息,如对象性别、对象年龄、对象籍贯、对象工作所在地、对象居住城市等。其中,设备基础属性信息可以包括设备分辨率、设备CPU核数、设备型号、设备价位等。其中,网路连接属性可以包括上网时长、连接Wi-Fi的个数、每天连接Wi-Fi的最早时间等。进一步地,计算机设备可以获取目标对象的对象特征信息中各个维度的对象特征信息所包含的信息量,该信息量可以用于反映各个对象特征信息的重要性。若某个维度上的对象特征信息所包含的信息量越多,则说明该某个维度上的对象特征信息的重要性较高;若某个维度上的对象特征信息所包含的信息量越少,则说明该某个维度上的对象特征信息的重要性较低。
可选的,计算机设备可以实时或者周期性地获取目标对象的线上特征信息,该线上特征信息可以是指目标对象实时产生的特征信息,即目标对象当前所产生的当前特征信息,计算机设备也可以获取预先存储在线下的线下特征信息,该线下特征信息可以是指目标对象历史所产生的特征信息,即该线下特征信息可以是指对目标对象历史所产生的特征信息进行聚合得到的历史特征信息。计算机设备可以分别对目标对象的线上特征信息和线下特征信息进行特征预处理,得到预处理后的线上特征信息和预处理后的线下特征信息,对预处理后的线上特征信息和预处理后的线下特征信息进行拼接,得到目标对象的对象特征信息。其中,计算机设备对预处理后的线上特征信息和预处理后的线下特征信息进行拼接的方式可以是直接连接,即将预处理后的线下特征信息拼接在预处理后的线上特征信息后面,或者,将预处理后的线上特征信息拼接在预处理后的线下特征信息后面,得到一个长向量特征信息。例如,预处理后的线上特征信息为(1,0,2,1.1),预处理后的线下特征信息为(41,…,3,1,14),直接将预处理后的线下特征信息(41,…,3,1,14)拼接在预处理后的线上特征信息(1,0,2,1.1),得到一个长向量(1,0,2,1.1,41,…,3,1,14)。
具体的,目标对象的线上特征信息可以包括通用特征信息和目标对象关于多个业务的业务特征信息等,计算机设备可通过例行定时特征获取组件,从线上实时日志数据中获取目标对象的通用特征信息。其中,例行定时特征获取组件是基于固定计算逻辑和计算定时器,定时从线上实时日志数据中获取目标对象的通用特征信息,并对该目标对象的通用特征信息进行特征计算(即特征编码)。计算机设备也可以通过业务侧设置的业务特征获取组件,从线上实时日志数据中获取目标对象关于多个业务的业务操作特征信息。其中,业务特征获取组件也是指基于固定计算逻辑和计算定时器,定时从线上实时日志数据中获取目标对象关于多个业务的业务操作特征信息,并对该目标对象的业务操作特征信息进行特征计算(即特征转换)。具体的,目标对象的通用特征信息可以包括对象基础信息(如性别、年龄、职位、所属地等)、设备基础属性信息(如设备类型、设备品牌等)以及网络连接属性信息(如当天连接Wi-Fi的个数和位置等)等。具体的,目标对象关于多个业务的业务操作特征信息可以包括目标对象每天使用Wi-Fi的总时长等其他使用信息,也还可以包括目标对象针对多个业务的点击行为和转化率情况等。其中,计算机设备获取目标对象的线上特征信息的特征获取粒度可以为半个小时(即间隔半个小时获取一次目标对象的线上特征信息)、一个小时(即间隔一个小时获取一次目标对象的线上特征信息)等。进一步地,计算机设备可以对目标对象的通用特征信息和目标对象关于多个业务的业务操作特征信息进行拼接,作为目标对象的线上特征信息,拼接后的线上特征信息可以是一个高纬度的向量。
可选的,计算机设备可以对目标对象的线上特征信息进行异常特征信息过滤处理和特征编码,得到预处理后的线上特征信息。具体的,计算机设备可以基于异常特征过滤规则,对目标对象的线上特征信息进行异常特征信息过滤,得到异常特征过滤后的线上特征信息。如根据目标对象使用产品时的流量使用情况、以及流量产生的时间分布等,对异常特征信息进行过滤,如将每个上网时间超过24小时的特征信息过滤等。具体的,计算机设备对异常特征过滤后的线上特征信息进行特征编码时,可以获取异常特征过滤后的线上特征信息中各个维度的线上特征信息的信息类型,根据该各个维度上的线上特征信息的信息类型,确定对相应的线上特征信息进行特征编码的目标编码方式,得到特征编码后的线上特征信息。
其中,计算机设备可以对目标对象的对象特征信息进行特征清洗、过滤、验证。具体的,计算机设备对目标对象的对象特征信息进行特征清洗、过滤、验证的具体方式可以包括:由于对象特征信息的获取是通过多个策略逻辑通路产生的,因此对象特征信息的数据质量难以保证,故需要进行特征数据质量检测。具体做法如下:第一,计算机设备可以基于业务经验,制定特征质量标准,对计算好的特征进行清洗、过滤、验证,质量标准包括但不限于:每天使用应用程序的时长低于16小时等。第二,计算机设备可以按照预设策略,验证已有特征,对无效、异常特征进行剔除,比如目标对象使用某个应用程序的时长不能大于24小时等。第三,计算机设备可以拼接符合业务要求的特征,对不符合要求的特征进行缺失标记处理。
具体的,计算机设备可以对线上特征信息进行特征编码的编码方式可以包括One-Hot编码(即独热编码)、Count编码(即计数编码)、Category编码(即分类编码)、NaN编码(即非数编码)、Consolidation编码(即信息归纳编码)、Trajectory编码(即轨迹编码)、Traffic编码(即列表编码)等编码方式。其中,One-Hot编码,又称为一位有效编码,主要是采用位状态寄存器来对一个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效)。例如,对于对象性别等特征,进行One-Hot编码后的结果为:男:(1,0),女:(0,1)。Count编码主要针对二分类问题,就是把每一个类别用对应的标签为“1”的样本的数量来代替,即计算某个类别出现的数量。例如,对于对象的Wi-Fi POI特征(即兴趣点特征),可以用Count编码来标识对象和POI(即兴趣点)的兴趣程度,比如对象当周去了“美食-中国菜-粤菜”这个POI(即兴趣点)共3次。Category编码是指一种将高维稀疏分类变量转换为低维稠密分类变量的编码方式,根据数据分析发现,有许多特征都存在较强的稀疏性,为了提高模型特征提取的稳定性,引入神经网络将高维稀疏分类变量转换为低维稠密分类变量的Category编码。NaN编码(即非数编码)是指一种将缺失数据用“非数”标记进行标识的方法,对于特征的缺失值处理,通过“剔除”、“平均值填充”和“缺失标记”等方法,实验结果显示将缺失值转为非数表达的方式,可以特征提取的准确性。Consolidation编码是指用一个粗粒度的标签对特征信息进行抽象,即用一个粗粒度的标签对特征信息进行归纳。例如,某些分类变量下的多个取值,可以将其归纳成同一个信息,比如安卓手机的***版本特征的多个取值里包括“4.2”、“4.4”和“5.0”三个,基于经验可以将这三个值归纳为“低版本安卓***”。实验证明,通过Consolidation编码处理方式,即将“低版本安卓***”取代传统的“安卓***”,可以提高特征提取的准确性。Trajectory编码是指一种用于对目标对象的对象行为进行轨迹连接,得到目标对象的行为轨迹特征信息。例如,基于Trajectory编码,对目标对象的Wi-Fi连接轨迹数据进行编码,捕捉用户Wi-Fi行为连接轨迹信息。Traffic编码可以用于对目标对象的使用行为序列进行列表特征编码,以获得低维稠密的行为特征。例如,基于Traffic编码方式,对目标对象关于不同种类的App的流量使用行为序列进行编码提取,获得低维稠密的行为特征。
可选的,计算机设备也可以对目标对象的线下特征信息进行异常特征信息过滤处理和特征编码,得到预处理后的线下特征信息。具体方式可以参考上述对目标对象的线上特征信息进行预处理的方式,本申请实施例在此不再赘述。
S102,根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。
具体的,计算机设备可以根据目标对象的对象特征信息,对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息,该第一处理状态可以用于反映目标对象针对目标业务的业务处理状态。例如,目标业务为公积金缴纳业务时,该第一处理状态信息可以是指目标对象属于正常缴纳公积金状态的概率,或者,该第一处理状态信息可以是指目标对象属于非正常缴纳公积金状态的概率。
可选的,根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息的具体方式可以包括:调用线性状态识别模型的特征提取层,对对象特征信息进行深度特征提取,得到目标对象关于目标业务的深度特征信息。调用线性状态识别模型的状态识别层,根据深度特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。
具体的,计算机设备可以调用线性状态识别模型,该线性状态识别模型可以用于根据目标对象的对象特征信息,对目标对象进行线性状态识别,得到目标对象关于目标业务的处理状态信息。计算机设备可以通过线性状态识别模型中的特征提取层,对目标对象的对象特征信息进行深度特征提取,得到目标对象关于目标业务的深度特征信息,该深度特征提取可以是指基于深度学习的特征提取,该深度特征信息可以是指对象特征信息的内在规律和表示层次。计算机设备可以将目标对象关于目标业务的深度特征信息输入线性状态识别模型中的状态识别层,对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。可以理解的是,该线性状态识别模型中的状态识别层可以对目标对象关于目标业务的深度特征信息进行分类,得到用于反映目标对象关于目标业务的第一处理状态信息。
可选的,计算机设备对对象特征信息进行深度特征提取,得到目标对象关于目标业务的深度特征信息的具体方式可以包括:调用线性状态识别模型的特征提取层,对对象特征信息中各个维度的对象特征信息进行关联关系识别,得到对象关联特征信息。对对象关联特征信息进行线性处理,得到线性特征信息,根据线性特征信息,确定目标对象关于目标业务的深度特征信息。
具体的,线性状态识别模型中的特征提取层可以包括关联特征提取子层和线性特征提取子层,计算机设备可以调用特征提取层中的关联特征提取子层,对目标对象的对象特征信息中各个维度上的对象特征信息进行关联关系识别,得到对象关联特征信息。可以理解的是,在关联特征提取子层中,可以对任意两个维度上的对象特征信息进行特征组合,提取出该任意两个维度上的对象特征信息之间的对象关联特征信息,这样,可以提取出更多的特征信息,以便于准确地识别出目标对象关于目标业务的第一处理状态信息。进一步地,计算机设备可以通过特征提取层中的线性特征提取子层,对目标对象的对象关联特征信息进行线性处理,得到线性特征信息,并根据该线性特征信息,确定目标对象关于目标业务的深度特征信息。可以理解的是,在线性特征提取子层中,对目标对象的对象关联特征信息进行线性组合或者非线性组合,以提取出目标对象的对象关联特征信息之间的线性关系,进而获得更多的特征信息,以便于准确地识别出目标对象关于目标业务的第一处理状态信息。
可选的,线性状态识别模型可以是指FNN模型(Factorisation Machinesupported Neural Network,即基于因子分解机的神经网络),该FNN模型采用FM网络结构(即因子分解机模型,Factorization Machines Model)预训练得到的隐含层及其权重作为神经网络的第一层的初始值,之后再不断堆叠全连接层,最终输出预测的点击率,可以将FNN模型理解成一种特殊的embedding(即嵌入编码层)+MLP(即多层感知器)。FNN模型要求第一层嵌入后的各特征域特征维度一致,并且嵌入权重的初始化是FM预训练好的。其中,线性状态识别模型可以通过FM网络结构得到对象特征信息的嵌入特征向量,再讲该嵌入特征向量输入DNN网络结构(即深度神经网络结构),相当于引入了FM中得到的先验的专家经验,可以加快特征信息的提取,同时也可以降低特征提取开销,提高特征提取的效率。
其中,将目标对象的对象特征信息输入到线性状态识别模型时,该目标对象的对象特征信息是大规模离散稀疏的向量,线性状态识别模型可以将该大规模离散稀疏的对象特征信息划分为N个维度上的对象特征信息,每个维度上的对象特征信息中,只有一个值为1,其余均为0(即对对象特征信息进行One-Hot特征编码并进行划分)。其中,线性状态识别模型的batch size(即一次训练时样本的数量)可以为1024,嵌入维度可以为16,可以使用Adam优化器(Adaptive Gradient,即自适应梯度)对线性状态识别模型中的模型参数进行调整。Adam优化器能够对每个不同的参数调整不同的学习率,对频繁变化的参数以更小的步长进行更新,而稀疏的参数以更大的步长进行更新。同时,也可以将线性状态识别模型中的Dropout参数设置为0.5,Dropout参数能够有效缓解线性状态识别模型的过拟合问题,从而使得训练得到更深更宽的网络。
具体的,线性状态识别模型中的关联特征提取子层可以是指FM网络结构,该FM网络结构可以用于对两两特征进行组合,进而提取出两两特征之间的关联关系。线性状态识别模型中的线性特征提取子层可以是指DNN网络结构,该DNN网络结构可以提取出输入特征与输出特征之间的线性关系,即对输入特征进行多个线性组合或者非线性组合,提取出更高阶的特征信息。
如图4所示,图4是本申请实施例提供的一种线性状态识别模型的网络结构的示意图,如图4所示,计算机设备可以将对象特征信息中每个维度上的对象特征信息输入线性状态识别模型中的关联特征提取子层40a中。通过线性状态识别模型中的关联特征提取子层40a,可以对目标对象的对象特征信息中各个维度上的对象特征信息进行关联关系识别,得到对象关联特征信息。计算机设备可以将对象关联特征信息输入线性状态识别模型中的第一线性特征提取子层40b,对对象关联特征信息进行线性处理,得到第一线性特征信息。
其中,第一线性特征提取子层40b的计算公式可以如下公式(1)所示:
L1=tanh(w1z)+b1 (1)
其中,公式(1)中的L1是指第一线性特征提取子层,W1是指第一线性特征提取子层中的权重矩阵,z是指输入第一线性特征提取子层的对象关联特征信息,b1是指第一线性特征提取子层中的偏置常数。
进一步地,如图4所示,计算机设备可以将第一线性特征提取子层输出的第一线性特征信息,输入线性状态识别模型中的第二线性特征提取子层40c中,对第一线性特征提取子层输出的第一线性特征信息进行线性处理,得到第二线性特征信息。
其中,其中,第二线性特征提取子层40b的计算公式可以如下公式(2)所示:
L2=tanh(w2L1)+b2 (2)
其中,公式(1)中的L2是指第二线性特征提取子层,W2是指第二线性特征提取子层中的权重矩阵,L1是指第一线性特征提取子层输出的第一线性特征信息,b2是指第二线性特征提取子层中的偏置常数。
进一步地,计算机设备可以通过多个感知层,对关联特征提取子层40a输出的对象关联特征信息进行线性处理,得到深度特征信息。通过线性状态识别模型中的状态识别层40d,对深度特征信息进行分类,得到用于反映目标对象关于目标业务的第一处理状态信息。其中,线性状态识别模型的具体内容可以参见步骤S102的内容,本申请实施例在此不再赘述。
S103,根据对象特征信息所包含的信息量和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
具体的,计算机设备可以获取对象特征信息所包含的信息量,根据对象特征信息所包含的信息量和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。可以理解的是,计算机设备通过根据对象特征信息所包含的信息量,对目标对象进行交叉状态识别,相对于步骤S102中对目标对象进行线性状态识别而言,是从不同的角度对目标对象的对象特征信息进行提取,进而识别出目标对象在不同识别角度下的关于目标业务的处理状态信息。例如,目标业务为公积金缴纳业务时,计算机设备可以根据目标对象的对象特征信息对目标对象进行交叉状态识别,得到目标对象在交叉状态识别角度下的第二处理状态信息,即在交叉状态识别方式下,确定目标对象处于正常缴纳公积金状态的概率,或者,目标对象处于非正常缴纳公积金状态的概率。
可选的,计算机设备得到用于反映目标对象关于目标业务的第二处理状态信息的具体方式可以包括:调用交叉状态识别模型的影响度确定层,根据对象特征信息所包含的信息量,确定对象特征信息的影响度。调用交叉状态识别模型的状态识别层,根据影响度和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
具体的,计算机设备可以调用交叉状态识别模型,该交叉状态识别模型可以根据目标对象的对象特征信息,对目标对象进行交叉状态识别,得到目标对象关于目标业务的第二处理状态信息。通过交叉状态识别模型的影响度确定层,获取目标对象的对象特征信息所包含的信息量,并根据该对象特征信息所包含的信息量,确定对象特征信息的影响度。其中,若对象特征信息所包含的信息量越多,则对应的影响度越高;若对象特征信息所包含的信息量越少,则对应的影响度越低。该影响度确定层用于学习不同特征的重要程度(即影响度),该重要程度可以用于对特征进行特征加权,进而实现对蕴含信息量较多的特征进行增强,对蕴含信息量不多的特征进行削弱。其中,计算机设备可以对目标对象的对象特征信息在每个维度上的对象特征信息进行汇总统计量的操作,即对对象特征信息在每个维度上的对象特征信息进行压缩表示,得到每个维度上的对象特征信息的信息量。具体的,计算机设备可以根据每个维度上的对象特征信息的信息量的大小确定每个维度上的对象特征信息的影响度(即重要程度),进一步地,计算机设备可以调用交叉状态识别模型中的状态识别层,根据影响度,对对象特征信息进行加权处理,得到加权处理后的对象特征信息。根据该加权处理后的对象特征信息进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
可选的,计算机设备根据影响度和对象特征信息对目标对象进行交叉状态识别,用于反映目标对象关于目标业务的第二处理状态信息的具体方式可以包括:调用交叉状态识别模型的状态识别层,根据影响度确定对象特征信息的加权参数。根据加权参数对对象特征信息进行加权处理,得到加权处理后的对象特征信息。对加权处理后的对象特征信息和对象特征信息进行特征交叉组合,得到交叉组合特征信息。对交叉组合特征信息进行状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
具体的,计算机设备可以调用交叉状态识别模型的状态识别层,该状态识别层可以包括加权参数确定子层、加权处理子层、交叉组合子层以及状态识别子层。计算机设备可以通过权重参数确定子层,根据对象特征信息的影响度,确定对象特征信息的加权参数。具体的,若对象特征信息的影响度越大,则对象特征信息的加权参数越大;若对象特征信息的影响度越小,则对象特征信息的加权参数越小。其中,计算机设备可以获取对象特征信息中每个维度上的对象特征信息的加权参数后,可以通过加权处理子层,根据该每个维度上的加权参数,对相应的对象特征信息进行加权处理,得到加权处理后的对象特征信息。这样,可以对蕴含较多信息量的对象特征信息进行增强,对蕴含较少信息量的对象特征信息进行削弱,可以提高特征提取的准确性。
进一步地,计算机设备可以通过交叉组合子层,采用交叉组合方式对加权处理后的对象特征信息和对象特征信息(即没有加权处理的对象特征信息)进行交叉组合,得到交叉组合特征信息。具体的,交叉组合方式可以包括内积方式、哈达玛积方式以及内积和哈达玛积的结合方式等方式,其中,内积方式又称数量积(dot product,scalar product),是指接受在实数R上的两个向量并返回一个实数值标量的二元运算。哈达玛积方式是指哈达玛积(Hadamard product)是矩阵的一类运算,若矩阵A和矩阵B是两个同阶矩阵,则矩阵A和矩阵B的哈达玛积等于矩阵A和矩阵B之间的点乘,即哈达玛积是两个同阶矩阵的点乘。内积和哈达玛积的结合方式是指结合内积和哈达玛积并引入一个额外的参数矩阵W的交叉组合方式。进一步地,计算机设备可以通过状态识别子层,对交叉组合特征信息进行状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。这样,计算机设备可以通过加权处理后的对象特征信息与对象特征信息进行特征交叉组合,得到交叉组合特征信息,根据该交叉组合特征信息识别出用于反映目标对象关于目标业务的第二处理状态信息。相对于线性状态识别,交叉状态识别是从不同的角度对目标对象的对象特征信息进行状态识别,即对目标对象的对象特征信息进行不同角度的状态识别,得到目标对象在不同识别角度下的识别结果。
可选的,交叉状态识别模型可以是指FiBiNet模型(即Combining FeatureImportance and Bilinear feature Interaction for Click-Through RatePrediction),该FiBiNet模型的本质是通过使用Squeeze-Excitation Network(即压缩+权重提取网络)结构动态学习特征的重要性以及使用一个双线性函数来更好的建模交叉特征。该FiBiNet模型中的SENET Layer(即影响度确定层)的主要作用是学习不同特征的重要程度,根据重要程度对相应的特征加权。这样,可以实现对蕴含信息量不多的特征进行削弱,对蕴含信息量较多的特征进行增强。其中,可以将目标对象特征信息输入FiBiNet模型中的SENET层(即影响度确定层),输出加权处理后的对象特征信息。具体的,FiBiNet模型中的SENE层(即影响度确定层)具体实现过程可以包括:对目标对象的对象特征信息中每个维度上的对象特征信息进行向量编码,得到每个维度上的对象特征信息的对象特征向量,对每个维度上的对象特征信息的对象特征向量进行组合,得到目标对象的对象特征信息的对象特征组E作为输入,产生对象特征组E对应的权重向量组A=[a1,...,ai,...af],一个维度上的对象特征信息的对象特征向量对应一个权重向量。将多个维度上的对象特征信息的对象特征组E乘上权重向量组A得到一组新的编码向量组V=[v1,...,vi,...vf],即加权处理后的对象特征信息。
具体的,FiBiNet模型中的SENET层包括Squeeze结构层(即信息量提取子层,又称压缩层)、Excitation结构层(即加权参数确定子层)以及Re-Weight结构层(即加权处理子层)。其中,Squeeze结构层主要是对对象特征信息中每个维度上的对象特征信息的对象特征向量进行汇总统计量的操作,使用了池化操作来对多个维度上的对象特征信息的对象特征组E=[e1,...,ei,...ef]进行压缩表示得到统计向量Z=[z1,...,zi,...zf],其中zi表示第i个维度上的对象特征信息的全局信息(即信息量)。其中,Excitation结构层用于基于统计向量Z=[z1,...,zi,...zf]来学习每个维度上的对象特征信息的重要性权重(即权重参数),可以使用两层的神经网络来学习每个维度上的对象特征信息的重要性权重(即权重参数),第一层为维度缩减层,第二层为维度提升层。Re-Weight结构层可以利用Excitation结构层操作得到的权重参数来对对象特征信息的对象特征组E=[e1,...,ei,...ef]进行加权处理,得到加权处理后的对象特征信息。这样,可以实现对蕴含信息量不多的对象特征信息进行削弱,对蕴含信息量较多的对象特征信息进行增强。
如图5所示,图5是本申请实施例提供的一种交叉状态识别模型的结构的示意图,如图5所示,计算机设备可以将目标对象的对象特征信息50a输入交叉状态识别模型中的嵌入向量编码层50b,对目标对象的对象特征信息进行嵌入向量编码,得到对象特征信息的对象嵌入向量。计算机设备可以将对象嵌入特征输入交叉状态识别模型的SENET层(即影响度确定层)50c中,获取对象特征信息的对象嵌入向量的影响度,并根据该影响度,对对象特征信息的对象嵌入向量进行加权处理,得到加权处理后的对象特征信息。进一步地,计算机设备可以将加权处理后的对象特征信息输入嵌入向量编码层50d,对加权处理后的对象特征信息再次进行特征编码,再将加权处理后的对象特征信息输入交叉状态识别模型中的第一特征交叉层50e,对加权处理后的对象特征信息进行特征交叉,得到第一特征交叉信息。计算机设备可以将对象特征信息的对象嵌入向量输入交叉状态识别模型中的第二特征交叉层50f中,对对象特征信息的对象嵌入向量进行特征交叉,得到第二特征交叉信息。计算机设备可以根据交叉状态识别模型中的特征组合层50g,对对象特征信息的第一特征交叉信息和加权处理后的第二特征交叉信息进行组合,得到交叉组合特征信息。进一步地,计算机设备通过交叉状态识别模型中的全连接层50h,对交叉组合特征信息进行卷积全连接处理,并通过对交叉状态识别模型中的状态识别层50i,对全连接处理后的交叉特征信息进行分类处理,输入用于反映目标对象关于目标业务的第二处理状态信息。其中,交叉状态识别模型的具体内容可以参见步骤S103的内容,本申请实施例在此不再赘述。
进一步地,计算机设备得到加权处理后的对象特征信息后,可以采用FiBiNet模型中的Bilinear-Interaction结构层(即交叉组合子层),对加权处理后的对象特征信息和对象特征信息进行特征交叉组合,得到交叉组合特征信息。其中,FiBiNet模型中的Bilinear-Interaction结构层是采用内积和哈达玛积的结合方式,对加权处理后的对象特征信息和对象特征信息进行交叉组合,得到交叉组合特征信息。具体的,计算机设备可以在FiBiNet模型中的交叉组合子层中,可以先采用内积的方式,将对象特征信息与参数矩阵W进行点乘处理,得到第一交叉组合结果。计算机可以再采用哈达玛积方式,对第一交叉组合结果和同阶矩阵进行点乘,得到第一特征交叉信息。同样的,计算机设备可以先采用内积的方式,将加权处理后对象特征信息与参数矩阵W进行点乘处理,得到第二交叉组合结果。计算机可以再采用哈达玛积方式,对第二交叉组合结果和同阶矩阵进行点乘,得到第二特征交叉信息。对第一特征交叉信息和第二特征交叉信息进行组合,得到交叉组合特征信息。
如图6所示,图6是本申请实施例提供的一种特征交叉组合的示意图,如图6所示,计算机设备可以采用内积方式60a、哈达玛方式60b或者内积与哈达玛方式的结合60c中的任意一种方式,分别对加权处理后的对象特征信息和对象特征信息进行交叉组合,得到交叉组合特征信息。可选的,如图6所示,计算机设备可以采用内积方式60a,获取一个与对象特征信息具体同阶的同阶矩阵,对该同阶矩阵进行倒置处理,得到倒置矩阵,采用对象特征信息与该倒置矩阵进行点乘,得到对象特征信息的第一特征交叉信息。同样的,采用内积方式60a得到加权处理后的对象特征信息的第二特征交叉信息,对该第一特征交叉信息和第二特征交叉信息进行组合交叉组合特征信息。
可选的,如图6所示,计算机设备可以采用哈达玛方式60b,获取一个与对象特征信息具体同阶的同阶矩阵,采用该同阶矩阵与对象特征信息进行点乘,得到第一特征交叉信息。同样的,采用哈达玛方式60b得到加权处理后的对象特征信息的第二特征交叉信息,对该第一特征交叉信息和第二特征交叉信息进行组合交叉组合特征信息。
可选的,如图6所示,计算机设备可以内积与哈达玛方式的结合60c方式,将对象特征信息与一个权重参数W进行点乘,再与一个同阶矩阵进行点乘,得到第一特征交叉信息。同样的,采用内积与哈达玛方式的结合60c方式得到加权处理后的对象特征信息的第二特征交叉信息,对该第一特征交叉信息和第二特征交叉信息进行组合交叉组合特征信息。
其中,当交叉状态组合模型为FiBiNet模型时,相对于传统的嵌入层,FiBiNet模型中加入了一个SENET层,可以对目标对象的对象特征信息进行特征编码,得到对象特征信息的影响度,根据该影响度对目标对象的对象特征信息进加权处理。这样,可以实现对影响度较大(即蕴含信息量较多)的对象特征信息进行增强,对影响度较小(即蕴含信息量较少)的对象特征信息进行削弱,进而提高特征提取的准确性。同时,计算机设备可以根据对象特征信息的影响度确定对目标对象的对象特征信息进行加权处理的加权参数,根据该加权参数对目标对象的对象特征信息进行加权处理,得到加权处理后的对象特征信息。另外,FiBiNet模型中没有采用传统的内积方式(即Inner Product)以及哈达玛方式(即HadamardProduct),对加权处理后的对象特征信息和对象特征信息进行交叉组合。而是采用了内积方式和哈达玛方式结合,并引入一个参数矩阵,来对加权处理后的对象特征信息和对象特征信息进行交叉组合,得到交叉组合特征信息,以此来获得对象特征信息之间的关联关系,可以提高特征提取的准确性。
其中,FiBiNet模型可以对包含大量分类信息的特征(即Categorical Feature)、特征基数较高的特征(即数量或者维度)(即Feature Cardinality)以及较稀疏的特征有很好的特征提取功能。其中,文字描述类的特征可以采用分词器(即Tokenizer),将文字描述类的特征处理成语句序列特征,将该语句序列特征作为FiBiNet模型的输入,这样可以提高特征提取的准确性,进而可以准确地识别出用于目标对象关于目标业务的第二处理状态信息。其中,在训练交叉状态识别模型(即FiBiNet模型)时,可以将FiBiNet模型中的ReduceRatio(即模型梯度下降率)设置到6-8,这样,可以加快FiBiNet模型的收敛效果,也可以使FiBiNet模型的性能果较好。
S104,对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息。
具体的,计算机设备可以对目标对象的对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息。具体的,计算机设备可以将第一处理状态信息和第二处理状态信息按列拼接在目标对象的对象特征信息后,得到目标融合特征信息。这样,通过线性状态识别模型和交叉状态识别模型,分别输出目标对象的对象特征信息关于目标业务的第一处理状态信息和第二处理状态信息,将该第一处理状态信息和第二处理状态信息作为目标对象的新的特征信息。
S105,根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
具体的,计算机设备可以根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。目标处理状态信息与目标业务相关联,例如,目标业务可以是指公积金缴纳业务,用于反映目标对象关于公积金缴纳业务的目标处理状态信息可以是指目标对象处于正常缴纳公积金状态的概率,或者,目标对象处于非正常缴纳公积金状态的概率。计算机设备通过将第一处理状态信息和第二处理状态信息,与目标对象的对象特征信息进行融合,得到多个维度上的对象特征信息。根据该多个维度上的对象特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息,可以提高对目标对象关于目标业务的目标处理状态信息的识别准确性。
可选的,计算机设备对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息的具体方式可以包括:调用组合状态识别模型的权重预测层,获取目标融合特征信息中任意两个维度的特征信息之间的组合权重。调用组合状态识别模型的特征组合层,基于组合权重,对目标融合特征信息中各个维度的特征信息进行特征组合,得到特征组合后的目标融合特征信息。调用组合状态识别模型的状态识别层,对特征组合后的目标融合特征信息进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
具体的,计算机设备可以调用组合状态识别模型,该组合状态识别模型可以根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。计算机设备可以调用组合状态识别模型中的权重预测层,获取目标融合特征信息汇总任意两个维度上的特征信息之间的组合权重,即权重预测层可以识别出任意两个维度上的特征信息组合后的表征能力。若两个特征信息组合后的表征能力越强,则对应的组合权重越高;若两个特征信息组合后的表征能力越弱,则对应的组合权重越低。这样,可以将组合在一起具有强大表征能力的特征信息组合在一起,提高特征提取的准确性。
进一步地,计算机设备可以调用组合状态识别模型中的特征组合层,基于任意两个维度的特征信息之间的组合权重,对相应的两个维度上的特征信息进行组合,得到特征组合后的目标融合特征信息。具体的,计算机设备可以获取目标融合特征信息中的特征信息i,该特征信息i为目标融合特征信息中任意一个维度上的特征信息,获取特征信息i与目标融合特征信息中其他维度上的特征信息之间的组合权重。计算机设备可以根据该特征信息与目标融合特征信息中其他维度上的特征信息之间的组合权重,来判断该特征信息i与其他特征信息进行组合的重要性,即越重要的组合给予的组合权重越高,越不重要的组合给予的组合权重越低。进一步地,计算机设备可以根据特征信息i与其他特征信息之间的组合权重,对特征信息i与其他特征信息之间的组合特征信息进行加权处理,得到特征信息i与其他特征信息之间的特征组合信息。对目标融合特征信息中每个维度上的特征信息与其他特征信息之间的特征组合信息进行汇总,得到特征组合后的目标融合特征信息。
进一步地,计算机设备可以调用组合识别模型中的状态识别层,对特征组合后的目标融合特征信息进行状态识别,即对特征组合后的目标融合特征信息进行分类处理,得到用于反映目标对象关于目标业务的目标处理状态信息,该目标处理状态信息可以为与目标对象相关联的其他业务的业务处理提供参考依据。例如,目标业务可以为公积金缴纳业务,可以根据用于反映目标对象关于公积金缴纳业务的公积金缴纳状态(即正常缴纳公积金(即已缴纳公积金)或者非正常缴纳公积金(即没有缴纳公积金)),为目标对象进行业务推荐,如根据目标对象的公积金缴纳状态对目标对象进行广告投放。例如,目标业务为婚恋推荐业务,目标处理状态信息为目标对象的婚恋状态,若目标对象处于未谈恋爱的状态,则可以向目标对象推荐交友社交软件。
可选的,组合状态识别模型可以是指AutoInt模型(即Automatic FeatureInteraction Learning via Self-Attentive Neural Networks),该AutoInt本质上是通过找到一种特征自动进行高阶交叉的方法,实现既能弥补线性状态识别模型中多层感知器,对乘性特征组合捕获能力不强的弱点,又能够较好的解释哪些特征组合组合在一起具有强大的表征能力的功能。AutoInt模型的底层是编码层(即embedding层),类似于DeepFM(一种用于低阶特征的提取和高阶特征的提取的网络结构,包括神经网络部分与因子分解机部分)的设计,将所有的离散、连续特征都映射成一个等长的编码向量。其中,离散特征是直接可以直接查看特征编码表,将特征映射成编码向量,多值的离散特征使用平均池化(即average pooling),将特征映射成编码向量。连续特征则相当于乘以一个不含偏离率(即bias)的Dense层,该Dense层的目的是将提取到的特征,通过Dense层进行非线性变化,提取这些特征之间的关联,最后映射到输出空间上。
如图7所示,图7是本申请实施例提供的一种组合状态识别模型的结构的示意图,如图7所示,计算机设备可以将目标融合特征信息70a输入组合状态识别模型中的编码层70b,输出目标融合特征信息70a的融合编码向量。计算机设备可以将该融合编码向量输入组合状态识别模型中的特征交叉层70c中的权重预测层中,获取目标融合特征信息中任意两个维度的特征信息之间的组合权重。进一步地,计算机设备可以调用特征交叉层70c中的特征组合层,基于组合权重,对目标融合特征信息中各个维度的特征信息进行特征组合,得到特征组合后的目标融合特征信息。进一步地,计算机设备可以调用组合状态识别模型中的输出层(即状态识别层),对特征组合后的目标融合特征信息进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。其中,组合状态识别模型的具体内容可以参见步骤S105的内容,本申请实施例在此不再赘述。
其中,组合状态识别模型为AutoInt模型时,可以自动学习高阶特征交叉,提高了可解释性,同时基于self-attentive neural network(即自注意力神经网络)提出一种新的方法,可自动学习高维特征交叉,有效提升了组合状态是被模型预测目标对象关于目标业务的目标处理状态信息的准确率。其中,组合状态识别模型的batch size(即一次训练时样本的数量)可以为512,嵌入维度可以为10。同时,可以使用Adam优化器(AdaptiveGradient,即自适应梯度)对组合状态识别模型中的模型参数进行调整。Adam优化器能够对每个不同的参数调整不同的学习率,对频繁变化的参数以更小的步长进行更新,而稀疏的参数以更大的步长进行更新。同时,也可以将组合状态识别模型中的Dropout参数设置为0.5,Dropout参数能够有效缓解线性状态识别模型的过拟合问题,从而使得训练得到更深更宽的网络。
其中,通过组合状态识别模型,可以将线性状态识别模型输出的第一处理状态信息和交叉状态识别模型输出的第二处理状态信息,作为目标样本的新的特征信息。同时,也可以对线性状态识别模型输出的第一处理状态信息和交叉状态识别模型输出的第二处理状态信息进行有监督的权重调优,提高对目标样本关于目标业务的目标处理状态信息的预测准确性。
其中,当本申请以上实施例运用到具体产品或技术中时,需要获得用户(即目标对象为业务用户时)许可或者同意,且目标对象的对象特征信息、目标对象关于多媒体数据的日志数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。也就是说,计算机设备可以在获取到用户针对上述信息的授权信息时,计算机设备才能获取目标对象的对象特征信息、目标对象关于多媒体数据的日志数据;即目标对象的对象特征信息、目标对象关于多媒体数据的日志数据是用户授权后才获取得到的。
例如,在计算机设备在多媒体平台的多媒体界面中显示权限提示界面,该权限提示界面用于提示用户当前正在搜集目标对象的对象特征信息、目标对象关于多媒体数据的日志数据,在获取到用户对该权限提示界面发出确认操作后,开始执行获取目标对象的对象特征信息、目标对象关于多媒体数据的日志数据步骤,否则结束。
如图8所示,图8是本申请实施例提供的一种获取目标处理状态信息的流程示意图,如图8所示,当触发计算机设备针对目标对象的目标处理状态信息识别操作时,计算机设备可以执行开始操作80a。计算机设备可以执行读取线下训练好的固化模型80b,该训练好的固化模型可以是指训练好的线性状态识别模型、交叉状态识别模型以及组合状态识别模型。计算机设备可以拉取目标对象的线上实时特征80c,以及读取线下离线特征80d,该线上实时特征和线下离线特征可以参见步骤S101中的描述,在此不再赘述。计算机设备可以拼接目标对象的线上实时特征和线下离线特征80e,得到目标对象的对象特征信息。进一步地,计算机设备可以将拼接好的特征输入到模型80f中,可以理解的是,计算机设备可以将拼接得到的对象特征信息输入到线性状态识别模型中,对目标对象的对象特征信息进行线性状态识别,输出用于反映目标对象关于目标业务的第一处理状态信息。计算机设备可以将拼接得到的对象特征信息输入到交叉状态识别模型中,对目标对象的对象特征信息进行交叉状态识别,输出用于反映目标对象关于目标业务的第二处理状态信息。计算机设备可以将拼接得到的对象特征信息、第一处理状态信息以及第二处理状态信息输入到组合状态识别模型中,对目标对象进行交叉状态识别,返回组合状态识别模型的计算概率80g,该组合状态识别模型的计算概率是指组合状态识别模型识别出的目标对象关于目标业务的处理状态的概率信息。进一步地,计算机设备可以将该组合模型返回的计算概率与产品运营的预设正例概率(即预设的正例概率)进行比较80h,得到目标处理状态信息,并执行结束操作80i。例如,目标业务为公积金缴纳业务操作,组合状态识别模型可以输出目标对象处于正常缴纳公积金状态的概率,将该目标对象处于正常缴纳公积金状态的概率,与公积金正常缴纳的预设正例概率进行比较。若目标对象处于正常缴纳公积金状态的概率大于或者等于公积金正常缴纳的预设正例概率,则确定目标对象的目标处理状态信息为正常缴纳公积金。若目标对象处于正常缴纳公积金状态的概率小于公积金正常缴纳的预设正例概率,则确定目标对象的目标处理状态信息为非正常缴纳公积金。
在本申请实施例中,通过根据目标对象的对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。同时根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。进一步地,将目标对象的对象特征信息与采用不同状态识别方式得到的状态信息(即第一处理状态信息和第二处理状态信息)进行融合,得到目标融合特征信息,根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。也就是说,根据目标融合特征信息对目标对象关于目标业务的处理状态进行优化识别,得到用于反映目标对象关于目标业务的目标处理状态信息,能够提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。另外,根据线性状态识别和线性状态识别两种不同特征提取方式,对目标对象的对象特征信息进行特征提取,进而得到目标对象在不同角度下的处理状态信息。将该目标对象在不同角度下的第一处理状态信息和第二处理状态信息,与对象特征信息进行融合,进而得到目标对象在多个维度的对象特征信息。通过对目标对象在多个维度的对象特征信息进行组合状态识别,可以提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。另外,通过线性状态识别模型输出目标对象关于目标业务的第一处理状态信息,通过交叉状态识别模型输出目标对象关于目标业务的第二处理状态信息。再通过组合状态识别模型,对线性状态识别模型输入的第一处理状态信息、交叉状态识别模型输出的第二处理状态信息以及对象特征信息进行融合,得到目标对象在多个维度上的目标融合特征信息,根据目标融合特征信息识别出用于反映目标对象关于目标业务的目标处理状态信息,可以提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。
请参见图9,图9是本申请实施例提供的一种状态识别方法的流程示意图。该状态识别方法可由计算机设备执行,该计算机设备可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),本申请对此不做限定。如图9所示,该状态识别方法可以包括但不限于以下步骤:
S201,获取样本对象关于目标业务的样本对象特征信息以及样本对象关于目标业务的目标处理状态信息标签。
具体的,计算机设备可以获取样本对象关于目标业务的样本对象特征信息,以及获取样本对象关于目标业务的目标处理状态信息标签,该目标处理状态信息标签可以由人工进行打标。
可选的,计算机设备获取样本对象关于目标业务的样本特征信息的具体方式可以包括:计算机设备可以找出与目标业务强相关、数据分布正常、特征画像合理的正负训练样本。例如,目标业务为公积金缴纳业务时,正负训练样本数据可以为正常缴纳公积金的样本对象以及非正常缴纳公积金的样本对象。
可选的,计算机设备可以获取样本对象关于目标业务的初始样本对象特征信息,基于异常检测准则,对所述初始样本对象特征信息进行过滤处理,得到第一候选对象特征信息;对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息;调用特征向量转换模型,对所述第二候选对象特征信息进行向量转换,得到向量转换后的第二候选对象特征信息,将所述向量转换后的第二候选对象特征信息,确定为所述样本对象关于目标业务的样本对象特征信息。
具体的,计算机设备可以进行样本训练数据的准备,计算机设备可以基于人工标注、样本验证业务逻辑,获取带有标签信息的种子对象(即样本对象)。其中,计算机设备可以基于样本获取规则粗召回多个样本对象,然后基于异常检测准则,对该初始样本对象特征信息进行过滤处理,得到第一候选对象特征信息。异常检测准则是指过滤得到符合用于对初始组合状态识别模型进行训练的样本对象特征信息的规则,异常检测准则用于过滤掉虚假对象、电脑操控手机的情况;异常检测准则可以包括用于剔除非真实对象对建模分析的影响的异常检测指标,比如设置对样本对象在使用产品软件时的流量使用情况、流量产生的时间分布等数据进行异常检测的指标。其中,计算机设备可以基于异常检测准则中的异常检测指标,过滤异常样本对象,如可以使用“拉依达准则”进行异常值判断。“拉依达准则”具体做法是:假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。进一步,计算机设备可以调用特征向量转换模型,对所述第二候选对象特征信息进行向量转换,得到向量转换后的第二候选对象特征信息,将该向量转换后的第二候选对象特征信息,确定为该样本对象关于目标业务的样本对象特征信息。
进一步地,计算机设备可以将过滤后的正常的样本对象和样本对象的对象特征信息,离线存储在HDFS(The Hadoop Distributed File System,即布式文件***,是一种运行在通用硬件(commodity hardware)上的分布式文件***),便于后续流程的快速访问。通过构建训练样本对象的画像特征,并基于特征的垂直特性,结合时间维度、不同特征处理方法,产出高维特征向量。其中,样本对象的样本对象特征信息的具体内容可以参考上述图3中步骤S101的内容,本申请实施例在此不再赘述。
可选的,获取所述第一候选对象特征信息的特征类型;根据所述特征类型,从编码方式集合中确定用于对所述第一候选对象特征信息进行特征编码的目标编码方式;采用所述目标编码方式,对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息。
可选的,特征类型包括基本画像特征和业务垂直类型,计算机设备可以对过滤后的样本对象的对象特征信息进行离线特征处理,即对样本对象的样本对象特征信息进行特征编码。具体的,计算机设备可以构建样本对象的基础画像特征,如可以基于对象历史行为数据,构建出丰富的样本对象的基本画像特征,基本画像特征包括:用户基础属性、设备基础属性、网络连接属性等。计算机设备可以基于业务特性,构建业务垂直类型特征。垂直类型特征,包括对象对特定类型广告的点击率、转化率等。进一步地,计算机设备可以结合时间维度,分别从基本画像特征和业务垂直类型特征中聚合出不同时间跨度的画像特征和业务特征,将聚合出的不同时间跨度的画像特征和业务特征确定为第二候选对象特征信息。如计算对象近半年/近3个月/近1个月/近1周的聚合画像,聚合的方法选用求和、中位数、标准差三种。进一步地,计算机设备可以对样本对象的样本对象特征信息进行特征处理,如归一化数值型特征和离散化非数值型特征,归一化方法可以选择高斯归一化。其中,计算机设备对样本对象的样本对象特征信息进行特征预处理的具体内容可以参考上述图3中步骤S101的内容,本申请实施例在此不再赘述。
进一步地,计算机设备可以对处理后的对象特征信息进行合并,并离线存储在HDFS中,便于后续流程的快速访问。其中,计算机设备可以固化对样本特征信息进行特征预处理的特征处理逻辑,定时离线自动化计算样本对象的对象特征信息,将离线计算结果推送到线上存储引擎。
S202,调用线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态识别,得到用于反映样本对象关于目标业务的第一识别处理状态信息。
具体的,计算机设备可以调用线性状态识别模型,根据样本对象的样本对象特征信息,对样本对象进行线性状态识别,得到用于反映样本对象关于目标业务的第一识别处理状态信息。其中,对样本对象进行线性状态识别的内容可以参考上述图3中步骤S102的内容,本申请实施例在此不再赘述。
S203,调用交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二识别处理状态信息。
具体的,计算机设备可以调用交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二识别处理状态信息。其中,对样本对象进行交叉状态识别的内容可以参考图3中步骤S103的内容,本申请实施例在次不再赘述。
S204,调用初始组合状态识别模型,对样本对象特征信息、第一识别处理状态信息以及第二识别处理状态信息进行融合,得到目标样本融合特征信息,根据目标样本融合特征信息,对样本对象进行组合状态预测,得到用于反映样本对象关于目标业务的预测目标处理状态信息。
具体的,计算机设备可以调用初始组合状态识别模型,对样本对象特征信息、第一识别处理状态信息以及第二识别处理状态信息进行融合,得到目标样本融合特征信息。根据目标样本融合特征信息,对样本对象进行组合状态预测,得到用于反映样本对象关于目标业务的预测目标处理状态信息。其中,对样本进行组合状态识别的具体内容可以参考上述图3中步骤S105的内容,本申请实施例在此不再赘述。
S205,根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,得到组合状态识别模型;组合状态识别模型用于根据目标对象的对象特征信息预测用于反映目标对象关于目标业务的目标处理状态信息。
具体的,计算机设备可以根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,当调整后的初始组合状态识别模型满足收敛条件时,则将该满足参数调整后的初始组合状态识别模型确定为组合状态识别模型。其中,组合状态识别模型用于根据目标对象的对象特征信息预测用于反映目标对象关于目标业务的目标处理状态信息。若参数调整后的初始组合状态识别模型不满足收敛条件,则继续对该不满足收敛条件的初始组合状态识别模型进行迭代训练,直到初始组合状态识别模型满足收敛条件。其中,收敛条件可以是指初始组合状态识别模型的训练次数达到目标次数,或者,初始组合状态识别模型的模型损失小于或者等于目标损失值。
可选的,计算机设备根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,得到组合状态识别模型的具体方式可以包括:根据目标处理状态信息标签和预测目标处理状态信息,确定初始组合状态识别模型的组合状态预测误差。若组合状态预测误差未处于收敛状态,根据组合状态预测误差对初始组合状态识别模型进行调整。将调整后的初始组合状态识别模型确定为组合状态识别模型。
具体的,收敛条件包括收敛状态,计算机设备可以根据目标处理状态信息标签和预测目标处理状态信息之间的差异,确定初始组合状态识别模型的组合状态预测误差。进一步地,计算机设备可以检测该组合状态预测误差是否处于收敛状态。其中,收敛状态可以为组合状态预测误差是否小于或者等于目标阈值。若组合状态预测误差小于或者等于目标阈值,则确定组合状态预测误差处于收敛条件,则将初始组合状态识别模型确定为组合状态识别模型。若组合状态预测误差大于目标阈值,则确定组合状态预测误差未处于收敛条件,则将根据组合状态预测误差确定用于对初始组合状态识别模型进行参数调整的第一模型调整参数。进一步地,计算机设备可以将第一模型调整参数替换初始组合状态识别模型中的初始模型参数,得到参数调整后的初始组合状态识别模型。计算机设备可以再次获取参数调整后的初始组合状态识别模型对应的组合状态预测误差,检测该再次获取到的组合状态识别误差是否满足收敛状态,若满足,则将该参数调整后的初始组合状态识别模型确定为组合状态识别模型。若不满足,则继续对参数调整后的初始组合状态识别模型进行模型训练,直到参数调整后的初始组合状态识别模型对应的组合状态识别误差满足收敛状态。
其中,通过初始组合状态识别模型,可以将线性状态识别模型输出的第一识别处理状态信息和交叉状态识别模型输出的第二识别处理状态信息,作为样本对象的新的样本特征信息。同时,也可以对线性状态识别模型输出的第一识别处理状态信息和交叉状态识别模型输出的第二识别处理状态信息进行有监督的权重调优,提高训练得到的组合状态识别模型的模型性能,同时提高组合状态识别模型对目标样本关于目标业务的目标处理状态信息的预测准确性。
可选的,计算机设备可以预先训练完成线性状态识别模型,在使用的时候直接调用。具体的,计算机设备训练完成线性状态识别模型的具体方式可以包括:调用初始线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态预测,得到用于反映样本对象关于目标业务的第一预测处理状态信息。根据目标处理状态信息标签和第一预测处理状态信息对初始线性状态识别模型进行调整,得到线性状态识别模型;线性状态识别模型用于对目标对象进行线性状态预测,得到目标对象的第一处理状态信息。
具体的,计算机设备可以对样本对象的样本对象特征信息进行划分,得到训练集合验证集,如按照样本所属的时间窗口进行划分,时间较早的作为训练集,时间较晚的作为验证集,训练集和验证集的比例保证为5:1。调用初始线性状态识别模型,根据样本对象特征信息中的训练集,对样本对象进行线性状态预测,得到用于反映样本对象关于目标业务的第一预测处理状态信息。进一步地,根据目标处理状态信息标签和第一预测处理状态信息对初始线性状态识别模型进行调整,得到线性状态识别模型。当线性状态识别模型训练完成后,可以调用线性状态识别模型,根据样本对象特征信息中的验证集,对样本对象进行线性状态预测,得到用于反映样本对象关于目标业务的第一处理状态信息。其中,对样本对象进行交叉状态识别的内容可以参考图3中步骤S103的内容,本申请实施例在次不再赘述。
可选的,计算机设备根据所述目标处理状态信息标签和所述第一预测处理状态信息,对所述初始线性状态识别模型进行调整,得到线性状态识别模型的具体方式可以包括:根据所述目标处理状态信息标签和所述第一预测处理状态信息,确定所述初始线性状态识别模型的线性状态预测误差。若所述线性状态预测误差未处于收敛状态,根据所述线性状态预测误差对所述初始线性状态识别模型进行调整,将调整后的初始线性状态识别模型确定为线性状态识别模型。
具体的,计算机设备可以获取目标处理状态信息和第一预测处理状态信息之间的状态信息差异,根据该状态信息差异确定初始线性状态识别模型的线性状态预测误差。计算机设备可以检测该初始线性状态识别模型的线性状态预测误差是否处于收敛状态,对初始线性状态识别模型进行参数调整,当参数调整后的初始线性状态识别模型满足收敛条件时,则将参数调整后的初始线性状态识别模型确定为线性状态识别模型。若参数调整后的初始线性状态识别模型不满足收敛条件,则继续对该不满足收敛条件的初始线性状态识别模型进行迭代训练,直到初始线性状态识别模型满足收敛条件。其中,收敛条件可以是指初始线性状态识别模型的训练次数达到目标次数,或者,初始线性状态识别模型的模型损失小于或者等于目标损失值。计算机设备训练完成线性状态识别模型后,可以通过线性状态识别模型对样本对象特征信息中的验证集,对样本对象进行线性状态识别,得到样本对象关于目标业务的第一识别处理状态信息,该第一识别处理状态信息可以是指样本对象针对目标业务中的识别处理状态的概率,如目标业务为公积金缴纳业务时,该第一识别处理状态信息可以是指样本对象正常缴纳公积金的概率。
可选的,计算机设备可以预先训练完成交叉状态识别模型,在使用的时候直接调用。具体的,计算机设备训练交叉状态识别模型的具体方式可以包括:调用初始交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态预测,得到用于反映样本对象关于目标业务的第二预测处理状态信息。根据目标处理状态信息标签和第二预测处理状态信息,对所述初始交叉状态识别模型进行调整,得到交叉状态识别模型;交叉状态识别模型用于对对象进行交叉状态预测,得到对象关于业务的第二处理状态信息。
可选的,上述根据目标处理状态信息标签和第二预测处理状态信息,对该初始交叉状态识别模型进行调整,得到交叉状态识别模型,包括:根据该目标处理状态信息标签和该第二预测处理状态信息,确定该初始交叉状态识别模型的交叉状态预测误差;若该交叉状态预测误差未处于收敛状态,根据该交叉状态预测误差对该初始交叉状态识别模型进行调整;将调整后的初始交叉状态识别模型确定为交叉状态识别模型。
具体的,计算机设备可以调用初始交叉状态识别模型,根据样本对象特征信息中训练集所包含的信息量,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二预测处理状态信息。其中,对样本对象进行交叉状态识别的具体内容可以参考上述图3中步骤S103的内容,本申请实施例在此不再赘述。
进一步地,计算机设备可以根据目标处理状态信息标签和第二预测处理状态信息,以及初始交叉状态识别模型的损失函数,确定初始交叉状态识别模型的交叉状态预测误差,该交叉状态预测误差用于反映该初始交叉状态识别模型的状态预测准确度。因此,如果该交叉状态预测误差处于收敛状态,表明该初始交叉状态识别模型的状态预测准确度比较高,则可以将该初始交叉状态识别模型确定为交叉状态识别模型。如果该交叉状态预测误差未处于收敛状态,表明该初始交叉状态识别模型的状态预测准确度比较低,则可以根据该交叉状态预测误差对初始交叉状态识别模型进行调整。若参数调整后的初始交叉状态识别模型不满足收敛条件,则继续对该不满足收敛条件的初始交叉状态识别模型进行迭代训练,直到初始交叉状态识别模型的交叉状态预测误差处于收敛条件。其中,收敛条件可以是指初始交叉状态识别模型的模型损失小于或者等于目标损失值。计算机设备训练完成交叉状态识别模型后,可以通过交叉状态识别模型对样本对象特征信息中的验证集,对样本对象进行交叉状态识别,得到样本对象关于目标业务的第二识别处理状态信息,该第二识别处理状态信息可以是指样本对象处于第二识别处理状态的概率,如目标业务为公积金缴纳业务时,该第二识别处理状态信息可以是指样本对象正常缴纳公积金的概率。
其中,计算机设备在对初始组合状态识别模型、初始线性状态识别模型以及初始交叉状态识别模型中的模型参数进行模型调优时,可以采用AUC(Area under Curve)评价指标对模型参数的进行评价,参数调优是指对选择模型的超参数进行网格寻优,以期待评价指标AUC能获得提升。其中,AUC指标本身和模型预测结果的绝对值无关,只关注排序效果,更加贴近实际业务的需要,另外AUC的计算方法同时考虑了学***衡的情况下,依然能够对分类器做出合理的评价。其中,AUC值越大,当前分类算法越有可能将正样本排在负样本前面,得到更好的分类结果。其中,计算机设备也可以对训练完成后的组合状态识别模型、线性状态识别模型以及交叉状态识别模型进行线上实验评估,如基于A/B(即对照组和实验组)实验的线上流量,对模型的效果进行评估,评估的指标有:广告点击率、广告转化率等。
其中,计算机设备训练完成组合状态识别模型、线性状态识别模型以及交叉状态识别模型后,可以对组合状态识别模型、线性状态识别模型以及交叉状态识别模型进行固化。其中,可以基于TensorFlow的Saver方法固化训练好的模型,共产生checkpoint(即文本文件,记录了模型文件的路径信息列表)、model.ckpt.data(即模型参数文件,记录了模型网络权重信息)、model.ckpt.index.data(即二进制文件,保存了模型中的变量权重信息)、index(即二进制文件,保存了模型中的变量权重信息)。这样,计算机设备可以在需要识别目标对象关于目标业务的目标处理状态信息时,可以直接调用。
如图10所示,图10是本申请实施例提供的一种模型训练的示意图,如图10所示,计算机设备可以进行样本准备,基于人工标注或者预设业务逻辑,获取带有标签的样本对象。计算机设备可以对该带有标签的样本对象的基础画像(即基础对象特征信息),并计算异常对象类型的样本对象的评价指标,对样本对象进行过滤处理,即过滤样本对象中异常样本对象,并将过滤后的正常样本对象离线存储。进一步地,计算机设备可以对样本对象离线存储的样本对象特征信息进行特征处理。首先,计算机设备可以构建样本对象的基础画像特征(即图3中步骤S101中的通用特征信息),以及构建业务垂直特征(图3中步骤S101中的目标对象关于多个业务的业务特征信息。其次,计算机设备可以结合时间维度,对样本对象特征信息进行聚合,得到不同实践跨度的基础画像特征和业务垂直特征。然后,计算机设备可以对不同实践跨度的基础画像特征和业务垂直特征进行特征预处理以及特征编码,得到处理后的样本特征信息,具体内容可以参考上述图3中步骤S101中的内容,本申请实施例在次不再赘述。然后,计算机设备可以对处理后的样本对象特征信息进行合并,并离线存储至HDFS,便于后续读取。计算机设备可以将对样本对象特征信息的特征处理逻辑进行固化,以便定时离线自动进行特征计算(即进行离线特征处理)。
进一步地,计算机设备可以进行模型融合准备,对样本对象特征信息进行划分,得到训练集和验证集,并读入样本特征信息中的训练集,基于训练集,分别独立训练初始线性状态识别模型和初始交叉状态识别模型。当线性状态识别模型和交叉状态识别模型训练完成后(即满足收敛条件),则读入样本对象特征信息中的验证集,将该验证集分别输入线性状态识别模型和交叉状态识别模型,获取线性状态识别模型和交叉状态识别模型分别对验证集的输出结果,将线性状态识别模型和交叉状态识别模型分别对应的输出结果进行存储。进一步地,计算机设备可以进行模型融合,读入样本对象特征信息中的训练集,读入线性状态识别模型和交叉状态识别模型分别输出的输出结果,对样本对象特征信息中的训练集与线性状态识别模型和交叉状态识别模型分别输出的输出结果进行拼接,得到目标融合特征信息。基于目标样本融合特征信息训练初始组合状态识别模型,对初始组合状态识别模型进行模型调优,得到组合状态识别模型,并对该组合状态识别模型进行固化,以便后续调用。其中,当计算机设备需要预测用于反映目标对象关于目标业务的目标处理状态信息时,可以直接调用线性状态识别模型、交叉状态识别模型以及组合状态识别模型,执行图3中步骤s101-s105的内容,得到用于反映目标对象关于目标业务的目标处理状态信息。
进一步地,计算机设备在需要确定目标对象关于目标业务的目标处理状态信息时,可以在线调用模型(即线性状态识别模型、交叉状态识别模型以及组合状态识别模型)。计算机设备可以定时从线上存储引擎,拉取目标对象最新的特征集合,获取特征计算逻辑,从线上实时日志导出原数据,基于特征计算逻辑,对原数据进行特征计算,得到目标对象的对象特征信息。将得到的对象特征信息输入到线性状态识别模型,输出第一处理状态信息,将对象特征信息输入到交叉状态识别模型,输出第二处理状态信息,对第一处理状态信息、第二处理状态信息以及对象特征进行拼接,得到目标融合特征信息,将该目标融合特征信息输入组合状态识别模型,输出目标处理状态信息。根据目标处理状态信息对目标对象进行业务处理,如根据该目标处理状态信息,对目标对象进行业务推荐。
如图11所示,图11是本申请实施例提供的一种组合状态识别模型训练的示意图,如图11所示,计算机设备对组合状态识别模型进行训练的内容包括训练数据准备110a、特征处理110b以及模型融合训练110c三个部分的内容。其中,如图11所示,在训练数据准备阶段,计算机设备可以基于人工标注或者预设业务逻辑,获取带有标签的样本对象。计算机设备可以对该带有标签的样本对象的基础画像(即基础对象特征信息),并计算异常对象类型的样本对象的评价指标,基于分布异常定理对样本对象进行过滤处理,即过滤样本对象中异常样本对象,并判断样本对象是否达标,若未达标则重新获取样本对象,若达标则将过滤后的正常样本对象离线存储。如图11所示,在特征处理110b阶段,计算机设备可以构建样本对象的基础画像特征(即图3中步骤S101中的通用特征信息),以及构建业务垂直特征(图3中步骤S101中的目标对象关于多个业务的业务特征信息。其次,计算机设备可以结合时间维度,对样本对象特征信息进行聚合,得到不同实践跨度的基础画像特征和业务垂直特征。然后,计算机设备可以对不同实践跨度的基础画像特征和业务垂直特征进行特征预处理以及特征编码,得到处理后的样本特征信息,具体内容可以参考上述图3中步骤S101中的内容,本申请实施例在次不再赘述。然后,计算机设备可以对处理后的样本对象特征信息进行合并,并离线存储至HDFS,便于后续读取。计算机设备可以将对样本对象特征信息的特征处理逻辑进行固化,以便定时离线自动进行特征计算(即进行离线特征处理)。在模型融合训练110c阶段,计算机设备可以对样本对象特征信息进行划分,得到训练集和验证集,并读入样本特征信息中的训练集,基于训练集,分别独立训练初始线性状态识别模型和初始交叉状态识别模型。当线性状态识别模型和交叉状态识别模型训练完成后(即满足收敛条件),则读入样本对象特征信息中的验证集,将该验证集分别输入线性状态识别模型和交叉状态识别模型,获取线性状态识别模型和交叉状态识别模型分别对验证集的验证结果,将线性状态识别模型和交叉状态识别模型分别对应的第一验证结果和第二验证结果进行存储。进一步地,计算机设备可以拼接第一验证结果、第二验证结果和样本对象特征信息,得到目标融合特征信息。基于目标样本融合特征信息训练初始组合状态识别模型,对初始组合状态识别模型进行模型调优,判断调优后的组合线性状态识别模型是否达标,若达标则对训练得到的组合状态识别模型进行固化,以便后续调用。若未达标,则重新基于目标融合特征信息对初始组合状态识别模型进行训练。
如图12所示,图12是本申请实施例提供的一种模型预测效果的示意图,图12展示了预测方式,对目标对象的公积金缴纳状态的预测效果。如图12所示,提供了人工指定强规则、非深度学习方案以及多层融合方案(即本申请中的多个模型融合方案)三种预测方式。其中,当预测方式为人工指定强规则时,即基于人工指定的规则来判别目标对象的公积金缴纳状态进行识别,线上AUC(即area under the curve,一种模型评价指标)和线下AUC低于非深度学习方案以及多层融合方案。其中,当预测方式为非深度学习方案时,线上AUC(即area under the curve,一种模型评价指标)和线下AUC低于多层融合方案。其中,当预测方式为多层融合方案,线上AUC(即area under the curve,一种模型评价指标)和线下AUC均高于非深度学习方案以及人工指定强规则。可见,本申请中的多层融合方案,可以提高模型的预测准确性,进而提高对目标对象关于目标业务的目标处理状态信息的预测准确性。
如图13所示,图13是本申请实施例提供的一种模型业务效果的示意图,图13展示了根据不同预测方式得到目标对象关于目标业务的目标处理状态信息,进行业务处理时的业务处理效果(如广告点击率和广告转化率)对比。如图13所示,提供了人工指定强规则、非深度学习方案以及多层融合方案(即本申请中的多个模型融合方案)三种预测方式。其中,当预测方式为人工指定强规则时,广告点击率和广告转化率均低于非深度学习方案和多层融合方案。其中,当预测方式为非深度学习方案时,广告点击率和广告转化率低于多层融合方案。其中,当预测方式为多层融合方案,广告点击率和广告转化率均高于非深度学习方案以及人工指定强规则。可见,本申请中的多层融合方案,可以提高对目标对象关于目标业务的目标处理状态信息的预测准确性,进而提高对目标对象的先关业务处理的业务处理效果。
其中,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且目标对象的对象特征信息、样本对象的样本对象特征信息、目标对象和样本对象关于多媒体数据(如应用程序)的日志数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。也就是说,计算机设备可以在获取到用户针对上述信息的授权信息时,计算机设备才能获取目标对象的对象特征信息、样本对象的样本对象特征信息、目标对象和样本对象关于多媒体数据的日志数据;即目标对象的对象特征信息、样本对象的样本对象特征信息、目标对象和样本对象关于多媒体数据的日志数据是用户授权后才获取得到的。
例如,在计算机设备在多媒体平台的多媒体界面中显示权限提示界面,该权限提示界面用于提示用户当前正在搜集目标对象的对象特征信息、样本对象的样本对象特征信息、目标对象和样本对象关于多媒体数据的日志数据,在获取到用户对该权限提示界面发出确认操作后,开始执行获取目标对象的对象特征信息、样本对象的样本特征信息、目标对象和样本对象关于多媒体数据的日志数据步骤,否则结束。
在本申请实施例中,通过获取样本对象关于目标业务的样本对象特征信息以及样本对象关于目标业务的目标处理状态信息标签。调用线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态识别,得到用于反映样本对象关于目标业务的第一识别处理状态信息。调用交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二识别处理状态信息。进一步地,调用初始组合状态识别模型,对样本对象特征信息、第一识别处理状态信息以及第二识别处理状态信息进行融合,得到目标样本融合特征信息,根据目标样本融合特征信息,对样本对象进行组合状态预测,得到用于反映样本对象关于目标业务的预测目标处理状态信息。根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,得到组合状态识别模型,采用该组合状态识别模型根据目标对象的对象特征信息确定用于反映目标对象关于目标业务的目标处理状态信息。可见,本申请可以将线性状态识别模型和交叉状态识别模型的输入与样本对象特征信息进行融合,得到目标样本融合特征信息,进而得到样本对象在多个维度上的样本对象特征信息,根据目标样本融合特征信息对初始组合状态识别模型进行训练,这样,可以对显性状态识别模型的输出和交叉状态识别模型的输出进行有监督的权重调优,可以提高训练得到组合状态识别模型的预测准确性,进而可以提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。
请参见图14,图14是本申请实施例提供的一种状态识别装置的结构示意图。上述状态识别装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该状态识别装置为一个应用软件;该状态识别装置可以用于执行本申请实施例提供的状态识别方法中的相应步骤。如图14所示,该状态识别装置可以包括:第一获取模块11、线性状态识别模块12、交叉状态识别模块13、融合模块14、组合状态识别模块15、第二获取模块16、第一调用模块17、第二调用模块18、第三调用模块19、第一调整模块20、第四调用模块21、第二调整模块22、第五调用模块23以及第三调整模块24。
第一获取模块11,用于获取目标对象关于目标业务的对象特征信息,以及对象特征信息所包含的信息量;
线性状态识别模块12,用于根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息;
交叉状态识别模块13,用于根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息;
融合模块14,用于对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息;
组合状态识别模块15,用于根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
其中,线性状态识别模块12包括:
深度特征提取单元1201,用于调用线性状态识别模型的特征提取层,对对象特征信息进行深度特征提取,得到目标对象关于目标业务的深度特征信息;
线性状态识别单元1202,用于调用线性状态识别模型的状态识别层,根据深度特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。
其中,深度特征提取单元1201具体用于:
调用线性状态识别模型的特征提取层,对对象特征信息中各个维度上的对象特征信息进行关联关系识别,得到对象关联特征信息;
对对象关联特征信息进行线性处理,得到线性特征信息;
根据线性特征信息,确定目标对象关于目标业务的深度特征信息。
其中,交叉状态识别模块13包括:
确定单元1301,用于调用交叉状态识别模型的影响度确定层,根据对象特征信息所包含的信息量,确定对象特征信息的影响度;
交叉状态识别单元1302,用于调用交叉状态识别模型的状态识别层,根据影响度和对象特征信息对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
其中,交叉状态识别单元1302具体用于:
调用交叉状态识别模型的状态识别层,根据影响度确定对象特征信息的加权参数;
根据加权参数对对象特征信息进行加权处理,得到加权处理后的对象特征信息;
对加权处理后的对象特征信息和对象特征信息进行特征交叉组合,得到交叉组合特征信息;
对交叉组合特征信息进行状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。
其中,组合状态识别模块15包括:
获取单元1501,用于调用组合状态识别模型的权重预测层,获取目标融合特征信息中任意两个维度的特征信息之间的组合权重;
特征组合单元1502,用于调用组合状态识别模型的特征组合层,基于组合权重,对目标融合特征信息中任意两个维度的特征信息进行特征组合,得到特征组合后的目标融合特征信息;
组合状态识别单元1503,用于调用组合状态识别模型的状态识别层,对特征组合后的目标融合特征信息进行状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
其中,状态识别装置还包括:
第二获取模块16,用于获取样本对象关于目标业务的样本对象特征信息以及样本对象关于目标业务的目标处理状态信息标签;
第一调用模块17,用于调用线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态识别,得到用于反映样本对象关于目标业务的第一识别处理状态信息;
第二调用模块18,用于调用交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态识别,得到用于反映样本对象关于目标业务的第二识别处理状态信息;
第三调用模块19,用于调用初始组合状态识别模型,对样本对象特征信息、第一识别处理状态信息以及第二识别处理状态信息进行融合,得到目标样本融合特征信息,根据目标样本融合特征信息,对样本对象进行组合状态预测,得到用于反映样本对象关于目标业务的预测目标处理状态信息;
第一调整模块20,用于根据目标处理状态信息标签和预测目标处理状态信息,对初始组合状态识别模型进行调整,得到组合状态识别模型;组合状态识别模型用于根据目标对象的对象特征信息确定用于反映目标对象关于目标业务的目标处理状态信息。
其中,第一调整模块20,用于根据目标处理状态信息标签和预测目标处理状态信息,确定初始组合状态识别模型的组合状态预测误差;若所述组合状态预测误差未处于收敛状态,根据所述组合状态预测误差对所述初始组合状态识别模型进行调整;将调整后的初始组合状态识别模型确定为组合状态识别模型。
其中,状态识别装置还包括:
第四调用模块21,用于调用初始线性状态识别模型,根据样本对象特征信息对样本对象进行线性状态预测,得到用于反映样本对象关于目标业务的第一预测处理状态信息;
第二调整模块22,用于根据目标处理状态信息标签和第一预测处理状态信息,确定第一损失函数,根据第一损失函数对初始线性状态识别模型进行参数调整,得到线性状态识别模型;线性状态识别模型用于对对象进行线性状态预测,得到对象关于业务的第一处理状态信息。
其中,第二调整模块用于根据所述目标处理状态信息标签和所述第一预测处理状态信息,确定所述初始线性状态识别模型的线性状态预测误差;若所述线性状态预测误差未处于收敛状态,根据所述线性状态预测误差对所述初始线性状态识别模型进行调整;将调整后的初始线性状态识别模型确定为线性状态识别模型。
其中,状态识别装置还包括:
第五调用模块23,用于调用初始交叉状态识别模型,根据样本对象特征信息所包含的信息量和样本对象特征信息,对样本对象进行交叉状态预测,得到用于反映样本对象关于目标业务的第二预测处理状态信息;
第三调整模块24,用于根据目标处理状态信息标签和第二预测处理状态信息,确定第二损失函数,根据第二损失函数对初始交叉状态识别模型进行参数调整,得到交叉状态识别模型;交叉状态识别模型用于对对象进行交叉状态预测,得到对象关于业务的第二处理状态信息。
其中,第三调整模块,用于根据所述目标处理状态信息标签和所述第二预测处理状态信息,确定所述初始交叉状态识别模型的交叉状态预测误差;若所述交叉状态预测误差未处于收敛状态,根据所述交叉状态预测误差对所述初始交叉状态识别模型进行调整;用于将调整后的初始交叉状态识别模型确定为交叉状态识别模型。
可选的,所述获取模块获取样本对象关于目标业务的样本对象特征信息,包括:
获取样本对象关于目标业务的初始样本对象特征信息,基于异常检测准则,对所述初始样本对象特征信息进行过滤处理,得到第一候选对象特征信息;
对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息;
调用特征向量转换模型,对所述第二候选对象特征信息进行向量转换,得到向量转换后的第二候选对象特征信息,将所述向量转换后的第二候选对象特征信息,确定为所述样本对象关于目标业务的样本对象特征信息。
可选的,所述获取模块对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息,包括:
获取所述第一候选对象特征信息的特征类型;
根据所述特征类型,从编码方式集合中确定用于对所述第一候选对象特征信息进行特征编码的目标编码方式;
采用所述目标编码方式,对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息。
根据本申请的一个实施例,图3所示的状态识别方法所涉及的步骤可由图14所示的状态识别装置中的各个模块来执行。例如,图3中所示的步骤S101可由图14中的第一获取模块11来执行,图3中所示的步骤S102可由图14中的线性状态识别模块12来执行,图3中所示的步骤S103可由图14中的交叉状态识别模块13来执行,图3中所示的步骤S104可由图14中的融合模块14来执行等等。
根据本申请的一个实施例,图14示的状态识别装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,测试装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
在本申请实施例中,通过根据目标对象的对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息。同时根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息。进一步地,将目标对象的对象特征信息与采用不同状态识别方式得到的状态信息(即第一处理状态信息和第二处理状态信息)进行融合,得到目标融合特征信息,根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。也就是说,根据目标融合特征信息对目标对象关于目标业务的处理状态进行优化识别,得到用于反映目标对象关于目标业务的目标处理状态信息,能够提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。另外,根据线性状态识别和线性状态识别两种不同特征提取方式,对目标对象的对象特征信息进行特征提取,进而得到目标对象在不同角度下的处理状态信息。将该目标对象在不同角度下的第一处理状态信息和第二处理状态信息,与对象特征信息进行融合,进而得到目标对象在多个维度的对象特征信息。通过对目标对象在多个维度的对象特征信息进行组合状态识别,可以提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。另外,通过线性状态识别模型输出目标对象关于目标业务的第一处理状态信息,通过交叉状态识别模型输出目标对象关于目标业务的第二处理状态信息。再通过组合状态识别模型,对线性状态识别模型输入的第一处理状态信息、交叉状态识别模型输出的第二处理状态信息以及对象特征信息进行融合,得到目标对象在多个维度上的目标融合特征信息,根据目标融合特征信息识别出用于反映目标对象关于目标业务的目标处理状态信息,可以提高对用于反映目标对象关于目标业务的目标处理状态信息的识别准确性。
请参见图15,图15是本申请实施例提供的一种计算机设备的结构示意图。如图15所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图15所示,作为一种计算机可读存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。
在图15所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取目标对象关于目标业务的对象特征信息,以及对象特征信息所包含的信息量;
根据对象特征信息对目标对象进行线性状态识别,得到用于反映目标对象关于目标业务的第一处理状态信息;
根据对象特征信息所包含的信息量和对象特征信息,对目标对象进行交叉状态识别,得到用于反映目标对象关于目标业务的第二处理状态信息;
对对象特征信息、第一处理状态信息以及第二处理状态信息进行融合,得到目标融合特征信息;
根据目标融合特征信息,对目标对象进行组合状态识别,得到用于反映目标对象关于目标业务的目标处理状态信息。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3或者图9所对应实施例中对状态识别方法的描述,也可执行前文图14所对应实施例中对状态识别装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的状态识别装置所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图3和图9所对应实施例中对状态识别方法的描述,因此,这里将不再进行赘述。
另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链***。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序可以包括计算机指令,该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器可以执行该计算机指令,使得该计算机设备执行前文图3和图9所对应实施例中对状态识别方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种状态识别方法,其特征在于,包括:
获取目标对象关于目标业务的对象特征信息,以及所述对象特征信息所包含的信息量;
根据所述对象特征信息对所述目标对象进行线性状态识别,得到用于反映所述目标对象关于所述目标业务的第一处理状态信息;
根据所述对象特征信息所包含的信息量和所述对象特征信息,对所述目标对象进行交叉状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息;
对所述对象特征信息、所述第一处理状态信息以及所述第二处理状态信息进行融合,得到目标融合特征信息;
根据所述目标融合特征信息,对所述目标对象进行组合状态识别,得到用于反映所述目标对象关于所述目标业务的目标处理状态信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述对象特征信息对所述目标对象进行线性状态识别,得到用于反映所述目标对象关于所述目标业务的第一处理状态信息,包括:
调用线性状态识别模型的特征提取层,对所述对象特征信息进行深度特征提取,得到所述目标对象关于所述目标业务的深度特征信息;
调用所述线性状态识别模型的状态识别层,根据所述深度特征信息对所述目标对象进行线性状态识别,得到用于反映所述目标对象关于所述目标业务的第一处理状态信息。
3.根据权利要求2所述的方法,其特征在于,所述调用线性状态识别模型的特征提取层,对所述对象特征信息进行深度特征提取,得到所述目标对象关于所述目标业务的深度特征信息,包括:
调用线性状态识别模型的特征提取层,对所述对象特征信息中各个维度上的对象特征信息进行关联关系识别,得到对象关联特征信息;
对所述对象关联特征信息进行线性处理,得到线性特征信息;
根据所述线性特征信息,确定所述目标对象关于所述目标业务的深度特征信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述对象特征信息所包含的信息量和所述对象特征信息,对所述目标对象进行交叉状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息,包括:
调用交叉状态识别模型的影响度确定层,根据所述对象特征信息所包含的信息量,确定所述对象特征信息的影响度;
调用交叉状态识别模型的状态识别层,根据所述影响度和所述对象特征信息对所述目标对象进行交叉状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息。
5.根据权利要求4所述的方法,其特征在于,所述调用交叉状态识别模型的状态识别层,根据所述影响度和所述对象特征信息对所述目标对象进行交叉状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息,包括:
调用所述交叉状态识别模型的状态识别层,根据所述影响度确定所述对象特征信息的加权参数;
根据所述加权参数对所述对象特征信息进行加权处理,得到加权处理后的对象特征信息;
对所述加权处理后的对象特征信息和所述对象特征信息进行特征交叉组合,得到交叉组合特征信息;
对所述交叉组合特征信息进行状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标融合特征信息,对所述目标对象进行组合状态识别,得到用于反映所述目标对象关于所述目标业务的目标处理状态信息,包括:
调用组合状态识别模型的权重预测层,获取所述目标融合特征信息中任意两个维度的特征信息之间的组合权重;
调用所述组合状态识别模型的特征组合层,基于所述组合权重,对所述目标融合特征信息中任意两个维度的特征信息进行特征组合,得到特征组合后的目标融合特征信息;
调用所述组合状态识别模型的状态识别层,对所述特征组合后的目标融合特征信息进行组合状态识别,得到用于反映所述目标对象关于所述目标业务的目标处理状态信息。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
获取样本对象关于目标业务的样本对象特征信息以及所述样本对象关于所述目标业务的目标处理状态信息标签;
调用线性状态识别模型,根据所述样本对象特征信息对所述样本对象进行线性状态识别,得到用于反映所述样本对象关于所述目标业务的第一识别处理状态信息;
调用交叉状态识别模型,根据所述样本对象特征信息所包含的信息量和所述样本对象特征信息,对所述样本对象进行交叉状态识别,得到用于反映所述样本对象关于所述目标业务的第二识别处理状态信息;
调用初始组合状态识别模型,对所述样本对象特征信息、所述第一识别处理状态信息以及所述第二识别处理状态信息进行融合,得到目标样本融合特征信息,根据所述目标样本融合特征信息,对所述样本对象进行组合状态预测,得到用于反映所述样本对象关于所述目标业务的预测目标处理状态信息;
根据所述目标处理状态信息标签和所述预测目标处理状态信息,对所述初始组合状态识别模型进行调整,得到组合状态识别模型;所述组合状态识别模型用于根据目标对象的对象特征信息确定用于反映所述目标对象关于所述目标业务的目标处理状态信息。
8.根据权利要求7所述的方法,其特征在于,所述根据所述目标处理状态信息标签和所述预测目标处理状态信息,对所述初始组合状态识别模型进行调整,得到组合状态识别模型,包括:
根据所述目标处理状态信息标签和所述预测目标处理状态信息,确定所述初始组合状态识别模型的组合状态预测误差;
若所述组合状态预测误差未处于收敛状态,根据所述组合状态预测误差对所述初始组合状态识别模型进行调整;
将调整后的初始组合状态识别模型确定为组合状态识别模型。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
调用初始线性状态识别模型,根据所述样本对象特征信息对所述样本对象进行线性状态预测,得到用于反映所述样本对象关于所述目标业务的第一预测处理状态信息;
根据所述目标处理状态信息标签和所述第一预测处理状态信息,对所述初始线性状态识别模型进行调整,得到线性状态识别模型;所述线性状态识别模型用于对对象进行线性状态预测,得到对象关于业务的第一处理状态信息。
10.根据权利要求9所述的方法,其特征在于,所述根据所述目标处理状态信息标签和所述第一预测处理状态信息,对所述初始线性状态识别模型进行调整,得到线性状态识别模型,包括:
根据所述目标处理状态信息标签和所述第一预测处理状态信息,确定所述初始线性状态识别模型的线性状态预测误差;
若所述线性状态预测误差未处于收敛状态,根据所述线性状态预测误差对所述初始线性状态识别模型进行调整;
将调整后的初始线性状态识别模型确定为线性状态识别模型。
11.根据权利要求7所述的方法,其特征在于,所述方法还包括:
调用初始交叉状态识别模型,根据所述样本对象特征信息所包含的信息量和所述样本对象特征信息,对所述样本对象进行交叉状态预测,得到用于反映所述样本对象关于所述目标业务的第二预测处理状态信息;
根据所述目标处理状态信息标签和所述第二预测处理状态信息,对所述初始交叉状态识别模型进行调整,得到交叉状态识别模型;所述交叉状态识别模型用于对对象进行交叉状态预测,得到对象关于业务的第二处理状态信息。
12.根据权利要求11所述的方法,其特征在于,所述根据所述目标处理状态信息标签和所述第二预测处理状态信息,对所述初始交叉状态识别模型进行调整,得到交叉状态识别模型,包括:
根据所述目标处理状态信息标签和所述第二预测处理状态信息,确定所述初始交叉状态识别模型的交叉状态预测误差;
若所述交叉状态预测误差未处于收敛状态,根据所述交叉状态预测误差对所述初始交叉状态识别模型进行调整;
将调整后的初始交叉状态识别模型确定为交叉状态识别模型。
13.根据权利要求7所述的方法,其特征在于,所述获取样本对象关于目标业务的样本对象特征信息,包括:
获取样本对象关于目标业务的初始样本对象特征信息,基于异常检测准则,对所述初始样本对象特征信息进行过滤处理,得到第一候选对象特征信息;
对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息;
调用特征向量转换模型,对所述第二候选对象特征信息进行向量转换,得到向量转换后的第二候选对象特征信息,将所述向量转换后的第二候选对象特征信息,确定为所述样本对象关于目标业务的样本对象特征信息。
14.根据权利要求13所述的方法,其特征在于,所述对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息,包括:
获取所述第一候选对象特征信息的特征类型;
根据所述特征类型,从编码方式集合中确定用于对所述第一候选对象特征信息进行特征编码的目标编码方式;
采用所述目标编码方式,对所述第一候选对象特征信息进行特征编码,得到第二候选对象特征信息。
15.一种状态识别装置,其特征在于,包括:
第一获取模块,用于获取目标对象关于目标业务的对象特征信息,以及所述对象特征信息所包含的信息量;
线性状态识别模块,用于根据所述对象特征信息对所述目标对象进行线性状态识别,得到用于反映所述目标对象关于所述目标业务的第一处理状态信息;
交叉状态识别模块,用于根据所述对象特征信息所包含的信息量和所述对象特征信息,对所述目标对象进行交叉状态识别,得到用于反映所述目标对象关于所述目标业务的第二处理状态信息;
融合模块,用于对所述对象特征信息、所述第一处理状态信息以及所述第二处理状态信息进行融合,得到目标融合特征信息;
组合状态识别模块,用于根据所述目标融合特征信息,对所述目标对象进行组合状态识别,得到用于反映所述目标对象关于所述目标业务的目标处理状态信息。
CN202210050467.1A 2022-01-17 2022-01-17 一种状态识别方法、装置、存储介质及设备 Pending CN116502173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210050467.1A CN116502173A (zh) 2022-01-17 2022-01-17 一种状态识别方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210050467.1A CN116502173A (zh) 2022-01-17 2022-01-17 一种状态识别方法、装置、存储介质及设备

Publications (1)

Publication Number Publication Date
CN116502173A true CN116502173A (zh) 2023-07-28

Family

ID=87323561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210050467.1A Pending CN116502173A (zh) 2022-01-17 2022-01-17 一种状态识别方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN116502173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118014372A (zh) * 2024-04-08 2024-05-10 吉奥时空信息技术股份有限公司 一种基于一标三实的劳资纠纷预测方法、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118014372A (zh) * 2024-04-08 2024-05-10 吉奥时空信息技术股份有限公司 一种基于一标三实的劳资纠纷预测方法、设备及存储介质
CN118014372B (zh) * 2024-04-08 2024-07-16 吉奥时空信息技术股份有限公司 一种基于一标三实的劳资纠纷预测方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109410036A (zh) 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN111753092B (zh) 一种数据处理方法、模型训练方法、装置及电子设备
CN106447066A (zh) 一种大数据的特征提取方法和装置
CN106445988A (zh) 一种大数据的智能处理方法和***
CN112749608A (zh) 视频审核方法、装置、计算机设备和存储介质
CN112819604A (zh) 基于融合神经网络特征挖掘的个人信用评估方法与***
CN114780831A (zh) 基于Transformer的序列推荐方法及***
CN111597340A (zh) 一种文本分类方法及装置、可读存储介质
CN112463968B (zh) 文本分类方法、装置和电子设备
CN116861258B (zh) 模型处理方法、装置、设备及存储介质
Wu et al. Optimized deep learning framework for water distribution data-driven modeling
CN113011646A (zh) 一种数据处理方法、设备以及可读存储介质
CN113011895A (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
CN114996486A (zh) 一种数据推荐方法、装置、服务器以及存储介质
CN111815485A (zh) 一种基于深度学习bert模型的量刑预测方法和装置
CN116680386A (zh) 基于多轮对话的答案预测方法和装置、设备、存储介质
CN115018190A (zh) 逾期行为预测方法及装置、存储介质及电子设备
CN117217807B (zh) 一种基于多模态高维特征的不良资产估值方法
CN116502173A (zh) 一种状态识别方法、装置、存储介质及设备
CN116821516B (zh) 资源推荐方法、装置、设备及存储介质
CN113850670A (zh) 银行产品推荐方法、装置、设备及存储介质
CN111159397A (zh) 文本分类方法和装置、服务器
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
CN117455518B (zh) 一种欺诈交易检测方法和装置
CN113569557B (zh) 信息的质量识别方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination