CN113963205A - 基于特征融合的分类模型训练方法、装置、设备及介质 - Google Patents

基于特征融合的分类模型训练方法、装置、设备及介质 Download PDF

Info

Publication number
CN113963205A
CN113963205A CN202111222241.7A CN202111222241A CN113963205A CN 113963205 A CN113963205 A CN 113963205A CN 202111222241 A CN202111222241 A CN 202111222241A CN 113963205 A CN113963205 A CN 113963205A
Authority
CN
China
Prior art keywords
target
classification model
behavior
characteristic
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111222241.7A
Other languages
English (en)
Inventor
刘慧芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202111222241.7A priority Critical patent/CN113963205A/zh
Publication of CN113963205A publication Critical patent/CN113963205A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,尤其涉及一种基于特征融合的分类模型训练方法、装置、设备及介质。该基于特征融合的分类模型训练方法包括获取目标客户的静态特征以及根据全量历史行为数据提取的动态特征;基于当前时间与每一目标触发行为的触发时间,获取目标触发行为的间隔时间特征;对间隔时间特征以及动态特征进行特征融合,得到目标触发行为的融合特征;基于静态特征以及目标触发行为的融合特征,构建目标客户的客户画像特征;将多个客户画像特征作为目标样本集,以基于目标样本集训练原始客群分类模型,得到目标客群分类模型。该方法可在保证采用全量历史行为数据进行客户分析,即保留行为数据的全局分布特性的同时提高客群分类的准确率。

Description

基于特征融合的分类模型训练方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于特征融合的分类模型训练方法、装置、设备及介质。
背景技术
随着人工智能技术的飞速发展,各种用于客户服务的***及平台也逐步开始投入使用。在客户服务领域中,为了提升客户体验,企业或机构一般会基于人工智能技术对客户群进行分类,以预测客户近期对于某类信息的关注度,从而针对性推荐相关服务。
目前,传统的客群分类方法一般是直接采集用户的静态数据(例如用户所属行业、用户年龄、用户性别等)以及历史行为数据作为样本数据构建分类模型进行分类,但由于历史行为数据中某些行为的触发时间距离当前时间的间隔时间长短可能会影响到用户近期对某类信息关注度的预测准确性,而为解决该问题,一般是仅采集用户最近一段时间的数据进行分类,但该种方法只能利用用户最近一段时间的数据,而无法保留历史行为数据的全局分布特性,且不同的客户在该段时间内的数据量不同,故容易造成样本分布不均衡,使得模型分类准确率不高。
发明内容
本发明实施例提供一种基于特征融合的分类模型训练方法、装置、设备及介质,以解决目前客群分类模型在使用全量历史行为数据进行训练时,模型分类准确率不高的问题。
一种基于特征融合的分类模型训练方法,包括:
获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,所述历史行为数据包括多种目标触发行为,所述动态特征为每一所述目标触发行为的行为特征表示;
基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征;
对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征;
基于所述静态特征以及每一所述目标触发行为的融合特征,构建每一所述目标客户的客户画像特征;
将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
一种基于特征融合的分类模型训练装置,包括:
数据获取模块,用于获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,所述历史行为数据包括多种目标触发行为,所述动态特征为每一所述目标触发行为的行为特征表示;
间隔时间特征获取模块,用于基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征;
融合模块,用于对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征;
客户画像特征构建模块,用于基于所述静态特征以及每一所述目标触发行为的融合特征,构建每一所述目标客户的客户画像特征;
训练模块,用于将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于特征融合的分类模型训练方法的步骤。
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于特征融合的分类模型训练方法的步骤。
上述基于特征融合的分类模型训练方法、装置、设备及介质中,通过获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征,以在目标客户全量的历史行为数据的基础上从全局角度进行客群分类。然后,基于当前时间与每一目标触发行为的触发时间的间隔时间,获取每一目标触发行为的间隔时间特征,以对每一目标触发行为的间隔时间特征以及动态特征进行特征融合,得到每一目标触发行为的融合特征,以便将目标触发行为的间隔时间特征信息与行为特征融合,使模型可学习到时间特征对客群分类的影响。接着,基于静态特征以及每一目标触发行为的融合特征,构建每一目标客户的客户画像特征,以将多个目标客户的客户画像特征作为目标样本集,以基于目标样本集对原始客群分类模型进行训练,得到目标客群分类模型,以通过将携带时间维度特征客户画像特征作为样本进行训练,可实现在使用全量历史行为数据进行客群分类的同时保证客群分类的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于特征融合的分类模型训练方法的一应用环境示意图;
图2是本发明一实施例中基于特征融合的分类模型训练方法的一流程图;
图3是图2中步骤S202的一具体流程图;
图4是图2中步骤S203的一具体流程图;
图5是本发明一实施例中基于特征融合的分类模型训练方法的一流程图;
图6是图5中步骤S501的一具体流程图;
图7是图6中步骤S602的一具体流程图;
图8是是本发明一实施例中基于特征融合的分类模型训练方法的一流程图;
图9是本发明一实施例中基于特征融合的分类模型训练装置的一示意图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该基于特征融合的分类模型训练方法可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一实施例中,如图2所示,提供一种基于特征融合的分类模型训练方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S201:获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,历史行为数据包括多种目标触发行为,动态特征为每一目标触发行为的行为特征表示。
具体地,本方法可应用在任意客群分类场景下,以根据客户的静态特征以及行为特征进行客群分类,以预测不同客户对应某些信息的关注度,以针对性不同客户展示对应的前端页面。
其中,静态特征是指客户的静态信息对应的向量表示。静态信息是指目标客户的固有属性信息,例如客户所属行业、年龄、性别、所属地区以及用户学历等。历史行为数据是指客户在平台中当前时间之前的全量历史行为数据。该历史行为数据包括多个目标触发行为,例如服务触发行为(即用户使用过的服务),资询触发行为(即浏览过的资讯),话题评论触发行为(即参与的话题评论)以及培训触发行为(即参与过的培训)等。动态特征是指目标触发行为对应的向量表示,每种目标触发行为作为一特征维度,例如动态特征的结构如下表所示(以4个客户样本对应的动态特征进行举例):
Figure 1
表中,服务触发行为可包括多个服务类别,即A、B、C、D,资询触发行为可包括多个资询类别即E、F、G、H,话题评论触发行为可包括多个话题类别即M、N、P、Q,培训触发行为可包括多个培训类别即X、Y、Z、W,其中,对于客户样本1中,在服务触发行为中的B类服务的动态特征“1”,表示该客户在过去使用过B类服务,“0”表示未浏览/未参与。同理,在话题评论触发行为中的N类服话题的动态特征“1”,表示该客户在过去参与过N类话题评论。
S202:基于当前时间与每一目标触发行为的触发时间,获取每一目标触发行为的间隔时间特征。
可以理解地是,传统的客群分类仅针对客户近期的历史行为数据进行分类,而不同的客户在近期的历史行为数据量不同,会导致样本分布均衡的问题,而采用全量的历史行为数据可使样本保留历史行为的分布特性,但若采用全量的历史行为数据使当前的客群分类仅通过某些触发行为的频次等进行特征提取,但忽略了触发行为的触发时间对于预测目标的影响,进而导致客群分类准确性不高的问题。
其中,对于不同的目标触发行为会对应一触发时间,而该触发时间与当前时间的间隔时间长短会影响客户对于不同信息的关注程度,故本实施例中通过在模型样本中引入每一目标触发行为的间隔时间特征进行训练,可实现在全局角度进行客群分类的同时,提高模型准确率。
具体地,通过每一所述目标触发行为的触发时间与当前时间的间隔时间作为每一所述目标触发行为的间隔时间特征。其中,当前时间指当前***时间,即为当前进行模型训练时的日期,如2021-9-15。
S203:对每一目标触发行为的间隔时间特征以及动态特征进行特征融合,得到每一目标触发行为的融合特征。
本实施例中,对每一目标触发行为的间隔时间特征以及动态特征的实现方式包括但不限于如下两种:一是通过将所述时间特征与所述动态特征进行相加处理,以得到所述融合特征;二是,对所述时间特征与所述动态特征进行拼接,以得到所述融合特征。
S204:基于静态特征以及每一目标触发行为的融合特征,构建每一目标客户的客户画像特征。
具体地,通过将每一目标触发行为的融合特征以及静态特征进行简单拼接,以得到构建所述目标客户对应的客户画像特征。例如,静态特征为1*N 的向量,每一目标触发行为(假设有C个目标触发行为)的融合特征为1*M 的向量,先将多个目标触发行为的融合特征拼接得到1*(M+C),然后拼接得到的向量1*(M+C)与静态特征拼接,得到每一目标客户的客户画像特征即为1* (M+N+C)的向量。
S205:将多个目标客户的客户画像特征作为目标样本集,以基于目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
具体地,将多个目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,以得到目标客群分类模型。本实施例中由于目标样本集为时序性数据,故在得到目标样本集后,可基于LSTM 网络构建原始客群分类模型,以基于目标样本集训练原始客群分类模型得到目标客群分类模型。其中,LSTM网络是一种门限RNN,LSTM网络的巧妙之处是通过增加输入门,遗忘门和输出门,设计连接间的权重系数,使得LSTM网络能够累积距离较远节点间的长期联系,实现对数据的长期记忆性。需要说明的是,对于LSTM网络进行模型训练过程与传统的LSTM网络进行模型训练的过程一致,此处不再详述。
本实施例中,通过获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征,以在目标客户全量的历史行为数据的基础上从全局角度进行客群分类。然后,基于当前时间与每一目标触发行为的触发时间的间隔时间,获取每一目标触发行为的间隔时间特征,以对每一目标触发行为的间隔时间特征以及动态特征进行特征融合,得到每一目标触发行为的融合特征,以便将目标触发行为的间隔时间特征信息与行为特征融合,使模型可学习到时间特征对客群分类的影响。接着,基于静态特征以及每一目标触发行为的融合特征,构建每一目标客户的客户画像特征,以将多个目标客户的客户画像特征作为目标样本集,以基于目标样本集对原始客群分类模型进行训练,得到目标客群分类模型,以通过将携带时间信息的客户画像特征作为样本进行训练,可实现在使用全量历史行为数据进行客群分类的同时保证客群分类的准确性。
在一实施例中,如图3所示,步骤S202中,即基于当前时间与每一目标触发行为的触发时间,获取每一目标触发行为的间隔时间特征,具体包括如下步骤:
S301:计算每一目标触发行为的触发时间与当前时间的间隔时间。
S302:对间隔时间进行离散化处理,得到每一目标触发行为的间隔时间特征。
具体地,可将时间区间划分为多个数域,例如[1-30天)、[30-60天) 等等。每一数域可采用预设的标准值表示,对计算得到的间隔时间确定对应的数域,然后采用该数域对应的标准值作为目标触发行为的间隔时间特征。
可以理解地是,对于间隔时间类似的客户样本来说,间隔时间所反映的时间特征对预测结果的影响不大,故本实施例中可将间隔时间进行离散化处理,得到每一所述目标触发行为的间隔时间特征,从而减少后续模型的数据处理量,提高模型训练效率。
在一实施例中,如图4所示,步骤S203中,即对每一目标触发行为的间隔时间特征以及动态特征进行特征融合,得到每一目标触发行为的融合特征,具体包括如下步骤:
S401:对间隔时间特征与动态特征进行相加处理,以得到融合特征。
具体地,可将该间隔时间特征X1与动态特征X2进行向量相加即按位相加处理,得到所述融合特征,即X1+X2。
S402:对间隔时间特征与动态特征进行拼接,得到目标触发行为的融合特征。
具体地,还可将间隔时间特征与动态特征进行拼接,得到融合特征,例如时间特征为1*P的行向量,融合特征为1*Q的行向量,拼接后得到客户画像特征即为1*(P+Q)的向量。
在一实施例中,如图5所示,该基于特征融合的分类模型训练方法还包括如下步骤:
S501:采用K-means聚类算法对目标样本集进行聚类分析,得到多个聚类簇;其中,每一聚类簇用于指示一客户类别。
S502:基于客户类别对每一聚类簇中的目标样本进行标注,以分别从每一聚类簇中随机选取至少一个标注后的目标样本组成训练样本集。
其中,kmeans聚类算法也称k均值聚类算法,是集简单和经典于一身的基于距离的聚类算法,它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的聚类簇作为最终目标。
可以理解地,通过采用kmeans聚类算法对目标样本数据进行聚类分析,以通过无监督学习方式对目标客户进行客户类别的标注,可而解决大大减少人工标注的成本。于本是实施例中,该客户类别可指不同的话题、服务、资询、培训等类别,表示客户对某种类别信息具有较高的关注度。
S503:基于训练样本集训练原始客群分类模型,得到目标客群分类模型。
具体地,由于目标样本集中的某些目标样本的相似性较高,不利于模型对于样本区分度的学习,故本实施例中通过对目标样本集中进行聚类分析,得到均匀的样本分布,然后再从每一聚类簇中随机选取标注后的至少一个目标样本组成训练样本集进行模型训练,加大不同样本之间的差异性,实现对样本数据的数据增强,进而提高分类模型的鲁棒性。
示例性地,假设聚类得到三个聚类簇即A、B、C,分别从A、B、C中随机选取至少一个目标样本,即从A中随机选取至少一个目标样本、从B中随机选取至少一个目标样本、从C中随机选取至少一个目标样本,以将选取得到的多个目标样本组成训练样本集。
在一实施例中,如图6所示,该基于特征融合的分类模型训练方法还包括如下步骤:
S601:初始化聚类簇数量,并从目标样本集中随机选取聚类簇数量个目标样本作为初始质心;其中,聚类簇数量用于指示初始质心的数量;
其中,聚类簇的数量指初始质心的数量或者客户类别的数量,本实施例中K值设定可根据实际需要设置,此处不做限定。具体地,可从目标样本集中随机选取k个目标样本作为初始质心。
S602:计算每一聚类簇的初始质心与目标样本集中每一目标样本之间的样本距离,以将样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中。
具体地,可通过包括但不限于欧式距离或余弦相似度算法计算每一聚类簇的初始质心目标样本集中每一目标样本之间的样本距离,以将样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中。其中,样本距离可通过欧式距离或余弦相似度表征。预设聚类条件可为预设的距离阈值或相似度阈值,此处不做限定。
S603:更新每一聚类簇的质心,以根据更新后的质心对目标样本集进行聚类分析,得到多个聚类簇。
具体地,更新每一聚类簇的质心,并重复执行步骤S602-S603,不断迭代聚类,直到聚类簇对应的更新后的质心与更新前的质心之间的距离小于预设距离(可为预先设定的算法停止条件),以得到多个聚类簇。
其中,余弦相似度的计算公式为
Figure BDA0003313025140000111
其中,a表示初始质心(或更新后的质心);b表示目标样本数据。具体地,余弦值取值范围为 [-1,1],余弦值越接近1,则两向量夹角越小,越相似。
在一实施例中,如图7所示,步骤S602中,即计算每一聚类簇的初始质心与目标样本集中每一目标样本之间的样本距离,以将样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中,具体包括如下步骤:
S701:基于初始质心以及目标样本计算平均值向量。
具体地,由于余弦相似度更多的是从方向上区分差异,而对绝对的数值不敏感,故无法衡量每个维度间的特征差异,例如:某假设X和Y这两个样本分别为(1,2)和(4,5),采用余弦相似度所得出的结果是0.98,两者极为相似,但从对于第一维度中,X样本对应的特征值“1”与Y样本中的特征值“4”差异较大,因此余弦相似度对于数值的不敏感导致相似度计算结果的误差,故为修正余弦相似度计算结果的不合理性,本实施例中通过对参与计算的样本分别进行归一化处理,提高数据精度,以修正余弦相似度对于数值的不敏感性。
其中,基于初始质心以及所述目标样本数据计算平均值向量,即在初始质心与目标样本数据的所有特征维度中进行取均值,以得到平均值向量,例如,初始质心和目标样本数据分别为(1,2)和(4,5),平均值向量即为(1+4/2, 2+5/2)。
S702:基于平均值向量,对初始质心以及目标样本集进行归一化处理,以更新初始质心以及目标样本集。
S703:计算更新后的初始质心以及目标样本集中每一目标样本之间的余弦相似度,以将余弦相似度满足预设聚类条件的目标样本聚集在同一聚类簇中。
本实施例中,通过对参与计算的样本分别进行归一化处理,即对于每个样本均减去平均值向量,例如X和Y这两个样本分别为(1,2)和(4,5),X和Y 的平均值向量为(2.5,3.5),更新后的调整后初始质心与目标样本数据分别为(-1.5,-1.5)和(1.5,2.5),再基于更新后的初始质心与目标样本数据进行余弦相似度计算得到样本距离为-0.98,相似度为负值且差异较大,可有效修正余弦相似度对于绝对数值的不敏感性所带来的误差。
在一实施例中,如图8所示,该基于特征融合的分类模型训练方法还包括如下步骤:
S801:基于每一聚类簇中的多个目标样本,计算每一聚类簇的协防差矩阵。
可以理解地是,通过将每一聚类簇中多个目标样本数据组成的样本矩阵X 转换为零均值矩阵,然后通过将零均值矩阵与零均值矩阵的转置计算对应的协方差矩阵。其中,协方差矩阵的计算公式为,
Figure BDA0003313025140000131
其中,C表示协方差矩阵,X表示目标样本数据,m表示客户画像特征中特征因子的数量。
S802:对协防差矩阵进行矩阵分解,得到至少一个特征值。
具体地,可通过对协方差矩阵进行SVD矩阵分解,得到特征值以及对应的特征向量。其中,奇异值分解(Singular Value Decomposition,简称SVD 分解)是线性代数中一种重要的矩阵分解,该矩阵分解运算处理能够有效对大批量数据进行降维,以减少运算量,节省运算时间。
具体地,通过对协方差矩阵进行矩阵分解会得到两个酉矩阵和一个半正定对角矩阵,半正定对角矩阵对角线上的值即为特征值,特征值一般含有N(N 大于2)个。该特征值可表征样本矩阵中隐含的重要信息,且重要性和特征值大小正相关。
可以理解地是,特征值越大,则该特征值包含的有效信息量越大;反之,特征值越小,则该特征值包含的有效信息量越少,认定包含越多的噪声。通过对协方差矩阵进行矩阵分解,获取特征值以及对应的特征向量,能够直观的观察出特征值中所包含的有效信息量的程度,便于对样本进行降噪处理,减少后续模型训练数据量,进而提高模型训练效率。
S803:基于至少一个特征值,对聚类簇中的目标样本进行降维,以更新每一聚类簇。
具体地,将特征向量按照特征值从大到小,从上到下排列成矩阵,然后将特征值排在前N位或大于预设阈值的特征向量保留,以过滤掉包括有效信息较少的特征因子,从而实现对每一类簇中的目标样本进行降维。
示例性地,假设目前经过奇异值分解得到2个特征值,如4,0,每一特特征值对应的特征向量分别
Figure BDA0003313025140000142
将特征向量按照特征值从大到小,从上到下排列成矩阵即为
Figure BDA0003313025140000141
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于特征融合的分类模型训练装置,该基于特征融合的分类模型训练装置与上述实施例中基于特征融合的分类模型训练方法一一对应。如图9所示,该基于特征融合的分类模型训练装置包括数据获取模块10、间隔时间特征获取模块20、融合模块30、客户画像特征构建模块 40以及训练模块50。各功能模块详细说明如下:
数据获取模块10,用于获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,所述历史行为数据包括多种目标触发行为,所述动态特征为每一所述目标触发行为的行为特征表示;
间隔时间特征获取模块20,用于基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征;
融合模块30,用于对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征;
客户画像特征构建模块40,用于基于所述静态特征以及每一所述目标触发行为的融合特征,构建每一所述目标客户的客户画像特征;
训练模块50,用于将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
具体地,间隔时间特征获取模块包括间隔时间获取单元以及时间特征获取单元。
间隔时间获取单元,用于计算每一所述目标触发行为的触发时间与当前时间的间隔时间;
时间特征获取单元,用于对所述间隔时间进行离散化处理,得到每一所述目标触发行为的间隔时间特征。
具体地,融合模块包括第一融合单元以及第二融合单元。
第一融合单元,用于对所述间隔时间特征与所述动态特征进行相加处理,以得到所述融合特征;
第二融合单元,用于对所述间隔时间特征与所述动态特征进行拼接,得到所述目标触发行为的融合特征。
具体地,该基于特征融合的分类模型训练装置还包括聚类模块、样本标注模块以及训练模块。
聚类模块,用于采用K-means聚类算法对所述目标样本集进行聚类分析,得到多个聚类簇;其中,每一所述聚类簇用于指示一客户类别;
样本标注模块,用于基于所述客户类别对每一所述聚类簇中的目标样本进行标注,以分别从每一聚类簇中随机选取至少一个标注后的目标样本组成训练样本集。
训练模块,用于基于所述训练样本集训练所述原始客群分类模型,得到所述目标客群分类模型。
具体地,聚类模块包括初始化单元、聚类单元以及迭代单元。
初始化单元,用于初始化聚类簇数量,并从目标样本集中随机选取聚类簇数量个目标样本作为初始质心;其中,所述聚类簇数量用于指示所述初始质心的数量;
聚类单元,用于计算每一聚类簇的初始质心与所述目标样本集中每一目标样本之间的样本距离,以将所述样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中;
迭代单元,用于更新每一所述聚类簇的质心,以根据更新后的质心对所述目标样本集进行聚类分析,得到多个聚类簇。
具体地,聚类单元包括平均值向量计算子单元、归一化处理单元以及聚类子单元。
平均值向量计算子单元,用于基于所述初始质心以及所述目标样本计算平均值向量;
归一化处理单元,用于基于所述平均值向量,对所述初始质心以及所述目标样本集进行归一化处理,以更新所述初始质心以及所述目标样本集;
聚类子单元,用于计算归一化后的初始质心以及所述目标样本集中每一目标样本之间的余弦相似度,以将所述余弦相似度满足所述预设聚类条件的目标样本聚集在同一聚类簇中。
具体地,该基于特征融合的分类模型训练装置还包括协方差矩阵计算模块、矩阵分解模块以及样本降维模块。
协方差矩阵计算模块,用于基于每一所述聚类簇中的多个目标样本,计算每一聚类簇的协防差矩阵;
矩阵分解模块,用于对所述协防差矩阵进行矩阵分解,得到至少一个特征值;
样本降维模块,用于基于至少一个所述特征值,对所述聚类簇中的目标样本进行降维,以更新每一所述聚类簇。
关于基于特征融合的分类模型训练装置的具体限定可以参见上文中对于基于特征融合的分类模型训练方法的限定,在此不再赘述。上述基于特征融合的分类模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括计算机存储介质、内存储器。该计算机存储介质存储有操作***、计算机程序和数据库。该内存储器为计算机存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行基于特征融合的分类模型训练方法过程中生成或获取的数据,如历史行为数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于特征融合的分类模型训练方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的基于特征融合的分类模型训练方法的步骤,例如图2所示的步骤S201-S205,或者图3至图8中所示的步骤。或者,处理器执行计算机程序时实现基于特征融合的分类模型训练装置这一实施例中的各模块/单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
在一实施例中,提供一计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中基于特征融合的分类模型训练方法的步骤,例如图2所示的步骤S201-S205,或者图3至图8 中所示的步骤,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述基于特征融合的分类模型训练装置这一实施例中的各模块/ 单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM (RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于特征融合的分类模型训练方法,其特征在于,包括:
获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,所述历史行为数据包括多种目标触发行为,所述动态特征为每一所述目标触发行为的行为特征表示;
基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征;
对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征;
基于所述静态特征以及每一所述目标触发行为的融合特征,构建每一所述目标客户的客户画像特征;
将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
2.如权利要求1所述基于特征融合的分类模型训练方法,其特征在于,所述基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征,包括:
计算每一所述目标触发行为的触发时间与当前时间的间隔时间;
对所述间隔时间进行离散化处理,得到每一所述目标触发行为的间隔时间特征。
3.如权利要求1所述基于特征融合的分类模型训练方法,其特征在于,所述对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征,包括:
对所述间隔时间特征与所述动态特征进行相加处理,以得到所述融合特征;或者,
对所述间隔时间特征与所述动态特征进行拼接,得到所述目标触发行为的融合特征。
4.如权利要求1所述基于特征融合的分类模型训练方法,其特征在于,在所述将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型之前,所述基于特征融合的分类模型训练方法还包括:
采用K-means聚类算法对所述目标样本集进行聚类分析,得到多个聚类簇;其中,每一所述聚类簇用于指示一客户类别;
基于所述客户类别对每一所述聚类簇中的目标样本进行标注,以分别从每一所述聚类簇中随机选取至少一个标注后的目标样本组成训练样本集;
所述基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型,包括:
基于所述训练样本集训练所述原始客群分类模型,得到所述目标客群分类模型。
5.如权利要求4所述基于特征融合的分类模型训练方法,其特征在于,所述采用K-means聚类算法对所述目标样本集进行聚类分析,得到多个聚类簇,包括:
初始化聚类簇数量,并从所述目标样本集中随机选取聚类簇数量个目标样本作为初始质心;
计算每一聚类簇的初始质心与所述目标样本集中每一目标样本之间的样本距离,以将所述样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中;
更新每一所述聚类簇的质心,以根据更新后的质心对所述目标样本集进行聚类分析,得到多个聚类簇。
6.如权利要求5所述基于特征融合的分类模型训练方法,其特征在于,所述计算每一聚类簇的初始质心与所述目标样本集中每一目标样本之间的样本距离,以将所述样本距离满足预设聚类条件的目标样本聚集在同一聚类簇中,包括:
基于所述初始质心以及所述目标样本计算平均值向量;
基于所述平均值向量,对所述初始质心以及所述目标样本集进行归一化处理,以更新所述初始质心以及所述目标样本集;
计算归一化后的初始质心以及所述目标样本集中每一目标样本之间的余弦相似度,以将所述余弦相似度满足所述预设聚类条件的目标样本聚集在同一聚类簇中。
7.如权利要求4所述基于特征融合的分类模型训练方法,其特征在于,在所述采用K-means聚类算法对所述目标样本集进行聚类分析,得到多个聚类簇之后,所述基于特征融合的分类模型训练方法还包括:
基于每一所述聚类簇中的多个目标样本,计算每一聚类簇的协防差矩阵;
对所述协防差矩阵进行矩阵分解,得到至少一个特征值;
基于至少一个所述特征值,对所述聚类簇中的目标样本进行降维,以更新每一所述聚类簇。
8.一种基于特征融合的分类模型训练装置,其特征在于,包括:
数据获取模块,用于获取每一目标客户的静态特征以及根据全量的历史行为数据提取得到的动态特征;其中,所述历史行为数据包括多种目标触发行为,所述动态特征为每一所述目标触发行为的行为特征表示;
间隔时间特征获取模块,用于基于当前时间与每一所述目标触发行为的触发时间,获取每一所述目标触发行为的间隔时间特征;
融合模块,用于对每一所述目标触发行为的间隔时间特征以及所述动态特征进行特征融合,得到每一所述目标触发行为的融合特征;
客户画像特征构建模块,用于基于所述静态特征以及每一所述目标触发行为的融合特征,构建每一所述目标客户的客户画像特征;
训练模块,用于将多个所述目标客户的客户画像特征作为目标样本集,以基于所述目标样本集对原始客群分类模型进行训练,得到目标客群分类模型。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于特征融合的分类模型训练方法的步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于特征融合的分类模型训练方法的步骤。
CN202111222241.7A 2021-10-20 2021-10-20 基于特征融合的分类模型训练方法、装置、设备及介质 Pending CN113963205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111222241.7A CN113963205A (zh) 2021-10-20 2021-10-20 基于特征融合的分类模型训练方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111222241.7A CN113963205A (zh) 2021-10-20 2021-10-20 基于特征融合的分类模型训练方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113963205A true CN113963205A (zh) 2022-01-21

Family

ID=79464935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111222241.7A Pending CN113963205A (zh) 2021-10-20 2021-10-20 基于特征融合的分类模型训练方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113963205A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538020A (zh) * 2021-07-05 2021-10-22 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置
CN116402113A (zh) * 2023-06-08 2023-07-07 之江实验室 一种任务执行的方法、装置、存储介质及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538020A (zh) * 2021-07-05 2021-10-22 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置
CN113538020B (zh) * 2021-07-05 2024-03-26 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置
CN116402113A (zh) * 2023-06-08 2023-07-07 之江实验室 一种任务执行的方法、装置、存储介质及电子设备
CN116402113B (zh) * 2023-06-08 2023-10-03 之江实验室 一种任务执行的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN108536800B (zh) 文本分类方法、***、计算机设备和存储介质
CN109800307B (zh) 产品评价的分析方法、装置、计算机设备及存储介质
CN113705772A (zh) 一种模型训练方法、装置、设备及可读存储介质
CN108520041B (zh) 文本的行业分类方法、***、计算机设备和存储介质
CN110135681B (zh) 风险用户识别方法、装置、可读存储介质及终端设备
CN113222139B (zh) 神经网络训练方法和装置、设备,及计算机存储介质
CN113963205A (zh) 基于特征融合的分类模型训练方法、装置、设备及介质
CN111831826B (zh) 跨领域的文本分类模型的训练方法、分类方法以及装置
CN109726391B (zh) 对文本进行情感分类的方法、装置及终端
US20230103635A1 (en) Interaction information determining method, interaction information prediction model training method, device, and medium
CN113435912A (zh) 基于客户画像的数据分析方法、装置、设备及介质
CN112380344A (zh) 文本分类的方法、话题生成的方法、装置、设备及介质
CN110162939B (zh) 人机识别方法、设备和介质
CN114266897A (zh) 痘痘类别的预测方法、装置、电子设备及存储介质
CN115238909A (zh) 一种基于联邦学习的数据价值评估方法及其相关设备
CN113239697B (zh) 实体识别模型训练方法、装置、计算机设备及存储介质
Rudner et al. On the connection between neural processes and gaussian processes with deep kernels
CN111209929A (zh) 访问数据处理方法、装置、计算机设备及存储介质
CN118043802A (zh) 一种推荐模型训练方法及装置
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
Huang et al. Efficient optimization for linear dynamical systems with applications to clustering and sparse coding
CN116776150A (zh) 接口异常访问识别方法、装置、计算机设备及存储介质
CN116680401A (zh) 文档处理方法、文档处理装置、设备及存储介质
US20230092949A1 (en) System and method for estimating model metrics without labels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination