CN112801718A - 用户行为预测方法、装置、设备及介质 - Google Patents

用户行为预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN112801718A
CN112801718A CN202110199787.9A CN202110199787A CN112801718A CN 112801718 A CN112801718 A CN 112801718A CN 202110199787 A CN202110199787 A CN 202110199787A CN 112801718 A CN112801718 A CN 112801718A
Authority
CN
China
Prior art keywords
data set
target
behavior prediction
user behavior
domain data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110199787.9A
Other languages
English (en)
Other versions
CN112801718B (zh
Inventor
于佳玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110199787.9A priority Critical patent/CN112801718B/zh
Publication of CN112801718A publication Critical patent/CN112801718A/zh
Application granted granted Critical
Publication of CN112801718B publication Critical patent/CN112801718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能领域,提供一种用户行为预测方法、装置、设备及介质,能够初始化源域数据集及目标域数据集的权重,得到初始权重,使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。此外,本发明还涉及区块链技术,目标分类器可存储于区块链节点中。

Description

用户行为预测方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种用户行为预测方法、装置、设备及介质。
背景技术
客户购买行为预测能够指导企业进行精准营销,例如:在寿险等场景下,当有新寿险产品、新地区销售产品推出或者项目重启等情况时,将导致缺乏样本或样本老旧,此时,如果需要预测客户未来购买行为以提供营销支持,会面临从0到1建立业务模型的问题,但是,模型的建立需要一定的数据积累,缺乏数据是一个较大的阻碍。
针对上述情况,通常的解决方式是根据经验进行一些策略的构建,或等待数据的积累,或直接使用类似场景下的已有模型对客户的购买行为进行预测。
但是,上述方式会对业务策略的时效性和精准性有所影响,例如:当采用等待数据积累的方式时,由于数据的积累需要一定的时间,将影响时效性;当直接使用类似场景下的已有模型对客户的购买行为进行预测时,由于不同场景间的数据是存在一定差异的,因此将影响预测的准确性。
发明内容
鉴于以上内容,有必要提供一种用户行为预测方法、装置、设备及介质,能够基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
一种用户行为预测方法,所述用户行为预测方法包括:
响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域;
获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;
初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;
根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;
获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;
获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
根据本发明优选实施例,所述根据所述用户行为预测指令确定源域及目标域包括:
解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;
获取第一预设标签及第二预设标签;
根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;
利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;
利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;
根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域。
根据本发明优选实施例,所述初始权重的公式如下:
Figure BDA0002947711960000031
其中,
Figure BDA0002947711960000032
表示第i个样本的初始权重取值,n表示所述源域数据集中的样本数量,m表示所述目标域数据集中的样本数量,i=n+m。
根据本发明优选实施例,所述方法还包括:
计算所述源域数据集与所述目标域数据集的并集,得到样本集;
对于每轮迭代训练,配置用于计算所述源域数据集的权重的第一阈值,及配置用于计算所述目标域数据集的权重的第二阈值;
对于所述样本集中的每个样本,基于每轮迭代训练得到的基分类器计算分类结果;
获取每个样本的实际标签,及获取每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
根据所述第一阈值、所述第二阈值、所述分类结果及所述实际标签更新每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
利用更新后的权重执行下一轮迭代训练。
根据本发明优选实施例,所述第一阈值的公式如下:
Figure BDA0002947711960000033
其中,β表示所述第一阈值,N表示所述预设轮数;
所述第二阈值的公式如下:
Figure BDA0002947711960000034
其中,βt表示所述第二阈值,Ut表示所述目标域数据集上产生的错误率,公式如下:
Figure BDA0002947711960000041
其中,
Figure BDA0002947711960000042
表示第i个样本在第t轮迭代过程中的权重,ht(xi)表示第i个样本在第t轮迭代过程中的分类结果,c(xi)表示第i个样本的实际标签。
根据本发明优选实施例,所述基于每轮迭代训练得到的基分类器计算分类结果包括:
获取历史数据及每个历史数据的实际标签;
从所述实际标签中识别配置行为对应的标签作为目标标签,并计算所述目标标签在所述历史数据中的占比作为转化率;
通过所述转化率确定分位点作为分类阈值;
当所述基分类器的输出大于或者等于所述分类阈值时,确定所述分类结果为1;或者
当所述基分类器的输出小于所述分类阈值时,确定所述分类结果为0。
根据本发明优选实施例,所述更新后的权重的公式如下:
Figure BDA0002947711960000043
其中,
Figure BDA0002947711960000044
表示更新后第i个样本在第(t+1)轮迭代过程中的权重。
一种用户行为预测装置,所述用户行为预测装置包括:
确定单元,用于响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域;
获取单元,用于获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;
初始化单元,用于初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;
训练单元,用于根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;
计算单元,用于获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;
所述确定单元,还用于获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述用户行为预测方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述用户行为预测方法。
由以上技术方案可以看出,本发明能够响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域,获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集,初始化所述源域数据集及所述目标域数据集的权重,得到初始权重,由于所述目标域数据集与实际业务场景下的数据分布相同,因此,首先赋予所述目标域数据集更高的权重,以保证后续训练得到的分类器具有较高的准确率,根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器,不同于现有技术中通常采用的投票方式,本实施例使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务,获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器,获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
附图说明
图1是本发明用户行为预测方法的较佳实施例的流程图。
图2是本发明用户行为预测装置的较佳实施例的功能模块图。
图3是本发明实现用户行为预测方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明用户行为预测方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述用户行为预测方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital SignalProcessor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域。
在本实施例中,所述用户行为预测指令可以由指定工作人员触发,本发明不限制。
例如:当有新产品出售时,由于缺乏足够的样本,难以训练模型进行行为预测,此时,需要基于迁移学习的思想确定与所述源域对应的目标域,并结合所述源域的数据对用户在所述目标域上的行为进行预测,那么相关负责人员(如销售人员)可以触发所述用户行为预测指令。其中,所述目标域是指所述新产品,所述源域是指与所述新产品类似的已有产品。
在本发明的至少一个实施例中,所述根据所述用户行为预测指令确定源域及目标域包括:
解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;
获取第一预设标签及第二预设标签;
根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;
利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;
利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;
根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域。
其中,所述用户行为预测指令实质上是一条代码,在所述用户行为预测指令中,根据代码的编写原则,{}之间的内容被称之为所述方法体。
所述第一预设标签及所述第二预设标签可以进行自定义配置,例如:所述第一预设标签可以配置为YID,进一步以所述第一预设标签建立第一正则表达式YID(),并以YID()进行遍历。
通过上实施方式,能够基于正则表达式及预设标签快速确定标识,并进一步根据标识确定源域及目标域,提高了数据获取的效率。
S11,获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集。
在本实施例中,所述源域数据集中可以包括,但不限于:用户的年龄、用户的性别等用户的基本信息,以及用户的购买信息。
同样地,所述目标域数据集中也可以包括,但不限于:用户的年龄、用户的性别等用户的基本信息,以及用户的购买信息。
需要说明的是,所述源域数据集与实际业务场景下的数据分布不同,所述目标域数据集与实际业务场景下的数据分布相同。本实施例的目的在于将从所述源域数据集中学习到的部分知识用于所述目标域数据集,以便对缺乏数据的领域进行预测,为了充分利用这部分信息,找到有用数据,过滤掉分布不同的数据,本实施例使用具有相同分布的目标域数据集对源域数据集的权重进行自动调整。
S12,初始化所述源域数据集及所述目标域数据集的权重,得到初始权重。
具体地,所述初始权重的公式如下:
Figure BDA0002947711960000081
其中,
Figure BDA0002947711960000082
表示第i个样本的初始权重取值,n表示所述源域数据集中的样本数量,m表示所述目标域数据集中的样本数量,i=n+m。
本实施例在配置初始权重时,由于所述目标域数据集与实际业务场景下的数据分布相同,因此,首先赋予所述目标域数据集更高的权重,以保证后续训练得到的分类器具有较高的准确率。
S13,根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器。
其中,所述预设轮次可以进行自定义配置,本发明不限制。
不同于现有技术中通常采用的投票方式,本实施例使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务。
并且,本实施例基于迁移学习方法,借鉴已有业务场景下的知识,通过对源域中样本权重的调整,使其分布靠近目标域,通过对目标域样本权重的调整,进一步提升模型的训练效果。
具体地,所述方法还包括:
计算所述源域数据集与所述目标域数据集的并集,得到样本集;
对于每轮迭代训练,配置用于计算所述源域数据集的权重的第一阈值,及配置用于计算所述目标域数据集的权重的第二阈值;
对于所述样本集中的每个样本,基于每轮迭代训练得到的基分类器计算分类结果;
获取每个样本的实际标签,及获取每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
根据所述第一阈值、所述第二阈值、所述分类结果及所述实际标签更新每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
利用更新后的权重执行下一轮迭代训练。
可以理解的是,本实施例的目的在于调整样本集的样本权重。
具体而言,通过上述迭代,如果目标域的样本被误分,则确定其较难分类,进一步根据目标域样本的分类错误率进行调整,增加其样本权重,在下一轮迭代时更加关注这些错分样本;如果源域样本被分类错误,则确定其与目标域数据分布不同,在下一轮迭代时降低其权重。具体实现方式可以参见下面的介绍的各个公式。
通过上述实施方式,能够在训练过程中不断调整每轮迭代过程中所述源域数据集及所述目标域数据集的权重,使样本集的权重配置与实际应用场景更加适配。
具体地,所述第一阈值的公式如下:
Figure BDA0002947711960000101
其中,β表示所述第一阈值,N表示所述预设轮数;
所述第二阈值的公式如下:
Figure BDA0002947711960000102
其中,βt表示所述第二阈值,Ut表示所述目标域数据集上产生的错误率,公式如下:
Figure BDA0002947711960000103
其中,
Figure BDA0002947711960000104
表示第i个样本在第t轮迭代过程中的权重,ht(xi)表示第i个样本在第t轮迭代过程中的分类结果,c(xi)表示第i个样本的实际标签。
上述实施方式配置的所述第一阈值及所述第二阈值能够用于在迭代过程中调整样本集的权重。
进一步地,所述基于每轮迭代训练得到的基分类器计算分类结果包括:
获取历史数据及每个历史数据的实际标签;
从所述实际标签中识别配置行为对应的标签作为目标标签,并计算所述目标标签在所述历史数据中的占比作为转化率;
通过所述转化率确定分位点作为分类阈值;
当所述基分类器的输出大于或者等于所述分类阈值时,确定所述分类结果为1;或者
当所述基分类器的输出小于所述分类阈值时,确定所述分类结果为0。
其中,所述实际标签能够表明每个历史数据的实际分类结果。
其中,所述分类结果表征用户行为是否可能发生,1表示可能发生,0表示不可能发生。
例如:当所述分类结果为1时,表示会产生购买行为;或者当所述分类结果为0时,表示不会产生购买行为。
通过上述实施方式,能够基于历史数据中的实际转化率确定分位点,以满足场景的实际分类需求。
更进一步地,所述更新后的权重的公式如下:
Figure BDA0002947711960000111
其中,
Figure BDA0002947711960000112
表示更新后第i个样本在第(t+1)轮迭代过程中的权重。
通过上述实施方式,能够根据每轮迭代的权重不断更新下一轮迭代的权重,以不断完善样本集的权重配置。
在本实施例中,还可以对所述源域数据集及所述目标域数据集的权重进行归一化处理,以统一数据的规格。
S14,获取测试数据集,并计算每个基分类器在所述测试数据集上的KS(Kolmogorov-Smirnov)值,并将所述KS值最高的基分类器确定为目标分类器。
其中,所述KS值的计算方式属于相对成熟的技术,在此不赘述。
通过上述实施方式,记录每一轮迭代得到的基分类器在测试数据集上的KS值,并获取KS值最高的基分类器作为目标分类器,进而使用在测试数据集上表现最好的模型进行分类,提升了分类的准确率。
S15,获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
例如:当所述待处理数据为用户的年龄及历史购买行为等信息时,如果所述目标分类器的输出为0,则确定所述行为预测结果为购买行为无发生的可能性,如果所述目标分类器的输出为1,则确定所述行为预测结果为购买行为有发生的可能性。
在上述实施方式中,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
需要说明的是,为了进一步保证数据的安全性,可以将目标分类器部署于区块链,以避免数据被恶意篡改。
由以上技术方案可以看出,本发明能够响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域,获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集,初始化所述源域数据集及所述目标域数据集的权重,得到初始权重,由于所述目标域数据集与实际业务场景下的数据分布相同,因此,首先赋予所述目标域数据集更高的权重,以保证后续训练得到的分类器具有较高的准确率,根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器,不同于现有技术中通常采用的投票方式,本实施例使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务,获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器,获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
如图2所示,是本发明用户行为预测装置的较佳实施例的功能模块图。所述用户行为预测装置11包括确定单元110、获取单元111、初始化单元112、训练单元113、计算单元114。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
响应于用户行为预测指令,确定单元110根据所述用户行为预测指令确定源域及目标域。
在本实施例中,所述用户行为预测指令可以由指定工作人员触发,本发明不限制。
例如:当有新产品出售时,由于缺乏足够的样本,难以训练模型进行行为预测,此时,需要基于迁移学习的思想确定与所述源域对应的目标域,并结合所述源域的数据对用户在所述目标域上的行为进行预测,那么相关负责人员(如销售人员)可以触发所述用户行为预测指令。其中,所述目标域是指所述新产品,所述源域是指与所述新产品类似的已有产品。
在本发明的至少一个实施例中,所述确定单元110根据所述用户行为预测指令确定源域及目标域包括:
解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;
获取第一预设标签及第二预设标签;
根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;
利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;
利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;
根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域。
其中,所述用户行为预测指令实质上是一条代码,在所述用户行为预测指令中,根据代码的编写原则,{}之间的内容被称之为所述方法体。
所述第一预设标签及所述第二预设标签可以进行自定义配置,例如:所述第一预设标签可以配置为YID,进一步以所述第一预设标签建立第一正则表达式YID(),并以YID()进行遍历。
通过上实施方式,能够基于正则表达式及预设标签快速确定标识,并进一步根据标识确定源域及目标域,提高了数据获取的效率。
获取单元111获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集。
在本实施例中,所述源域数据集中可以包括,但不限于:用户的年龄、用户的性别等用户的基本信息,以及用户的购买信息。
同样地,所述目标域数据集中也可以包括,但不限于:用户的年龄、用户的性别等用户的基本信息,以及用户的购买信息。
需要说明的是,所述源域数据集与实际业务场景下的数据分布不同,所述目标域数据集与实际业务场景下的数据分布相同。本实施例的目的在于将从所述源域数据集中学习到的部分知识用于所述目标域数据集,以便对缺乏数据的领域进行预测,为了充分利用这部分信息,找到有用数据,过滤掉分布不同的数据,本实施例使用具有相同分布的目标域数据集对源域数据集的权重进行自动调整。
初始化单元112初始化所述源域数据集及所述目标域数据集的权重,得到初始权重。
具体地,所述初始权重的公式如下:
Figure BDA0002947711960000141
其中,
Figure BDA0002947711960000142
表示第i个样本的初始权重取值,n表示所述源域数据集中的样本数量,m表示所述目标域数据集中的样本数量,i=n+m。
本实施例在配置初始权重时,由于所述目标域数据集与实际业务场景下的数据分布相同,因此,首先赋予所述目标域数据集更高的权重,以保证后续训练得到的分类器具有较高的准确率。
训练单元113根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器。
其中,所述预设轮次可以进行自定义配置,本发明不限制。
不同于现有技术中通常采用的投票方式,本实施例使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务。
并且,本实施例基于迁移学习方法,借鉴已有业务场景下的知识,通过对源域中样本权重的调整,使其分布靠近目标域,通过对目标域样本权重的调整,进一步提升模型的训练效果。
具体地,计算所述源域数据集与所述目标域数据集的并集,得到样本集;
对于每轮迭代训练,配置用于计算所述源域数据集的权重的第一阈值,及配置用于计算所述目标域数据集的权重的第二阈值;
对于所述样本集中的每个样本,基于每轮迭代训练得到的基分类器计算分类结果;
获取每个样本的实际标签,及获取每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
根据所述第一阈值、所述第二阈值、所述分类结果及所述实际标签更新每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
利用更新后的权重执行下一轮迭代训练。
可以理解的是,本实施例的目的在于调整样本集的样本权重。
具体而言,通过上述迭代,如果目标域的样本被误分,则确定其较难分类,进一步根据目标域样本的分类错误率进行调整,增加其样本权重,在下一轮迭代时更加关注这些错分样本;如果源域样本被分类错误,则确定其与目标域数据分布不同,在下一轮迭代时降低其权重。具体实现方式可以参见下面的介绍的各个公式。
通过上述实施方式,能够在训练过程中不断调整每轮迭代过程中所述源域数据集及所述目标域数据集的权重,使样本集的权重配置与实际应用场景更加适配。
具体地,所述第一阈值的公式如下:
Figure BDA0002947711960000161
其中,β表示所述第一阈值,N表示所述预设轮数;
所述第二阈值的公式如下:
Figure BDA0002947711960000162
其中,βt表示所述第二阈值,Ut表示所述目标域数据集上产生的错误率,公式如下:
Figure BDA0002947711960000163
其中,
Figure BDA0002947711960000164
表示第i个样本在第t轮迭代过程中的权重,ht(xi)表示第i个样本在第t轮迭代过程中的分类结果,c(xi)表示第i个样本的实际标签。
上述实施方式配置的所述第一阈值及所述第二阈值能够用于在迭代过程中调整样本集的权重。
进一步地,所述基于每轮迭代训练得到的基分类器计算分类结果包括:
获取历史数据及每个历史数据的实际标签;
从所述实际标签中识别配置行为对应的标签作为目标标签,并计算所述目标标签在所述历史数据中的占比作为转化率;
通过所述转化率确定分位点作为分类阈值;
当所述基分类器的输出大于或者等于所述分类阈值时,确定所述分类结果为1;或者
当所述基分类器的输出小于所述分类阈值时,确定所述分类结果为0。
其中,所述实际标签能够表明每个历史数据的实际分类结果。
其中,所述分类结果表征用户行为是否可能发生,1表示可能发生,0表示不可能发生。
例如:当所述分类结果为1时,表示会产生购买行为;或者当所述分类结果为0时,表示不会产生购买行为。
通过上述实施方式,能够基于历史数据中的实际转化率确定分位点,以满足场景的实际分类需求。
更进一步地,所述更新后的权重的公式如下:
Figure BDA0002947711960000171
其中,
Figure BDA0002947711960000172
表示更新后第i个样本在第(t+1)轮迭代过程中的权重。
通过上述实施方式,能够根据每轮迭代的权重不断更新下一轮迭代的权重,以不断完善样本集的权重配置。
在本实施例中,还可以对所述源域数据集及所述目标域数据集的权重进行归一化处理,以统一数据的规格。
计算单元114获取测试数据集,并计算每个基分类器在所述测试数据集上的KS(Kolmogorov-Smirnov)值,并将所述KS值最高的基分类器确定为目标分类器。
其中,所述KS值的计算方式属于相对成熟的技术,在此不赘述。
通过上述实施方式,记录每一轮迭代得到的基分类器在测试数据集上的KS值,并获取KS值最高的基分类器作为目标分类器,进而使用在测试数据集上表现最好的模型进行分类,提升了分类的准确率。
所述确定单元110获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
例如:当所述待处理数据为用户的年龄及历史购买行为等信息时,如果所述目标分类器的输出为0,则确定所述行为预测结果为购买行为无发生的可能性,如果所述目标分类器的输出为1,则确定所述行为预测结果为购买行为有发生的可能性。
在上述实施方式中,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
需要说明的是,为了进一步保证数据的安全性,可以将目标分类器部署于区块链,以避免数据被恶意篡改。
由以上技术方案可以看出,本发明能够响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域,获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集,初始化所述源域数据集及所述目标域数据集的权重,得到初始权重,由于所述目标域数据集与实际业务场景下的数据分布相同,因此,首先赋予所述目标域数据集更高的权重,以保证后续训练得到的分类器具有较高的准确率,根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器,不同于现有技术中通常采用的投票方式,本实施例使用逻辑回归分类器作为基模型,使用单一模型作为最终的分类器,使得模型可以保留线性模型的可解释性,更加贴合实际业务,获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器,获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果,基于迁移学习的方法,通过不断迭代调整源域数据集与目标域数据集的权重,使训练数据更加适用于实际应用场景,进而训练得到最优模型进行预测,既解决了缺乏样本的问题,又提高了模型训练的效果,进而实现更加准确的用户行为预测。
如图3所示,是本发明实现用户行为预测方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如用户行为预测程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如用户行为预测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行用户行为预测程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作***以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个用户行为预测方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成确定单元110、获取单元111、初始化单元112、训练单元113、计算单元114。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述用户行为预测方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种用户行为预测方法,所述处理器13可执行所述多个指令从而实现:
响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域;
获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;
初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;
根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;
获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;
获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种用户行为预测方法,其特征在于,所述用户行为预测方法包括:
响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域;
获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;
初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;
根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;
获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;
获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
2.如权利要求1所述的用户行为预测方法,其特征在于,所述根据所述用户行为预测指令确定源域及目标域包括:
解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;
获取第一预设标签及第二预设标签;
根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;
利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;
利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;
根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域。
3.如权利要求1所述的用户行为预测方法,其特征在于,所述初始权重的公式如下:
Figure FDA0002947711950000021
其中,
Figure FDA0002947711950000022
表示第i个样本的初始权重取值,n表示所述源域数据集中的样本数量,m表示所述目标域数据集中的样本数量,i=n+m。
4.如权利要求1所述的用户行为预测方法,其特征在于,所述方法还包括:
计算所述源域数据集与所述目标域数据集的并集,得到样本集;
对于每轮迭代训练,配置用于计算所述源域数据集的权重的第一阈值,及配置用于计算所述目标域数据集的权重的第二阈值;
对于所述样本集中的每个样本,基于每轮迭代训练得到的基分类器计算分类结果;
获取每个样本的实际标签,及获取每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
根据所述第一阈值、所述第二阈值、所述分类结果及所述实际标签更新每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;
利用更新后的权重执行下一轮迭代训练。
5.如权利要求4所述的用户行为预测方法,其特征在于,所述第一阈值的公式如下:
Figure FDA0002947711950000023
其中,β表示所述第一阈值,N表示所述预设轮数;
所述第二阈值的公式如下:
Figure FDA0002947711950000024
其中,βt表示所述第二阈值,Ut表示所述目标域数据集上产生的错误率,公式如下:
Figure FDA0002947711950000031
其中,
Figure FDA0002947711950000032
表示第i个样本在第t轮迭代过程中的权重,ht(xi)表示第i个样本在第t轮迭代过程中的分类结果,c(xi)表示第i个样本的实际标签。
6.如权利要求4所述的用户行为预测方法,其特征在于,所述基于每轮迭代训练得到的基分类器计算分类结果包括:
获取历史数据及每个历史数据的实际标签;
从所述实际标签中识别配置行为对应的标签作为目标标签,并计算所述目标标签在所述历史数据中的占比作为转化率;
通过所述转化率确定分位点作为分类阈值;
当所述基分类器的输出大于或者等于所述分类阈值时,确定所述分类结果为1;或者
当所述基分类器的输出小于所述分类阈值时,确定所述分类结果为0。
7.如权利要求5所述的用户行为预测方法,其特征在于,所述更新后的权重的公式如下:
Figure FDA0002947711950000033
其中,
Figure FDA0002947711950000034
表示更新后第i个样本在第(t+1)轮迭代过程中的权重。
8.一种用户行为预测装置,其特征在于,所述用户行为预测装置包括:
确定单元,用于响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域;
获取单元,用于获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;
初始化单元,用于初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;
训练单元,用于根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;
计算单元,用于获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;
所述确定单元,还用于获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的用户行为预测方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的用户行为预测方法。
CN202110199787.9A 2021-02-22 2021-02-22 用户行为预测方法、装置、设备及介质 Active CN112801718B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110199787.9A CN112801718B (zh) 2021-02-22 2021-02-22 用户行为预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110199787.9A CN112801718B (zh) 2021-02-22 2021-02-22 用户行为预测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112801718A true CN112801718A (zh) 2021-05-14
CN112801718B CN112801718B (zh) 2021-10-01

Family

ID=75815390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110199787.9A Active CN112801718B (zh) 2021-02-22 2021-02-22 用户行为预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112801718B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113256181A (zh) * 2021-07-13 2021-08-13 平安科技(深圳)有限公司 风险因子预测方法、装置、设备及介质
CN113343087A (zh) * 2021-06-09 2021-09-03 南京星云数字技术有限公司 用于获取营销用户的方法及***
CN113406496A (zh) * 2021-05-26 2021-09-17 广州市香港科大***研究院 基于模型迁移的电池容量预测方法、***、装置及介质
CN113516205A (zh) * 2021-09-03 2021-10-19 平安科技(深圳)有限公司 基于人工智能的数据分类方法、装置、设备及存储介质
CN113516231A (zh) * 2021-08-10 2021-10-19 大连海事大学 一种基于dsn深度对抗迁移网络的日常行为迁移识别方法
CN113657535A (zh) * 2021-08-24 2021-11-16 北京奇艺世纪科技有限公司 一种模型的训练方法、装置、电子设备及存储介质
CN113743678A (zh) * 2021-09-18 2021-12-03 中国银行股份有限公司 一种用户信用评分预测方法及相关设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599922A (zh) * 2016-12-16 2017-04-26 中国科学院计算技术研究所 用于大规模数据标定的迁移学习方法及***
CN109462610A (zh) * 2018-12-24 2019-03-12 哈尔滨工程大学 一种基于主动学习和迁移学习的网络入侵检测方法
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备
WO2020009652A1 (en) * 2018-07-06 2020-01-09 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for dynamic service performance prediction using transfer learning
CN111027870A (zh) * 2019-12-14 2020-04-17 支付宝(杭州)信息技术有限公司 用户风险评估方法及装置、电子设备、存储介质
US10776693B2 (en) * 2017-01-31 2020-09-15 Xerox Corporation Method and system for learning transferable feature representations from a source domain for a target domain
CN112115916A (zh) * 2020-09-29 2020-12-22 西安电子科技大学 域适应Faster R-CNN半监督SAR检测方法
CN112231586A (zh) * 2020-12-15 2021-01-15 平安科技(深圳)有限公司 基于迁移学习的课程推荐方法、装置、设备及介质
CN112270545A (zh) * 2020-10-27 2021-01-26 上海淇馥信息技术有限公司 基于迁移样本筛选的金融风险预测方法、装置和电子设备
CN112288042A (zh) * 2020-12-18 2021-01-29 蚂蚁智信(杭州)信息技术有限公司 行为预测***的更新方法及装置、存储介质和计算设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599922A (zh) * 2016-12-16 2017-04-26 中国科学院计算技术研究所 用于大规模数据标定的迁移学习方法及***
US10776693B2 (en) * 2017-01-31 2020-09-15 Xerox Corporation Method and system for learning transferable feature representations from a source domain for a target domain
WO2020009652A1 (en) * 2018-07-06 2020-01-09 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for dynamic service performance prediction using transfer learning
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109462610A (zh) * 2018-12-24 2019-03-12 哈尔滨工程大学 一种基于主动学习和迁移学习的网络入侵检测方法
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备
CN111027870A (zh) * 2019-12-14 2020-04-17 支付宝(杭州)信息技术有限公司 用户风险评估方法及装置、电子设备、存储介质
CN112115916A (zh) * 2020-09-29 2020-12-22 西安电子科技大学 域适应Faster R-CNN半监督SAR检测方法
CN112270545A (zh) * 2020-10-27 2021-01-26 上海淇馥信息技术有限公司 基于迁移样本筛选的金融风险预测方法、装置和电子设备
CN112231586A (zh) * 2020-12-15 2021-01-15 平安科技(深圳)有限公司 基于迁移学习的课程推荐方法、装置、设备及介质
CN112288042A (zh) * 2020-12-18 2021-01-29 蚂蚁智信(杭州)信息技术有限公司 行为预测***的更新方法及装置、存储介质和计算设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI SHUANG,LIU CHI HAROLD,SU LIMIN,XIE BINHUI等: "Discriminative Transfer Feature and Label Consistency for Cross-Domain Image Classification", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
赵鹏飞,李艳玲,林民: "面向迁移学习的意图识别研究进展", 《计算机科学与探索》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113406496A (zh) * 2021-05-26 2021-09-17 广州市香港科大***研究院 基于模型迁移的电池容量预测方法、***、装置及介质
CN113406496B (zh) * 2021-05-26 2023-02-28 广州市香港科大***研究院 基于模型迁移的电池容量预测方法、***、装置及介质
CN113343087A (zh) * 2021-06-09 2021-09-03 南京星云数字技术有限公司 用于获取营销用户的方法及***
CN113256181A (zh) * 2021-07-13 2021-08-13 平安科技(深圳)有限公司 风险因子预测方法、装置、设备及介质
CN113516231A (zh) * 2021-08-10 2021-10-19 大连海事大学 一种基于dsn深度对抗迁移网络的日常行为迁移识别方法
CN113516231B (zh) * 2021-08-10 2024-03-29 大连海事大学 一种基于dsn深度对抗迁移网络的日常行为迁移识别方法
CN113657535A (zh) * 2021-08-24 2021-11-16 北京奇艺世纪科技有限公司 一种模型的训练方法、装置、电子设备及存储介质
CN113516205A (zh) * 2021-09-03 2021-10-19 平安科技(深圳)有限公司 基于人工智能的数据分类方法、装置、设备及存储介质
CN113516205B (zh) * 2021-09-03 2021-12-14 平安科技(深圳)有限公司 基于人工智能的员工稳定性分类方法及相关设备
CN113743678A (zh) * 2021-09-18 2021-12-03 中国银行股份有限公司 一种用户信用评分预测方法及相关设备
CN113743678B (zh) * 2021-09-18 2024-05-31 中国银行股份有限公司 一种用户信用评分预测方法及相关设备

Also Published As

Publication number Publication date
CN112801718B (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN112801718B (zh) 用户行为预测方法、装置、设备及介质
CN112231586A (zh) 基于迁移学习的课程推荐方法、装置、设备及介质
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN115002200B (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
CN115146865A (zh) 基于人工智能的任务优化方法及相关设备
CN113626606B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN112396547B (zh) 基于无监督学习的课程推荐方法、装置、设备及介质
CN112288337B (zh) 行为推荐方法、装置、设备及介质
CN111985545B (zh) 基于人工智能的目标数据检测方法、装置、设备及介质
CN115081538A (zh) 基于机器学习的客户关系识别方法、装置、设备及介质
CN114612194A (zh) 产品推荐方法、装置、电子设备及存储介质
CN112380454A (zh) 培训课程推荐方法、装置、设备及介质
CN114781832A (zh) 课程推荐方法、装置、电子设备及存储介质
CN113313211B (zh) 文本分类方法、装置、电子设备及存储介质
CN113627160B (zh) 文本纠错方法、装置、电子设备及存储介质
CN113658002B (zh) 基于决策树的交易结果生成方法、装置、电子设备及介质
CN114862140A (zh) 基于行为分析的潜力评估方法、装置、设备及存储介质
CN111652282B (zh) 基于大数据的用户偏好分析方法、装置及电子设备
CN113256181A (zh) 风险因子预测方法、装置、设备及介质
CN112269875A (zh) 文本分类方法、装置、电子设备及存储介质
CN112651782A (zh) 基于缩放点积注意力的行为预测方法、装置、设备及介质
CN111950707A (zh) 基于行为共现网络的行为预测方法、装置、设备及介质
CN116842290A (zh) 数据缓存方法、装置、设备及计算机可读存储介质
CN111429085A (zh) 合同数据生成方法、装置、电子设备及存储介质
CN116843481A (zh) 知识图谱分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant