CN114756762A - 数据处理方法、装置、设备、存储介质及程序产品 - Google Patents

数据处理方法、装置、设备、存储介质及程序产品 Download PDF

Info

Publication number
CN114756762A
CN114756762A CN202210662836.2A CN202210662836A CN114756762A CN 114756762 A CN114756762 A CN 114756762A CN 202210662836 A CN202210662836 A CN 202210662836A CN 114756762 A CN114756762 A CN 114756762A
Authority
CN
China
Prior art keywords
information
recommended
target
recommendation
vertex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210662836.2A
Other languages
English (en)
Other versions
CN114756762B (zh
Inventor
沈春旭
成昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210662836.2A priority Critical patent/CN114756762B/zh
Publication of CN114756762A publication Critical patent/CN114756762A/zh
Application granted granted Critical
Publication of CN114756762B publication Critical patent/CN114756762B/zh
Priority to PCT/CN2023/088857 priority patent/WO2023241207A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种数据处理方法、装置、设备、存储介质及程序产品,应用于云技术、人工智能、智慧交通、游戏和车载等各种信息推荐场景;该数据处理方法包括:获取待推荐对象对应的待推荐对象特征,待推荐对象特征通过待推荐对象的目标二阶信息所对应的非线性映射结果获得,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个推荐信息为每个互动对象所转化的信息;获取待推荐信息对应的待推荐信息特征,待推荐信息为互动对象所转化的任一推荐信息;基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐。通过本申请,能够提升信息推荐的准确度。

Description

数据处理方法、装置、设备、存储介质及程序产品
技术领域
本申请涉及人工智能领域中的信息推荐技术,尤其涉及一种数据处理方法、装置、设备、存储介质及程序产品。
背景技术
冷启动对象是指信息推荐时,转化次数为零的对象;由于冷启动用户所转化的推荐信息的数量为零,因此,转化对象与待推荐信息对应的转化二部图中,冷启动对象对应的顶点为孤立顶点;然而,孤立顶点在图神经网络中因为没有任何边的连接,信息无法有效传播,从而冷启动场景中无法确定转化概率,导致信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
发明内容
本申请实施例提供一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提升信息推荐的准确率,降低信息推荐的资源消耗。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种数据处理方法,包括:
获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
本申请实施例提供一种数据处理装置,包括:
特征获取模块,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
在本申请实施例中,所述特征获取模块,还用于获取所述待推荐对象对应的所述目标二阶信息;获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
在本申请实施例中,所述特征获取模块,还用于获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
在本申请实施例中,所述数据处理装置还包括对象判断模块,用于获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息。
在本申请实施例中,所述特征获取模块,还用于当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
在本申请实施例中,所述特征获取模块,还用于对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
在本申请实施例中,所述特征获取模块,还用于当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
在本申请实施例中,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述数据处理装置还包括模型训练模块,用于基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;将迭代更新后的所述待更新异构图,确定为所述指定异构图。
在本申请实施例中,所述模型训练模块,还用于基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
在本申请实施例中,所述模型训练模块,还用于获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;获取所述当前对象顶点对应的至少一个相邻信息顶点;基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
在本申请实施例中,所述模型训练模块,还用于获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
在本申请实施例中,所述信息推荐模块,还用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;向所述待推荐对象推荐所述目标待推荐信息。
本申请实施例提供一种数据处理设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的数据处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令用于被处理器执行时,实现本申请实施例提供的数据处理方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或指令,所述计算机程序或指令被处理器执行时,实现本申请实施例提供的数据处理方法。
本申请实施例至少具有以下有益效果:通过获取待推荐对象对应的目标二阶信息,并基于目标二阶信息的非线性映射结果确定待推荐对象特征的过程中;由于目标二阶信息不仅包括对象之间的交互,还包括对象与推荐信息之间的交互,是一种异质信息,因此,通过对目标二阶信息进行非线性映射来获得待推荐对象对应的待推荐对象特征,使得待推荐对象与推荐信息建立了准确的关联,从而能够准确地确定是否向待推荐对象推荐任一推荐信息,能够提升转化概率的准确度;因此,即使是冷启动用户,也能够提升信息推荐的准确率,降低信息推荐的资源消耗。
附图说明
图1是本申请实施例提供的信息推荐***的架构示意图;
图2是本申请实施例提供的图1中的一种服务器的组成结构示意图;
图3是本申请实施例提供的数据处理方法的流程示意图;
图4是本申请实施例提供的模型训练的流程示意图;
图5是本申请实施例提供的一种示例性的信息推荐流程示意图;
图6是本申请实施例提供的一种示例性的点击二部图的示意图;
图7是本申请实施例提供的一种示例性的社交图的示意图;
图8是本申请实施例提供的一种示例性的异构图的示意图;
图9是本申请实施例提供的一种示例性的异质信息聚合示意图;
图10是本申请实施例提供的另一种示例性的异质信息聚合示意图;
图11是本申请实施例提供的一种示例性的权重更新示意图;
图12是本申请实施例提供的一种示例性的模型性能对比示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
2)机器学习(Machine Learning,ML),是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析和算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能;重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习和归纳学习等技术。
3)人工神经网络,是一种模仿生物神经网络结构和功能的数学模型,本申请实施例中人工神经网络的示例性结构包括图卷积网络(Graph Convolutional Network,GCN)、深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional NeuralNetwork,CNN)和循环神经网络(Recurrent Neural Network,RNN)、神经状态机(NeuralState Machine,NSM)和相位函数神经网络(Phase-Functioned Neural Network,PFNN)等。本申请实施例中所涉及的指定异构图和待更新异构图即为人工神经网络对应的模型。
4)云计算(Cloud Computing),是一种计算模式,通过将计算任务分布在大量计算机构成的资源池上,使各种应用***能够根据需要获取计算力、存储空间和信息服务;其中,为资源池提供资源的网络被称为“云”,“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。本申请实施例提供的数据处理方法,可通过云计算实现。
5)转化概率(Conversion Rate, CVR),是指成功转化的概率;其中,成功转化包括点击、浏览、下载、购买、运行和注册等,从而,转化概率包括点击概率(Clickthrough Rate,CTR)、浏览概率、下载概率、购买概率、运行概率和注册概率等;比如,广告曝光用户点击广告的概率,广告曝光用户对目标资源进行购买的概率。
6)同质图(Homogeneous Graph),有一种类型的节点和一种类型的边的图;本申请实施例中的对象交互图为同质图。
7)异质图(Heterogeneous Graph),顶点和边的类型中的至少一种大于等于两种的图;本申请实施例中的对象信息转化图、以及指定异构图、待更新异构图均为异质图。
8)二部图(Bipartite Graph),顶点的类型为两种,且边存在于不同类型的顶点之间的图;也就是说,二部图的顶点集包括两个互不相交的子集,且二部图中每条边两端的顶点都属于不同的两个子集,从而同一个子集中的顶点不相邻。在本申请实施例中,对象信息转化图即为二部图,包括对象集合和信息集合,边表示对象对信息成功进行了转化。
9)社交网络服务(Social Networking Service,SNS),通过对象之间的互动将对象连接起来获得的网络结构;其中,互动是指对象之间的社交行为,比如,关注,组队对局,交互虚拟资源等。
需要说明的是,为了进行信息推荐,可通过推荐信息与对象的历史转化关系,确定出对应的推荐策略,然后基于推荐策略在当前的信息推荐过程中进行信息推荐。然而,不同信息推荐周期,信息推荐的对象并不相同;也就是说,当前的待推荐对象可能在推荐信息与对象的历史转化关系中并未出现,是冷启动对象。因此,基于推荐信息与对象的历史转化关系所确定出的推荐策略,无法适用于当前的待推荐对象,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
另外,为了进行信息推荐,还可以通过GCN实现,比如,神经网络协同过滤(NeuralGraph Collaborative Filtering,NGCF),简化GCN(LightGCN);其中,NGCF利用对象和信息作为顶点来构建的二部图,并通过消息传播预估转化概率;简化GCN通过去除NGCF中特征转换和非线性操作,来预估转化概率。然而,在包括冷启动用户的信息推荐场景中,由于对待推荐对象所转化的推荐信息的数量为零,因此,待推荐对象与推荐信息对应的二部图中,待推荐对象为孤立顶点;然而,孤立顶点在GCN中没有边的连接,信息无法有效传播,从而冷启动场景中无法确定待推荐对象对推荐信息的转化概率,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
此外,为了对冷启动对象进行信息推荐,还可以采用探索(Exploration)和利用(Exploitation)策略。为了对冷启动对象进行信息推荐,又可以采用迁移学习与元学习,也就是通过学习冷启动对象与其他信息推荐场景的推荐信息的转化行为,来通过知识迁移适配到当前的信息推荐场景中的信息推荐上。为了对冷启动对象进行信息推荐,也可以基于知识图谱(Knowledge Graph,KG)来根据推荐信息在KG上的相似性进行关联推荐;也就是说,为冷启动对象推荐的信息,是冷启动对象在KG上的相似对象所转化的推荐信息。为了对冷启动对象进行信息推荐,以及可以采用异质图神经模型将“对象-推荐信息”转化二部图和“对象-对象”社交图作为全图的子图,全图通过两个子图的线性拼接结果,并利用SNS先验知识,对冷启动对象进行信息推荐。然而,采用探索和利用策略对冷启动对象进行信息推荐的过程中,由于冷启动对象对不同类别推荐信息的喜好相同,需要不断试错,找到冷启动对象潜在的共同喜好;同时,也要多推一些已知情况下用户兴趣相关的广告(比如,转化概率大于阈值的广告),来促进用户对广告素材的点击,以实现对冷启动对象的信息推荐。而融合知识图谱和“对象-推荐信息”转化二部图的信息推荐过程中,或者融合社交图和“对象-推荐信息”转化二部图的信息推荐过程中,由于不同图结构上的信息是异质信息,线性运算无法充分衡量用户间的相似性,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
基于此,本申请实施例提供一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提升信息推荐的准确率,降低信息推荐的资源消耗。下面说明本申请实施例提供的设备的示例性应用,本申请实施例提供的设备可以实施为智能手机、智能手表、笔记本电脑、平板电脑、台式计算机、智能家电、机顶盒、智能车载设备、便携式音乐播放器、个人数字助理、专用消息设备、智能语音交互设备、便携式游戏设备和智能音箱等各种类型的终端,也可以实施为服务器。下面,将说明设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的信息推荐***的架构示意图;如图1所示,为支撑一个信息推荐应用,在信息推荐***100中,终端200(示例性示出了终端200-1和终端200-2)通过网络300连接服务器400(称为数据处理设备),网络300可以是广域网或者局域网,又或者是二者的组合。另外,该信息推荐***100中还包括数据库500,用于向服务器400提供数据支持;并且,图1中示出的为数据库500独立于服务器400的一种情况,此外,数据库500还可以集成在服务器400中,本申请实施例对此不作限定。
终端200,用于在图形界面(示例性示出了图形界面210-1和图形界面210-2)显示目标待推荐信息。
服务器400,用于获取待推荐对象对应的待推荐对象特征,其中,待推荐对象特征通过待推荐对象的目标二阶信息所对应的非线性映射结果获得,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个互动对象为与待推荐对象互动的对象,至少一个推荐信息为每个互动对象所转化的信息;获取待推荐信息对应的待推荐信息特征,其中,待推荐信息为互动对象所转化的任一推荐信息;基于待推荐对象特征和待推荐信息特征的融合结果,通过网络300向终端200发送向待推荐对象推荐的目标待推荐信息。
在一些实施例中,服务器400可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,ContentDelivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端200可以是智能手机、智能手表、笔记本电脑、平板电脑、台式计算机、智能电视、机顶盒、智能车载设备、便携式音乐播放器、个人数字助理、专用消息设备、便携式游戏设备和智能音箱等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不作限制。
参见图2,图2是本申请实施例提供的图1中的一种服务器的组成结构示意图,图2所示的服务器400包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。服务器400中的各个组件通过总线***440耦合在一起。可理解,总线***440用于实现这些组件之间的连接通信。总线***440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线***440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作***451,包括用于处理各种基本***服务和执行硬件相关任务的***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他计算机设备,示例性的网络接口420包括:蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作***设备和显示内容和信息的用户接口);
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的数据处理装置可以采用软件方式实现,图2示出了存储在存储器450中的数据处理装置455,其可以是程序和插件等形式的软件,包括以下软件模块:特征获取模块4551、信息推荐模块4552、对象判断模块4553和模型训练模块4554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在一些实施例中,本申请实施例提供的数据处理装置可以采用硬件方式实现,作为示例,本申请实施例提供的数据处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的数据处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的数据处理方法。举例来说,计算机程序可以是操作***中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作***中安装才能运行的程序,如游戏APP或者视频播放APP;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
下面,将结合本申请实施例提供的数据处理设备的示例性应用和实施,说明本申请实施例提供的数据处理方法。另外,本申请实施例提供的数据处理方法应用于云技术、人工智能、智慧交通和车载等各种信息推荐场景。
参见图3,图3是本申请实施例提供的数据处理方法的流程示意图,将结合图3示出的步骤进行说明。
步骤301、获取待推荐对象对应的待推荐对象特征。
在本申请实施中,数据处理设备在对待推荐对象进行信息推荐时,先确定待推荐对象与推荐信息关联的特征表示,即为待推荐对象特征;其中,至少一个互动对象为待推荐对象所互动的对象中,包括存在转化的推荐信息的对象。
这里,待推荐对象特征可以是实时确定的,也就是说,数据处理设备先针对待推荐对象所互动的至少一个互动对象、以及每个互动对象所转化的至少一个推荐信息,获取每个互动对象的特征表示(称为对象特征)、以及每个推荐信息的特征表示(称为第一信息特征),此时,也就获得了至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征;接着,数据处理设备对至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征进行聚合,也就获得了待推荐对象的目标二阶信息,最后,数据处理设备对目标二阶信息进行非线性映射,也就获得了待推荐对象特征。另外,还可以迭代获取目标二阶信息并对目标二阶信息进行非线性映射,来获得待推荐对象特征。其中,对象特征可以是互动对象的嵌入表示,还可以是互动对象的独热码(One-Hot编码),又可以是互动对象的标签所对应的特征表示,等等,本申请实施例对此不作限定。
待推荐对象特征可以是预先确定好的,也就是说,数据处理设备预先获取包括待推荐对象的各个对象,并迭代地对每个对象的特征表示、以及每个对象转化的每个推荐信息的特征表示先进行聚合再进行非线性映射,来获得包括待推荐对象的各个对象中每个对象的更新后的特征表示,进而也就获得了待推荐对象的待推荐对象特征。
需要说明的是,待推荐对象特征为目标二阶信息所对应的非线性映射结果,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个互动对象为与待推荐对象互动的对象,至少一个推荐信息为每个互动对象所转化的信息;另外,非线性映射是指提升特征空间维度的处理,比如,基于核函数(比如,高斯核函数)的数据处理等;通过非线性映射,使得非线性映射后的结果相比非线性映射前的数据,特征空间维度更高;也就是说,目标二阶信息为低维特征,待推荐对象特征为高维特征;如此,能够使得待推荐对象与每个推荐信息有效关联,准确地确定对象之间的相似性。此外,待推荐对象和至少一个互动对象所属的领域,还可以与至少一个互动对象与每个互动对象对应的至少一个推荐信息所属的领域相同;比如,均为游戏领域,均为即时通信领域,等等。
步骤302、获取待推荐信息对应的待推荐信息特征。
在本申请实施例中,待推荐信息为互动对象所转化的任一推荐信息,即为每个互动对象所转化的至少一个推荐信息中任一个;这里,数据处理设备获取待推荐信息的特征表示,也就获得了待推荐信息特征。
需要说明的是,待推荐信息特征用于确定待推荐信息是否为可向待推荐对象推荐的信息;另外,待推荐信息特征可以是待推荐信息的嵌入表示,还可以是待推荐信息的独热码(One-Hot编码),又可以是待推荐信息的标签所对应的特征表示,等等,本申请实施例对此不作限定。
步骤303、基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐。
在本申请实施例中,数据处理设备获得了待推荐对象特征和待推荐信息特征之后,基于待推荐对象特征和待推荐信息特征确定是否向待推荐对象推荐该待推荐信息;这里,数据处理设备先对待推荐对象特征和待推荐信息特征进行融合,再利用激活函数(比如,Sigmoid函数)对待推荐对象特征和待推荐信息特征的融合结果进行处理,也就获得了待推荐对象对待推荐信息进行转化的概率,进而基于待推荐对象对待推荐信息进行转化的概率,来确定是否向待推荐对象推荐该待推荐信息,以实现对待推荐对象的信息推荐。
可以理解的是,通过将对象之间的交互信息、以及对象与推荐信息之间的转化信息进行关联,并通过非线性映射来实现准确关联,使得对象与推荐信息之间能够有效交互,进而能够提升信息推荐的准确度。
在本申请实施例中,步骤301可通过步骤3011至步骤3014(图中未示出)实现;也就是说,获取待推荐对象对应的待推荐对象特征,包括步骤3011至步骤3014,下面对各步骤分别进行说明。
步骤3011、获取待推荐对象对应的目标二阶信息。
在本申请实施例中,数据处理设备可以直接基于至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征进行聚合,来获得目标二阶信息;比如,数据处理设备获取至少一个互动对象分别对应的对象特征的第一累加结果,并获取至少一个推荐信息分别对应的第一信息特征的第二累加结果,以及累加第一累加结果和至少一个互动对象对应的至少一个第二累加结果,来获得目标二阶信息。
数据处理设备还可以结合权重来聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征,以获得目标二阶信息。也就是说,数据处理设备获取待推荐对象对应的目标二阶信息,包括:数据处理设备获取待推荐对象与互动对象之间的互动权重,并获取互动对象与推荐信息之间的转化权重;接着,数据处理设备获取互动权重与对象特征的第一融合结果、以及转化权重和第一信息特征的第二融合结果;将至少一个互动对象对应的至少一个第一融合结果、以及每个互动对象所转化的至少一个推荐信息对应的至少一个第二融合结果,组合为待推荐对象对应的目标二阶信息。
需要说明的是,互动权重是指待推荐对象与互动对象之间的权重,表示待推荐对象与互动对象之间的亲密度;转化权重是指互动对象与推荐信息之间的权重,表示互动对象与推荐信息之间的转化度。这里,数据处理设备将互动权重与该互动权重所对应的互动对象的对象特征融合,也就获得了第一融合结果,从而,针对至少一个互动对象,也就获得了至少一个第一融合结果;数据处理设备将转化权重与该转化权重所对应的推荐信息的第一信息特征融合,也就获得了第二融合结果,从而,针对至少一个推荐信息,也就获得了至少一个第二融合结果,也即每个互动对象对应至少一个第二融合结果。另外,组合为目标二阶信息的方式可以是相加,也可以是拼接,又可以是加权融合,等等,本申请实施例对此不作限定。
还需要说明的是,第一叠加结果为数据处理设备直接对至少一个互动对象所对应的至少一个对象特征进行累加获得的;第一融合结果为数据处理设备基于待推荐对象和互动对象之间的亲密度,对至少一个对象特征进行加权累加获得的。第二叠加结果为数据处理设备直接对至少一个推荐信息所对应的至少一个第一信息特征进行累加获得的,第二融合结果为数据处理设备基于互动对象与推荐信息之间的转化度,对至少一个第一信息特征进行加权累加获得的。
可以理解的是,通过结合权重来获得目标二阶信息,进而再通过目标二阶信息获取待推荐对象特征,能够提升目标二阶信息获取的准确度,进而提升待推荐对象特征的准确度,使得待推荐对象特征能够有效与待推荐信息关联,也就能够提升信息推荐的准确度。
步骤3012、获取目标二阶信息与指定中心信息之间的空间距离。
需要说明的是,数据处理设备能够获取到指定中心信息;其中,指定中心信息是通过多个对象二阶信息确定的,多个对象二阶信息包括目标二阶信息,以及多个对象二阶信息中除目标二阶信息之后的其他对象二阶信息,可以是至少一个交互对象分别对应的二阶信息;比如,指定中心信息为所有对象的二阶信息的均值,而二阶信息即为对象所交互的对象的特征、以及每个所交互的对象所转化的信息的特征的聚合结果。
在本申请实施例中,数据处理设备获取目标二阶信息与指定中心信息之间的特征差异,并将特征差异确定为目标二阶信息与指定中心信息之间的空间距离,比如为欧式距离等。
步骤3013、基于多个指定映射参数对空间距离进行非线性映射,得到多个待融合二阶特征。
需要说明的是,数据处理设备能够获得多个指定映射参数,其中,指定映射参数表示映射空间范围,比如为高斯带宽;这里,数据处理设备利用每个指定映射参数对空间距离进行非线性映射,以将空间距离映射到不同的映射空间范围,从而,针对多个指定映射参数,能够得到多个待融合二阶特征。
步骤3014、基于多个待融合二阶特征对应的第一非线性映射结果,得到待推荐对象特征。
在本申请实施例中,数据处理设备获得了多个待融合二阶特征之后,整合多个待融合二阶特征,也就获得了第一非线性映射结果;这里,数据处理设备可以直接将第一非线性映射结果确定为待推荐对象特征,也可以将第一非线性映射结果和其他信息(比如,待推荐对象所互动的对象的信息等)结合为待推荐对象特征,等等,本申请实施例对此不作限定。从而,目标二阶信息所对应的非线性映射结果包括第一非线性映射结果。
在本申请实施例中,步骤301中数据处理设备获取待推荐对象对应的待推荐对象特征之前,该数据处理方法还包括:数据处理设备获取待推荐对象对待推荐信息库的转化标识。
需要说明的是,待推荐信息库包括至少一个互动对象中每个互动对象所转化的至少一个推荐信息;数据处理设备检测待推荐对象对待推荐信息库中每个推荐信息的转化情况,以获得转化标识;其中,转化标识表示待推荐对象是否对待推荐信息库中的推荐信息进行过转化。
相应地,在本申请实施例中,步骤301可通过步骤3015和步骤3016(图中未示出)实现;也就是说,数据处理设备获取待推荐对象对应的待推荐对象特征,包括步骤3015和步骤3016,下面对各步骤分别进行说明。
步骤3015、当转化标识表示待推荐信息库中包括待推荐对象对应的至少一个已转化信息时,数据处理设备获取待推荐对象对应的目标一阶信息。
需要说明的是,当转化标识表示待推荐信息库中包括待推荐对象对应的至少一个已转化信息时,表明待推荐对象对待推荐信息库中的推荐信息进行过转化,且所转化过的推荐信息为至少一个已转化信息,故待推荐对象为非冷启动对象;其中,每个已转化信息为待推荐信息库中被待推荐对象进行过转化的推荐信息;此时,待推荐对象与推荐信息之间的关联还可以通过自身所转化的至少一个已转化信息建立;从而,数据处理设备聚合至少一个已转化信息分别对应的第二信息特征,也就获得了待推荐对象对应的目标一阶信息,也就是说,目标一阶信息通过聚合至少一个已转化信息分别对应的第二信息特征获得。
步骤3016、将目标一阶信息对应的第二非线性映射结果与目标二阶信息对应的第一非线性映射结果,组合为待推荐对象对应的待推荐对象特征。
在本申请实施例中,数据处理设备对目标一阶信息进行非线性映射,也就获得了第二非线性映射结果;其中,数据处理设备对目标一阶信息进行非线性映射的过程,与对目标二阶信息进行非线性映射的过程类似,本申请实施例在此不再重复描述。这里,数据处理设备通过组合第一非线性映射结果和第二非线性映射结果,也就获得了待推荐对象特征;其中,组合方式可以是相加,也可以是加权相加,等等;并且,第一非线性映射结果结合其他信息获得待推荐对象特征的过程中,所结合的其他信息即为第二非线性映射结果。
可以理解的是,当待推荐对象为非冷启动对象时,在基于目标二阶信息获得待推荐对象特征的过程中,结合目标二阶信息对应的第一非线性映射结果的同时,再结合目标一阶信息对应的第二非线性映射结果来实现,提升了获取待推荐对象特征所依据数据的多样性;从而,能够提升待推荐对象特征的准确度,进而能够提升信息推荐的准确度,降低信息推荐的资源消耗。
在本申请实施例中,步骤3016中数据处理设备将目标一阶信息对应的第二非线性映射结果与目标二阶信息对应的第一非线性映射结果,组合为待推荐对象对应的待推荐对象特征,包括:数据处理设备对目标一阶信息对应的第二非线性映射结果、以及目标二阶信息对应的第一非线性映射结果进行组合,得到初始聚合信息;并获取与初始聚合信息负相关、且与第一非线性映射结果正相关的第一组合权重,并获取第一组合权重对应的第二组合权重;以及对第一组合权重与第二非线性映射结果的融合结果、以及第二组合权重与第一非线性映射结果的融合结果进行组合,得到待推荐对象特征。
需要说明的是,数据处理设备可以通过将第一非线性映射结果和第二非线性映射结果进行相加等方式的组合,来实现两者的组合,以获得初始聚合信息;另外,第一组合权重和第二组合权重负相关;此外,数据处理设备可以通过将第一组合权重与第二非线性映射结果的融合结果、以及第二组合权重与第一非线性映射结果的融合结果进行相加等方式的组合,来获得待推荐对象特征。
在本申请实施例中,步骤301中数据处理设备获取待推荐对象对应的待推荐对象特征,包括:当转化标识表示转化对象库与待推荐对象独立时,数据处理设备将目标二阶信息对应的第二非线性映射结果,确定为待推荐对象对应的待推荐对象特征。
需要说明的是,当转化标识表示待推荐信息库对应的转化对象库与待推荐对象独立时,表明待推荐对象未对待推荐信息库中的推荐信息进行过转化,待推荐对象为冷启动对象;也就是说,待推荐对象不属于转化对象库;其中,转化对象库为对待推荐信息库中的待推荐信息进行过转化的对象集合;此时,待推荐对象与推荐信息之间的关联通过目标二阶信息的第二非线性映射结果获得。
在本申请实施例中,待推荐对象特征和待推荐信息特征通过指定异构图获得;其中,指定异构图中,顶点为对象(包括待推荐对象和至少一个互动对象)的特征或推荐信息(包括每个互动对象对应的至少一个推荐信息)的特征,边为对象之间的边,或者对象与推荐信息之间的边;并且,边可以是有权边,也可以是无权边;当边为有权边时,边的权重表示两顶点之间的关联程度,比如对象之间的亲密度,对象与推荐信息之间的转化度;以及,对象的特征通过聚合所关联的对象对应的转化的推荐信息的特征获得。
参见图4,图4是本申请实施例提供的模型训练的流程示意图;如图4所示,指定异构图通过步骤305至步骤309获得,下面对各步骤分别进行说明。
步骤305、基于至少两个第一对象之间的互动记录,构建对象互动图。
需要说明的是,至少两个第一对象包括待推荐对象和至少一个互动对象;数据处理设备所构建的对象互动图中,顶点为第一对象的特征表示,边表示两个第一对象之间存在交互;当边为有权边时,表示基于两个第一对象之间的交互信息(比如,交互次数,交互频率,交互类型等)确定的亲密度。
步骤306、基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图。
需要说明的是,至少一个初始推荐信息包括每个互动对象所转化的至少一个推荐信息;数据处理设备所构建的对象信息转化图中,顶点为第二对象的特征表示或者初始推荐信息的特征表示,边表示第二对象对初始推荐信息进行过转化;当边为有权边时,边对应的权重表示基于第二对象对初始推荐信息的转化信息(比如,转化次数,转化时长,转化频率,转化类型等)确定的转化度。
步骤307、基于至少两个第一对象和至少一个第二对象之间的共同对象,对对象互动图和对象信息转化图进行融合,得到待更新异构图。
在本申请实施例中,数据处理设备获得了对象互动图和对象信息转化图之后,先获取至少两个第一对象和至少一个第二对象之间的共同对象;接着将共同对象在对象互动图中通过边所关联的第一对象的相关信息,与共同对象在对象信息转化图中通过边所关联的初始推荐信息的相关信息结合,也就得到了待更新异构图;也就是说,待更新异构图中,即包括共同对象与所互动的第一对象之间的互动关系,还包括共同对象与所转化的初始推荐信息之间的转化关系。
步骤308、基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新待更新异构图中的对象顶点。
在本申请实施例中,待更新异构图中的顶点,有的为对象顶点,有的为信息顶点;其中,对象顶点为第一对象或第二对象的特征表示,信息顶点为初始推荐信息的特征表示;这里,数据处理设备对待更新异构图的对象顶点进行迭代更新,以完成对待更新异构图的更新;以及,数据处理设备基于每个对象顶点的二阶信息所对应的非线性映射结果,来实现对应对象顶点的更新。
需要说明的是,每个对象顶点的二阶信息包括与该对象顶点所交互的对象相应的对象顶点、以及与所交互的对象所转化的初始推荐信息相应的对象顶点;另外,本申请实施例中的二阶信息通过聚合对象所交互的对象的特征、以及所交互的对象转化的推荐信息的特征获得,从而,目标二阶信息为待推荐对象的二阶信息。
步骤309、将迭代更新后的待更新异构图,确定为指定异构图。
在本申请实施例中,数据处理设备对待更新异构图进行迭代更新,当迭代更新后的待更新异构图达到指定截止条件时,结束迭代更新,并将迭代更新后的待更新异构图,确定为指定异构图。其中,指定截止条件是指当前迭代更新后的待更新异构图能够达到指定指标,比如,准确率大于指定准确率,损失函数值小于指定损失函数值,曲线下面积(AreaUnder Curve,AUC)大于指定面积等。
在本申请实施例中,步骤308可通过步骤3081至步骤3085(图中未示出)实现;也就是说,数据处理设备基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新待更新异构图中的对象顶点,包括步骤3081至步骤3085,下面对各步骤分别进行说明。
步骤3081、基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新待更新异构图中的对象顶点,得到当前异构图。
需要说明的是,数据处理设备获取待更新异构图中每个对象顶点的二阶信息的过程,与获取目标二阶信息的过程类似;并且,数据处理设备获取待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果的过程,与获取目标二阶信息对应的非线性映射结果的过程类似;以及,数据处理设备更新待更新异构图中对象顶点的过程,与基于目标二阶信息所对应的非线性映射结果获得待推荐对象特征的过程类似;本申请实施例在此不再重复描述。
步骤3082、对当前异构图中的边权重进行注意力更新,得到待更新边权重。
在本申请实施例中,数据处理设备对当前异构图中的边权重进行注意力更新,得到待更新边权重,包括:数据处理设备获取当前异构图中每个当前对象顶点对应的至少一个相邻对象顶点,相邻对象顶点为与当前对象顶点相邻的对象顶点;基于至少一个相邻对象顶点,确定当前对象顶点与每个相邻对象顶点之间的注意力互动权重;获取当前对象顶点对应的至少一个相邻信息顶点,相邻信息顶点为与当前对象顶点相邻的信息顶点;基于至少一个相邻信息顶点,确定当前对象顶点与每个相邻信息顶点之间的注意力转化权重;其中,待更新边权重为注意力互动权重或注意力转化权重。
需要说明的是,数据处理设备针对至少一个相邻对象顶点中的每个相邻对象顶点,在至少一个相邻对象顶点中所占的比重,确定注意力互动权重;也就是说,注意力互动权重为每个相邻对象顶点在至少一个相邻对象顶点中所占的比重;数据处理设备针对至少一个相邻对象顶点中的每个相邻信息顶点,在至少一个相邻信息顶点中所占的比重,确定注意力转化权重;也就是说,注意力转化权重为每个相邻信息顶点在至少一个相邻信息顶点中所占的比重。
步骤3083、对待更新边权重进行自适应增强,得到当前异构图中的目标边权重。
在本申请实施例中,数据处理设备对待更新边权重进行自适应增强,得到当前异构图中的目标边权重,包括:数据处理设备获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个待更新边权重;并基于至少一个待更新边权重,增强目标待更新边权重,得到当前异构图中的目标边权重;其中,目标待更新边权重为任一待更新边权重。
需要说明的是,当目标待更新边权重为注意力互动权重时,数据处理设备获取与注意力互动权重相邻的至少一个注意力转化权重,将每个注意力转化权重与注意力互动权重叠加,得到第一权重叠加和;接着,数据处理设备确定与第一权重叠加和负相关、且与该注意力转化权重正相关的第一增强参数,并通过融合第一增强参数与对应的注意力转化权重获得第一增强权重;最后,数据处理设备将该注意力互动权重与至少一个注意力转化权重对应的至少一个第一增强权重叠加,得到更新后的目标待更新边权重,即为当前异构图中的目标边权重。
当目标待更新边权重为注意力转化权重时,数据处理设备获取与注意力转化权重相邻的至少一个注意力互动权重,将每个注意力互动权重与注意力转化权重叠加,得到第二权重叠加和;接着,数据处理设备确定与第二权重叠加和负相关、且与该注意力互动权重正相关的第二增强参数,并通过融合第二增强参数与对应的注意力互动权重获得第二增强权重;最后,数据处理设备将该注意力转化权重与至少一个注意力互动权重对应的至少一个第二增强权重叠加,得到更新后的目标待更新边权重,即为当前异构图中的目标边权重。
步骤3084、基于目标边权重,聚合出当前异构图中每个当前对象顶点的二阶信息。
需要说明的是,数据处理设备基于目标边权重,获得当前异构图中每个当前对象顶点的二阶信息的过程,与数据处理设备结合互动权重和交互权重获得目标二阶信息的过程类似,本申请实施例在此不再重复描述。
步骤3085、基于当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新当前异构图中的对象顶点,得到指定异构图。
在本申请实施例中,数据处理设备迭代更新当前异构图的过程,与迭代更新异构图的过程类似,本申请实施例在此不再重复描述。
在本申请实施例中,步骤303中数据处理设备基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐,包括:数据处理设备基于待推荐对象特征和待推荐信息特征的融合结果,确定待推荐对象对待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个待推荐信息时,基于待推荐对象对至少两个待推荐信息的至少两个转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从待推荐信息序列中依次选择指定数量的待推荐信息,得到目标待推荐信息;向待推荐对象推荐目标待推荐信息。其中,目标待推荐信息包括至少一个待推荐信息。
需要说明的是,数据处理设备还可以将转化概率与指定概率进行比较,当转化概率大于指定概率时,向待推荐对象推荐该待推荐信息。
在本申请实施例中,当对待更新异构图进行迭代更新时,可以是对异构图中的对象顶点进行更新,还可以是对异构图中所有的顶点(包括对象顶点和信息顶点)进行更新,本申请实施例对此不作限定。并且,数据处理设备对异构图中的信息顶点进行更新的过程,与对象顶点的更新过程类似,本申请实施例对此不再重复描述。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。该示例性应用由服务器(称为数据处理设备)执行,描述了在游戏领域中,先基于历史推荐数据中用户与广告之间的历史点击情况,构建“用户-广告”点击二部图(称为对象信息转化图),并基于用户之间的互动情况,构建“用户-用户”社交图(称为对象互动图);接着,融合点击二部图和社交图,获得异构图,并对异构图中用户对应的顶点进行异质信息聚合,来实现冷启动用户与广告的信息交互,进而针对冷启动用户,能够提升信息推荐准确度。
参见图5,图5是本申请实施例提供的一种示例性的信息推荐流程示意图;如图5所示,该示例性的信息推荐流程包括数据采集阶段5-1、信息聚合阶段5-2和广告推荐阶段5-3。
在数据采集阶段5-1中,采集游戏领域内广告的历史推荐数据,并从历史推荐数据中提取用户对广告点击的数据(称为互动记录),以及基于用户对广告点击的数据构建“用户-广告”点击二部图;在点击二部图中,顶点为用户(称为第二对象)或广告(称为初始推荐信息)的向量表示(称为特征表示),顶点之间的边表示用户对广告进行了点击,以及边的权重表示用户与广告的转化关系,比如,边的权重与用户对广告点击的次数或消费时长正相关。
参见图6,图6是本申请实施例提供的一种示例性的点击二部图的示意图;如图6所示,点击二部图6-1中,顶点A、B、C和D为用户的向量表示,顶点a、b、c和d为广告的向量表示;这里,以顶点B与顶点a的连接为例进行说明:顶点B对应的用户对顶点a对应的广告进行了点击,从而顶点B与顶点a之间存在边,且该边对应的权重为
Figure 92938DEST_PATH_IMAGE001
。另外,顶点A分别与顶点a、b、c和d之间无边,在点击二部图6-1中为孤立顶点,从而顶点A对应的用户为冷启动用户(称为冷启动对象);而顶点B、C和D分别对应的用户为非冷启动用户(称为非冷启动对象)。
在数据采集阶段5-1中,还采集游戏领域内的历史社交数据(称为转化记录),并基于历史社交数据构建“用户-用户”社交图;在社交图中,顶点(称为第一对象)为用户的向量表示,顶点之间的边表示两用户进行了互动,比如,虚拟资源交互,组队游戏,交流等,以及边的权重表示两用户互动的亲密度。
参见图7,图7是本申请实施例提供的一种示例性的社交图的示意图;如图7所示,社交图7-1中,顶点A、B、C和D为用户的向量表示;这里,以顶点A分别与顶点B、C、以及D的连接为例进行说明:顶点A对应的用户分别与顶点B对应的用户、C对应的用户和D对应的用户进行了互动,从而顶点A分别与顶点B、C和D之间存在边,且各个边对应的权重分别依次为
Figure 541237DEST_PATH_IMAGE002
Figure 602865DEST_PATH_IMAGE003
Figure 529232DEST_PATH_IMAGE004
;另外,顶点C与顶点D之间的权重为
Figure 140342DEST_PATH_IMAGE005
在信息聚合阶段5-2中,首先,融合点击二部图和社交图,得到异构图(称为待更新异构图)。在异构图
Figure 228384DEST_PATH_IMAGE006
中,顶点V表示用户和广告分别对应的相邻表示所构成的向量集合,权重W表示用户之间、以及用户和广告之间的权重所构成的标量集合。由于该异构图是通过点击二部图
Figure 42887DEST_PATH_IMAGE007
和社交图
Figure 772946DEST_PATH_IMAGE008
两个子图融合得到的,所以,异构图G也可以表示为
Figure 972983DEST_PATH_IMAGE009
。其中,U为点击二部图
Figure 497505DEST_PATH_IMAGE007
中用户的向量表示的全集,u为用户的向量表示的个体,从而
Figure 533726DEST_PATH_IMAGE010
;I为社交图
Figure 5158DEST_PATH_IMAGE008
中广告的向量表示的全集,i为广告的向量表示的个体,从而
Figure 59702DEST_PATH_IMAGE011
;所以,点击二部图的顶点、边、边权重(称为转化权重)可以依次表示为
Figure 20705DEST_PATH_IMAGE012
Figure 793489DEST_PATH_IMAGE013
Figure 362222DEST_PATH_IMAGE014
Figure 536851DEST_PATH_IMAGE015
;社交图的顶点、边、边权重(称为互动权重)可以依次表示为
Figure 403176DEST_PATH_IMAGE016
;其中,m表示用户索引,n表示广告索引。
参见图8,图8是本申请实施例提供的一种示例性的异构图的示意图;如图8所示,异构图8-1是通过融合图6中的点击二部图6-1和图7中的社交图7-1获得的。异构图8-1中,通过顶点B、C和D,顶点A能够与顶点a、b、c和d建立关联;因此,在异构图中体现了冷启动用户与广告的关联。
最后,对异构图中的用户所对应的顶点进行异质信息聚合,包括冷启动用户的异质信息聚合和非冷启动用户的异质信息聚合。其中,对冷启动用户进行异质信息聚合时,采用顶点的二阶信息进行异质信息聚合;对非启动用户进行异质信息聚合时,采用顶点的一阶信息和二阶信息进行异质信息聚合。其中,一阶信息可通过式(1)实现,式(1)如下所示。
Figure 663256DEST_PATH_IMAGE017
(1);
其中,
Figure 23961DEST_PATH_IMAGE018
表示用户u对应的顶点的一阶信息;
Figure 53097DEST_PATH_IMAGE019
表示用户u和广告i之间的权重;
Figure 355903DEST_PATH_IMAGE020
表示广告i的向量表示。
二阶信息可通过式(2)实现,式(2)如下所示。
Figure 385170DEST_PATH_IMAGE021
(2);
其中,
Figure 2096DEST_PATH_IMAGE022
表示用户u对应的顶点的二阶信息;
Figure 885738DEST_PATH_IMAGE023
表示用户
Figure 359445DEST_PATH_IMAGE024
的向量表示;
Figure 328538DEST_PATH_IMAGE025
表示用户u和用户
Figure 31046DEST_PATH_IMAGE024
之间的权重;
Figure 34774DEST_PATH_IMAGE026
表示用户
Figure 758010DEST_PATH_IMAGE024
和广告i之间的权重。
参见图9,图9是本申请实施例提供的一种示例性的异质信息聚合示意图;如图9所示,针对图8的异构图8-1中冷启动用户所对应的顶点A,对应的二阶信息可表示为[顶点A-顶点B-顶点a;顶点A-顶点C-顶点b;顶点A-顶点C-顶点c;顶点A-顶点D-顶点d],如图9中的实线所示。
参见图10,图10是本申请实施例提供的另一种示例性的异质信息聚合示意图;如图10所示,针对图8的异构图8-1中非冷启动用户所对应的顶点C,对应的一阶信息可表示为[顶点C-顶点b;顶点C-顶点c],如图10中边10-1和边10-2所示;二阶信息可表示为[顶点C-顶点A;顶点C-顶点D-顶点d],如图10中边10-3、边10-4和边10-5所示。
需要说明的是,由于异质信息聚合中所涉及的信息来源于两种不同的子图结构,因此这里采用多频带高斯核函数来实现异质信息聚合。从而,异质信息聚合的结果
Figure 214399DEST_PATH_IMAGE027
可通过式(3)实现,式(3)如下所示。
Figure 969866DEST_PATH_IMAGE028
(3);
其中,k表示高斯带宽的索引值,K表示多个高斯带宽的集合;
Figure 562521DEST_PATH_IMAGE029
表示高斯核函数,这里以
Figure 581293DEST_PATH_IMAGE030
为例进行说明,
Figure 275710DEST_PATH_IMAGE030
可通过式(4)实现;
Figure 834868DEST_PATH_IMAGE031
可通过式(5)实现;式(4)和式(5)如下所示。
Figure 547609DEST_PATH_IMAGE032
(4);
其中,
Figure 268440DEST_PATH_IMAGE033
表示第k个高斯带宽参数,
Figure 715733DEST_PATH_IMAGE034
表示高斯核函数中心。
Figure 813002DEST_PATH_IMAGE035
(5);
需要说明的是,对冷启动用户的异质信息聚合过程中,不涉及一阶信息,此时式(3)中的
Figure 645829DEST_PATH_IMAGE031
为0。
在本申请实施例中,当完成一次异质信息聚合之后,接着进行权重更新。由于异构图源于两种不同的子图(点击二部图与社交图),两种不同类型的子图属于异质信息。因此,采用自适应加权注意力机制进行权重更新;也就是说,先在单个子图上分别采用注意力机制更新权重;再采用自适应加权机制来融合不同子图上的权重。从而,采用注意力机制更新异构图中属于点击二部图上的边的权重
Figure 537562DEST_PATH_IMAGE036
的过程如式(6)所示。
Figure 206571DEST_PATH_IMAGE037
(6);
其中,LeakyReLU表示激活层函数();
Figure 841952DEST_PATH_IMAGE038
表示用户u所点击的所有广告的向量表示集合,当前对象顶点对应的至少一个相邻信息顶点,
Figure 263706DEST_PATH_IMAGE039
Figure 591919DEST_PATH_IMAGE040
表示广告
Figure 748225DEST_PATH_IMAGE041
的向量表示。
采用注意力机制更新异构图中属于社交图上的边的权重的过程如式(7)所示。
Figure 452876DEST_PATH_IMAGE042
(7);
其中,
Figure 994716DEST_PATH_IMAGE043
表示用户u所互动的所有用户的向量表示集合,称为当前对象顶点对应的至少一个相邻对象顶点,
Figure 493830DEST_PATH_IMAGE044
Figure 871853DEST_PATH_IMAGE045
表示用户
Figure 317878DEST_PATH_IMAGE024
的向量表示;
Figure 714224DEST_PATH_IMAGE046
称为注意力转化权重;
Figure 384240DEST_PATH_IMAGE047
称为注意力互动权重。
采用自适应加权机制来融合不同子图上的权重的过程如式(8)和(9)所示。
Figure 498827DEST_PATH_IMAGE048
(8);
Figure 296012DEST_PATH_IMAGE049
(9);
其中,
Figure 15707DEST_PATH_IMAGE050
Figure 856624DEST_PATH_IMAGE046
称为至少一个待更新边权重;
Figure 458506DEST_PATH_IMAGE051
称为第一权重叠加和,
Figure 308651DEST_PATH_IMAGE051
称为第二权重叠加和;
Figure 430322DEST_PATH_IMAGE052
称为第一增强参数,
Figure 645402DEST_PATH_IMAGE053
称为第二增强参数。
示例性地,参见图11,图11是本申请实施例提供的一种示例性的权重更新示意图;如图11所示,采用注意力机制更新权重11-1(WA-C)时,基于顶点A和顶点D实现;采用自适应加权机制更新权重11-1时,基于注意力机制更新后的权重11-1、权重11-2和权重11-3实现。
需要说明的是,基于式(1)至式(9)进行迭代处理,来更新异构图,获得最终的异构图,其中,最终的异构图中包括用户最终的向量表示和广告最终的向量表示;从而,在广告推荐阶段5-3进行广告推荐时,能够基于最终的异构图中用户u对应的顶点和广告i对应的顶点,确定广告点击概率
Figure 469002DEST_PATH_IMAGE054
,如式(10)所示。
Figure 857258DEST_PATH_IMAGE055
(10);
其中,
Figure 348282DEST_PATH_IMAGE056
表示最终的异构图中用户u对应的顶点,
Figure 281734DEST_PATH_IMAGE057
表示最终的异构图中广告i对应的顶点,
Figure 858209DEST_PATH_IMAGE058
为激活层函数;
Figure 784577DEST_PATH_IMAGE059
称为待推荐对象特征和待推荐信息特征的融合结果。
这里,通过最终的异构图预估各个广告(比如N个广告,N为正整数)分别对应的广告点击概率,并基于广告点击概率进行广告排序,筛选出广告点击概率最大的广告推荐给用户,实现信息推荐。
下面说明本申请实施例提供的数据处理方法与基线模型,分别在训练数据集、验证数据集和测试数据集上进行广告点击概率预估时对应的指标数据,如表1所示。
表1
Figure 864528DEST_PATH_IMAGE060
由表1可知,本申请实施例提供的数据处理方法优于基线模型。
下面说明应用过程中本申请实施例提供的数据处理方法与多个基线模型的对比结果。
参见图12,图12是本申请实施例提供的一种示例性的模型性能对比示意图;如图12所示,横坐标轴表示应用日期(0507至0511),纵坐标表示性能指标(0.06至0.13);曲线12-1位基线模型1对应的性能信息,曲线12-2为基线模型2对应的性能信息,曲线12-3为基线模型3对应的性能信息,曲线12-4为本申请实施例提供的数据处理方法所对应的性能信息。通过曲线12-1至曲线12-4,可知,本申请实施例提供的数据处理方法在性能指标上,优于基线模型1至基线模型3。
可以理解的是,通过将社交图和点击二部图融合为异构图,并对异构图中用户对应的顶点结合边权重进行非线性聚合,使得用户与广告进行了信息交互;从而,即使是冷启动用户,也和广告之间建立了有效关联。另外,由于非线性聚合过程中,在不断更新用户对应的顶点的过程中,还采用自适应注意力机制对边权重进行了更新,能够提升非线性聚合的效果;综上,本申请实施例提供的异构图聚合的方法,能够提升对冷启动用户进行信息推荐的准确度。
下面继续说明本申请实施例提供的数据处理装置455的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器450的数据处理装置455中的软件模块可以包括:
特征获取模块4551,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过所述待推荐对象的目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块4551,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块4552,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
在本申请实施例中,所述特征获取模块4551,还用于获取所述待推荐对象对应的所述目标二阶信息;获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
在本申请实施例中,所述特征获取模块4551,还用于获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
在本申请实施例中,所述数据处理装置455还包括对象判断模块4553,用于获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息。
在本申请实施例中,所述特征获取模块4551,还用于当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
在本申请实施例中,所述特征获取模块4551,还用于对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
在本申请实施例中,所述特征获取模块4551,还用于当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
在本申请实施例中,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述数据处理装置455还包括模型训练模块4554,用于基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;将迭代更新后的所述待更新异构图,确定为所述指定异构图。
在本申请实施例中,所述模型训练模块4554,还用于基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
在本申请实施例中,所述模型训练模块4554,还用于获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;获取所述当前对象顶点对应的至少一个相邻信息顶点;基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
在本申请实施例中,所述模型训练模块4554,还用于获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
在本申请实施例中,所述信息推荐模块4552,还用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;向所述待推荐对象推荐所述目标待推荐信息。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备(称为数据处理设备)的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的数据处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的数据处理方法,例如,如图3示出的数据处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件***中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算机设备上执行(此时,这一个计算机设备即数据处理设备),或者在位于一个地点的多个计算机设备上执行(此时,位于一个地点的多个计算机设备即数据处理设备),又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行(此时,分布在多个地点且通过通信网络互连的多个计算机设备即数据处理设备)。
可以理解的是,在本申请实施例中,涉及到互动等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
综上,本申请实施例通过获取待推荐对象对应的目标二阶信息,并基于目标二阶信息的非线性映射结果确定待推荐对象特征的过程中;由于目标二阶信息不仅包括对象之间的交互,还包括对象与推荐信息之间的交互,是一种异质信息,因此,通过对目标二阶信息进行非线性映射来获得待推荐对象对应的待推荐对象特征,使得待推荐对象与推荐信息建立了准确的关联,从而能够准确地确定是否向待推荐对象推荐任一推荐信息,能够提升转化概率的准确度;因此,即使是冷启动用户,也能够提升信息推荐的准确率较低,进而降低信息推荐的资源消耗。
以上,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (15)

1.一种数据处理方法,其特征在于,所述方法包括:
获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征,包括:
获取所述待推荐对象对应的所述目标二阶信息;
获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;
基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;
基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待推荐对象对应的所述目标二阶信息,包括:
获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;
获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;
获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;
将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征之前,所述方法还包括:
获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息;
所述获取待推荐对象对应的待推荐对象特征,包括:
当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;
将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
5.根据权利要求4所述的方法,其特征在于,所述将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征,包括:
对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;
获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;
对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
6.根据权利要求4所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征,包括:
当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
7.根据权利要求1所述的方法,其特征在于,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述指定异构图通过以下步骤获得:
基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;
基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;
基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;
基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;
将迭代更新后的所述待更新异构图,确定为所述指定异构图。
8.根据权利要求7所述的方法,其特征在于,所述基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点,包括:
基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;
对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;
对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;
基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;
基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
9.根据权利要求8所述的方法,其特征在于,所述对所述当前异构图中的边权重进行注意力更新,得到待更新边权重,包括:
获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;
基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;
获取所述当前对象顶点对应的至少一个相邻信息顶点;
基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
10.根据权利要求8或9所述的方法,其特征在于,所述对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重,包括:
获取与目标待更新边权重相邻、且与所述目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;
基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
11.根据权利要求1至3、7至9任一项所述的方法,其特征在于,所述基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐,包括:
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;
当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;
从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;
向所述待推荐对象推荐所述目标待推荐信息。
12.一种数据处理装置,其特征在于,所述数据处理装置包括:
特征获取模块,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
13.一种数据处理设备,其特征在于,所述数据处理设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至11任一项所述的数据处理方法。
14.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令用于被处理器执行时,实现权利要求1至11任一项所述的数据处理方法。
15.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现权利要求1至11任一项所述的数据处理方法。
CN202210662836.2A 2022-06-13 2022-06-13 数据处理方法、装置、设备及存储介质 Active CN114756762B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210662836.2A CN114756762B (zh) 2022-06-13 2022-06-13 数据处理方法、装置、设备及存储介质
PCT/CN2023/088857 WO2023241207A1 (zh) 2022-06-13 2023-04-18 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210662836.2A CN114756762B (zh) 2022-06-13 2022-06-13 数据处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114756762A true CN114756762A (zh) 2022-07-15
CN114756762B CN114756762B (zh) 2022-09-02

Family

ID=82336354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210662836.2A Active CN114756762B (zh) 2022-06-13 2022-06-13 数据处理方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN114756762B (zh)
WO (1) WO2023241207A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116450938A (zh) * 2023-04-07 2023-07-18 北京欧拉认知智能科技有限公司 一种基于图谱的工单推荐实现方法及***
WO2023241207A1 (zh) * 2022-06-13 2023-12-21 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品
CN117786094A (zh) * 2023-12-29 2024-03-29 北京基智科技有限公司 一种基于知识图谱的企业技术服务推荐方法及装置

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995866A (zh) * 2014-05-19 2014-08-20 北京邮电大学 一种基于链路预测的商品信息推送方法及装置
CN105320719A (zh) * 2015-01-16 2016-02-10 焦点科技股份有限公司 一种基于项目标签和图形关系的众筹网站项目推荐方法
CN106202519A (zh) * 2016-07-22 2016-12-07 桂林电子科技大学 一种结合用户评论内容和评分的项目推荐方法
BR112013026814A2 (pt) * 2011-04-19 2017-01-10 Nokia Corp método, aparelho, meio de armazenamento legível por computador e produto de programa de computador
CN106682114A (zh) * 2016-12-07 2017-05-17 广东工业大学 一种融合用户信任关系和评论信息的个性化推荐方法
US20180268318A1 (en) * 2017-03-17 2018-09-20 Adobe Systems Incorporated Training classification algorithms to predict end-user behavior based on historical conversation data
CN110837598A (zh) * 2019-11-11 2020-02-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及存储介质
CN111046286A (zh) * 2019-12-12 2020-04-21 腾讯科技(深圳)有限公司 一种对象推荐方法、装置、以及计算机存储介质
CN111414548A (zh) * 2020-05-09 2020-07-14 中国工商银行股份有限公司 对象推荐方法、装置、电子设备和介质
CN112883268A (zh) * 2021-02-22 2021-06-01 中国计量大学 一种考虑用户多兴趣以及社交影响的会话推荐方法
US20210174164A1 (en) * 2019-12-09 2021-06-10 Miso Technologies Inc. System and method for a personalized search and discovery engine
CN112948668A (zh) * 2021-02-04 2021-06-11 深圳大学 一种信息推荐方法、电子设备及存储介质
CN113010802A (zh) * 2021-03-25 2021-06-22 华南理工大学 一种基于用户与物品多属***互面向隐式反馈的推荐方法
CN113536106A (zh) * 2020-11-23 2021-10-22 腾讯科技(深圳)有限公司 待推荐信息内容确定方法
CN114238750A (zh) * 2021-11-18 2022-03-25 浙江工业大学 基于异构网络信息嵌入模型的交互可视推荐方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291266B (zh) * 2020-02-13 2023-03-21 深圳市雅阅科技有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111553759A (zh) * 2020-03-25 2020-08-18 平安科技(深圳)有限公司 一种产品信息推送方法、装置、设备及存储介质
CN114756762B (zh) * 2022-06-13 2022-09-02 腾讯科技(深圳)有限公司 数据处理方法、装置、设备及存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013026814A2 (pt) * 2011-04-19 2017-01-10 Nokia Corp método, aparelho, meio de armazenamento legível por computador e produto de programa de computador
CN103995866A (zh) * 2014-05-19 2014-08-20 北京邮电大学 一种基于链路预测的商品信息推送方法及装置
CN105320719A (zh) * 2015-01-16 2016-02-10 焦点科技股份有限公司 一种基于项目标签和图形关系的众筹网站项目推荐方法
CN106202519A (zh) * 2016-07-22 2016-12-07 桂林电子科技大学 一种结合用户评论内容和评分的项目推荐方法
CN106682114A (zh) * 2016-12-07 2017-05-17 广东工业大学 一种融合用户信任关系和评论信息的个性化推荐方法
US20180268318A1 (en) * 2017-03-17 2018-09-20 Adobe Systems Incorporated Training classification algorithms to predict end-user behavior based on historical conversation data
CN110837598A (zh) * 2019-11-11 2020-02-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及存储介质
US20210174164A1 (en) * 2019-12-09 2021-06-10 Miso Technologies Inc. System and method for a personalized search and discovery engine
CN111046286A (zh) * 2019-12-12 2020-04-21 腾讯科技(深圳)有限公司 一种对象推荐方法、装置、以及计算机存储介质
CN111414548A (zh) * 2020-05-09 2020-07-14 中国工商银行股份有限公司 对象推荐方法、装置、电子设备和介质
CN113536106A (zh) * 2020-11-23 2021-10-22 腾讯科技(深圳)有限公司 待推荐信息内容确定方法
CN112948668A (zh) * 2021-02-04 2021-06-11 深圳大学 一种信息推荐方法、电子设备及存储介质
CN112883268A (zh) * 2021-02-22 2021-06-01 中国计量大学 一种考虑用户多兴趣以及社交影响的会话推荐方法
CN113010802A (zh) * 2021-03-25 2021-06-22 华南理工大学 一种基于用户与物品多属***互面向隐式反馈的推荐方法
CN114238750A (zh) * 2021-11-18 2022-03-25 浙江工业大学 基于异构网络信息嵌入模型的交互可视推荐方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALAHMADI D H 等: "Twitter-based recommender system to address cold-start: A genetic algorithm based trust modelling and probabilistic sentiment analysis", 《2015 IEEE 27TH INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI)》 *
JIA X 等: "Collaborative restricted Boltzmann machine for social event recommendation", 《2016 IEEE/ACM INTERNATIONAL CONFERENCE ON ADVANCES IN SOCIAL NETWORKS ANALYSIS AND MINING (ASONAM)》 *
ZHANG S 等: "Next item recommendation with self-attention", 《ARXIV PREPRINT ARXIV:1808.06414》 *
刘雅辉: "基于深度学习与历史交互序列建模的推荐排序算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
张亚楠 等: "基于社交关系拓扑结构的冷启动推荐方法", 《浙江大学学报(工学版)》 *
罗鹏宇: "基于时序推理的分层会话感知推荐方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023241207A1 (zh) * 2022-06-13 2023-12-21 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品
CN116450938A (zh) * 2023-04-07 2023-07-18 北京欧拉认知智能科技有限公司 一种基于图谱的工单推荐实现方法及***
CN117786094A (zh) * 2023-12-29 2024-03-29 北京基智科技有限公司 一种基于知识图谱的企业技术服务推荐方法及装置

Also Published As

Publication number Publication date
WO2023241207A1 (zh) 2023-12-21
CN114756762B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN114756762B (zh) 数据处理方法、装置、设备及存储介质
CN113626719B (zh) 信息推荐方法、装置、设备、存储介质及计算机程序产品
CN110825884B (zh) 基于人工智能的嵌入表示处理方法、装置及电子设备
CN110378434A (zh) 点击率预测模型的训练方法、推荐方法、装置及电子设备
US20170308535A1 (en) Computational query modeling and action selection
WO2023065859A1 (zh) 物品推荐方法、装置及存储介质
CN112085615A (zh) 图神经网络的训练方法及装置
WO2023213157A1 (zh) 数据处理方法、装置、程序产品、计算机设备和介质
CN116664719A (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
CN116452263A (zh) 一种信息推荐方法、装置、设备及存储介质、程序产品
CN103425791A (zh) 一种基于蚁群协同过滤算法的物品推荐方法和装置
CN114756768B (zh) 数据处理方法、装置、设备、可读存储介质及程序产品
CN116977661A (zh) 一种数据处理方法、装置、设备、存储介质及程序产品
CN110866866A (zh) 图像仿色处理方法、装置、电子设备及存储介质
CN113033209B (zh) 文本关系抽取方法、装置、存储介质及计算机设备
CN114332678A (zh) 数据处理方法、装置、存储介质及设备
US20240211991A1 (en) Data processing method, apparatus, and computer-readable storage medium
WO2023051678A1 (zh) 一种推荐方法及相关装置
CN114817751B (zh) 数据处理方法、装置、电子设备、存储介质及程序产品
KR102266151B1 (ko) 인공지능 기반 투표플랫폼을 통한 소비자 선호도를 제공하는 방법
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN116501993B (zh) 房源数据推荐方法及装置
CN116017068A (zh) 直播推荐方法、装置、设备及计算机可读存储介质
CN117216537A (zh) 集成模型的训练方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070918

Country of ref document: HK