CN111241394A - 数据处理方法、装置、计算机可读存储介质及电子设备 - Google Patents

数据处理方法、装置、计算机可读存储介质及电子设备 Download PDF

Info

Publication number
CN111241394A
CN111241394A CN202010014261.4A CN202010014261A CN111241394A CN 111241394 A CN111241394 A CN 111241394A CN 202010014261 A CN202010014261 A CN 202010014261A CN 111241394 A CN111241394 A CN 111241394A
Authority
CN
China
Prior art keywords
service
vector
feature
characteristic
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010014261.4A
Other languages
English (en)
Other versions
CN111241394B (zh
Inventor
丘志杰
谢若冰
刘毅
饶君
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010014261.4A priority Critical patent/CN111241394B/zh
Publication of CN111241394A publication Critical patent/CN111241394A/zh
Priority to PCT/CN2020/129886 priority patent/WO2021139415A1/zh
Priority to US17/674,682 priority patent/US20220171760A1/en
Application granted granted Critical
Publication of CN111241394B publication Critical patent/CN111241394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/252Processing of multiple end-users' preferences to derive collaborative data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • H04N21/44224Monitoring of user activity on external systems, e.g. Internet browsing
    • H04N21/44226Monitoring of user activity on external systems, e.g. Internet browsing on social networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • Signal Processing (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种数据处理方法、装置、计算机可读存储介质及电子设备。该方法包括:根据第一业务行为特征生成第一业务嵌入向量,根据第二业务行为特征生成第二业务嵌入向量,并根据业务场景特征生成场景表征向量;根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量,获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重;根据第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据第二业务嵌入向量及其第二权重,生成第二业务特征向量;根据第一业务特征向量和第二业务特征向量,获得对象嵌入向量;获取第一业务候选项目;根据对象嵌入向量,从第一业务候选项目中确定第一业务目标项目。

Description

数据处理方法、装置、计算机可读存储介质及电子设备
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种数据处理方法、装置、计算机可读存储介质及电子设备。
背景技术
在一些应用平台中,可能同时存在多个不同的业务推荐场景,用户在平台上消费多样的内容,同一个用户往往会对这个平台上的不同的业务具有不同的消费行为,但是,相关技术中的推荐***在召回阶段并不能同时考虑这些不同业务之间的相互影响,也未考虑用户所处的业务场景对不同业务的影响,使得召回的项目不够准确,从而影响了最终的推荐结果的精准度。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种数据处理方法、装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服相关技术中存在的多业务场景中,召回的项目不够准确的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一方面,提供了一种数据处理方法,包括:获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征;根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量;根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重;根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重,生成第二业务特征向量;根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量;获取第一业务候选项目;根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
根据本公开实施例的一方面,提供了一种数据处理装置,包括:特征信息获取单元,用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征;行为场景获取单元,用于根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量;业务权重获得单元,用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重;业务权重调整单元,用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重,生成第二业务特征向量;对象向量获得单元,用于根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量;候选信息获取单元,用于获取第一业务候选项目;目标项目确定单元,用于根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
根据本公开实施例的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的数据处理方法。
根据本公开实施例的一方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的数据处理方法。
在本公开的一些实施例所提供的技术方案中,一方面,通过根据第一业务行为特征生成第一业务嵌入向量,根据第二业务行为特征生成第二业务嵌入向量,并根据业务场景特征生成场景表征向量,且根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量,获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重,从而可以根据第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据第二业务嵌入向量及其第二权重,生成第二业务特征向量,即可以针对对象当前所处的业务场景调整不同业务的行为特征的重要程度;另一方面,同时根据第一业务特征向量和第二业务特征向量获得对象嵌入向量,可以有效的融合多种业务信息,从而可以有效利用相关业务辅助当前待推荐的业务的项目召回。由此,综合考虑了对象当前所处的业务场景以及其他业务对当前待推荐的业务的辅助信息,可以提高召回的项目的准确性,最终有助于改善个性化推荐结果的精准性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本公开实施例的数据处理方法或数据处理装置的示例性***架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图;
图3示意性示出了根据本公开的一实施例的数据处理方法的流程图;
图4示出了图3中所示的步骤S320在一实施例中的处理过程示意图;
图5示出了图3中所示的步骤S350在一实施例中的处理过程示意图;
图6示出了图5中所示的步骤S355在一实施例中的处理过程示意图;
图7示出了图3中所示的步骤S350在另一实施例中的处理过程示意图;
图8示意性示出了根据本公开的一实施例的组注意力机制的示意图;
图9示意性示出了根据本公开的另一实施例的数据处理方法的流程图;
图10示出了图3中所示的步骤S350在又一实施例中的处理过程示意图;
图11示意性示出了根据本公开的一实施例的不同业务场景下不同的业务特征的权重的热力图;
图12示意性示出了根据本公开的一实施例的特征域内部交互特征的热力图;
图13示出了图3中所示的步骤S370在一实施例中的处理过程示意图;
图14示意性示出了根据本公开的一实施例的召回框架的网络结构示意图;
图15示意性示出了根据本公开的又一实施例的数据处理方法的流程图;
图16示意性示出了根据本公开的一实施例的召回模型应用在推荐***中的示意图;
图17示意性示出了根据本公开的一个实施例的数据处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本公开实施例的数据处理方法或数据处理装置的示例性***架构100的示意图。
如图1所示,***架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群、云端服务器等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机、可穿戴智能设备、智能家居设备和台式计算机等等。
服务器105可以是提供各种服务的服务器。例如服务器105可以基于用户在终端设备103(也可以是终端设备101或102)上对第一业务和第二业务的行为,获取用户的第一业务行为特征和第二业务行为特征,并获取用户当前所处的业务场景特征。服务器105可以基于第一业务行为特征生成第一业务嵌入向量,根据第二业务行为特征生成第二业务嵌入向量,并根据业务场景特征生成场景表征向量;根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量,获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重;根据第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据第二业务嵌入向量及其第二权重,生成第二业务特征向量;根据第一业务特征向量和第二业务特征向量,获得对象嵌入向量;获取第一业务候选项目;根据对象嵌入向量,从第一业务候选项目中确定第一业务目标项目。服务器105可以进一步对第一业务目标项目进行筛选和排序,并将最终筛选出来的第一业务目标项目以排序后的顺序反馈给终端设备103,进而用户可以基于终端设备103上显示的内容获得其个性化推荐结果。
图2示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图。
需要说明的是,图2示出的电子设备的计算机***200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机***200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有***操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的***中限定的各种功能。
需要说明的是,本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图3或图4或图5或图6或图7或图9或图10或图11或图13所示的各个步骤。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
首先对本公开实施例中涉及的一些术语进行解释说明。
短视频:是指在各种媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容,播放时长通常在几秒到几分钟不等。
小视频:通常比短视频的播放时长更短,生产方式更便利。一般小视频的播放时长在十几秒到1分钟左右。
关键词(Tag):是一种关键词标记,可以用于表达业务的主题内容。例如,对于文章而言,可以从文章的正文和/或标题等中抽取表示该文章的核心内容的一个/组词,如一篇介绍国内手机性能比较的文章,其关键词可以为“手机”、“国内”、“性能”等。再例如,对于视频而言,可以从视频的名称和/或剧情介绍等中提取能够表达该视频的关键内容的一个/组词,如一个根据聊斋志异拍摄的故事,其关键词可以为“聊斋”、“画皮”等。
类目(Category,以下简写为Cate):是对业务的一个抽象描述,将同一业务中多个描述相似内容的项目映射到同一个类目。例如,对于文章而言,可以将多篇描述相似内容的文章归类到同一个类目下,如搞笑类、体育类、新闻类、财经类等。再例如,对于视频而言,可以将多个讲述类似内容的视频归类到同一个类目下,如武侠类、娱乐类、综艺类、资讯类等。
项目(item):是指业务中的一个消费(例如,阅读,观看等)单元,在不同的业务场景中,项目的具体含义不同。例如,对于文章业务而言,一个项目就是一篇文章。再例如,对于视频业务而言,一个视频就是一个项目。再例如,对于短视频业务而言,一个短视频就是一个项目。再例如,对于小视频而言,一个小视频就是一个项目。
Encoding(编码):将输入的数据编码成一个向量。
Decoding:结合编码生成的向量预测可能的输出项目,在本公开实施例中为通过用户的行为编码向量(即对象嵌入向量)预测下一个项目。
Cosine相似度:余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。
Self-Attention:自注意力机制,计算相关性的数据为同源数据。
Attention:注意力机制,通过与多个数据进行相关性计算,得到相关性分布的差异,从而可以对更重要的部分给予更多的关注。
冷启动:在互联网环境当中,冷启动一般指的是在数据分析领域,起初的时候没有大量的数据积累,所以在前期需要积累数据之后才能进行进一步的挖掘分析,而前期的这一个阶段,一般就称之为冷启动。本公开实施例中是指新业务在前期时没有大量的用户消费行为,无法基于新业务的用户消费行为进行新业务的推荐,这个阶段称之为新业务的冷启动。
召回:是指从大量例如上百万、千万的item中,筛选出较少的例如几百上千的item,以供后续的rank(排序)模型进行排序。
在个性化推荐场景中,可能同时存在很多不同的业务推荐场景,例如包括且不止文章推荐、视频(这里的视频是相对短视频和小视频而言的,在下面的实施例中也可以称之为长视频)推荐、短视频推荐、小视频推荐等。用户使用应用程序(application,APP)例如某一款即时通讯APP去消费多样的内容,同一个用户往往有不同的业务消费行为。
相关技术中,针对上述场景,提供的推荐方法是使用单业务信息进行单业务的推荐,即只使用了本业务内部的行为特征,例如需要给用户推荐文章时,仅使用该用户的历史文章阅读行为信息训练一个预测模型用于完成文章推荐;需要给用户推荐长视频时,仅使用该用户的历史长视频观看行为信息训练另一个预测模型用于完成长视频推荐;需要给用户推荐小视频时,仅使用该用户的历史小视频观看行为信息训练又一个预测模型用于完成小视频推荐。
采用上述相关技术中的方案,至少存在以下两个问题:
第一,在***面临着多种业务的个性化推荐问题时,需要针对不同的业务分别开发各自的独立的模型,线上需要同时运行和维护多个模型,耗费较多的运算资源,占据较大的存储空间,且调用和管理较为复杂。
第二,实际情况中,还会面临着随时可能会有新的业务场景融入到信息流中,这就面临着新业务的冷启动推荐问题。例如,这里假设小视频是一个新业务,由于其积累的用户的历史小视频观看行为信息较少,用于训练其对应的预测模型的样本数据较少,从而导致训练获得的模型的预测准确度较低,很难提供比较好的个性化推荐。
基于上述问题,在本公开的一个实施例中提出了一种数据处理方法,以对上述问题进行优化处理。具体参照图3所示,该数据处理方法适用于前述实施例中所述的电子设备,并可以包括步骤S310至步骤S370:
在步骤S310中,获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征。
本公开实施例中,均以对象为用户为例进行举例说明,但本公开并不限定于此,在不同的场景中,对象可以具有不同的含义。第一业务和第二业务可以是文章、视频、短视频和小视频等中的任意一种,且这里假设文章、视频和短视频是平台中比较成熟的业务,小视频是新业务,在下面的实施例中,均以第一业务为文章,第二业务为视频为例进行举例说明,但本公开的保护范围并不限定于此。
用户通过平台,可以阅读文章和观看视频,从用户的阅读历史和观看历史中,可以提取出用户的第一业务行为特征和第二业务行为特征,例如第一业务行为特征可以包括用户的历史阅读过的文章阅读序列、历史阅读过的文章的tag和category信息等,第二业务行为特征可以包括用户的历史观看过的视频的视频播放序列、历史观看过的视频的tag和category信息等。
在示例性实施例中,业务场景特征可以包括业务类型(BusinessType)、网络类型(NetType)和频道标识(ChannelID)。
业务类型例如可以为文章、视频、短视频、小视频等中的任意一种,例如当BusinessType为“文章”时,说明当前要预测的是用户下一步可能感兴趣的文章是什么,当BusinessType为“小视频”时,说明当前要预测的是用户下一步可能感兴趣的小视频是什么。
网络类型例如可以为是否wifi环境下,不同的网络类型也会影响到推荐给用户的item,例如若用户当前处于wifi环境下,则可以给用户推荐播放时长长一些的视频,这样不会造成视频播放时卡顿,也不会浪费用户的流量;若用户当前处于非wifi环境下,则可以给用户推荐播放时长短一些的小视频,给用户流畅的播放体验。
频道标识和业务类型均是与业务场景相关的特征,频道标识这个特征是比业务类型更加细化的用于描述场景信息的特征,用于表达当前用户所处的信息展示页面,某个业务会至少在某个ChannelID下出现。
例如,可以预先设置信息流的主页面的ChannelID为“1”,主页面上可以同时包括视频、短视频、小视频和文章,当用户当前处于主页面时,下一步可以向用户推荐视频、短视频、小视频和文章中的任意一种;当用户滑动主页面时,对某个视频感兴趣时,其可以点击该视频进入视频流页面,假设预先设置了视频流页面的ChannelID为“2”,表示当前用户处于全部是视频的页面,下一步可以向用户推荐视频;短视频流页面的ChannelID为“3”,表示当前用户处于全部是短视频的页面,下一步可以向用户推荐短视频;小视频流页面的ChannelID为“4”,表示当前用户处于全部是小视频的页面,下一步可以向用户推荐小视频。
再例如,可以预先根据信息流的内容和格式的不同,设定视频频道、小说频道、图片频道、热点频道、科技频道、娱乐频道、体育频道、游戏频道、动漫频道、旅游频道、财经频道、汽车频道、时尚频道等,并对这些频道分别设定不同的ChannelID,用户可以切换至所选择的频道,在相应的频道中查看相应的信息流,此时可以通过ChannelID获知用户当前具体所处的频道,从而给用户推荐相应频道的item,以达到更精准的个性化推荐。
可以理解的是,当业务不同时,业务行为特征和业务场景特征可以发生相应的改变,并不限于上述举例说明。
在步骤S320中,根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量。
具体如何生成第一业务嵌入向量和第二业务嵌入向量可以参照下述图4的实施例。
在示例性实施例中,根据所述业务场景特征生成场景表征向量,可以包括:分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化,获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量;根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量,生成所述场景表征向量。
例如,假设业务类型为“文章”、网络类型为“wifi”和频道标识为“1”,可以将其分别映射为一个相同维数的嵌入向量,假设均用一个4(并不限定于此)维的向量来表示,然后,将这3个4维向量(a1,a2,a3,a4)、(b1,b2,b3,b4)和(c1,c2,c3,c4)进行聚合(Aggregate),生成一个新的4维向量(d1,d2,d3,d4)作为场景表征向量。这里的聚合可以是对这3个4维向量进行平均池化(average-pooling)或者最大池化(max-pooling)等操作。以平均池化为例,相当于对这3个4维向量进行向量求平均运算,即d1=(a1+b1+c1)/3,d2=(a2+b2+c2)/3,d3=(a3+b3+c3)/3,d4=(a4+b4+c4)/3。平均池化在减少参数、节约计算资源的同时,更有利信息的完整传递,可以控制过拟合以及提高模型性能。
在步骤S330中,根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重。
本公开实施例中,可以使用场景表征向量来调整不同的业务的特征的权重信息。
例如,可以通过以下公式获得第一业务嵌入向量的第一权重α1
Figure BDA0002358273480000131
其中,A表示场景表征向量,f1表示第一业务嵌入向量,f2表示第二业务嵌入向量。T表示矩阵的转置。
类似的,可以通过以下公式获得第二业务嵌入向量的第二权重α2
Figure BDA0002358273480000141
在步骤S340中,根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重,生成第二业务特征向量。
例如,可以通过以下公式获得第一业务特征向量g1
g1=α1×f1 (3)
例如,可以通过以下公式获得第二业务特征向量g2
g2=α2×f2 (4)
在步骤S350中,根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量。
本公开实施例中,不同的业务的特征可以使用Self-Attention方式自动学习不同的特征之间的相互联系即关联性,生成对象嵌入向量,例如用户观看过的短视频的tag和小视频的tag之间的相互影响等。这样,一方面,在不同的业务场景学习不同的业务的特征的权重信息,可以侧重与用户当前所处的业务场景相匹配的业务,提高召回的数据的准确性。另一方面,使用特征之间的Self-Attention有效的学习不同的业务的特征之间的关联性,这样可以有效的利用不同的业务信息辅助当前待推荐的单业务的个性化推荐,进一步提高召回的item的精准度。此外,若当前待推荐的业务是新业务例如小视频,则可以利用成熟的其他业务信息辅助新业务的个性化推荐,从而有利于新业务的冷启动。
在步骤S360中,获取第一业务候选项目。
例如,假设第一业务是文章,则可以实现设定一些规则(例如排版布局是否美观等),提取一些优质文章放入到文章候选池中。当BusinessType为“文章”时,将文章候选池中的文章作为候选item。
在步骤S370中,根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
具体确定第一业务目标项目的过程可以参考图11的描述。
本公开实施方式提供的数据处理方法,一方面,通过根据第一业务行为特征生成第一业务嵌入向量,根据第二业务行为特征生成第二业务嵌入向量,并根据业务场景特征生成场景表征向量,且根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量,获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重,从而可以根据第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据第二业务嵌入向量及其第二权重,生成第二业务特征向量,即可以针对对象当前所处的业务场景调整不同业务的行为特征的重要程度;另一方面,同时根据第一业务特征向量和第二业务特征向量获得对象嵌入向量,可以有效的融合多种业务信息,从而可以有效利用相关业务辅助当前待推荐的业务的项目召回。由此,综合考虑了对象当前所处的业务场景以及其他业务对当前待推荐的业务的辅助信息,可以提高召回的项目的准确性,最终有助于改善个性化推荐结果的精准性。
图4示出了图3中所示的步骤S320在一实施例中的处理过程示意图。
如图4所示,本公开实施例中,上述步骤S320可以进一步包括以下步骤。
在步骤S321中,将所述第一业务行为特征中的特征值向量化,获得所述第一业务行为特征中的特征值向量。
例如,可以将第一业务行为特征中的每个特征值(一个特征值是一个元素)进行向量化,这里假设将每个特征值用一个4维向量进行表示,则获得第一业务行为特征的每个特征值向量。
在步骤S322中,根据所述第一业务行为特征中的特征值向量,生成第一业务表征向量。
本公开实施例中,可以对第一业务行为特征中的全部特征值向量进行聚合。例如,对第一业务行为特征中的全部特征值向量进行一次平均池化操作,求取全部特征值向量的平均向量作为第一业务表征向量x1
在步骤S323中,将所述第一业务表征向量进行空间映射,生成所述第一业务嵌入向量。
例如,可以通过以下公式获得第一业务嵌入向量f1
f1=x1W1+b1 (5)
上述公式中,W1为第一空间矩阵,b1为第一偏置矩阵,均可以在模型训练阶段确定。
在其他实施例中,上述步骤S320可以进一步包括:将第二业务行为特征中的特征值向量化,获得第二业务行为特征中的特征值向量;根据所述第二业务行为特征中的特征值向量,生成第二业务表征向量;将第二业务表征向量进行空间映射,生成第二业务嵌入向量。
例如,可以将第二业务行为特征中的每个特征值进行向量化,这里假设将每个特征值用一个4维向量进行表示,则获得第二业务行为特征的每个特征值向量。可以对第二业务行为特征中的全部特征值向量进行聚合。例如,对第二业务行为特征中的全部特征值向量进行一次平均池化操作,求取全部特征值向量的平均向量作为第二业务表征向量x2
例如,可以通过以下公式获得第二业务嵌入向量f2
f2=x2W+b (6)
本公开实施例,通过对业务中的多个特征值向量进行平均池化操作,在减少参数、降低计算量的同时,更有利信息的完整传递,可以控制过拟合以及提高模型性能。
图5示出了图3中所示的步骤S350在一实施例中的处理过程示意图。
如图5所示,本公开实施例中,上述步骤S350可以进一步包括以下步骤。
在步骤S351中,根据所述第一业务特征向量g1和所述第二业务特征向量g2生成第一矩阵K和第二矩阵V。
例如,可以通过以下公式获得第一矩阵K:
K=<g1,g2>W2+b2 (7)
上述公式中,W2为第二空间矩阵,b2为第二偏置矩阵,均可以在模型训练阶段确定。
例如,可以通过以下公式获得第二矩阵V:
V=<g1,g2>W3+b3 (8)
上述公式中,W3为第三空间矩阵,b3为第三偏置矩阵,均可以在模型训练阶段确定。
在步骤S352中,根据所述第一业务特征向量生成第三矩阵Q1
例如,可以通过以下公式获得第三矩阵Q1
Q1=g1W4+b4 (9)
上述公式中,W4为第四空间矩阵,b4为第四偏置矩阵,均可以在模型训练阶段确定。
在步骤S353中,根据所述第一矩阵获得n个第一子矩阵,根据所述第二矩阵获得n个第二子矩阵,并根据所述第三矩阵获得n个第三子矩阵,n为大于1的正整数。
例如,以n=8为例,假设第一矩阵K、第二矩阵V和第三矩阵Q1均是9*64维的矩阵,则可以将第一矩阵K拆分成8个9*8维的第一子矩阵,将第二矩阵V拆分成8个9*8维的第二子矩阵,将第三矩阵Q1拆分成8个9*8维的第三子矩阵。n的取值可以根据实际情况进行设定,并不限于这里的举例说明。
在步骤S354中,根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵,生成n个第一头矩阵。
若是基于Self-Attention对第一业务特征向量g1和第二业务特征向量g2进行建模,则可以根据以下公式对这两个特征进行重新编码:
Figure BDA0002358273480000171
其中,softmax是激活函数。假设Q1是一个k*dk维的矩阵,K是一个dk*m维的矩阵,V是一个m*dv维的矩阵,k、dk、m、dv均为大于或等于1的正整数,若忽略softmax的影响,则这是一个attention层,将k*dk的序列Q1编码成了一个新的k*dv的序列。
Figure BDA0002358273480000172
起到调节作用,使得内积不至于太大,太大的话softmax后得到的结果就是非0即1了。
本公开实施例中,使用多头(multi-head)自注意力机制,每一个头可以表示为:
Figure BDA0002358273480000173
上述公式中,i为大于或等于1且小于或等于n的正整数。head1i表示第i个第一头矩阵,Q1i表示第i个第一子矩阵,Ki表示第i个第二子矩阵,Vi表示第i个第三子矩阵。Wi5为第i个第五空间矩阵,可以在模型训练阶段确定。
在步骤S355中,根据n个所述第一头矩阵生成第一业务特征组向量。
第一业务特征组向量的生成过程可以参照图6实施例。如图6所示,本公开实施例中,上述步骤S355可以进一步包括以下步骤。
在步骤S3551中,拼接n个所述第一头矩阵。
在步骤S3552中,根据拼接后的n个所述第一头矩阵和映射矩阵,生成所述第一业务特征组向量。
例如,可以使用以下公式计算第一业务特征组向量group1
group1=[head11,head12,head13,...,head1n]Wo (12)
上述公式中,Wo表示映射矩阵。
图7示出了图3中所示的步骤S350在另一实施例中的处理过程示意图。
如图7所示,本公开实施例中,上述步骤S350可以进一步包括以下步骤。
在步骤S356中,根据所述第二业务特征向量生成第四矩阵。
例如,可以通过以下公式获得第四矩阵Q2
Q2=g2W6+b6 (13)
上述公式中,W6为第六空间矩阵,b6为第六偏置矩阵,均可以在模型训练阶段确定。
在步骤S357中,根据所述第四矩阵获得n个第四子矩阵。
例如,以n=8为例,假设第四矩阵Q2均是9*64维的矩阵,则可以第四矩阵Q2拆分成8个9*8维的第四子矩阵。
在步骤S358中,根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵,生成n个第二头矩阵。
若是基于Self-Attention对第一业务特征向量g1和第二业务特征向量g2进行建模,则可以根据以下公式对这两个特征进行重新编码:
Figure BDA0002358273480000181
其中,假设Q2是一个k*dk维的矩阵。
本公开实施例中,使用多头(multi-head)自注意力机制,每一个头可以表示为:
Figure BDA0002358273480000191
上述公式中,head2i表示第i个第二头矩阵,Q2i表示第i个第四子矩阵。Wi7为第i个第七空间矩阵,可以在模型训练阶段确定。
在步骤S359中,根据n个所述第二头矩阵生成第二业务特征组向量。
例如,可以使用以下公式计算第二业务特征组向量group2
group2=[head21,head22,head23,...,head2n]Wo (16)
图8示意性示出了根据本公开的一实施例的组注意力机制的示意图。
如图8所示,组(group)是指将用户的行为特征划分为了不同的特征组,例如上述举例说明中的m=2,组E1对应的是第一业务特征向量g1,组E2对应的是第二业务特征向量g2,经过多头尺度点乘(multi-head Scale Dot-Product)自注意力层后,生成组1和组2,即第一业务特征组向量group1和第二业务特征组向量group2
本公开实施例中,经过上述自注意力层后,每个group的业务特征组向量融入了全局的所有group的信息。
图9示意性示出了根据本公开的另一实施例的数据处理方法的流程图。
如图9所示,与上述实施例的不同之处在于,本公开实施例提供的方法还可以进一步包括以下步骤。
在步骤S910中,获取所述对象的基础属性特征和社交特征。
用户的基础属性特征例如可以包括性别、年龄、当前所处的位置等,社交特征例如可以包括用户的好友信息、用户发布的动态信息、用户与其好友的互动信息等。
在步骤S920中,根据所述基础属性特征生成基础属性向量。
例如,以用户的性别、年龄、当前所处的位置为例,首先将这3个特征用相同维度例如4维向量表示,对这3个4维向量进行平均池化操作,即进行向量求平均,获得一个新的4维向量作为用户的基础属性向量。
在步骤S930中,根据所述社交特征生成社交嵌入向量。
根据用户的社交特征可以构建该用户的社交关系图或者社交网络(socialnetwork),社交关系图中的一个节点代表一个用户,将具有社交关系例如好友关系、同事关系、亲人关系等的两个用户进行连线,将社交关系图输入至图嵌入模型例如Node2vec(nodeto vector,节点至向量)、DeepWalk和LINE(large-scale information Network,大规模信息网络)等中,图嵌入模型可以自动输出该用户的社交嵌入向量。
图10示出了图3中所示的步骤S350在又一实施例中的处理过程示意图。
如图10所示,本公开实施例中,上述步骤S350可以进一步包括以下步骤。
在步骤S3510中,根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量,获得拼接特征向量。
将第一业务特征组向量、第二业务特征组向量、基础属性向量和社交嵌入向量依次拼接起来,形成一个更大维度的拼接特征向量,不仅融合多种业务行为特征,还同时融合了用户的基础属性特征和用户的社交特征。
在步骤S3511中,通过前馈神经网络对所述拼接特征向量进行处理,获得所述对象嵌入向量。
本公开实施例设计了上下文可感知的多业务融合模型,可以融合多种业务行为特征(即多业务融合),且可以根据业务场景特征调整不同业务行为特征的权重分配(即上下文可感知),并可以使用前馈神经网络(feed forward neural network,FNN)处理生成对象嵌入向量例如用户嵌入向量。在建模的过程中,还会引入社交属性,从用户的社交关系上帮助提供一些召回的候选项目。
其中,前馈神经网络,简称前馈网络,是人工神经网络的一种。前馈神经网络采用一种单向多层结构。其中每一层包含若干个神经元。在此种神经网络中,各神经元可以接收前一层神经元的信号,并产生输出到下一层。第0层叫输入层,最后一层叫输出层,其他中间层叫做隐含层(或隐藏层、隐层)。隐层可以是一层,也可以是多层。整个网络中无反馈,信号从输入层向输出层单向传播。
下面通过一个具体的举例对上述实施例提供的方法进行举例说明。
假设用户U1最近点击了文章A1,A2,A3,即文章阅读序列为[A1,A2,A3],这里要预测用户U1下一篇可能阅读的文章A4,此外还收集用户最近观看的视频播放序列[B1,B2,B3]和小视频播放序列[C1,C2,C3],这些可以称之为用户近期兴趣(user short-terminterests)中的近期行为(short-term behaviors)。具体的特征例举如下表1所示。需要说明的是,这里的“最近”并不限定具体是不是最近一周,只要是用户最近阅读的文章或者浏览的视频等即可。
表1
用户的基础属性 男,34岁,北京
文章阅读序列 A1,A2,A3
历史阅读文章中的Tag ATag1,ATag2,ATag3,ATag4
历史阅读文章所属Category ACate1,ACate2,ACate3
视频播放序列 B1,B2,B3
历史播放视频中的Tag BTag1,BTagB2,BTag3,BTag4
历史播放视频所属Category BCate1,BCate2,BCate3
小视频播放序列 C1,C2,C3
历史播放小视频中的Tag CTag1,CTagB2,CTag3,CTag4
历史播放小视频所属Category CCate1,CCate2,CCate3
BusinessType 文章
ChannelId 1
NetType Wifi
通过本公开实施例提供的模型,将上述表1中每个特征的每一个元素映射为一个嵌入向量(即特征值向量),表1中的每一行可以称之为一个特征组,每一个特征组简称为Field Group,有些特征组内部有多个元素,有些特征组内部只有一个元素。
BusinessType,ChannelID和NetType特征是上下文场景相关的特征,将这三个特征通过一个网络生成场景表征向量,这里假设使用ContextEmbed表示场景表征向量。
其他的特征分为两部分,一部分是用户的基础属性特征,一部分是用户的近期业务行为特征。用户的基础属性特征部分直接做Aggregate,例如直接做一个AveragePooling生成用户的基础属性向量。
用户的近期业务行为特征总共包含9个特征组,将这9个特征组先分别Aggregate在一起,生成9个特征表征向量(即这里将每个业务表征向量用三个特征表征向量来表示,例如第一业务表征向量包括文章阅读序列的第一特征表征向量,历史阅读文章中的Tag的第二特征表征向量,历史阅读文章所属Category的第三特征表征向量)。这里可以使用Average Pooling进行Aggregate,对同一个特征组内的各个元素的向量进行向量求平均,生成一个新的向量作为相应特征组的特征表征向量,这样,因为不同的用户的同一个特征组包含的元素个数可能相差很大,但是经过向量求平均后,最终每个特征组可以用一个相同维度的向量表达。
然后将这9个特征表征向量进行一次空间映射,将不同的特征映射到相同的特征空间,具体的就是一个矩阵乘法计算,可以参考上述公式(5)和(6),这时,公式中的xj代表第j个特征表征向量,j为大于或等于1且小于或等于9的正整数。映射之后获得9个特征嵌入向量表示为Embed1-9。
接下来使用ContextEmbed去重新调整近期业务中的九个特征组的权重。具体的可以使用Attention,参考上述公式(1)-(4),可以根据以下公式计算:
Figure BDA0002358273480000221
NemEmbedj=αjEmbedj (18)
上述公式中,αj表示第j个特征嵌入向量的权重,nf表示与近期业务行为相关的特征组数量,nf为大于或等于1的正整数,j为大于或等于1且小于或等于nf的正整数,例如这里nf=9。Embedj表示第j个特征嵌入向量,NemEmbedj表示第j个业务特征向量,A表示ContextEmbed。
利用上述公式(17)计算得到每个特征组在当前的业务场景下的权重分配,然后利用公式(18)将权重值分别乘到相应的特征组的特征嵌入向量上,经过Attention权重调整之后的业务特征向量表示为NewEmbed1-9
在实际的场景中,不同的场景下不同的业务特征起到的作用是不一样的,本公开实施例通过使用Contextual Attention(基于上下文的注意力机制)的解决方式,可以在不同的业务场景下,完成对不同的业务特征的权重的重新分配。通过数据统计分析,确认本公开实施例提供的方法可以完成按业务场景对业务特征的重新调整权重。对于比较成熟的业务,相关的业务场景特征起到了主导作用。而对于冷启动业务而言,泛化的特征起到了重要的作用,此时其他的相关业务的特征的权重得到了明显的提升,从而可以辅助冷启动业务完成推荐结果的召回。图11绘制了不同业务场景下不同的业务特征的权重的热力图(heatmap)。
如图11所示,文章的ID、Cate和Tag分别表示文章阅读序列、历史阅读文章中的Tag和历史阅读文章所属Category;长视频的ID、Cate和Tag分别表示视频播放序列、历史播放视频中的Tag和历史播放视频所属Category;小视频的ID、Cate和Tag分别表示小视频播放序列、历史播放小视频中的Tag和历史播放小视频所属Category。文章推荐业务中,文章相关的特征组起到了决定性的作用,而在小视频(冷启动业务)推荐业务中,除了小视频相关的特征起到了重要作用外,长视频相关的特征也起到了重要的作用。这说明这种建模方式能够学习到不同的业务场景下的业务特征分配权重,当应用于冷启动业务时,可以很好地学习到其他业务特征对于冷启动业务的辅助信息。
接着使用Self-Attention对新生成的九个业务特征向量进行建模。Self-Attention层的好处是能够一步到位捕捉到全局的联系,解决了长距离依赖,因为它直接把序列两两比较,而且可以进行并行计算。
这里使用的是multi-head Scale Dot-Product自注意力层,将这九个与近期业务行为相关的特征组进行重新编码,具体计算方法如下:
Figure BDA0002358273480000241
上述公式(19)中,K和V分别是对NewEmbed1-9经过类似公式(5)空间映射生成的,对求取下述的group1至group9是相同的,但Q对于group1至group9中的每个group是不同的,在计算group1时,Q是根据NewEmbed1进行类似公式(5)的空间映射获得的;在计算group2时,Q是根据NewEmbed2进行类似公式(5)的空间映射获得的;其他依此类推,直至计算group9时,Q是根据NewEmbed9进行类似公式(5)的空间映射获得的。需要说明的是,空间映射过程中的空间矩阵和偏置矩阵均是通过模型训练过程中获得的。
在本公开实施例中,利用了多头自注意力机制,下面以计算group1为例,每一个头head可以表示为:
Figure BDA0002358273480000242
q为大于或等于2且小于或等于n的正整数,n为K,V,Q中的每一个矩阵所拆分成的子矩阵的个数,例如,假设K,V,Q均是9*64维的矩阵,若将K,V,Q分别分成8个9*8维的子矩阵,则n=8,q的取值为1至8的正整数,根据K,V,Q的相应子矩阵进行相应head的计算,获得8个9*8维的head:head1、head2、head3、head4、head5、head6、head7、head8。多头自注意力机制是注意力机制的完善,把Q,K,V通过空间矩阵映射后,然后再做Attention,把这个过程重复做多次,再把结果拼接起来。所谓“多头”,就是指多做几次同样的事情(参数不共享),然后把结果拼接,在序列内部做Attention,寻找序列内部的联系。
然后,将每个特征组的业务特征组向量表示为多个head的拼接,再乘以映射矩阵Wo,将拼接之后的向量重新映射到一个多维空间中:
groupj=[head1,head2,head3,...,headn]Wo (21)
上述公式中,groupj表示第j个特征组的业务特征组向量,j为大于或等于1且小于或等于nf的正整数,例如这里nf=9。例如,若n=8,则将head1,head2,head3,...,head8进行拼接,形成一个新的9*64维的矩阵。需要说明的是,对于每个group,head1,head2,head3,...,headn是不同的,因此,每个group也是不同的。
经过上述的Attention之后,每个特征组的业务特征组向量会融入全局的所有group的信息。
为了可视化交互注意力机制(Interaction Attention)的有效性,分析了来自小视频通道的用户在所有特征域之间的多头自注意力热力图。大多数heads关注的是目标小视频通道的特征字段,而图12显示的两个heads分别从其他异构通道获取了重要信息。在图12左侧的热力图中,在构建小视频和长视频通道的ID和Cate embeddings(嵌入向量)时,multi-head attention放大了长视频通道的ID和Cate特性。而在右侧的热力图中,multi-head attention在构建两个视频通道的Tag embeddings(嵌入向量)时,突出了文章的Tag和ID特征。结果表明,本公开实施例提供的方法能够有效地解决具有不同头的特征域之间的交互模式。此外,这也证实了单独考虑每个特征域的有效性,因为它们在特征交互中通常表现不同。
经过Self-Attention操作之后,得到了最后的9个特征组的最新的业务特征组向量,将这些特征组的业务特征组向量与用户的基础属性特征组的基础属性向量以及用户的社交嵌入向量进行拼接操作,得到一个长维度的拼接特征向量,经过一个多层的前馈神经网络(例如,下图12中的三个顺次相连的全连接层&激活函数,激活函数可以是Tanh函数,即每一个全连接层后面接一个ReLU(Rectified Linear Unit,线性整流函数)激活函数,但本公开并不限定于此)得到用户最终的用户嵌入向量,假设这个用户嵌入向量为Eu
图13示出了图3中所示的步骤S370在一实施例中的处理过程示意图。
如图13所示,本公开实施例中,上述步骤S370可以进一步包括以下步骤。
在步骤S371中,计算所述对象嵌入向量与所述第一业务候选项目之间的相似度。
例如,还是以第一业务为文章为例,可以使用上述实施例中的用户嵌入向量Eu去预测需要推荐的文章,这里假设优质文章候选池包括N篇文章[X1,X2,X3,…XN]作为候选item,N为大于或等于1的正整数,分别获得各个候选item的嵌入向量,然后将各个候选item的嵌入向量分别于用户嵌入向量Eu计算相似度。
本公开实施例中,以余弦相似度为例,可以根据以下公式计算候选item与用户嵌入向量Eu之间的相似度:
Figure BDA0002358273480000261
上述公式中,u和v均为M维的向量,M为大于或等于1的正整数,u可以用于表示用户嵌入向量Eu,v可以用于表示任意一个候选item的嵌入向量,ui表示u中的第i个特征值,vi表示v中的第i个特征值。
需要说明的是,相似度的计算方式并不限于上述例举的余弦相似度,其他计算方式也属于本公开的保护范围。
在步骤S372中,根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。
可以根据各个候选item与用户嵌入向量之间的相似度,将各个候选item进行降序排列,从中选取排在前(top)的K个候选item作为召回的第一业务目标项目。然后将召回的第一业务目标项目返回给上层应用方,例如推荐***中的rank(排序)模块。
例如,对于上述表1的用户U1,将其近期的文章阅读行为特征、视频播放行为特征、小视频播放行为特征与用户画像(包括用户的基础属性特征和社交特征)有效融合,编码成用户嵌入向量Eu,计算用户嵌入向量Eu与每个候选item的Cosine相似度分值,假设优质文章候选池内有10篇文章,计算之后得到与用户嵌入向量Eu最相似的候选item为X3,X5,X7,于是将它们作为召回候选item,至此,***已经完成了对于用户U1的候选item召回。
图14示意性示出了根据本公开的一实施例的召回框架的网络结构示意图。
如图14所示,假设用户近期兴趣包括用户对多个不同业务的近期行为,将用户的近期行为分为特征组1、特征组2、…、特征组m,m为大于或等于2的正整数,将每个特征组内的特征值用相同维数的嵌入向量表示(例如,这里假设为4维),然后对每个特征组的特征值向量进行向量求平均,获得每个特征组的一个新的4维向量作为每个特征组的业务表征向量,这里将特征组的业务表征向量称之为异构特征(heterogeneous feature),是因为每个特征组表达了不同的含义,可以是同一业务的不同行为特征信息,例如文章阅读序列、历史阅读文章中的tag和历史阅读文章所属Category;也可以是不同业务的行为特征信息,例如文章阅读序列和视频播放序列。然后,通过场景表征向量调整不同特征组的业务表征向量的权重,生成每个特征组的业务特征向量,基于注意力机制可感知上下文业务场景信息(contextual attention,上下文注意力)。接着,通过自注意力机制,对特征组的业务特征向量进行融合处理,获得每个特征组的业务特征组向量,每个特征组的业务特征组向量融合了全部特征组的业务特征信息,即所谓的“交互注意力(Interactive attention)”。
继续参考图14,除了用户近期兴趣,还可以收集用户长期属性(user long-termprofiles),例如用户的社交网络、基础属性和内容属性,其中内容属性是用户长期行为内的内容(contents in users long-term behaviors),是与用户的近期行为相对的一个概念,用户的近期行为例如可以包括用户最近阅读的文章、最近观看的视频、最近播放的小视频等等,用户长期行为综合了用户历史上很长一段时间以来,例如从用户在APP上注册登录以来的全部历史阅读文章、全部历史播放视频、全部历史播放小视频等等,从这些长期行为中可以提取出该用户历史上所有文章阅读序列、所有历史阅读文章中的Tag、所有历史阅读文章所属Category、所有视频播放序列、所有历史播放视频中的Tag、所有历史播放视频所属Category、所有小视频播放序列、所有历史播放小视频中的Tag、所有历史播放小视频所属Category等长期行为特征,将这些长期行为特征表示为嵌入向量,通过神经网络对长期行为特征的嵌入向量进行处理,可以获得长期行为特征向量。
图14实施例中,可以将表征用户近期兴趣的每个特征组的业务特征组向量、表征用户长期属性的社交嵌入向量、基础属性向量和长期行为特征向量进行拼接,然后将拼接后的向量输入至一个多层的前馈神经网络,这里以3层顺次连接的全连接层&激活函数为例进行举例说明,但本公开并不限定于此,前馈神经网络中每层的具体结构,以及所包括的总层数可以根据实际需要进行设置,这里通过前馈神经网络的最后一个全连接层&激活函数输出用户嵌入向量。
图14可以分为两个阶段,第一个阶段是离线训练模型,第二个阶段是利用训练好的模型提供在线服务。在离线训练模型阶段,首先获取训练数据集,训练数据集中包括用户近期兴趣和长期属性以及该用户的标签,用户的标签可以根据用户历史上是否阅读过某篇文章、是否播放过某个视频或者小视频来确定,例如用户历史上阅读过某篇文章,则将该用户作为训练数据集中的正样本,用户历史上没有阅读过某篇文章,则将该用户作为训练数据集中的负样本。将训练数据集中的用户近期兴趣和长期属性输入至模型中,会获得用户嵌入向量,将用户嵌入向量输入至模型的输出层,输出分类概率,从分类概率中选择概率最大的那个分类结果作为预测结果,根据预测结果与用户的标签进行比较,计算误差函数,通过梯度回传优化模型的参数,迭代执行,直至满足停止条件,例如达到设定的迭代次数,或者误差小于设定值。至此,模型训练完毕。
在在线服务阶段,将当前待预测的用户的近期兴趣和长期属性输入至上述训练好的模型中,获得用户嵌入向量,将用户嵌入向量与各个候选item进行相似度的计算,从中选择相似度最大的前K个item作为召回的item,即所谓的最近邻索引(Nearest NeighborIndex),就是根据数据的相似性,从数据库中寻找与目标数据(例如这里的用户嵌入向量)最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。
对于近期兴趣部分来说,可以用于实时收集用户行为反馈,并可以选取加入至训练样本中,实时抽取近期业务行为特征,并近乎实时地更新模型,这样可以将用户的最新兴趣近乎实时地体现在推荐结果里。
对于离线部分而言,通过对线上用户长期以来的行为数据的存储和清理,整理离线训练数据,并周期性地更新模型。对于超大规模数据和基于机器学***台来对离线训练进行支持。
图15示意性示出了根据本公开的又一实施例的数据处理方法的流程图。
如图15所示,与上述实施例的不同之处在于,本公开实施例提供的方法还可以进一步包括以下步骤。
在步骤S1510中,计算所述第一业务目标项目的预估点击率。
本公开实施例中,可以通过推荐***中的rank模块计算召回的item的CTR。
在步骤S1520中,根据所述预估点击率对所述第一业务目标项目进行排序。
根据召回的item的CTR对召回的item进行降序排列,但本公开并不限定于此,例如也可以进行升序排列。
在步骤S1530中,将排序后的第一业务目标项目展示于所述对象。
将排序后的召回的item按顺序返回至用户对应的终端设备,显示于该终端设备的显示屏上,例如可以显示于该用户的即时通讯APP中的信息流界面中。
图16示意性示出了根据本公开的一实施例的召回模型应用在推荐***中的示意图。
如图16所示,是将本公开实施例提出的召回模型(将上述图14所示的模型称之为上下文可感知的多业务融合模型)应用于即时通讯APP上的信息流推荐***中,其可以包括用户/文章网络、交互和上下文注意力网络以及检索模型,需要说明的是,这里之所以称之为用户/文章网络,是假设要预测的是用户感兴趣的下一篇文章,若待测的业务类型发生变化,相应的网络名称可以发生变化,例如用户/视频网络,用户/小视频网络等等。
可以从数据***中存储的用户行为和用户属性中采集用户的近期业务行为特征、基础属性特征和社交特征,还可以从数据***中存储的文章/视频/小视频等不同业务的项目中提取候选item,例如这里假设为候选文章,然后将用户用户的近期业务行为特征、基础属性特征、社交特征和候选文章输入至用户/文章网络,可以生成每个特征组的业务嵌入向量和候选文章的嵌入向量,再将每个特征组的业务嵌入向量输入至交互和上下文注意力网络,可以生成每个特征组的业务特征组向量,基于每个特征组的业务特征组向量可以生成用户嵌入向量,具体生成过程可以参照上述实施例的描述。
这里的检索模型是用于根据用户嵌入向量和候选item的嵌入向量,来确定召回的候选item。在图14实施例中,是基于最近邻检索从候选item中找到相似度最大的K个item作为召回的候选item,由于最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。图16实施例中,采用了近似最近邻检索(Approximate Nearest Neighbor,ANN)。ANN服务器是指基于ANN算法,计算候选item与用户嵌入向量之间的余弦相似度的服务器或者服务器集群。近似最近邻检索搜索可能是近邻的数据项而不再只局限于返回最可能的项目,在可接受范围内的精度的情况下提高检索效率。
图16实施例中的推荐***包括召回逻辑、初选逻辑和排序模块。
其中召回逻辑的作用是,利用上下文可感知的多业务融合模型对多种业务场景提供召回服务,获取用户多种业务的近期行为特征如最近点击阅读行为等、以及用户的基础属性信息和社交信息,利用训练好的模型进行encoding,然后按照上述实施例中描述的策略选择相似度分值最高的一些item进行召回推荐。召回逻辑依据特定用户的画像信息,按照各种个性化、热度等维度进行数据拉取(召回),这里假设ANN服务器召回了K个候选item。
初选逻辑主要负责对召回结果按照特定规则(例如,用户文章相关性,时效性,地域,多样性等)进行初步筛选,例如利用上下文可感知的多业务融合模型中计算好的用户嵌入向量作为初选中的特征,为初选提供精细的语义特征,从K个候选item中选择K’个候选item,K’为大于或等于1且小于或等于K的正整数,以减少rank模块的计算规模。对于推荐***而言,初选逻辑是可选的。
rank模块利用特征生成***抽取的特征,计算预估点击率CTR,以对这K’个候选item排序,呈现给用户。在另一些实施例中,rank模块后,还可以加上一些业务策略,例如去已读、推荐多样化、加入广告等各种业务策略,之后形成最终推荐结果展示给用户。
本公开实施方式提供的数据处理方法,使用上下文业务场景相关的特征去动态调节不同业务特征组的权重,可以针对不同的业务场景建模出不同特征的重要程度;并使用multi-head Self-Attention学习特征组的相互关系,设计的模型可以有效的融合多种业务信息,提供一个多业务有效融合的框架,可以实现所有业务使用同一个模型进行推荐。此外,若待推荐的业务是新业务,该框架还可以巧妙地使用已有的成熟业务辅助新业务的冷启动推荐。
以下介绍本公开的装置实施例,可以用于执行本公开上述的数据处理方法。对于本公开装置实施例中未披露的细节,请参照本公开上述的数据处理方法的实施例。
图17示意性示出了根据本公开的一个实施例的数据处理装置的框图。
参照图17所示,根据本公开的一个实施例的数据处理装置1700可以包括:特征信息获取单元1710、行为场景获取单元1720、业务权重获得单元1730、业务权重调整单元1740、对象向量获得单元1750、候选信息获取单元1760以及目标项目确定单元1770。
具体地,特征信息获取单元1710可以用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征。行为场景获取单元1720可以用于根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量。业务权重获得单元1730可以用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重。业务权重调整单元1740可以用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重,生成第二业务特征向量。对象向量获得单元1750可以用于根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量。候选信息获取单元1760可以用于获取第一业务候选项目。目标项目确定单元1770可以用于根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
在示例性实施例中,行为场景获取单元1720可以包括:特征值向量获得单元,可以用于将所述第一业务行为特征中的特征值向量化,获得所述第一业务行为特征中的特征值向量;第一业务表征向量生成单元,可以用于根据所述第一业务行为特征中的特征值向量,生成第一业务表征向量;第一业务嵌入向量生成单元,可以用于将所述第一业务表征向量进行空间映射,生成所述第一业务嵌入向量。
在示例性实施例中,所述业务场景特征可以包括业务类型、网络类型和频道标识。其中,行为场景获取单元1720可以包括:业务场景特征向量化单元,可以用于分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化,获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量;场景表征向量生成单元,可以用于根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量,生成所述场景表征向量。
在示例性实施例中,业务权重获得单元1730可以通过公式(1)获得所述第一业务嵌入向量的第一权重a1
在示例性实施例中,对象向量获得单元1750可以包括:第一二矩阵生成单元,可以用于根据所述第一业务特征向量和所述第二业务特征向量生成第一矩阵和第二矩阵;第三矩阵生成单元,可以用于根据所述第一业务特征向量生成第三矩阵;第一二三子矩阵获得单元,可以用于根据所述第一矩阵获得n个第一子矩阵,根据所述第二矩阵获得n个第二子矩阵,并根据所述第三矩阵获得n个第三子矩阵,n为大于1的正整数;第一头矩阵生成单元,可以用于根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵,生成n个第一头矩阵;第一业务特征组向量生成单元,可以用于根据n个所述第一头矩阵生成第一业务特征组向量。
在示例性实施例中,第一业务特征组向量生成单元可以包括:第一头矩阵拼接单元,可以用于拼接n个所述第一头矩阵;第一业务特征组向量获得单元,可以用于根据拼接后的n个所述第一头矩阵和映射矩阵,生成所述第一业务特征组向量。
在示例性实施例中,对象向量获得单元1750还可以包括:第四矩阵生成单元,可以用于根据所述第二业务特征向量生成第四矩阵;第四子矩阵获得单元,可以用于根据所述第四矩阵获得n个第四子矩阵;第二头矩阵生成单元,可以用于根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵,生成n个第二头矩阵;第二业务特征组向量生成单元,可以用于根据n个所述第二头矩阵生成第二业务特征组向量。
在示例性实施例中,数据处理装置1700还可以包括:对象属性特征获取单元,可以用于获取所述对象的基础属性特征和社交特征;基础属性向量生成单元,可以用于根据所述基础属性特征生成基础属性向量;社交嵌入向量生成单元,可以用于根据所述社交特征生成社交嵌入向量。
在示例性实施例中,对象向量获得单元1750还可以包括:拼接特征向量获得单元,可以用于根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量,获得拼接特征向量;对象嵌入向量获得单元,可以用于通过前馈神经网络对所述拼接特征向量进行处理,获得所述对象嵌入向量。
在示例性实施例中,目标项目确定单元1770可以包括:相似度计算单元,可以用于计算所述对象嵌入向量与所述第一业务候选项目之间的相似度;第一业务目标项目选取单元,可以用于根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。
在示例性实施例中,数据处理装置1700还可以包括:预估点击率计算单元,可以用于计算所述第一业务目标项目的预估点击率;排序单元,可以用于根据所述预估点击率对所述第一业务目标项目进行排序;项目展示单元,可以用于将排序后的第一业务目标项目展示于所述对象。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种数据处理方法,其特征在于,包括:
获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征;
根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量;
根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重;
根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重生成第二业务特征向量;
根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量;
获取第一业务候选项目;
根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
2.根据权利要求1所述的数据处理方法,其特征在于,根据所述第一业务行为特征生成第一业务嵌入向量,包括:
将所述第一业务行为特征中的特征值向量化,获得所述第一业务行为特征中的特征值向量;
根据所述第一业务行为特征中的特征值向量,生成第一业务表征向量;
将所述第一业务表征向量进行空间映射,生成所述第一业务嵌入向量。
3.根据权利要求1所述的数据处理方法,其特征在于,所述业务场景特征包括业务类型、网络类型和频道标识;其中,根据所述业务场景特征生成场景表征向量,包括:
分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化,获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量;
根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量,生成所述场景表征向量。
4.根据权利要求1所述的数据处理方法,其特征在于,通过以下公式获得所述第一业务嵌入向量的第一权重a1
Figure FDA0002358273470000021
其中,A表示所述场景表征向量,f1表示所述第一业务嵌入向量,f2表示所述第二业务嵌入向量。
5.根据权利要求1所述的数据处理方法,其特征在于,根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量,包括:
根据所述第一业务特征向量和所述第二业务特征向量生成第一矩阵和第二矩阵;
根据所述第一业务特征向量生成第三矩阵;
根据所述第一矩阵获得n个第一子矩阵,根据所述第二矩阵获得n个第二子矩阵,并根据所述第三矩阵获得n个第三子矩阵,n为大于1的正整数;
根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵,生成n个第一头矩阵;
根据n个所述第一头矩阵生成第一业务特征组向量。
6.根据权利要求5所述的数据处理方法,其特征在于,根据所述n个第一头矩阵生成第一业务特征组向量,包括:
拼接n个所述第一头矩阵;
根据拼接后的n个所述第一头矩阵和映射矩阵,生成所述第一业务特征组向量。
7.根据权利要求5所述的数据处理方法,其特征在于,根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量,还包括:
根据所述第二业务特征向量生成第四矩阵;
根据所述第四矩阵获得n个第四子矩阵;
根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵,生成n个第二头矩阵;
根据n个所述第二头矩阵生成第二业务特征组向量。
8.根据权利要求7所述的数据处理方法,其特征在于,还包括:
获取所述对象的基础属性特征和社交特征;
根据所述基础属性特征生成基础属性向量;
根据所述社交特征生成社交嵌入向量。
9.根据权利要求8所述的数据处理方法,其特征在于,根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量,还包括:
根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量,获得拼接特征向量;
通过前馈神经网络对所述拼接特征向量进行处理,获得所述对象嵌入向量。
10.根据权利要求1所述的数据处理方法,其特征在于,根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目,包括:
计算所述对象嵌入向量与所述第一业务候选项目之间的相似度;
根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。
11.根据权利要求1所述的数据处理方法,其特征在于,还包括:
计算所述第一业务目标项目的预估点击率;
根据所述预估点击率对所述第一业务目标项目进行排序;
将排序后的第一业务目标项目展示于所述对象。
12.一种数据处理装置,其特征在于,包括:
特征信息获取单元,用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征;
行为场景获取单元,用于根据所述第一业务行为特征生成第一业务嵌入向量,根据所述第二业务行为特征生成第二业务嵌入向量,并根据所述业务场景特征生成场景表征向量;
业务权重获得单元,用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量,获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重;
业务权重调整单元,用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量,并根据所述第二业务嵌入向量及其第二权重,生成第二业务特征向量;
对象向量获得单元,用于根据所述第一业务特征向量和所述第二业务特征向量,获得对象嵌入向量;
候选信息获取单元,用于获取第一业务候选项目;
目标项目确定单元,用于根据所述对象嵌入向量,从所述第一业务候选项目中确定第一业务目标项目。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至11中任一项所述的数据处理方法。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至11中任一项所述的数据处理方法。
CN202010014261.4A 2020-01-07 2020-01-07 数据处理方法、装置、计算机可读存储介质及电子设备 Active CN111241394B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010014261.4A CN111241394B (zh) 2020-01-07 2020-01-07 数据处理方法、装置、计算机可读存储介质及电子设备
PCT/CN2020/129886 WO2021139415A1 (zh) 2020-01-07 2020-11-18 数据处理方法、装置、计算机可读存储介质及电子设备
US17/674,682 US20220171760A1 (en) 2020-01-07 2022-02-17 Data processing method and apparatus, computer-readable storage medium, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010014261.4A CN111241394B (zh) 2020-01-07 2020-01-07 数据处理方法、装置、计算机可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111241394A true CN111241394A (zh) 2020-06-05
CN111241394B CN111241394B (zh) 2023-09-22

Family

ID=70866493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010014261.4A Active CN111241394B (zh) 2020-01-07 2020-01-07 数据处理方法、装置、计算机可读存储介质及电子设备

Country Status (3)

Country Link
US (1) US20220171760A1 (zh)
CN (1) CN111241394B (zh)
WO (1) WO2021139415A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112416931A (zh) * 2020-11-18 2021-02-26 脸萌有限公司 信息生成方法、装置和电子设备
WO2021139415A1 (zh) * 2020-01-07 2021-07-15 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读存储介质及电子设备
CN113473179A (zh) * 2021-06-30 2021-10-01 北京百度网讯科技有限公司 视频处理方法、装置、电子设备和介质
CN114971664A (zh) * 2021-02-26 2022-08-30 富联精密电子(天津)有限公司 广告投放方法及相关设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12014029B2 (en) * 2021-05-26 2024-06-18 Intuit Inc. Smart navigation
CN113658176B (zh) * 2021-09-07 2023-11-07 重庆科技学院 基于交互注意力与卷积神经网络的瓷砖表面缺陷检测方法
CN115131698B (zh) * 2022-05-25 2024-04-12 腾讯科技(深圳)有限公司 视频属性确定方法、装置、设备及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110238608A1 (en) * 2010-03-25 2011-09-29 Nokia Corporation Method and apparatus for providing personalized information resource recommendation based on group behaviors
US20140279756A1 (en) * 2013-03-18 2014-09-18 The Echo Nest Corporation Cross media recommendation
CN105183781A (zh) * 2015-08-14 2015-12-23 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN107193831A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109918568A (zh) * 2019-03-13 2019-06-21 百度在线网络技术(北京)有限公司 个性化学习方法、装置、电子设备及存储介质
CN110110206A (zh) * 2018-01-17 2019-08-09 阿里巴巴集团控股有限公司 物品间关系挖掘及推荐方法、装置、计算设备、存储介质
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN110347916A (zh) * 2019-06-11 2019-10-18 北京三快在线科技有限公司 跨场景的项目推荐方法、装置、电子设备及存储介质
CN110362751A (zh) * 2019-07-22 2019-10-22 腾讯科技(深圳)有限公司 业务推荐方法、装置、计算机设备和存储介质
CN110472145A (zh) * 2019-07-25 2019-11-19 维沃移动通信有限公司 一种内容推荐方法和电子设备
CN110532472A (zh) * 2019-08-28 2019-12-03 百度在线网络技术(北京)有限公司 内容同步推荐方法、装置、电子设备和存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2727335A4 (en) * 2011-06-28 2015-01-14 Tata Consultancy Services Ltd PROCESS AND SYSTEM FOR CONTEXTIC RECOMMENDATIONS
CN104038517A (zh) * 2013-03-05 2014-09-10 腾讯科技(深圳)有限公司 基于群组关系的信息推送方法以及服务器
US20220092028A1 (en) * 2020-09-21 2022-03-24 Hubspot, Inc. Multi-service business platform system having custom object systems and methods
US11392598B2 (en) * 2016-10-19 2022-07-19 Ebay Inc. Applying a quantitative range for qualitative terms
US10108902B1 (en) * 2017-09-18 2018-10-23 CS Disco, Inc. Methods and apparatus for asynchronous and interactive machine learning using attention selection techniques
KR20200092465A (ko) * 2019-01-07 2020-08-04 삼성전자주식회사 추천 컨텐츠 리스트 제공 방법 및 그에 따른 전자 장치
CN109992710B (zh) * 2019-02-13 2021-10-15 网易传媒科技(北京)有限公司 点击率预估方法、***、介质和计算设备
US11301540B1 (en) * 2019-03-12 2022-04-12 A9.Com, Inc. Refined search query results through external content aggregation and application
CN110297848B (zh) * 2019-07-09 2024-02-23 深圳前海微众银行股份有限公司 基于联邦学习的推荐模型训练方法、终端及存储介质
US11113479B2 (en) * 2019-09-12 2021-09-07 Adobe Inc. Utilizing a gated self-attention memory network model for predicting a candidate answer match to a query
CN111241394B (zh) * 2020-01-07 2023-09-22 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读存储介质及电子设备
US11551086B2 (en) * 2020-03-02 2023-01-10 Rovi Guides, Inc. Systems and methods for improving content recommendations using a trained model

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110238608A1 (en) * 2010-03-25 2011-09-29 Nokia Corporation Method and apparatus for providing personalized information resource recommendation based on group behaviors
US20140279756A1 (en) * 2013-03-18 2014-09-18 The Echo Nest Corporation Cross media recommendation
CN105183781A (zh) * 2015-08-14 2015-12-23 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN107193831A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN110110206A (zh) * 2018-01-17 2019-08-09 阿里巴巴集团控股有限公司 物品间关系挖掘及推荐方法、装置、计算设备、存储介质
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109918568A (zh) * 2019-03-13 2019-06-21 百度在线网络技术(北京)有限公司 个性化学习方法、装置、电子设备及存储介质
CN110347916A (zh) * 2019-06-11 2019-10-18 北京三快在线科技有限公司 跨场景的项目推荐方法、装置、电子设备及存储介质
CN110362751A (zh) * 2019-07-22 2019-10-22 腾讯科技(深圳)有限公司 业务推荐方法、装置、计算机设备和存储介质
CN110472145A (zh) * 2019-07-25 2019-11-19 维沃移动通信有限公司 一种内容推荐方法和电子设备
CN110532472A (zh) * 2019-08-28 2019-12-03 百度在线网络技术(北京)有限公司 内容同步推荐方法、装置、电子设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139415A1 (zh) * 2020-01-07 2021-07-15 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读存储介质及电子设备
CN112416931A (zh) * 2020-11-18 2021-02-26 脸萌有限公司 信息生成方法、装置和电子设备
CN114971664A (zh) * 2021-02-26 2022-08-30 富联精密电子(天津)有限公司 广告投放方法及相关设备
CN113473179A (zh) * 2021-06-30 2021-10-01 北京百度网讯科技有限公司 视频处理方法、装置、电子设备和介质
CN113473179B (zh) * 2021-06-30 2022-12-02 北京百度网讯科技有限公司 视频处理方法、装置、电子设备和介质

Also Published As

Publication number Publication date
WO2021139415A1 (zh) 2021-07-15
US20220171760A1 (en) 2022-06-02
CN111241394B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN111241394B (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN111241311B (zh) 媒体信息推荐方法、装置、电子设备及存储介质
CN111177575A (zh) 一种内容推荐方法、装置、电子设备和存储介质
Lin et al. Heterogeneous knowledge-based attentive neural networks for short-term music recommendations
Sahu et al. Movie popularity and target audience prediction using the content-based recommender system
CN114202061A (zh) 基于生成对抗网络模型及深度强化学习的物品推荐方法、电子设备及介质
CN112989212B (zh) 媒体内容推荐方法、装置和设备及计算机存储介质
CN113051468B (zh) 一种基于知识图谱和强化学习的电影推荐方法及***
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及***
CN112364184A (zh) 多媒体数据的排序方法、装置、服务器及存储介质
Fazelnia et al. Variational user modeling with slow and fast features
CN115438787A (zh) 行为预测***的训练方法及装置
CN114840745A (zh) 一种基于图表征学习和深度语义匹配模型的个性化推荐方法及***
Yuan et al. Wide and deep model of multi-source information-aware recommender system
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质
CN114090848A (zh) 数据推荐及分类方法、特征融合模型及电子设备
Cheng et al. Practice of a New Model Fusion Structure in Short Video Recommendation
Dereventsov et al. Simulated contextual bandits for personalization tasks from recommendation datasets
Wang et al. MOOC resources recommendation based on heterogeneous information network
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
Faisal et al. Recommending Movies on User's Current Preferences via Deep Neural Network
Wu et al. SGT: Session-based Recommendation with GRU and Transformer
CN114298118B (zh) 一种基于深度学习的数据处理方法、相关设备及存储介质
Yusup et al. Siamese Neural Networks Approach to Hybrid Recommender System Modeling for Fostering Economic Growth in Fashion Domain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023642

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant