CN113469752A - 内容推荐方法、装置、存储介质及电子设备 - Google Patents
内容推荐方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN113469752A CN113469752A CN202110832808.6A CN202110832808A CN113469752A CN 113469752 A CN113469752 A CN 113469752A CN 202110832808 A CN202110832808 A CN 202110832808A CN 113469752 A CN113469752 A CN 113469752A
- Authority
- CN
- China
- Prior art keywords
- content
- user
- preference
- feature
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 239000013598 vector Substances 0.000 claims abstract description 156
- 238000011156 evaluation Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 25
- 238000013507 mapping Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 66
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 57
- 238000010586 diagram Methods 0.000 description 15
- 238000012512 characterization method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012384 transportation and delivery Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0263—Targeted advertisements based upon Internet or website rating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及计算机技术领域,具体涉及一种内容推荐方法、装置、存储介质及电子设备。该内容推荐方法包括响应于目标用户的访问请求,获取所述目标用户的用户特征向量;基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。本公开提供的内容推荐方法能够解决现有的活动圈人推荐方案中效率低、准确度不高、覆盖不全面的问题。
Description
技术领域
本公开涉及计算机技术领域,具体涉及一种内容推荐方法、内容推荐装置、计算机可读存储介质及电子设备。
背景技术
在电商场景中,为了吸引用户流量和注意力,运营人员往往会针对部分商品制定营销活动,并圈选可能对其感兴趣的人群进行投放。
目前主要的活动推荐圈人方案主要还是依赖运营提前一天基于以往经验,手工选择标签圈选可能对活动感兴趣的人进行投放。因此,目前的推荐圈人策略对人工依赖强,效率较低,并且对运营人员业务经验依赖性强,准确度不高,同时当前的圈人推荐算法都是提前一天基于标签离线圈选部分可能感兴趣用户,限制了活动的投放人群范围。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种内容推荐方法、内容推荐装置、计算机可读存储介质及电子设备,旨在解决现有的活动圈人推荐方案中效率低、准确度不高、覆盖不全面的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供了一种内容推荐方法,包括:响应于目标用户的访问请求,获取所述目标用户的用户特征向量;基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
根据本公开的一些实施例,基于前述方案,所述获取所述目标用户的用户特征向量,包括:获取所述目标用户的基础信息;基于所述基础信息从预设的用户特征数据库中提取所述目标用户的用户特征向量。
根据本公开的一些实施例,基于前述方案,所述方法还包括预先构建所述用户特征数据库,所述预先构建所述用户特征数据库包括:周期性获取历史用户的用户属性信息和用户行为信息;基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量;存储所述历史用户和所述历史用户的用户特征向量,以构建所述用户特征数据库。
根据本公开的一些实施例,基于前述方案,所述基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量,包括:对所述用户属性信息进行特征处理得到用户属性特征;以及对所述用户行为信息进行特征转换得到用户内容特征;将所述用户属性特征和所述用户内容特征进行特征拼接,以得到所述历史用户的用户特征向量。
根据本公开的一些实施例,基于前述方案,所述对所述用户行为信息进行特征转换得到用户内容特征,包括:基于所述用户行为信息对应的内容品类信息,将所述用户行为信息进行特征映射得到内容品类向量;对所述内容品类向量进行均值处理得到所述用户内容特征。
根据本公开的一些实施例,基于前述方案,所述方法还包括:从预设的内容特征数据库中提取所述候选内容的内容特征向量。
根据本公开的一些实施例,基于前述方案,所述方法还包括预先构建所述内容特征数据库,包括:获取所述候选内容的内容信息;基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量;存储所述候选内容和所述候选内容的内容特征向量,以构建所述内容特征数据库。
根据本公开的一些实施例,基于前述方案,所述内容信息包括内容品类信息、内容品牌信息和内容属性信息;所述基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量,包括:对所述内容品类信息进行特征映射得到内容品类向量,并对所述内容品类向量进行加权处理得到内容品类特征;对所述内容品牌信息进行特征映射得到内容品牌向量,并对所述内容品牌向量进行加权处理得到内容品牌特征;以及对所述内容属性信息进行特征处理得到内容属性特征;将所述内容品类特征、所述内容品牌特征和所述内容属性特征进行特征拼接,以得到所述候选内容的内容特征向量。
根据本公开的一些实施例,基于前述方案,所述基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果,包括:从所述候选内容中确定一目标内容;基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果。
根据本公开的一些实施例,基于前述方案,所述基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果,包括:利用多层感知器计算所述内容特征向量和所述用户特征向量的交叉特征;基于所述交叉特征确定所述目标内容的偏好值作为所述偏好结果。
根据本公开的一些实施例,基于前述方案,所述根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户,包括:根据所述偏好结果中各候选内容的偏好值对所述候选内容进行排序得到排序结果;基于所述排序结果选取偏好内容,并将所述偏好内容推荐至所述目标用户。
根据本公开的一些实施例,基于前述方案,所述方法还包括构建所述双塔模型,所述构建所述双塔模型包括:根据历史推荐数据生成训练集;通过所述训练集进行模型训练得到输入层、表示层和匹配层的参数,以得到所述双塔模型。
根据本公开的一些实施例,基于前述方案,所述方法还包括:将所述双塔模型中用户塔对应的输入层和表示层存储为用户侧子模型;将所述双塔模型中内容塔对应的输入层和表示层存储为内容侧子模型;以及
将所述双塔模型中的匹配层存储为偏好评价子模型。
根据本公开实施例的第二个方面,提供了一种内容推荐装置,包括:响应模块,用于响应于目标用户的访问请求,获取所述目标用户的用户特征向量;评价模块,用于基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;推荐模块,用于根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
根据本公开实施例的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中的内容推荐方法。
根据本公开实施例的第四个方面,提供了一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中的内容推荐方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一些实施例所提供的技术方案中,对用户使用用户特征向量表征,对候选内容使用内容特征向量表征,当接收到目标用户的访问请求时,能够根据目标用户的用户特征向量以及所有候选内容的内容特征向量进行偏好评价,得到目标用户对各候选内容的偏好结果,最终根据偏好结果确定该目标用户的偏好内容来进行推荐。本公开提供的内容推荐方法一方面,在接收到访问请求时,实时响应进行偏好评价得到推荐结果,避免人工选择标签进行圈选操作,提高了内容推荐的效率;另一方面对用户和内容都进行了向量表征以用于偏好评价,而不是利用已有的标签进行推荐,提高了内容推荐的准确性;再一方面,根据访问的目标用户来进行内容推荐,能够优先处理访问的用户,避免预先圈选人群,扩大了内容投放的人群范围。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出本公开示例性实施例中一种内容推荐方法的流程示意图;
图2示意性示出本公开示例性实施例中一种双塔模型的结构示意图;
图3示意性示出本公开示例性实施例中一种构建用户特征数据库的流程示意图;
图4示意性示出本公开示例性实施例中一种构建内容特征数据库的流程示意图;
图5示意性示出本公开示例性实施例中一种内容推荐方法的流程示意图;
图6示意性示出本公开示例性实施例中一种内容推荐装置的组成示意图;
图7示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图;
图8示意性示出本公开示例性实施例中一种电子设备的计算机***的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在电商场景中,为了吸引用户流量和注意力,运营人员往往会针对部分商品制定营销活动内容,并圈选可能对其感兴趣的人群进行内容投放。
目前主要的圈人方案主要还是依赖运营提前一天基于以往经验,手工选择标签圈选可能对活动感兴趣的人进行投放。这种方式存在以下诸多问题:
1、策略圈选对人工依赖强,每一个要投放的活动内容都需要手工操作标签,圈选对其感兴趣的人群进行投放,效率较低;尤其当活动量级较大时,单纯的基于人工圈选无法满足对应的需求。
2、策略圈选对运营人员业务经验依赖性强,但每天的活动层出不穷,彼此区别也很大,利用已有的标签无法精准的对每一个活动以及用户进行个性化挖掘,圈选人群的准确度不高;
3、当前圈人算法都是提前一天基于标签离线圈选部分可能感兴趣用户,一方面标签一般比较单一,会产生用户遗漏的问题,此外用户第二天来访app的概率是随机的,这也进一步限制了活动的投放人群范围。
因此,针对现有技术中存在的问题,本公开提供了一种内容推荐方法,利用用户信息和内容信息基于双塔模型进行建模,自动对全量用户和内容进行表征,实现为活动内容圈选***。
以下对本公开实施例的技术方案的实现细节进行详细阐述。
图1示意性示出本公开示例性实施例中一种内容推荐方法的流程示意图。如图1所示,该内容推荐方法包括步骤S1至步骤S3:
步骤S1,响应于目标用户的访问请求,获取所述目标用户的用户特征向量;
步骤S2,基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;
步骤S3,根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
在本公开的一些实施例所提供的技术方案中,对用户使用用户特征向量表征,对候选内容使用内容特征向量表征,当接收到目标用户的访问请求时,能够根据目标用户的用户特征向量以及所有候选内容的内容特征向量进行偏好评价,得到目标用户对各候选内容的偏好结果,最终根据偏好结果确定该目标用户的偏好内容来进行推荐。本公开提供的内容推荐方法一方面,在接收到访问请求时,实时响应进行偏好评价得到推荐结果,避免人工圈选操作,提高了内容推荐的效率;另一方面对用户和内容都进行了向量表征以用于偏好评价,而不是利用已有的标签进行推荐,提高了内容推荐的准确性;再一方面,根据访问的目标用户来进行内容推荐,能够优先处理访问的用户,避免预先圈选人群,扩大了内容投放的人群范围。
下面,将结合附图及实施例对本示例实施方式中的内容推荐方法的各个步骤进行更详细的说明。
步骤S1,响应于目标用户的访问请求,获取所述目标用户的用户特征向量。
在本公开的一个实施例中,为了给目标用户推荐偏好内容,需要对用户信息和内容信息进行表征。在本公开中采用双塔模型预先进行模型训练,训练完成后分别导出三个子模型,即用户侧子模型、内容测模型和偏好评价子模型,从而实现直接对来访用户和所有候选内容分别自动化生成表征向量,产出用户最感兴趣的内容,解决内容推荐效率低、精度低和覆盖用户不全面的问题。
因此,在步骤S1之前,所述方法还包括步骤S0:构建所述双塔模型,构建双塔模型包括:根据历史推荐数据生成训练集;通过所述训练集进行模型训练得到输入层、表示层和匹配层的参数,以得到所述双塔模型。
图2示意性示出本公开示例性实施例中一种双塔模型的结构示意图。在电商场景中,通常会针对部分商品制定营销活动,在圈选可能对其感兴趣的人群进行内容投放,因此候选内容可以是与商品有关的营销活动。
参考图2所示,在模型训练时,对用户相关信息和活动相关信息分别进行Embedding表征,最后根据表征后的用户Embedding和活动Embedding进行偏好打分。模型共分为三层,由下至上分别为输入层、表示层和匹配层。
在构建训练集时,主要提取历史推荐数据的用户信息和活动信息,例如图2所示的双塔模型中的输入层。其中,用户信息主要包括用户的属性信息(例如性别、年龄、购买力等)、用户的品类行为信息(例如点击品类行为、搜索品类行为、关注品类行为、加购品类行为、下单品类行为),而活动信息可以通过制定营销活动的活动详情页提取,主要包括品类信息、品牌信息以及活动的属性信息(例如有效日期、热门品类数量等),并基于用户对活动的行为打标,构建训练集,通过双塔模型结构输入训练。
在训练时,通过对输入的信息进行特征映射,最终得到用户信息对应的userembedding和活动内容信息对应的camp embedding。这部分由双塔模型的表示层完成,将用户信息表征和活动内容信息表征分成两个单独的塔进行特征映射,分别构建多层的NN模型,最后输出一个多维embedding,分别作为用户和活动内容的低维语义表征。
需要说明的是,用户的品类行为信息和活动的品类信息均为同一套品类体系,可以采用通用的三级品类分类法,也可以根据需要设定分类。因此,由于用户行为中涉及到的商品品类和活动中涉及到的商品品类的体系相同,为了减少训练参数,在该模型中,用户与活动的品类参数可以为共享参数。
最后,双塔模型的匹配层根据用户的user embedding和内容对应的campembedding进行活动偏好评价,通过与实际推荐结果进行对比,进行后向传播优化网络参数。
训练结束后,得到双塔模型的输入层、表示层和匹配层调整后的参数,得到双塔模型。训练的过程与后续使用的过程类似,在使用时会对模型的具体过程进行详细阐述,在此处就不再过多描述。
实际应用中,为提升线上的服务性能,减少线上在线服务的推理压力,因此可以将该模型分别导出为三个子模型。
具体地,将所述双塔模型中用户塔对应的输入层和表示层存储为用户侧子模型,即用户Embedding生成子模型,主要基于用户的相关特征产出用户的Embedding;将所述双塔模型中内容塔对应的输入层和表示层存储为内容侧子模型,即活动Embedding生成子模型,主要基于活动的相关特征产出活动的Embedding;以及将所述双塔模型中的匹配层存储为偏好评价子模型,即用户活动偏好打分子模型,主要基于前两个子模型产出的用户Embedding以及活动Embedding得到用户对活动的偏好程度。
在步骤S1中,响应于目标用户的访问请求,获取所述目标用户的用户特征向量。
其中,目标用户是指访问APP的用户。当用户访问APP时,将该用户作为目标用户,并生成一访问请求发送至服务器,服务器在接收到目标用户的访问请求时,获取该目标用户对应的用户特征向量
基于上述方法,针对每一个来访用户进行实时评价并推荐候选内容,能够避免用户遗漏的问题,相较于传统推荐方法中基于标签圈选用户进行内容投放,扩大了投放的人群范围。
在本公开的一个实施例中,所述获取所述目标用户的用户特征向量,包括:获取所述目标用户的基础信息;基于所述基础信息从预设的用户特征数据库中提取所述目标用户的用户特征向量。
为了减少服务器在线推荐的压力,可以预先对用户信息进行表征构建用户特征数据库,当有目标用户来访时,从数据库中提取该用户的用户特征向量。
图3示意性示出本公开示例性实施例中一种构建用户特征数据库的流程示意图。参考图3所示,预先构建所述用户特征数据库包括:
步骤S31,周期性获取历史用户的用户属性信息和用户行为信息;
步骤S32,基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量;
步骤S33,存储所述历史用户和所述历史用户的用户特征向量,以构建所述用户特征数据库。
接下来对各个步骤进行详细说明:
在步骤S31中,可以由数据管理模块中的用户信息管理模块收集和管理用户的相关数据,周期性地针对全量用户底池定时拉取用户属性信息和用户行为信息可以是每小时、每天或每周,具体可以根据需求进行设定,以进行用户信息实时更新。
用户属性信息可以是用户的画像属性,例如用户的性别、年龄、地理位置、职业等属性;用户行为信息即用户的离线行为序列例如用户的历史的点击行为、搜索行为、关注行为、加购行为、下单行为等等。
在步骤S32中,利用双塔模型的用户侧子模型对全量用户进行特征表征。具体地,所述基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量,包括:
步骤S321,对所述用户属性信息进行特征处理得到用户属性特征。
具体而言,用户属性信息一般都是以字符串形式存在,参考图2所示,将用户的性别、年龄、地理位置、职业等用户属性信息通过用户侧子模型输入层的Embedding Layer嵌入层进行特征映射,连接字符串形成特征向量,作为用户属性特征,记为up。
步骤S322,对所述用户行为信息进行特征转换得到用户内容特征。
在本公开的一个实施例中,所述对所述用户行为信息进行特征转换得到用户内容特征,包括:基于所述用户行为信息对应的内容品类信息,将所述用户行为信息进行特征映射得到内容品类向量;对所述内容品类向量进行均值处理得到所述用户内容特征。
用户行为信息是用户的离线行为序列,每一次行为都对应有商品信息,例如点击品类行为、搜索品类行为、关注品类行为、加购品类行为、下单品类行为,对这些用户行为进行特征处理,记为ul,b,主要用于提取用户的行为兴趣。
获取用户上述的行为特征后,基于Embedding Layer嵌入层将用户行为对应的内容品类进行特征映射,生成用户各个行为特征的内容品类Embedding向量,最后对Embedding向量做average-pooling均值处理,以得到用户行为的抽象表示,即用户内容特征。这是因为用户行为中涉及的商品品类是无序的,可以对向量求均值。
需要注意的是,本公开中并不限制步骤S321和步骤S322的执行步骤,获取用户属性特征和用户内容特征不分先后,可以先处理得到用户属性特征,或是先得到用户内容特征,当然也可以同时进行处理。
步骤S323,将所述用户属性特征和所述用户内容特征进行特征拼接,以得到所述历史用户的用户特征向量。
在本公开的一个实施例中,将用户属性特征和用户内容特征进行特征拼接该过程记为fu。将拼接后的特征经过用户侧的多层全连接转换得到用户的Embedding,记为Su,即:
Su=fu(up,ul,b) (1)
其中,up为用户属性特征,ul,b为用户的行为特征。
用于表征用户信息的用户特征向量是由用户属性特征和用户内容特征拼接得到,其中包括了用户的属性信息,以及用户行为中设计到的内容信息,对用户的基本属性和行为偏好都进行了特征映射。
在步骤S33中,将全量的历史用户以及计算出来的该历史用户的用户特征向量存入Redis,构建用户特征数据库,同时为每一用户添加标识,以便通过标识从数据库中查找匹配的历史用户。
通过定时拉取用户信息,并对用户信息进行表征以构建用户特征数据库,能够在接收到目标用户的访问请求时直接获取该目标用户的用户特征向量,减少在线推荐的服务器压力,提高推荐效率。
步骤S2,基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果。
在本公开的一个实施例中,候选内容同样也可以预先进行表征,进而减少线上实时推荐的服务器压力。因此,所述方法还包括:从预设的内容特征数据库中提取所述候选内容的内容特征向量。
图4示意性示出本公开示例性实施例中一种构建内容特征数据库的流程示意图。参考图4所示,预先构建所述内容特征数据库包括:
步骤S41,获取所述候选内容的内容信息;
步骤S42,基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量;
步骤S43,存储所述候选内容和所述候选内容的内容特征向量,以构建所述内容特征数据库。
在步骤S41中,具体而言,所述内容信息包括内容品类信息、内容品牌信息和内容属性信息。
以候选内容为向用户推荐活动为例,内容信息是指该活动对应商品的品类、品牌以及属性等信息。由于业务每天不定期会创建新活动,为了支持该需求,可以在业务提报新的活动内容时,提取该活动详情页的所有品类、品牌、属性信息。
可以由数据管理模块中的内容信息管理模块收集解析内容数据,为后续用户表征和内容表征做准备。用于实时接收并解析业务提报的活动品类、品牌、起止时间等信息。
在步骤S42中,所述基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量,包括:
步骤S421,对所述内容品类信息进行特征映射得到内容品类向量,并对所述内容品类向量进行加权处理得到内容品类特征;
步骤S422,对所述内容品牌信息进行特征映射得到内容品牌向量,并对所述内容品牌向量进行加权处理得到内容品牌特征;以及步骤S423,对所述内容属性信息进行特征处理得到内容属性特征;
在本公开的一个实施例中,在对内容信息进行表征时,根据内容信息的类别不同,分别采用对应的Embedding Layer嵌入层对内容品类信息、内容品牌信息和内容属性信息进行特征映射得到对应的Embedding向量,记为ci。
参考图2所示,活动属性信息中通常可以将信息映射为字符串后,在将其进行拼接即可得到内容属性特征。而活动中涉及的商品品类或品牌信息有所不同,为了对活动进行准确表征,需要将映射得到向量进行weighted-pooling加权处理,同一活动中不同商品有不同的权重,使得内容表征更加准确,也能进一步提高内容推荐的准确率。
需要说明的是,本公开并不限制步骤S421至步骤S423的执行顺序,可以同时执行,也可以分开执行。
步骤S424,将所述内容品类特征、所述内容品牌特征和所述内容属性特征进行特征拼接,以得到所述候选内容的内容特征向量。
将内容品类特征和所述内容品牌特征与内容属性特征进行特征拼接,并将拼接后的特征向量经过活动侧的多层全连接转换,过程记为fa,得到内容的Embedding,记为Sa,即:
其中,wi为第i项内容的权重,ci为第i项内容的特征向量,a为内容的总数。
在步骤S43中,将全量的候选内容以及计算出来的该内容的内容特征向量存入Redis,构建内容特征数据库。内容更新时获取新的内容信息并对其进行表征,可以确保内容表征实时准确,同时也可以减少在线推荐的服务器压力,提高推荐效率。
在本公开的一个实施例中,在确定了目标用户的用户特征向量,并获取了全量候选内容的内容特征向量后,基于用户特征向量和内容特征向量进行偏好评价。
因此,所述基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果,包括:从所述候选内容中确定一目标内容;基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果。
其中,所述基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果,包括:利用多层感知器计算所述内容特征向量和所述用户特征向量的交叉特征;基于所述交叉特征确定所述目标内容的偏好值作为所述偏好结果。
具体来说,从redis中分别查询得到当前实时来访用户的Embedding和活动池中所有活动的Embedding,进行1v1打分评价。所以在进行偏好评价时,需要选择一个目标内容,将目标用户的user embedding和目标内容对应的camp embedding进行偏好评价,最终得到该目标用户对该目标内容的偏好结果。
鉴于本文使用的双塔模型,不易引入用户-活动的交叉特征,而本公开对线上实时要求较高,时延不能太大,以往线上往往使用点积、cosine等度量函数不符合要求,因此本公开的偏好评价部分采用轻量MLP结构,在保证计算时间的前提下,可以引入更加高阶的交叉特征,更准确的捕捉用户对活动的偏好因子,例如x2、y2、x2y等等。并通过端到端的训练方式,保证用户Embedding与内容Embedding处于同一个特征空间。经过MLP计算得分记为Su,a,过程记为fu,a,即:
Su,a=fu,a(Su,Sa) (3)
步骤S3,根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
在本公开的一个实施例中,所述根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户,包括:根据所述偏好结果中各候选内容的偏好值对所述候选内容进行排序得到排序结果;基于所述排序结果选取偏好内容,并将所述偏好内容推荐至所述目标用户。
在进行偏好评价时,得到了目标用户对各候选内容的偏好分值Su,a,在推荐时,可以将所有候选活动的偏好分值进行排序,从中选择得分最高的内容作为最终的结果返回给用户,记为Au,即:
图5示意性示出本公开示例性实施例中一种内容推荐方法的流程示意图。参考图5所示,该内容推荐方法主要分为三个部分,分别为活动表征、活动推荐和用户表征。
针对活动表征部分,510活动信息管理数据库收集实时活动信息;然后执行步骤S501,活动品牌品类解析,即解析业务提报的活动品类、品牌、起止时间等活动属性;然后执行步骤S502,利用双塔模型对活动信息进行表征,得到活动Embedding向量,存储至520活动redis数据库中。
针对用户表征部分,580用户信息管理数据库收集和管理用户的相关数据,数据主要包括用户属性信息570,以及用户在平台产生的历史行为信息580,同时580用户信息管理数据库还负责收集实时活动信息,以用于后续对用户行为进行表征;之后通过步骤S510、步骤S509对用户行为信息560,以及步骤S512、步骤S511对用户属性信息570进行特征处理,以将信息转化为计算机可读取的用户特征数据,得到用户特征数据550,存储至离线数据库540中;之后执行步骤S508,将离线数据库中各用户的用户特征数据进行用户表征,得到用户Embedding向量,存储至530用户redis数据库中。
针对活动推荐部分,590活动筛选模块用于接收用户的访问请求,然后分别执行步骤S504和步骤S506,即从520活动redis中获取活动Embedding向量,以及从530用户redis中获取用户Embedding向量,之后执行步骤S505,利用用户Embedding向量和活动Embedding向量进行偏好评价,并将结果返回至590活动筛选模块,最终确定偏好值Top的活动推荐给该用户。
基于以上方法,本公开通过对用户的画像属性及品类行为序列,结合活动的品类属性,分别导出三个子模型:用户表征模型、活动表征模型以及用户-活动偏好实时打分模型,从而实现直接对来访用户和所有候选活动分别自动化生成表征向量,产出用户最感兴趣活动,解决了效率低、精度低和覆盖用户不全面的问题。
图6示意性示出本公开示例性实施例中一种内容推荐装置的组成示意图,如图6所示,该内容推荐装置600可以包括响应模块601、评价模块602以及推荐模块603。其中:
响应模块601,用于响应于目标用户的访问请求,获取所述目标用户的用户特征向量;
评价模块602,用于基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;
推荐模块603,用于根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
根据本公开的示例性实施例,所述响应模块601包括用户单元,所述用户单元用于获取所述目标用户的基础信息;基于所述基础信息从预设的用户特征数据库中提取所述目标用户的用户特征向量。
根据本公开的示例性实施例,所述内容推荐装置600还包括用户特征模块(图中未示出),所述用户特征模块用于预先构建所述用户特征数据库,包括:周期性获取历史用户的用户属性信息和用户行为信息;基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量;存储所述历史用户和所述历史用户的用户特征向量,以构建所述用户特征数据库。
根据本公开的示例性实施例,所述内容推荐装置600还用于对所述用户属性信息进行特征处理得到用户属性特征;以及对所述用户行为信息进行特征转换得到用户内容特征;将所述用户属性特征和所述用户内容特征进行特征拼接,以得到所述历史用户的用户特征向量。
根据本公开的示例性实施例,所述内容推荐装置600还用于基于所述用户行为信息对应的内容品类信息,将所述用户行为信息进行特征映射得到内容品类向量;对所述内容品类向量进行均值处理得到所述用户内容特征。
根据本公开的示例性实施例,所述评价模块602包括或内容单元,所述内容单元用于从预设的内容特征数据库中提取所述候选内容的内容特征向量。
根据本公开的示例性实施例,所述内容推荐装置600还包括内容特征模块(图中未示出),所述内容特征模块用于获取所述候选内容的内容信息;基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量;存储所述候选内容和所述候选内容的内容特征向量,以构建所述内容特征数据库。
根据本公开的示例性实施例,所述内容信息包括内容品类信息、内容品牌信息和内容属性信息;所述内容特征模块还用于对所述内容品类信息进行特征映射得到内容品类向量,并对所述内容品类向量进行加权处理得到内容品类特征;对所述内容品牌信息进行特征映射得到内容品牌向量,并对所述内容品牌向量进行加权处理得到内容品牌特征;以及对所述内容属性信息进行特征处理得到内容属性特征;将所述内容品类特征、所述内容品牌特征和所述内容属性特征进行特征拼接,以得到所述候选内容的内容特征向量。
根据本公开的示例性实施例,所述评价模块602还包括评价单元,所述评价单元用于从所述候选内容中确定一目标内容;基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果。
根据本公开的示例性实施例,所述评价单元还用于利用多层感知器计算所述内容特征向量和所述用户特征向量的交叉特征;基于所述交叉特征确定所述目标内容的偏好值作为所述偏好结果。
根据本公开的示例性实施例,所述推荐模块603用于根据所述偏好结果中各候选内容的偏好值对所述候选内容进行排序得到排序结果;基于所述排序结果选取偏好内容,并将所述偏好内容推荐至所述目标用户。
根据本公开的示例性实施例,所述内容推荐装置600还包括模型训练模块(图中未示出),所述模型训练模块用于根据历史推荐数据生成训练集;通过所述训练集进行模型训练得到输入层、表示层和匹配层的参数,以得到所述双塔模型。
根据本公开的示例性实施例,所述模型训练模块还用于将所述双塔模型中用户塔对应的输入层和表示层存储为用户侧子模型;将所述双塔模型中内容塔对应的输入层和表示层存储为内容侧子模型;以及将所述双塔模型中的匹配层存储为偏好评价子模型。
上述的内容推荐装置600中各模块的具体细节已经在对应的内容推荐方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的存储介质。图7示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图。如图7所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如手机上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。图8示意性示出本公开示例性实施例中一种电子设备的计算机***的结构示意图。
需要说明的是,图8示出的电子设备的计算机***800仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,计算机***800包括中央处理单元(Central Processing Unit,CPU)801,其可以根据存储在只读存储器(Read-Only Memory,ROM)802中的程序或者从存储部分808加载到随机访问存储器(Random Access Memory,RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有***操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output,I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本公开的***中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (16)
1.一种内容推荐方法,其特征在于,包括:
响应于目标用户的访问请求,获取所述目标用户的用户特征向量;
基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;
根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
2.根据权利要求1所述的内容推荐方法,其特征在于,所述获取所述目标用户的用户特征向量,包括:
获取所述目标用户的基础信息;
基于所述基础信息从预设的用户特征数据库中提取所述目标用户的用户特征向量。
3.根据权利要求2所述的内容推荐方法,其特征在于,所述方法还包括预先构建所述用户特征数据库,所述预先构建所述用户特征数据库包括:
周期性获取历史用户的用户属性信息和用户行为信息;
基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量;
存储所述历史用户和所述历史用户的用户特征向量,以构建所述用户特征数据库。
4.根据权利要求3所述的内容推荐方法,其特征在于,所述基于所述用户属性信息和所述用户行为信息,利用双塔模型的用户侧子模型对所述历史用户进行特征提取,以得到所述历史用户的用户特征向量,包括:
对所述用户属性信息进行特征处理得到用户属性特征;以及
对所述用户行为信息进行特征转换得到用户内容特征;
将所述用户属性特征和所述用户内容特征进行特征拼接,以得到所述历史用户的用户特征向量。
5.根据权利要求4所述的内容推荐方法,其特征在于,所述对所述用户行为信息进行特征转换得到用户内容特征,包括:
基于所述用户行为信息对应的内容品类信息,将所述用户行为信息进行特征映射得到内容品类向量;
对所述内容品类向量进行均值处理得到所述用户内容特征。
6.根据权利要求1所述的内容推荐方法,其特征在于,所述方法还包括:
从预设的内容特征数据库中提取所述候选内容的内容特征向量。
7.根据权利要求6所述的内容推荐方法,其特征在于,所述方法还包括预先构建所述内容特征数据库,包括:
获取所述候选内容的内容信息;
基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量;
存储所述候选内容和所述候选内容的内容特征向量,以构建所述内容特征数据库。
8.根据权利要求7所述的内容推荐方法,其特征在于,所述内容信息包括内容品类信息、内容品牌信息和内容属性信息;
所述基于所述内容信息利用双塔模型的内容侧子模型对所述候选内容进行特征提取,以得到所述候选内容的内容特征向量,包括:
对所述内容品类信息进行特征映射得到内容品类向量,并对所述内容品类向量进行加权处理得到内容品类特征;
对所述内容品牌信息进行特征映射得到内容品牌向量,并对所述内容品牌向量进行加权处理得到内容品牌特征;以及
对所述内容属性信息进行特征处理得到内容属性特征;
将所述内容品类特征、所述内容品牌特征和所述内容属性特征进行特征拼接,以得到所述候选内容的内容特征向量。
9.根据权利要求1所述的内容推荐方法,其特征在于,所述基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果,包括:
从所述候选内容中确定一目标内容;
基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果。
10.根据权利要求9所述的内容推荐方法,其特征在于,所述基于所述目标用户的用户特征向量和所述目标内容的内容特征向量,利用双塔模型的偏好评价子模型进行偏好评价以得到所述偏好结果,包括:
利用多层感知器计算所述内容特征向量和所述用户特征向量的交叉特征;
基于所述交叉特征确定所述目标内容的偏好值作为所述偏好结果。
11.根据权利要求1所述的内容推荐方法,其特征在于,所述根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户,包括:
根据所述偏好结果中各候选内容的偏好值对所述候选内容进行排序得到排序结果;
基于所述排序结果选取偏好内容,并将所述偏好内容推荐至所述目标用户。
12.根据权利要求3、7、9中任意一项所述的内容推荐方法,其特征在于,所述方法还包括构建所述双塔模型,所述构建所述双塔模型包括:
根据历史推荐数据生成训练集;
通过所述训练集进行模型训练得到输入层、表示层和匹配层的参数,以得到所述双塔模型。
13.根据权利要求12所述的内容推荐方法,其特征在于,所述方法还包括:
将所述双塔模型中用户塔对应的输入层和表示层存储为用户侧子模型;
将所述双塔模型中内容塔对应的输入层和表示层存储为内容侧子模型;以及
将所述双塔模型中的匹配层存储为偏好评价子模型。
14.一种内容推荐装置,其特征在于,包括:
响应模块,用于响应于目标用户的访问请求,获取所述目标用户的用户特征向量;
评价模块,用于基于所述目标用户的用户特征向量和候选内容的内容特征向量进行偏好评价,得到所述目标用户对所述候选内容的偏好结果;
推荐模块,用于根据所述偏好结果从所述候选内容中选取偏好内容,以用于将所述偏好内容推荐至所述目标用户。
15.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1至13任一项所述的内容推荐方法。
16.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至13任一项所述的内容推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832808.6A CN113469752A (zh) | 2021-07-22 | 2021-07-22 | 内容推荐方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832808.6A CN113469752A (zh) | 2021-07-22 | 2021-07-22 | 内容推荐方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469752A true CN113469752A (zh) | 2021-10-01 |
Family
ID=77882164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110832808.6A Pending CN113469752A (zh) | 2021-07-22 | 2021-07-22 | 内容推荐方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469752A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708008A (zh) * | 2021-12-30 | 2022-07-05 | 北京有竹居网络技术有限公司 | 一种推广内容处理方法、装置、设备、介质及产品 |
CN117994008A (zh) * | 2024-04-03 | 2024-05-07 | 深圳市灵智数字科技有限公司 | 活动商品推荐方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN110704739A (zh) * | 2019-09-30 | 2020-01-17 | 汉海信息技术(上海)有限公司 | 资源推荐方法、装置及计算机存储介质 |
CN110825957A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 基于深度学习的信息推荐方法、装置、设备及存储介质 |
CN111026971A (zh) * | 2019-12-25 | 2020-04-17 | 腾讯科技(深圳)有限公司 | 内容的推送方法及装置、计算机存储介质 |
CN111177575A (zh) * | 2020-04-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法、装置、电子设备和存储介质 |
CN111242752A (zh) * | 2020-04-24 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 一种基于多任务预测的确定推荐对象的方法及*** |
CN111784455A (zh) * | 2020-06-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 一种物品推荐方法及推荐设备 |
CN112084404A (zh) * | 2020-09-01 | 2020-12-15 | 北京百度网讯科技有限公司 | 内容推荐方法、装置、设备和介质 |
CN112765482A (zh) * | 2020-12-23 | 2021-05-07 | 微民保险代理有限公司 | 产品投放方法、装置、设备及计算机可读介质 |
CN113077317A (zh) * | 2021-04-19 | 2021-07-06 | 北京京东拓先科技有限公司 | 基于用户数据的物品推荐方法、装置、设备及存储介质 |
-
2021
- 2021-07-22 CN CN202110832808.6A patent/CN113469752A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN110825957A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 基于深度学习的信息推荐方法、装置、设备及存储介质 |
CN110704739A (zh) * | 2019-09-30 | 2020-01-17 | 汉海信息技术(上海)有限公司 | 资源推荐方法、装置及计算机存储介质 |
CN111026971A (zh) * | 2019-12-25 | 2020-04-17 | 腾讯科技(深圳)有限公司 | 内容的推送方法及装置、计算机存储介质 |
CN111177575A (zh) * | 2020-04-07 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法、装置、电子设备和存储介质 |
CN111242752A (zh) * | 2020-04-24 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 一种基于多任务预测的确定推荐对象的方法及*** |
CN111784455A (zh) * | 2020-06-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 一种物品推荐方法及推荐设备 |
CN112084404A (zh) * | 2020-09-01 | 2020-12-15 | 北京百度网讯科技有限公司 | 内容推荐方法、装置、设备和介质 |
US20210209491A1 (en) * | 2020-09-01 | 2021-07-08 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for recommending content, device, and medium |
CN112765482A (zh) * | 2020-12-23 | 2021-05-07 | 微民保险代理有限公司 | 产品投放方法、装置、设备及计算机可读介质 |
CN113077317A (zh) * | 2021-04-19 | 2021-07-06 | 北京京东拓先科技有限公司 | 基于用户数据的物品推荐方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708008A (zh) * | 2021-12-30 | 2022-07-05 | 北京有竹居网络技术有限公司 | 一种推广内容处理方法、装置、设备、介质及产品 |
CN117994008A (zh) * | 2024-04-03 | 2024-05-07 | 深圳市灵智数字科技有限公司 | 活动商品推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070391B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN109492772B (zh) | 生成信息的方法和装置 | |
EP4242955A1 (en) | User profile-based object recommendation method and device | |
US20190303980A1 (en) | Training and utilizing multi-phase learning models to provide digital content to client devices in a real-time digital bidding environment | |
US20100318427A1 (en) | Enhancing database management by search, personal search, advertising, and databases analysis efficiently using core-set implementations | |
CN107644036A (zh) | 一种数据对象推送的方法、装置及*** | |
CN113569129A (zh) | 点击率预测模型处理方法、内容推荐方法、装置及设备 | |
CN110008397A (zh) | 一种推荐模型训练方法及装置 | |
CN108133390A (zh) | 用于预测用户行为的方法和装置以及计算设备 | |
CN113469752A (zh) | 内容推荐方法、装置、存储介质及电子设备 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
CN112148994B (zh) | 信息推送效果评估方法、装置、电子设备及存储介质 | |
CN115222433A (zh) | 一种信息推荐方法、装置及存储介质 | |
US20230316106A1 (en) | Method and apparatus for training content recommendation model, device, and storage medium | |
CN117391866A (zh) | 一种数据处理方法、装置、设备及其存储介质 | |
CN112559877A (zh) | 基于跨平台异构数据及行为上下文的ctr预估方法及*** | |
CN111814050A (zh) | 旅游场景强化学习模拟环境构建方法、***、设备和介质 | |
EP4116884A2 (en) | Method and apparatus for training tag recommendation model, and method and apparatus for obtaining tag | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN116226537A (zh) | 页面中页面模块的布局、展示方法、装置、设备及介质 | |
CN110503306A (zh) | 一种满意度指标可视化处理方法及装置 | |
CN114119078A (zh) | 目标资源确定方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |