CN117591750A - 内容推荐模型的训练方法、内容推荐的方法及相关产品 - Google Patents

内容推荐模型的训练方法、内容推荐的方法及相关产品 Download PDF

Info

Publication number
CN117591750A
CN117591750A CN202410080474.5A CN202410080474A CN117591750A CN 117591750 A CN117591750 A CN 117591750A CN 202410080474 A CN202410080474 A CN 202410080474A CN 117591750 A CN117591750 A CN 117591750A
Authority
CN
China
Prior art keywords
sequence
content
recommended
model
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410080474.5A
Other languages
English (en)
Inventor
杨若辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Bodian Zhihe Technology Co ltd
Original Assignee
Beijing Bodian Zhihe Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bodian Zhihe Technology Co ltd filed Critical Beijing Bodian Zhihe Technology Co ltd
Priority to CN202410080474.5A priority Critical patent/CN117591750A/zh
Publication of CN117591750A publication Critical patent/CN117591750A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了内容推荐模型的训练方法、内容推荐的方法及相关产品。目标ID序列输入待训练模型中的生成模块得到待推荐ID序列,目标ID序列为用户历史交互内容的ID序列。将待推荐ID序列输入待训练模型中的判别模块,得到各待推荐ID的合理性评分。将合理性评分作为反馈信号,指导生成模块的训练。基于生成对抗网络训练,使生成模块生成更合理的待推荐ID序列,判别模块更好地辨别待推荐ID序列的合理性,两模块迭代训练,共同优化参数。且各生成模块间进行模型参数共享,目标ID序列也可为用户历史交互内容对应的特征ID序列,能够基于多种特征、更灵活、准确地捕获到用户偏好、推荐给用户个性化的内容。

Description

内容推荐模型的训练方法、内容推荐的方法及相关产品
技术领域
本申请涉及数据处理技术领域,特别涉及内容推荐模型的训练方法、内容推荐的方法及相关产品。
背景技术
随着大数据时代的到来,用户在搜索时往往面对大量数据,无法快速找到适合自己的内容。例如,短视频平台每天上传海量的视频,用户更需要看到(被推荐到)自己偏好的视频。又例如,在二手房市场中,用户很难在海量的房源中找到适合自己的房源。因此,需要一种根据用户个人需求和喜好来推荐内容的方法。
现有技术中的内容推荐方法通常依赖于定制的启发式方法,如设置预设条件筛选,或是提取内容特征进行筛选。设置预设条件的技术高度依赖于人工设置的策略,对于新内容缺乏灵活性。筛选内容特征的技术只考虑了特征匹配,未完全考虑到用户历史行为,且不适用于没有筛选条件的内容。综上所述,现有技术并不能充分挖掘用户的需求和喜好,推荐模式固化、缺乏灵活性。因此,如何灵活、准确地推荐给用户个性化的内容,成为了一个亟需解决的问题。
发明内容
基于上述问题,本申请提供了内容推荐模型的训练方法、内容推荐的方法及相关产品,以灵活、准确地推荐给用户个性化的内容。
本申请公开了一种内容推荐模型的训练方法,所述训练方法包括:
从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列;所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列;当存在多个所述生成模块时,各生成模块间进行模型参数共享;
将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分;
将所述合理性评分作为反馈信号,指导所述生成模块的训练;
当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
可选的,所述ID库为内容ID库或特征ID库,预构建ID库,包括:
对内容进行预处理,得到每个内容的ID;
对内容中的特征进行预处理,得到每个特征的ID;
基于所述每个内容的ID构建所述内容ID库;
基于所述每个特征的ID构建所述特征ID库。
可选的,所述得到待推荐ID序列,包括:
所述生成模块根据所述目标ID序列,预测出与所述目标ID序列长度相等的预测ID序列;
所述生成模块根据所述预测ID序列,预测出待推荐ID;
所述生成模块将所述待推荐ID拼接在所述预测ID序列后,得到所述待推荐ID序列。
可选的,所述将所述合理性评分作为反馈信号,指导所述生成模块的训练,包括:
所述判别模块将所述合理性评分进行加权求和,得到综合评分;所述加权求和中的权重与所述内容的特征相关;
所述判别模块将所述综合评分作为反馈信号发送回所述生成模块,以指导所述生成模块的训练。
基于上述一种内容推荐模型的训练方法,本申请还公开了一种内容推荐模型的训练装置,所述装置包括:数据生成单元、数据判别单元、指导单元和模型获取单元;
所述数据输入单元,用于从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列;所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列;当存在多个所述生成模块时,各生成模块间进行模型参数共享;
所述数据判别单元,用于将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分;
所述指导单元,用于将所述合理性评分作为反馈信号,指导所述生成模块的训练;
所述模型获取单元,用于当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
可选的,所述ID库为内容ID库或特征ID库,所述数据输入单元,包括:
内容ID获取子单元,用于对内容进行预处理,得到每个内容的ID;
特征ID获取子单元,用于对内容中的特征进行预处理,得到每个特征的ID;
内容ID库构建子单元,用于基于所述每个内容的ID构建所述内容ID库;
特征ID库构建子单元,用于基于所述每个特征的ID构建所述特征ID库。
可选的,所述数据输入单元,包括:
预测ID序列获取子单元,用于所述生成模块根据所述目标ID序列,预测出与所述目标ID序列长度相等的预测ID序列;
待推荐ID获取子单元,用于所述生成模块根据所述预测ID序列,预测出待推荐ID;
待推荐ID序列获取子单元,用于所述生成模块将所述待推荐ID拼接在所述预测ID序列后,得到所述待推荐ID序列。
可选的,所述指导单元,包括:
评分子单元,用于所述判别模块将所述合理性评分进行加权求和,得到综合评分;所述加权求和中的权重与所述内容的特征相关;
指导子单元,用于所述判别模块将所述综合评分作为反馈信号发送回所述生成模块,以指导所述生成模块的训练。
本申请还公开了一种内容推荐的方法,所述方法包括:
将用户的历史ID序列输入内容推荐模型,得到预测结果;所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列;所述内容推荐模型为通过上述内容推荐模型的训练方法训练得到的;
基于所述预测结果,在ID库中获取推荐ID;
向用户推荐与所述推荐ID对应的内容或特征。
可选的,所述得到预测结果,包括:
根据所述历史ID序列,得到与所述历史ID序列长度相等的预测结果ID序列;
根据所述预测结果ID序列,预测出预测结果ID;
将所述预测结果ID作为最后一位向量拼接在所述历史ID序列后,得到所述预测结果。
可选的,所述基于所述预测结果,在ID库中获取推荐ID,包括:
获取所述预测结果ID映射到所述ID库中每一个ID的概率;
选取所述概率中最大的概率对应的ID,作为推荐ID。
可选的,所述用户历史交互内容为用户历史交互房源;
所述用户历史交互内容对应的特征为用户历史交互房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施。
基于上述一种内容推荐的方法,本申请还公开了一种内容推荐的装置,包括:预测单元、推荐ID获取单元和推荐单元;
所述预测单元,用于将用户的历史ID序列输入内容推荐模型,得到预测结果;所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列;所述内容推荐模型为通过上述内容推荐模型的训练方法训练得到的;
所述推荐ID获取单元,用于基于所述预测结果,在ID库中获取推荐ID;
所述推荐单元,用于向用户推荐与所述推荐ID对应的内容或特征。
可选的,所述预测单元,包括:
预测结果ID序列获取子单元,用于根据所述历史ID序列,得到与所述历史ID序列长度相等的预测结果ID序列;
预测结果ID获取子单元,用于根据所述预测结果ID序列,预测出预测结果ID;
预测结果获取子单元,用于将所述预测结果ID作为最后一位向量拼接在所述历史ID序列后,得到所述预测结果。
可选的,推荐ID获取单元,包括:
概率获取子单元,用于获取所述预测结果ID映射到所述ID库中每一个ID的概率;
推荐ID获取子单元,用于选取所述概率中最大的概率对应的ID,作为推荐ID。
可选的,所述用户历史交互内容为用户历史交互房源;
所述用户历史交互内容对应的特征为用户历史交互房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施。
本申请公开了内容推荐模型的训练方法、内容推荐的方法及相关产品。根据从预构建的ID库中选取目标ID序列,并将目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列,目标ID序列为用户历史交互内容的ID序列。将待推荐ID序列输入待训练模型中的判别模块,得到待推荐ID序列中每个待推荐ID的合理性评分。将合理性评分作为反馈信号,指导生成模块的训练。当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。基于生成对抗网络训练,生成模块能够生成更合理的待推荐ID序列,判别模块能够更好地辨别待推荐ID序列的合理性,两个模块迭代训练,共同优化参数。使得模型的输出更加准确、更能捕获到用户偏好。同时,各生成模块间进行模型参数共享,目标ID序列也可为用户历史交互内容对应的特征ID序列,能够基于多种特征、更灵活、准确地推荐给用户个性化的内容。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种内容推荐模型的训练方法的流程示意图;
图2为本申请实施例公开的一种内容推荐的方法的流程示意图;
图3为本申请实施例公开的一种内容推荐模型的训练装置的结构示意图;
图4为本申请实施例公开的一种内容推荐的装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一:本申请公开了一种内容推荐模型的训练方法。
步骤101:从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列。
其中,所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列。
在本实施例所述的方法中,可先对内容进行预处理,得到每个内容的ID,基于所述每个内容的ID构建所述内容ID库。并对内容中的特征进行预处理,得到每个特征的ID,基于所述每个特征的ID构建所述特征ID库。例如,用户历史交互内容为用户历史交互房源时,用户历史交互房源可以为用户在一段时间内曾查看、收藏或咨询等操作过的房源,一般为多个。将每个房源映射到一个数字ID上,又将多个数字ID组成ID序列,便于统一模型的输入输出格式。又例如,用户历史交互内容对应的特征为用户历史交互房源的属性(包括房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施等)时,对每个属性进行映射,得到每个属性的数字ID,又将多个数字ID组成ID序列,以适应模型的输入输出格式。
其中,对内容的预处理和对内容中的特征的预处理可以同时进行,也可以先后进行,此步骤为本实施例所述方法的预处理步骤,在此不对两个预处理的执行顺序做具体限定,能够完成预处理即可。
标准的Transformers架构为端到端的生成架构,具有很强的序列建模能力。在本实施例所述的方法中,可基于Transformers架构构建生成模块。具体可以为,使用具有12个Transformer层的模型,把目标ID序列(历史交互内容的ID序列)作为输入序列,生成模块输出同样长度的预测ID序列,并使用预测ID序列预测出待推荐ID。例如,生成模块基于长度为n的目标ID序列,得到长度为n的预测ID序列,在通过预测ID序列中的第n个向量继续进行预测,得到第n+1个向量,即待推荐ID。最后,将待推荐ID拼接在预测ID序列后,得到待推荐ID序列。
在本实施例所述的方法中,生成模块的目标是目标ID序列,预测下一个交互ID。作为一种可选的方法,当目标ID序列为用户历史交互内容的ID序列,内容为房源时,就是基于用户历史交互房源序列,预测下一个交互房源。作为另一种可选的方法,当目标ID序列为用户历史交互内容对应的特征ID序列,特征为房源的属性时,就是基于用户历史交互房源的属性,预测下一个交互属性。其中,当存在多个生成模块时,各生成模块间进行模型参数共享。作为一种可选的方法,当存在一个针对于交互房源的生成模型和若干针对于交互属性的生成模型时,所有生成模型共享它们的模型参数,如此能够使不同生成器得到的交互属性融入到针对于交互房源的生成模型中,来从不同属性的角度理解用户想要交互的房源。作为另一种可选的方法,当存在若干针对于交互属性的生成模型时,所有生成模型也可以共享它们的模型参数,如此能够为用户提供更多参考。
其中,下一个交互房源可以为用户倾向于进行查看、收藏或咨询等操作的房源。下一个交互属性可以为用户倾向于进行查看、收藏或咨询等操作的属性。
在本实施例所述的方法中,在预测交互属性时,对于每一个属性征,均构建一个基于Transformers架构的生成模型,以特征ID序列作为输入,预测下一个交互的房源的属性。例如,针对m种属性构建m个生成模型。各生成模型间共享同一套模型参数,便于训练时的信息传递,同时也不会带来额外的参数量负担。
步骤102:将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分。
在本实施例所述的方法中,判别模块的目标是基于生成模块生成的待推荐ID序列,判断该序列是否合理。作为一种可选的方法,可以同样基于Transformers架构构建判别模块。由于判别任务的难度低于生成任务,判别模块可使用2个Transformers层的模型,以减少训练代价。判别模块的输入为生成模块生成的待推荐ID序列,输出可以为与待推荐ID一一对应的一个0至1的实数评分,分数越高代表该待推荐ID更合理。以交互房源的预测为例,判别模块可以为生成模块生成的交互房源序列中的每一个交互房源进行合理性评分。
在本实施例所述的方法中,以交互属性的预测为例,对于每一个属性各构建一个基于2个Transformers层架构的生成模型。以特征ID序列作为输入,判断该特征ID序列的合理性。例如,针对每个属性构建m个判别模型,对于该特征ID序列,就可以得到m个合理性评分。这些基于属性的合理性评分,能够为生成模型的预测结果提供可解释性,即推荐给用户该房源时,重点考虑了哪些属性、用户将更倾向于与哪些属性进行交互等,为用户选择房源带来了更多的参考。
步骤103:将所述合理性评分作为反馈信号,指导所述生成模块的训练。
在本实施例所述的方法中,所述判别模块将所述合理性评分进行加权求和,得到综合评分。其中,所述加权求和中的权重与所述内容的特征相关。所述判别模块将所述综合评分作为反馈信号发送回所述生成模块,以指导所述生成模块的训练。例如,将长度为n+1的待推荐ID序列作为判别模块的输入,得到n+1个合理性评分。根据特征的不同,赋予其不同的权重,再将这些合理性评分按照权重进行加权求和,得到综合评分。综合评分就作为生成模块生成的待推荐ID序列的反馈信号,用于指导生成模块的训练。训练的损失函数如下式:
(1)
式中,Gθ表示生成模块,Dφ表示判别模块,Q表示反馈信号,yt表示t时刻生成的待推荐ID,Y1:t-1表示第1时刻到t-1时刻的目标ID序列。
作为一种可选的方法,当综合评分达到激励阈值时,判别模块给予生成模块的反馈信号为激励,当综合未达到激励阈值时,判别模块给予生成模块的反馈信号为惩罚。
步骤104:当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
在本实施例所述的方法中,预设条件可根据实际需求设置。
本实施例所述的方法Transformers架构搭建模型框架,具有优秀的序列理解能力。基于生成对抗网络训练,使生成模块能够生成更合理的待推荐ID序列,使判别模块能够更好地辨别待推荐ID序列的合理性,两个模块迭代训练,共同优化参数。同时多个特征的引入,使得模型能够捕获到更加丰富的用户偏好,在不同特征上理解用户交互行为,能够基于多种特征、更灵活、准确地推荐给用户个性化的内容。从房源与房源的属性的角度,可以预测用户的偏好,准确推荐房源。也可以在推荐给用户该房源时,介绍该房源的某些属性,或者为用户推荐以某属性为基础的房源,从而为用户选择房源带来更多的参考。
实施例二:本申请公开了一种内容推荐的方法。
具体的,请参阅图2,本实施例公开的一种内容推荐的方法包括以下步骤:
步骤201:将用户的历史ID序列输入内容推荐模型,得到预测结果。
在本实施例所述的方法中,所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列。所述内容推荐模型为通过上述内容推荐模型的训练方法训练得到的。
在本实施例所述的方法中,根据所述历史ID序列,得到与所述历史ID序列长度相等的预测结果ID序列。根据所述预测结果ID序列,预测出预测结果ID。将所述预测结果ID作为最后一位向量拼接在所述历史ID序列后,得到所述预测结果。
步骤202:基于所述预测结果,在ID库中获取推荐ID。
在本实施例所述的方法中,获取所述预测结果ID映射到所述ID库中每一个ID的概率。选取所述概率中最大的概率对应的ID,作为推荐ID。例如,当预测结果ID为内容推荐模型输出的房源ID时,使用Softmax函数将这个房源ID映射到房源ID库中的每一个房源ID上,并获取映射概率,选取这些概率中值最大的房源ID作为推荐ID。
步骤203:向用户推荐与所述推荐ID对应的内容或特征。
在本实施例所述的方法中,所述用户历史交互内容为用户历史交互房源。所述用户历史交互内容对应的特征为用户历史交互房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施等。例如,推荐ID为房源ID时,根据该房源ID可获取到该房源,将该房源推荐给用户。推荐ID为属性ID时,根据该属性ID可获取到该属性,将该属性展示/推荐给客户。
本实施例所述方法可用于房源和房源的属性的预测。预测用户的偏好房源/属性,准确推荐房源。也可以在推荐给用户该房源时,介绍该房源的某些属性,或者为用户推荐以某属性为基础的房源,从而为用户选择房源带来更多的参考。
基于上述实施例公开的一种内容推荐模型的训练方法,本实施例对应公开了一种内容推荐模型的训练装置。请参阅图3,所述一种内容推荐模型的训练装置包括:数据生成单元301、数据判别单元302、指导单元303和模型获取单元304;
所述数据输入单元301,用于从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列;所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列;当存在多个所述生成模块时,各生成模块间进行模型参数共享;
所述数据判别单元302,用于将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分;
所述指导单元303,用于将所述合理性评分作为反馈信号,指导所述生成模块的训练;
所述模型获取单元304,用于当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
可选的,所述ID库为内容ID库或特征ID库,所述数据输入单元301,包括:
内容ID获取子单元,用于对内容进行预处理,得到每个内容的ID;
特征ID获取子单元,用于对内容中的特征进行预处理,得到每个特征的ID;
内容ID库构建子单元,用于基于所述每个内容的ID构建所述内容ID库;
特征ID库构建子单元,用于基于所述每个特征的ID构建所述特征ID库。
可选的,所述数据输入单元301,包括:
预测ID序列获取子单元,用于所述生成模块根据所述目标ID序列,预测出与所述目标ID序列长度相等的预测ID序列;
待推荐ID获取子单元,用于所述生成模块根据所述预测ID序列,预测出待推荐ID;
待推荐ID序列获取子单元,用于所述生成模块将所述待推荐ID拼接在所述预测ID序列后,得到所述待推荐ID序列。
可选的,所述指导单元303,包括:
评分子单元,用于所述判别模块将所述合理性评分进行加权求和,得到综合评分;所述加权求和中的权重与所述内容的特征相关;
指导子单元,用于所述判别模块将所述综合评分作为反馈信号发送回所述生成模块,以指导所述生成模块的训练。
基于上述实施例公开的一种内容推荐的方法,本实施例对应公开了一种内容推荐的装置。请参阅图4,所述一种内容推荐的装置包括:预测单元401、推荐ID获取单元402和推荐单元403;
所述预测单元401,用于将用户的历史ID序列输入内容推荐模型,得到预测结果;所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列;所述内容推荐模型为通过上述内容推荐模型的训练方法训练得到的;
所述推荐ID获取单元402,用于基于所述预测结果,在ID库中获取推荐ID;
所述推荐单元403,用于向用户推荐与所述推荐ID对应的内容或特征。
可选的,所述预测单元401,包括:
预测结果ID序列获取子单元,用于根据所述历史ID序列,得到与所述历史ID序列长度相等的预测结果ID序列;
预测结果ID获取子单元,用于根据所述预测结果ID序列,预测出预测结果ID;
预测结果获取子单元,用于将所述预测结果ID作为最后一位向量拼接在所述历史ID序列后,得到所述预测结果。
可选的,推荐ID获取单元402,包括:
概率获取子单元,用于获取所述预测结果ID映射到所述ID库中每一个ID的概率;
推荐ID获取子单元,用于选取所述概率中最大的概率对应的ID,作为推荐ID。
可选的,
所述用户历史交互内容为用户历史交互房源;
所述用户历史交互内容对应的特征为用户历史交互房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施。
本说明书中实施例采用递进的方式描述。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
本说明书中实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种内容推荐模型的训练方法,其特征在于,包括:
从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列;所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列;当存在多个所述生成模块时,各生成模块间进行模型参数共享;
将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分;
将所述合理性评分作为反馈信号,指导所述生成模块的训练;
当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
2.根据权利要求1所述的训练方法,其特征在于,所述ID库为内容ID库或特征ID库,预构建ID库,包括:
对内容进行预处理,得到每个内容的ID;
对内容中的特征进行预处理,得到每个特征的ID;
基于所述每个内容的ID构建所述内容ID库;
基于所述每个特征的ID构建所述特征ID库。
3.根据权利要求1所述的训练方法,其特征在于,所述得到待推荐ID序列,包括:
所述生成模块根据所述目标ID序列,预测出与所述目标ID序列长度相等的预测ID序列;
所述生成模块根据所述预测ID序列,预测出待推荐ID;
所述生成模块将所述待推荐ID拼接在所述预测ID序列后,得到所述待推荐ID序列。
4.根据权利要求1所述的训练方法,其特征在于,所述将所述合理性评分作为反馈信号,指导所述生成模块的训练,包括:
所述判别模块将所述合理性评分进行加权求和,得到综合评分;所述加权求和中的权重与所述内容的特征相关;
所述判别模块将所述综合评分作为反馈信号发送回所述生成模块,以指导所述生成模块的训练。
5.一种内容推荐的方法,其特征在于,包括:
将用户的历史ID序列输入内容推荐模型,得到预测结果;所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列;所述内容推荐模型为通过权利要求1-4中任一项所述的内容推荐模型的训练方法训练得到的;
基于所述预测结果,在ID库中获取推荐ID;
向用户推荐与所述推荐ID对应的内容或特征。
6.根据权利要求5所述的方法,其特征在于,所述得到预测结果,包括:
根据所述历史ID序列,得到与所述历史ID序列长度相等的预测结果ID序列;
根据所述预测结果ID序列,预测出预测结果ID;
将所述预测结果ID作为最后一位向量拼接在所述历史ID序列后,得到所述预测结果。
7.根据权利要求6所述的方法,其特征在于,所述基于所述预测结果,在ID库中获取推荐ID,包括:
获取所述预测结果ID映射到所述ID库中每一个ID的概率;
选取所述概率中最大的概率对应的ID,作为推荐ID。
8.根据权利要求7所述的方法,其特征在于,所述用户历史交互内容为用户历史交互房源;
所述用户历史交互内容对应的特征为用户历史交互房源的区域、通勤、价格、房型、建筑面积、朝向、户型特点、楼龄、楼层、装修和配套设施。
9.一种内容推荐模型的训练装置,其特征在于,包括:数据生成单元、数据判别单元、指导单元和模型获取单元;
所述数据输入单元,用于从预构建的ID库中选取目标ID序列,并将所述目标ID序列输入待训练模型中的生成模块,得到待推荐ID序列;所述目标ID序列为用户历史交互内容的ID序列,或所述用户历史交互内容对应的特征ID序列;当存在多个所述生成模块时,各生成模块间进行模型参数共享;
所述数据判别单元,用于将所述待推荐ID序列输入所述待训练模型中的判别模块,得到所述待推荐ID序列中每个待推荐ID的合理性评分;
所述指导单元,用于将所述合理性评分作为反馈信号,指导所述生成模块的训练;
所述模型获取单元,用于当得到的合理性评分满足预设条件时,获取当前的待训练模型为内容推荐模型。
10.一种内容推荐的装置,其特征在于,包括:预测单元、推荐ID获取单元和推荐单元;
所述预测单元,用于将用户的历史ID序列输入内容推荐模型,得到预测结果;所述历史ID序列为所述用户的用户历史交互内容的ID序列,或所述用户的用户历史交互内容对应的特征ID序列;所述内容推荐模型为通过权利要求1-4中任一项所述的内容推荐模型的训练方法训练得到的;
所述推荐ID获取单元,用于基于所述预测结果,在ID库中获取推荐ID;
所述推荐单元,用于向用户推荐与所述推荐ID对应的内容或特征。
CN202410080474.5A 2024-01-19 2024-01-19 内容推荐模型的训练方法、内容推荐的方法及相关产品 Pending CN117591750A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410080474.5A CN117591750A (zh) 2024-01-19 2024-01-19 内容推荐模型的训练方法、内容推荐的方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410080474.5A CN117591750A (zh) 2024-01-19 2024-01-19 内容推荐模型的训练方法、内容推荐的方法及相关产品

Publications (1)

Publication Number Publication Date
CN117591750A true CN117591750A (zh) 2024-02-23

Family

ID=89920599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410080474.5A Pending CN117591750A (zh) 2024-01-19 2024-01-19 内容推荐模型的训练方法、内容推荐的方法及相关产品

Country Status (1)

Country Link
CN (1) CN117591750A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200107389A (ko) * 2019-03-07 2020-09-16 네이버 주식회사 생성적 적대 신경망에 기반한 평점 증강 및 아이템 추천 방법 및 시스템
CN113268660A (zh) * 2021-04-28 2021-08-17 重庆邮电大学 一种基于生成对抗网络的多样性推荐方法、装置及服务器
WO2022041979A1 (zh) * 2020-08-28 2022-03-03 腾讯科技(深圳)有限公司 一种信息推荐模型的训练方法和相关装置
CN116540546A (zh) * 2023-05-30 2023-08-04 西门子(中国)有限公司 工艺控制***的控制参数的推荐方法、***、设备和介质
CN116541610A (zh) * 2023-07-06 2023-08-04 深圳须弥云图空间科技有限公司 一种推荐模型的训练方法及装置
CN116842254A (zh) * 2023-06-26 2023-10-03 中国石油大学(华东) 基于时间间隔数据增强的生成对抗网络序列推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200107389A (ko) * 2019-03-07 2020-09-16 네이버 주식회사 생성적 적대 신경망에 기반한 평점 증강 및 아이템 추천 방법 및 시스템
WO2022041979A1 (zh) * 2020-08-28 2022-03-03 腾讯科技(深圳)有限公司 一种信息推荐模型的训练方法和相关装置
CN113268660A (zh) * 2021-04-28 2021-08-17 重庆邮电大学 一种基于生成对抗网络的多样性推荐方法、装置及服务器
CN116540546A (zh) * 2023-05-30 2023-08-04 西门子(中国)有限公司 工艺控制***的控制参数的推荐方法、***、设备和介质
CN116842254A (zh) * 2023-06-26 2023-10-03 中国石油大学(华东) 基于时间间隔数据增强的生成对抗网络序列推荐方法
CN116541610A (zh) * 2023-07-06 2023-08-04 深圳须弥云图空间科技有限公司 一种推荐模型的训练方法及装置

Similar Documents

Publication Publication Date Title
JP5259913B2 (ja) ユーザの共同体のプリファランスエンコーディングの考慮を介したアプリケーションおよびサービスの個人化をサポートする統計的モデルおよび方法
CN111552880B (zh) 基于知识图谱的数据处理方法、装置、介质及电子设备
EP1684507A1 (en) Program recommendation device, program recommendation method of program recommendation device, and computer program
CN108875055B (zh) 一种***方法及设备
KR101720797B1 (ko) 트레이드 카드 서비스
CN110971659A (zh) 推荐消息的推送方法、装置及存储介质
CN111242310A (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN108665148B (zh) 一种电子资源质量评价方法、装置和存储介质
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN111752647A (zh) 卡片信息展示方法、装置、计算机设备及存储介质
KR100553943B1 (ko) 온라인 상의 전문가 선출 방법 및 시스템
CN114969487A (zh) 一种课程推荐方法、装置、计算机设备及存储介质
CN114417174A (zh) 内容推荐方法、装置、设备及计算机存储介质
CN113836388B (zh) 信息推荐方法、装置、服务器及存储介质
KR20210135943A (ko) 오디션과 배우의 매칭 서비스를 제공하는 방법 및 이를 운용하는 서버
CN113204699B (zh) 信息推荐方法、装置、电子设备及存储介质
JP6752330B1 (ja) 機械学習ベースのマッチング装置およびマッチング方法
JP2021114097A (ja) 画像判定システム
CN117591750A (zh) 内容推荐模型的训练方法、内容推荐的方法及相关产品
CN113626709B (zh) 一种基于热度的内容推荐方法及服务器
CN114625894A (zh) 鉴赏力评估、模型训练方法、装置、介质和计算设备
JP2005149033A (ja) コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
CN114861033A (zh) 直播推荐方法、装置、设备及计算机可读存储介质
CN111475737A (zh) 用户推荐方法、装置、电子设备、存储介质
JPWO2019130434A1 (ja) 機械学習処理結果提供システム、機械学習処理結果提供方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination