CN111125420B

CN111125420B - 基于人工智能的对象推荐方法、装置及电子设备

Info

Publication number: CN111125420B
Application number: CN201911360645.5A
Authority: CN
Inventors: 缪畅宇
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2021-05-07
Anticipated expiration: 2039-12-25
Also published as: CN111125420A

Abstract

本发明提供了一种基于人工智能的对象推荐方法、装置、电子设备及存储介质；方法包括：获取交互用户的领域外特征；其中，所述交互用户是针对被推荐对象实施交互行为的用户，所述领域外特征是与所述用户相关的、且与所述交互行为无关的特征；确定所述领域外特征与所述被推荐对象之间的关联关系；根据所述关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，所述无交互用户是针对所述待推荐对象未实施交互行为的用户；当所述行为预测结果符合推荐条件时，执行向所述无交互用户推荐所述待推荐对象的操作。通过本发明，能够提升对无交互用户进行对象推荐的准确性。

Description

基于人工智能的对象推荐方法、装置及电子设备

技术领域

本发明涉及人工智能技术，尤其涉及一种基于人工智能的对象推荐方法、装置、电子设备及存储介质。

背景技术

人工智能(AI，Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

对象推荐是人工智能的一个重要应用方向，具体如商品推荐及音乐推荐等。在对象推荐中往往存在冷启动问题，即需要在用户未进行过交互行为的情况下向用户推荐合适的对象，对于该问题，在相关技术提供的方案中，通常是由人工配置冷启动阶段的推荐对象，但是，用户有较大可能对推荐的对象不感兴趣，对象推荐的准确性差。

发明内容

本发明实施例提供一种基于人工智能的对象推荐方法、装置、电子设备及存储介质，能够提升对象推荐的准确性。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种基于人工智能的对象推荐方法，包括：

获取交互用户的领域外特征；

其中，所述交互用户是针对被推荐对象实施交互行为的用户，所述领域外特征是与所述用户相关的、且与所述交互行为无关的特征；

确定所述领域外特征与所述被推荐对象之间的关联关系；

根据所述关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，所述无交互用户是针对所述待推荐对象未实施交互行为的用户；

当所述行为预测结果符合推荐条件时，执行向所述无交互用户推荐所述待推荐对象的操作。

本发明实施例提供一种基于人工智能的对象推荐装置，包括：

获取模块，用于获取交互用户的领域外特征；

关系确定模块，用于确定所述领域外特征与所述被推荐对象之间的关联关系；

预测模块，用于根据所述关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，所述无交互用户是针对所述待推荐对象未实施交互行为的用户；

推荐模块，用于当所述行为预测结果符合推荐条件时，执行向所述无交互用户推荐所述待推荐对象的操作。

本发明实施例提供一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的基于人工智能的对象推荐方法。

本发明实施例提供一种存储介质，存储有可执行指令，用于引起处理器执行时，实现本发明实施例提供的基于人工智能的对象推荐方法。

本发明实施例具有以下有益效果：

本发明实施例通过确定领域外特征与被推荐对象之间的关联关系，在无交互用户仅有领域外特征时，根据关联关系，确定无交互用户针对待推荐对象的行为预测结果，从而确定是否进行推荐，提升了对象推荐的准确性，适用于冷启动的场景。

附图说明

图1是本发明实施例提供的基于人工智能的对象推荐***的一个可选的架构示意图；

图2是本发明实施例提供的结合区块链网络的基于人工智能的对象推荐***的一个可选的架构示意图；

图3是本发明实施例提供的服务器的一个可选的架构示意图；

图4是本发明实施例提供的基于人工智能的对象推荐装置的一个可选的架构示意图；

图5A是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图；

图5B是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图；

图5C是本发明实施例提供的更新权重参数的一个可选的流程示意图；

图5D是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图；

图5E是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图；

图6是本发明实施例提供的通过第二机器学习模型进行预测处理的一个可选的示意图；

图7是本发明实施例提供的训练第一机器学习模型的一个可选的示意图；

图8是本发明实施例提供的通过第一机器学习模型进行预测处理的一个可选的示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)冷启动：指对与对象没有交互行为的新用户进行对象推荐，常用于产品的拉新、增加日活及增加留存。

2)对象：任意具有推荐价值的项目，例如物品、歌曲、服务、新闻、公众号和社交网络好友等。

3)被推荐对象：指用户已实施交互行为的对象，具体可以是通过主动推荐的方式推荐给用户的对象，也可以是用户主动实施交互行为的对象。例如，被推荐对象可以是音乐应用程序向用户主动推荐的、且用户已收听的歌曲，也可以是用户主动在音乐应用程序中搜索并收听的歌曲。

4)待推荐对象：待推荐至用户的对象，待推荐对象与被推荐对象可以相同，也可以不同，但两者属于一类，例如都属于歌曲类。

5)交互行为：指用户针对被推荐对象所实施的、表示对被推荐对象的偏好程度的行为，例如点击、收听、收藏、下载及转发/分享(到社交网络)等。

6)领域外特征：也称冷特征，是指与用户相关的、且与用户针对被推荐对象实施的交互行为无关的特征，例如用户的年龄、性别及城市等。

7)领域内特征：也称热特征，是指与用户针对被推荐对象实施的交互行为相关的特征，例如被推荐对象是歌曲，则领域内特征可以是用户听过的歌曲名称、收听(即交互行为)次数、收听时长及转发/分享次数等。

8)交互用户：针对被推荐对象实施了交互行为的用户。

9)无交互用户：针对待推荐对象未实施交互行为的用户，例如长期注册了某应用程序却并未使用应用程序功能的用户，又例如某应用程序的首次登陆的注册用户。

10)信息散度：又被称为相对熵或KL散度(Kullback-Leibler divergence)，是两个概率分布间差异的非对称性度量。

本发明实施例提供一种基于人工智能的对象推荐方法、装置、电子设备及存储介质，能够提升对象推荐的准确性，下面说明本发明实施例提供的电子设备的示例性应用。

参见图1，图1是本发明实施例提供的基于人工智能的对象推荐***100的一个可选的架构示意图，为实现支撑一个基于人工智能的对象推荐应用，终端设备400(示例性示出了终端设备400-1和终端设备400-2)通过网络300连接服务器200，服务器200连接数据库500，其中，网络300可以是广域网或者局域网，又或者是二者的组合。

服务器200用于从数据库500获取交互样本，对交互样本中的领域内特征进行弱化处理，并根据包括弱化处理后的领域内特征的交互样本，更新第一机器学习模型的权重参数；从终端设备400获取无交互用户的领域外特征，并确定待推荐对象；通过更新后的第一机器学习模型接收待推荐对象的对象特征和无交互用户的领域外特征，并进行预测处理，得到行为预测结果；当行为预测结果符合推荐条件时，将待推荐对象发送至终端设备400；终端设备400用于在图形界面410(示例性示出了图形界面410-1和图形界面410-2)显示待推荐对象。在图1中，以终端设备显示的待推荐对象包括对象1、对象2和对象3为例。

本发明实施例也可结合区块链技术实现，区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中，用户管理模块负责所有区块链参与者的身份信息管理，包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等，并且在授权的情况下，监管和审计某些真实身份的交易情况，提供风险控制的规则配置(风控审计)；基础服务模块部署在所有区块链节点设备上，用来验证业务请求的有效性，并对有效请求完成共识后记录到存储上，对于一个新的业务请求，基础服务先对接口适配解析和鉴权处理(接口适配)，然后通过共识算法将业务信息加密(共识管理)，在加密之后完整一致的传输至共享账本上(网络通信)，并进行记录存储；智能合约模块负责合约的注册发行以及合约触发和合约执行，开发人员可以通过某种编程语言定义合约逻辑，发布到区块链上(合约注册)，根据合约条款的逻辑，调用密钥或者其它的事件触发执行，完成合约逻辑，同时还提供对合约升级注销的功能；运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出，例如：告警、监控网络情况、监控节点设备健康状态等。

参见图2，图2是本发明实施例提供的基于人工智能的对象推荐***110的一个可选的架构示意图，包括区块链网络600(示例性地示出了节点610-1至节点610-3)、认证中心700、业务***800(示例性地示出了归属于业务***800的电子设备810，电子设备810可以是图1中的服务器200或终端设备400)，下面分别进行说明。

区块链网络600的类型是灵活多样的，例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例，任何业务***的电子设备例如终端设备和服务器，都可以在不需要授权的情况下接入区块链网络600；以联盟链为例，业务***在获得授权后其下辖的电子设备(例如终端设备/服务器)可以接入区块链网络600，此时，成为区块链网络600中的一类特殊的节点即客户端节点。

需要指出地，客户端节点可以只提供支持业务***发起交易(例如，用于上链存储数据或查询链上数据)功能，对于区块链网络600的原生节点的功能，例如下文的排序功能、共识服务和账本功能等，客户端节点可以缺省或者有选择性(例如，取决于业务***的具体业务需求)地实现。从而，可以将业务***的数据和业务处理逻辑最大程度迁移到区块链网络600中，通过区块链网络600实现数据和业务处理过程的可信和可追溯。

区块链网络600接收来自业务***(例如图2中示出的业务***800)的客户端节点(例如，图2中示出的归属于业务***800的电子设备810)提交的交易，执行交易以更新账本或者查询账本。

下面以业务***接入区块链网络以实现机器学习模型的上链为例，说明区块链网络的示例性应用。

业务***800的电子设备810接入区块链网络600，成为区块链网络600的客户端节点。电子设备810生成提交机器学习模型的交易，在交易中指定了实现提交操作需要调用的智能合约以及向智能合约传递的参数，交易还携带了业务***800签署的数字签名(例如，使用业务***800的数字证书中的私钥，对交易的摘要进行加密得到)，并将交易广播到区块链网络600。其中，数字证书可由业务***800向认证中心700进行登记注册得到。

区块链网络600中的节点610在接收到交易时，对交易携带的数字签名进行验证，数字签名验证成功后，根据交易中携带的业务***800的身份，确认业务***800是否是具有交易权限，数字签名和权限验证中的任何一个验证判断都将导致交易失败。验证成功后签署节点610自己的数字签名，并继续在区块链网络600中广播。

区块链网络600中具有排序功能的节点610接收到验证成功的交易后，将交易填充到新的区块中，并广播到区块链网络中600提供共识服务的节点。

区块链网络600中的提供共识服务的节点610对新区块进行共识过程以达成一致，提供账本功能的节点将新区块追加到区块链的尾部，并执行新区块中的交易：对于提交机器学习模型的交易，将机器学习模型以键值对的形式存储至状态数据库。

下面以业务***接入区块链网络以实现机器学习模型的查询为例，说明区块链网络的示例性应用。

电子设备810根据用户的指令或预设逻辑，生成查询机器学习模型的交易，同时在交易中指定了实现查询操作需要调用的智能合约以及向智能合约传递的参数，交易还携带了业务***800签署的数字签名。然后，电子设备810将交易广播到区块链网络600，区块链网络的节点610经验证、区块填充及共识一致后，提供账本功能的节点610将形成的新区块追加到区块链的尾部，并执行新区块中的交易：对于用于查询机器学习模型的交易，从状态数据库中查询机器学习模型，并将其发送至电子设备810。值得说明的是，状态数据库中存储的数据通常与区块链存储的数据相同，在响应查询交易时，优先根据状态数据库中的数据进行响应，从而提升响应效率。

下面继续说明本发明实施例提供的电子设备的示例性应用。电子设备可以实施为笔记本电脑，平板电脑，台式计算机，机顶盒，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)等各种类型的终端设备，也可以实施为服务器。下面，以电子设备为服务器为例进行说明。

参见图3，图3是本发明实施例提供的服务器200(例如，可以是图1所示的服务器200)的架构示意图，图3所示的服务器200包括：至少一个处理器210、存储器240和至少一个网络接口220。服务器200中的各个组件通过总线***230耦合在一起。可理解，总线***230用于实现这些组件之间的连接通信。总线***230除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线***230。

处理器210可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器240可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器240可选地包括在物理位置上远离处理器210的一个或多个存储设备。

存储器240包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本发明实施例描述的存储器240旨在包括任意适合类型的存储器。

在一些实施例中，存储器240能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作***241，包括用于处理各种基本***服务和执行硬件相关任务的***程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块242，用于经由一个或多个(有线或无线)网络接口220到达其他计算设备，示例性的网络接口220包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等。

在一些实施例中，本发明实施例提供的基于人工智能的对象推荐装置可以采用软件方式实现，图3示出了存储在存储器240中的基于人工智能的对象推荐装置243，其可以是程序和插件等形式的软件，包括以下软件模块：获取模块2431、关系确定模块2432、预测模块2433及推荐模块2434，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本发明实施例提供的基于人工智能的对象推荐装置可以采用硬件方式实现，作为示例，本发明实施例提供的基于人工智能的对象推荐装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本发明实施例提供的基于人工智能的对象推荐方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable LogicDevice)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

本发明实施例提供的基于人工智能的对象推荐方法可以由上述的服务器执行，也可以由终端设备(例如，可以是图1所示的终端设备400-1和终端设备400-2)执行，或者由服务器和终端设备共同执行。

下面将结合上文记载的电子设备的示例性应用和结构，说明电子设备中通过嵌入的基于人工智能的对象推荐装置而实现基于人工智能的对象推荐方法的过程。

参见图4和图5A，图4是本发明实施例提供的基于人工智能的对象推荐装置243的架构示意图，示出了通过一系列模块实现对象推荐的流程，图5A是本发明实施例提供的基于人工智能的对象推荐方法的流程示意图，将结合图4对图5A示出的步骤进行说明。

在步骤101中，获取交互用户的领域外特征；其中，交互用户是针对被推荐对象实施交互行为的用户，领域外特征是与用户相关的、且与交互行为无关的特征。

这里，确定已针对被推荐对象实施交互行为的交互用户，并获取交互用户的与交互行为无关的特征，作为领域外特征，交互用户的领域外特征可从数据库中获取，可从终端设备的本地日志中获取，本发明实施例对此不做限定。为了便于理解，以被推荐对象为歌曲举例，领域外特征可包括与交互行为无关的用户年龄、性别及城市等。

在步骤102中，确定领域外特征与被推荐对象之间的关联关系。

这里，可对多个交互用户的领域外特征进行分析，得到领域外特征与被推荐对象之间的关联关系，例如可通过机器学习模型进行分析，具体的分析方式在后文进行详细阐述。

在步骤103中，根据关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，无交互用户是针对待推荐对象未实施交互行为的用户。

这里，无交互用户是针对待推荐对象未实施过交互行为的用户，待推荐对象与上文的被推荐对象可以相同，也可以不同。根据关联关系，确定出无交互用户针对待推荐对象的行为预测结果，并根据行为预测结果，进一步判断是否将待推荐对象推荐给无交互用户。

在步骤104中，当行为预测结果符合推荐条件时，执行向无交互用户推荐待推荐对象的操作。

参见图4，在推荐模块2434中，设定推荐条件，当行为预测结果符合推荐条件时，执行向无交互用户推荐待推荐对象的操作。本发明实施例对推荐的方式不做限定，例如可为前端呈现、发送短信或发送邮件等。

在一些实施例中，步骤104之前，还包括：当行为预测结果用于表示无交互用户针对待推荐对象是否实施交互行为时，将表示实施交互行为的行为预测结果，确定为符合推荐条件的行为预测结果；当行为预测结果用于表示无交互用户针对待推荐对象所实施的交互行为的时长时，将表示的时长超过时长阈值的行为预测结果，确定为符合推荐条件的行为预测结果。

根据行为预测结果的不同类型，可以设定不同的推荐条件。具体地，当行为预测结果用于表示无交互用户针对待推荐对象是否实施交互行为时，可设定推荐条件为行为预测结果表示实施交互行为；当行为预测结果用于表示无交互用户针对待推荐对象所实施的交互行为的时长时，可设定推荐条件为行为预测结果表示的时长超过时长阈值，时长阈值可根据实际应用场景进行设定，如设定为30秒。通过上述方式，提升了对不同类型的行为预测结果的适用性。

通过发明实施例对于图5A的上述示例性实施可知，本发明实施例通过确定领域外特征与被推荐对象之间的关联关系，从而对仅包括领域外特征的无交互用户进行更精准地对象推荐，有效地解决了冷启动问题。

在一些实施例中，参见图5B，图5B是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图，图5A示出的步骤101可以更新为步骤201，在步骤201中，获取交互样本；其中，交互样本包括被推荐对象的对象特征、交互用户的领域外特征、交互用户的领域内特征及交互用户针对被推荐对象的交互行为；领域内特征是与交互用户的交互行为相关的特征。

作为示例，参见图4，在获取模块2431中，获取交互用户针对被推荐对象实施交互行为而产生的交互样本，作为机器学习模型的输入数据。其中，交互样本包括被推荐对象的对象特征、交互用户的领域外特征、交互用户的领域内特征及交互行为。同样以被推荐对象为歌曲的情况举例，被推荐对象的对象特征表示歌曲本身的属性，例如歌曲的时长、名称、作词者、作曲者及演唱者等，交互用户的领域内特征可以包括交互用户听过的歌曲名称、收听次数、收听时长、转发/分享次数及听过的歌曲的音频信息/文本信息等。

在图5B中，图5A示出的步骤102可以通过步骤202至步骤204实现，将结合各步骤进行说明。

在步骤202中，对交互样本中的领域内特征进行弱化处理。

作为示例，参见图4，在关系确定模块2432中，为了确定领域外特征与被推荐对象之间的关联关系，首先对交互样本中的领域内特征进行弱化处理，以降低模型训练时领域内特征的影响。

在一些实施例中，可以通过这样的方式来实现上述的对交互样本中的领域内特征进行弱化处理：确定交互样本中领域内特征对应的特征种类总数；将丢弃参数与特征种类总数进行乘积处理，得到丢弃种类数量；其中，丢弃种类数量为大于0的整数；对交互样本中任意的、且数量符合丢弃种类数量的领域内特征进行丢弃处理；对丢弃处理后的领域内特征进行池化处理。

这里，可通过丢弃(drop out)层对交互样本中的领域内特征进行弱化处理。具体地，确定交互样本中的领域内特征对应的特征种类总数，并将设定的丢弃参数与特征种类总数进行乘积处理，得到丢弃种类数量，其中，丢弃数量可根据实际应用场景进行设定，如设定为0.3，得到的丢弃种类数量为大于0的整数。确定丢弃种类数量后，对交互样本中任意的、且数量符合丢弃种类数量的领域内特征进行丢弃处理，丢弃处理可以是特征值置0的处理。举例来说，领域内特征包括交互用户听过的歌曲名称、收听次数及收听时长，当确定出的丢弃种类数量为1时，将歌曲名称、收听次数及收听时长中任1个的特征值置为0。

然后，通过池化(pooling)层对丢弃处理后的领域内特征(包括特征值为0的特征)进行池化处理，得到与丢弃处理后的领域内特征对应的向量表示，其中，池化层可以是最大池化(max pooling)层。通过上述方式，有效地弱化了领域内特征对模型训练的影响。

在步骤203中，通过第一机器学习模型接收被推荐对象的对象特征、交互用户的领域外特征及弱化处理后的领域内特征，并进行预测处理，得到待对比的行为预测结果。

为了便于区分，将针对无交互用户训练的机器学习模型，命名为第一机器学习模型。作为示例，参见图4，在关系确定模块2432中，将交互样本中的被推荐对象的对象特征、交互用户的领域外特征及弱化处理后的领域内特征，输入至第一机器学习模型，以通过第一机器学习模型进行预测处理，得到待对比的行为预测结果。其中，第一机器学习模型的权重参数可以随机初始化，也可根据其他方式确定。

在步骤204中，根据待对比的行为预测结果和交互样本中的交互行为，更新第一机器学习模型的权重参数，以强化交互用户的领域外特征与被推荐对象的对象特征之间的关联关系。

作为示例，参见图4，在关系确定模块2432中，根据待对比的行为预测结果和交互样本中的交互行为，更新第一机器学习模型的权重参数。由于领域外特征并未进行弱化，故通过模型训练的方式，能够强化交互用户的领域外特征与被推荐对象的对象特征之间的关联关系。重复更新第一机器学习模型的权重参数，直到符合停止条件，停止条件如设定的迭代次数，或设定的准确率阈值。

在一些实施例中，步骤201之后，还包括：将交互样本发送至区块链网络，以使区块链网络的节点将交互样本存储至区块链，并根据区块链中的所有交互样本，对机器学习模型的权重参数进行更新，得到初始化机器学习模型；

步骤203之前，还包括：向区块链网络发送初始化模型请求，以获取区块链存储的初始化机器学习模型，并将初始化机器学习模型，确定为用于接收被推荐对象的对象特征、交互用户的领域外特征及弱化处理后的领域内特征的第一机器学习模型。

在获取到交互样本后，可将不具有隐私性，即可公开的交互样本发送至区块链网络，以使区块链网络的节点经过验证、区块填充及共识一致后，将交互样本存储至区块链。然后，区块链网络的节点可在预先部署的智能合约的指示下，根据区块链中的所有交互样本(可能包括其他电子设备上传的交互样本)，对机器学习模型的权重参数进行更新，得到初始化机器学习模型，并将初始化机器学习模型存储至区块链，其中，对权重参数更新的方式与步骤202～步骤204类似，在此不做赘述。在此基础上，可在智能合约中设定每隔固定间隔(如7天)，根据区块链中的所有交互样本，更新一次机器学习模型，得到初始化机器学习模型。

在需要对第一机器学习模型的权重参数进行初始化时，向区块链网络发送初始化模型请求，以获取区块链存储的、且更新时间最近的初始化机器学习模型。然后，将初始化机器学习模型作为第一机器学习模型，或者，将初始化机器学习模型的权重参数共享至第一机器学习模型。在后续处理中，通过具有隐私性，即不可公开的交互样本，对第一机器学习模型的权重参数进行进一步的精调。通过上述的结合区块链网络的方式，能够获得权重参数更为合理的第一机器学习模型，缩短对第一机器学习模型的训练时长。值得说明的是，在存在状态数据库时，区块链网络的节点可将交互样本及初始化机器学习模型同时存储至状态数据库，并优先根据状态数据库中的数据响应初始化模型请求，以加快反馈效率。

在图5B中，图5A示出的步骤103可以通过步骤205至步骤206实现，将结合各步骤进行说明。

在步骤205中，通过更新后的第一机器学习模型接收待推荐对象的对象特征和无交互用户的领域外特征，并进行预测处理，得到至少一个初始行为预测结果及对应的结果概率；其中，被推荐对象的对象特征与待推荐对象的对象特征属于相同的特征种类。

作为示例，参见图4，在预测模块2433中，将无交互用户的领域外特征及待推荐对象的对象特征输入至更新后的第一机器学习模型，以通过更新后的第一机器学习模型进行预测处理，得到至少一个初始行为预测结果及对应的结果概率，该结果概率为对应的初始行为预测结果的可信程度。其中，被推荐对象的对象特征与待推荐对象的对象特征属于相同的特征种类，例如被推荐对象和待推荐对象都为歌曲，且按照相同的特征种类提取对象特征。

在一些实施例中，步骤204之后，还包括：生成包括公钥和私钥的密钥对；根据公钥对更新后的第一机器学习模型进行加密处理，并将加密后的第一机器学习模型发送至区块链网络，以使区块链网络的节点将加密后的第一机器学习模型填充至新区块，并将新区块追加至区块链的尾部；

步骤205之前，还包括：向区块链网络发送模型请求，以获取区块链存储的加密后的第一机器学习模型；根据私钥对加密后的第一机器学习模型进行解密处理。

在完成对第一机器学习模型的更新后，可通过非对称加密算法生成包括公钥和私钥的密钥对，根据公钥对更新后的第一机器学习模型进行加密处理，并生成提交加密后的第一机器学习模型的交易，将该交易发送至区块链网络。区块链网络的节点在对该交易进行验证、区块填充及共识一致后，将区块填充所形成的新区块追加至区块链的尾部。

在需要对待推荐对象的对象特征和无交互用户的领域外特征进行预测处理时，向区块链网络发送模型请求，以获取区块链存储的加密后的第一机器学习模型。在获取到加密后的第一机器学习模型后，根据私钥对加密后的第一机器学习模型进行解密处理，如此，便可根据解密后的第一机器学习模型，进行相应的预测处理。由于区块链具有不可篡改的特性，故通过上述方式进行第一机器学习模型的存储，能够保证模型数据的准确性，同时，由于上链的是加密后的第一机器学习模型，故能够保证第一机器学习模型的安全性。值得说明的是，在存在状态数据库时，区块链网络的节点可将加密后的第一机器学习模型同时存储至状态数据库，并优先根据状态数据库中的数据响应模型请求，以加快反馈效率。

在步骤206中，将数值最大的结果概率对应的初始行为预测结果，确定为无交互用户针对待推荐对象的行为预测结果。

这里，数值最大的结果概率对应的初始行为预测结果，即最可信的初始行为预测结果，确定为无交互用户针对待推荐对象的行为预测结果。值得说明的是，第一机器学习模型可以是分类模型或回归模型，当第一机器学习模型为分类模型时，其输出的行为预测结果用于表示无交互用户针对待推荐对象是否实施交互行为；当第一机器学习模型为回归模型时，其输出的行为预测结果用于表示无交互用户针对待推荐对象所实施的交互行为的时长。

通过发明实施例对于图5B的上述示例性实施可知，本发明实施例通过对交互样本中的领域内特征进行弱化处理，保证不会过于强化领域内特征的作用，从而提升了模型训练的效果，强化了交互用户的领域外特征与被推荐对象的对象特征之间的关联关系。

在一些实施例中，参见图5C，图5C是本发明实施例提供的更新权重参数的一个可选的流程示意图，图5B示出的步骤204可以通过步骤301至步骤304实现，将结合各步骤进行说明。

在步骤301中，根据待对比的行为预测结果和与交互样本中的交互行为之间的差异，确定第一损失值。

这里，根据损失函数对待对比的行为预测结果和交互样本中的交互行为进行处理，得到第一损失值，该第一损失值表示待对比的行为预测结果与交互样本中的交互行为之间的差异。本发明实施例对损失函数的类型不做限定，例如，当第一机器学习模型是分类模型时，损失函数可以是交叉熵(cross entropy)损失函数；当第一机器学习模型是回归模型时，损失函数可以应用均方根误差(RMSE，Root Mean Square Error)。

在步骤302中，将交互样本中的领域外特征与弱化处理后的领域内特征之间的信息散度，确定为第二损失值。

这里，计算交互样本中的领域外特征与弱化处理后的领域内特征之间的信息散度，并将该信息散度确定为第二损失值，其中，第二损失值用于确定领域外特征与弱化处理后的领域内特征之间的关联关系。

在图5C中，步骤302可以通过步骤401至步骤402实现，在步骤401中，确定交互样本中的每个领域外特征与弱化处理后的领域内特征之间的子信息散度。

在确定第二损失值时，首先分别确定每个领域外特征的向量表示与弱化处理后的领域内特征之间的信息散度，为了便于区分，将这里得到的信息散度命名为子信息散度。

在步骤402中，对所有子信息散度进行累积处理，得到第二损失值。

这里，对所有领域外特征对应的子信息散度进行累积处理，得到第二损失值，其中，累积处理可以是求和处理，也可以是加权求和处理。

在图5C中，步骤302之后，还在步骤303中，将第一损失值与第二损失值进行加权处理，得到加权损失值。

在图5C中，步骤303可通过步骤403至步骤404实现，具体地，在步骤403中，获取与第一损失值对应的第一损失权重，获取与第二损失值对应的第二损失权重；其中，第一损失权重大于第二损失权重。

在本发明实施例中，优化第一损失值是训练第一机器学习模型的主要任务，而优化第二损失值是次要任务，故设定第一损失值对应的第一损失权重大于第二损失值对应的第二损失权重，且第一损失权重与第二损失权重之和为1，例如，将第一损失权重设置为0.9，将第二损失权重设置为0.1。

在步骤404中，根据第一损失权重和第二损失权重，对第一损失值和第二损失值进行加权求和处理，得到加权损失值。

通过加权求和处理的方式得到加权损失值，从而实现两个任务的同时学习。

在图5C中，步骤303后，还在步骤304中，根据加权损失值在第一机器学习模型中进行反向传播，并在反向传播的过程中，沿梯度下降方向更新第一机器学习模型的权重参数。

这里，可应用反向传播的机制，根据加权损失值在第一机器学习模型中进行反向传播，在反向传播的过程中计算出梯度，并沿梯度下降方向更新第一机器学习模型的权重参数。值得说明的是，这里也可仅根据第一损失值在第一机器学习模型中进行反向传播，更新机器学习模型的权重参数，即进行单任务的学习。

在一些实施例中，步骤201之后，还包括：创建至少两个样本批；其中，每个样本批包括至少一个交互样本，且不同样本批包括的交互样本的数量相同；

可以通过这样的方式来实现上述的根据加权损失值在第一机器学***均处理，得到批损失值；根据批损失值在第一机器学习模型中进行反向传播。

在获取到多个交互样本之后，可将交多个互样本分配到至少两个样本批中，其中，每个样本批包括至少一个交互样本，且不同样本批包括的交互样本的数量相同。如此，在更新第一机器学***均处理得到批损失值，并根据批损失值在第一机器学习模型中进行反向传播，即进行小批量梯度下降，在提升第一机器学习模型的训练效率的同时，保证训练精度。

通过发明实施例对于图5C的上述示例性实施可知，本发明实施例通过计算加权损失值，从而训练第一机器学习模型，在强化领域外特征与被推荐对象之间的关联关系的同时，学习领域外特征与领域内特征之间的关联关系，进一步提升了根据训练后的第一机器学习模型进行对象推荐的准确性。

在一些实施例中，参见图5D，图5D是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图，基于图5B，在步骤201之后，还可以在步骤501中，通过第二机器学习模型接收被推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征，并进行预测处理，得到待对比的行为预测结果。

在本发明实施例中，也可针对交互用户训练机器学习模型，为了便于区分，将该机器学习模型命名为第二机器学习模型。在训练第二机器学习模型时，将交互样本中的被推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征输入至第二机器学习模型，以通过第二机器学习模型的预测处理，得到待对比的行为预测结果。

在步骤502中，根据待对比的行为预测结果和交互样本中的交互行为，更新第二机器学习模型的权重参数。

这里，根据待对比的行为预测结果和交互样本中的交互行为之间的差异，确定损失值，并根据损失值在第二机器学习模型中进行反向传播，在反向传播的过程中，沿梯度下降方向更新第二机器学习模型的权重参数。与第一机器学习模型类似的，更新后的第二机器学习模型也可上传至区块链网络。

在步骤503中，通过更新后的第二机器学习模型接收待推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征，并进行预测处理，得到交互用户针对待推荐对象的行为预测结果。

在确定出待推荐对象时，将待推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征输入至更新后的第二机器学习模型，以通过更新后的第二机器学习模型的预测处理，得到交互用户针对待推荐对象的行为预测结果。

在步骤504中，当基于第二机器学习模型得到的行为预测结果符合推荐条件时，执行向交互用户推荐待推荐对象的操作。

同样地，当基于第二机器学习模型得到的行为预测结果符合推荐条件时，向交互用户推荐待推荐对象。

通过发明实施例对于图5D的上述示例性实施可知，本发明实施例通过训练第二机器学习模型，针对交互用户实现了更精准的对象推荐。

在一些实施例中，参见图5E，图5E是本发明实施例提供的基于人工智能的对象推荐方法的一个可选的流程示意图，图5A示出的步骤104可以通过步骤601至步骤603实现，将结合各步骤进行说明。

在步骤601中，将符合推荐条件的行为预测结果对应的待推荐对象，确定为目标对象。

在实际应用场景，可能会存在至少两个待推荐对象，对于该情况，将符合推荐条件的行为预测结果对应的待推荐对象，确定为目标对象。

在步骤602中，当目标对象的数量小于或等于数量阈值时，执行向无交互用户推荐所有目标对象的操作。

在进行对象推荐时，通常会限制推荐的对象的数量，以避免引起用户反感。在本发明实施例，获取数量阈值，当目标对象的数量小于或等于数量阈值时，执行向无交互用户推荐所有目标对象的操作，其中，数量阈值可人为设定，如设定为2个。

在步骤603中，当目标对象的数量大于数量阈值时，获取每个目标对象的热度数据，并执行向无交互用户推荐部分目标对象的操作，其中，部分目标对象与符合热度条件的热度数据对应。

当目标对象的数量大于数量阈值时，对目标对象进行筛选，具体地，获取每个目标对象的热度数据，确定符合热度条件的热度数据对应的部分目标对象，并执行向无交互用户推荐部分目标对象的操作。其中，热度数据用于表现对应的目标对象的受欢迎程度，具体可为浏览热度、转发/分享热度或评论热度，也可以是上面的至少两个热度的加权结果，本发明实施例对此不做限定。热度条件可以设定为数值最大的N个热度数据，其中N的数值与数量阈值相同。

在一些实施例中，可以通过这样的方式来实现上述的当行为预测结果符合推荐条件时，执行向无交互用户推荐待推荐对象的操作：将符合推荐条件的行为预测结果对应的、且注册时长超过设定时长的无交互用户，确定为目标用户；确定目标用户对应的行为预测结果的结果概率；执行向满足概率条件的目标用户推荐待推荐对象的操作。

在实际应用场景，也可能会存在至少两个无交互用户，对于该情况，对至少两个无交互用户进行两步筛选。首先，将符合推荐条件的行为预测结果对应的、且注册时长超过设定时长的无交互用户，确定为目标用户，其中，注册时长是指无交互用户在提供待推荐对象的应用程序中已注册的时长，设定时长可根据实际应用场景进行设定，如设定为7天。然后，确定目标用户对应的行为预测结果的结果概率，执行向满足概率条件的目标用户推荐待推荐对象的操作，概率条件如结果概率超过设定的概率阈值，概率阈值如70％。通过上述方式，对注册时长较久、但未实施交互行为的用户进行对象推荐，以提醒用户使用应用程序，同时，通过设定概率条件，提升了对象推荐的精确度。

通过发明实施例对于图5E的上述示例性实施可知，本发明实施例通过对待推荐对象进行筛选，提升了用户体验，避免因推荐过多对象而引起用户反感。

下面，将说明本发明实施例在一个实际的应用场景中的示例性应用。

本发明实施例提供了如图6所示的通过第二机器学习模型进行预测处理的示意图，针对交互用户，第二机器学习模型的输入参数由两大类构成，其一是对象的对象特征，其二是与用户相关的特征，具体包括领域外特征和领域内特征。为了便于理解，以向用户推荐音乐应用程序中的歌曲的场景进行举例，则对象特征就是与歌曲相关的特征；用户的领域内特征是与用户的交互行为相关的特征，例如用户听过的歌曲名称、收听(即交互行为)次数、收听时长、转发/分享次数及听过歌曲的音频信息/文本信息等；用户的领域外特征是与用户的交互行为无关的特征，例如用户年龄、性别、城市及用户在其他场景下的行为所产生的特征(如搜索记录、对话记录及浏览文章记录等)。对于已在音乐应用程序中注册、并使用音乐应用程序收听过歌曲的用户来说，该用户即为交互用户，收听歌曲的行为即为交互行为，用户收听过的歌曲即为被推荐对象，若需要对该用户进行歌曲推荐，则可根据该用户收听过的歌曲的对象特征、该用户的领域内特征和该用户的领域外特征，对第二机器学习模型进行训练。然后，根据训练后的第二机器学习模型，对待推荐歌曲的对象特征、该用户的领域内特征和该用户的领域外特征进行预测处理，得到该用户针对待推荐歌曲的行为预测结果，其中，待推荐歌曲可以是音乐应用程序所提供的全部歌曲，也可以是音乐应用程序所提供的、经过人工筛选后得到的歌曲。

根据第二机器学习模型的不同类型，可设定不同的推荐条件，并将符合推荐条件的行为预测结果对应的待推荐歌曲，推荐至该用户。例如，当第二机器学习模型是分类模型时，行为预测结果用于表示该用户是否会对待推荐歌曲实施收听行为，故将表示会实施收听行为的行为预测结果对应的待推荐歌曲，推荐给该用户，推荐方式包括但不限于应用程序内部推荐及通知栏推荐；当第二机器学习模型是回归模型时，行为预测结果用于表示该用户收听待推荐歌曲的时长，故将表示的时长超出时长阈值的行为预测结果对应的待推荐歌曲，推荐给该用户。

但是，在实际中可能会存在已在音乐应用程序中注册、但并未在音乐应用程序中收听过歌曲的用户，该用户即为无交互用户，由于无交互用户通常不存在领域内特征，相当于领域内特征的特征值为0，导致无法应用图6所示的第二机器学习模型进行歌曲推荐。对于该情况，本发明实施例提供了如图7所示的训练第一机器学习模型的示意图。在图7中，先获取交互用户的交互样本，并对交互样本中的领域内特征进行弱化处理，具体地，添加丢弃(drop out)层和最大池化(max pooling)层，从而依次对领域内特征进行丢弃处理和池化处理，以减弱领域内特征对模型训练的影响，强化领域外特征与交互用户收听过的歌曲之间的关联关系。

举例来说，交互用户的某个交互样本S可表示为{X_in，X_out，Y}，其中，X_in表示交互用户的领域内特征，X_out表示交互用户的领域外特征，Y表示交互用户实施的收听行为。在模型训练的阶段，具体在交互样本S的某步迭代过程中，通过丢弃层对交互样本S中的X_in进行丢弃处理，具体将X_in中的任意m*ratio个特征的特征值置为0，这里的ratio是超参数，对应上文的丢弃参数，可设定为0.3，m为领域内特征的特征种类总数。

对于丢弃处理后的m个领域内特征，通过最大池化层，对其进行池化处理，得到与m个领域内特征对应的一个向量表示，记为h_hot，从而完成对领域内特征的弱化。此外，将每一个领域外特征对应的向量表示，记为h_cold。

由于领域内特征包括较为丰富的用户喜好信息，故为了确定领域内特征与领域外特征之间的关联关系，在第一机器学习模型中额外增设一个学习任务，以使第一机器学习模型不光能学习到领域内特征和领域外特征对交互行为的影响，还能学习到领域内特征与领域外特征之间的关联关系。如此，对于并未在音乐应用程序中收听过歌曲的无交互用户，能够通过训练后的第一机器学习模型，推测出无交互用户的部分领域内特征，并将领域外特征和推测出的部分领域内特征融合在一起进行预测处理。

具体地，通过信息散度(即KL散度)学习领域内特征与领域外特征之间的关联关系，信息散度的计算公式如下：

其中，X代表交互样本的总数量。将h_hot代入上式的P(x)，将h_cold代入上式的Q(x)，则对于每一个h_cold，都可以得到KL(h_hot，h_cold)，KL(h_hot，h_cold)即为上文的子信息散度。将所有领域外特征对应的子信息散度进行求和处理，得到增设的学习任务的损失值。

在对图7所示的第一机器学习模型进行训练时，第一机器学习模型的损失函数可如下式：

L＝a*L1+b*L2

其中，L1对应第一机器学习模型的第一个学习任务，体现交互样本中的收听行为与第一机器学习模型的行为预测结果之间的差异，在第一机器学习模型是分类模型的情况下，L1可为交叉熵损失函数，分类模型的目的是预测用户是否对待推荐歌曲实施收听行为；在第一机器学习模型是回归模型的情况下，L1可为均方根误差，回归模型的目的是预测用户收听待推荐歌曲的时长。L2对应第一机器学习模型的第二个学习任务，即增设的学习任务，体现领域内特征与领域外特征之间的关联关系。在本发明实施例中，将第一个学习任务设置为主要任务，故设置a的数值大于b，如将a设置为0.9，将b设置为0.1，其中，a即为上文的第一损失权重，b即为上文的第二损失权重。

通过交互用户的交互样本，训练完成图7所示的第一机器学习模型后，便可将训练后的第一机器学习模型，应用于对无交互用户的歌曲推荐。本发明实施例提供了如图8所示的通过第一机器学习模型进行预测处理的示意图，在图8中，通过训练后的第一机器学习模型，对无交互用户的领域外特征和待推荐歌曲的对象特征进行预测处理，得到无交互用户针对待推荐歌曲的行为预测结果。与第二机器学习模型同样的，可针对第一机器学习模型的不同类型，设定不同的推荐条件，并将符合推荐条件的行为预测结果对应的待推荐歌曲，推荐至无交互用户，例如，当第一机器学习模型是分类模型时，行为预测结果用于表示无交互用户是否会对待推荐歌曲实施收听行为，故将表示会实施收听行为的行为预测结果对应的待推荐歌曲，推荐给无交互用户。

下面继续说明本发明实施例提供的基于人工智能的对象推荐装置243实施为软件模块的示例性结构，在一些实施例中，如图3所示，存储在存储器240的基于人工智能的对象推荐装置243中的软件模块可以包括：获取模块2431，用于获取交互用户的领域外特征；其中，交互用户是针对被推荐对象实施交互行为的用户，领域外特征是与用户相关的、且与交互行为无关的特征；关系确定模块2432，用于确定领域外特征与被推荐对象之间的关联关系；预测模块2433，用于根据关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，无交互用户是针对待推荐对象未实施交互行为的用户；推荐模块2434，用于当行为预测结果符合推荐条件时，执行向无交互用户推荐待推荐对象的操作。

在一些实施例中，获取模块2431，还用于：获取交互样本；其中，交互样本包括被推荐对象的对象特征、交互用户的领域外特征、交互用户的领域内特征及交互用户针对被推荐对象的交互行为；领域内特征是与交互用户的交互行为相关的特征；

关系确定模块2432，还用于：对交互样本中的领域内特征进行弱化处理；通过第一机器学习模型接收被推荐对象的对象特征、交互用户的领域外特征及弱化处理后的领域内特征，并进行预测处理，得到待对比的行为预测结果；根据待对比的行为预测结果和交互样本中的交互行为，更新第一机器学习模型的权重参数，以强化交互用户的领域外特征与被推荐对象的对象特征之间的关联关系。

在一些实施例中，预测模块2433，还用于：通过更新后的第一机器学习模型接收待推荐对象的对象特征和无交互用户的领域外特征，并进行预测处理，得到至少一个初始行为预测结果及对应的结果概率；将数值最大的结果概率对应的初始行为预测结果，确定为无交互用户针对待推荐对象的行为预测结果；其中，被推荐对象的对象特征与待推荐对象的对象特征属于相同的特征种类。

在一些实施例中，关系确定模块2432，还用于：确定交互样本中领域内特征对应的特征种类总数；将丢弃参数与特征种类总数进行乘积处理，得到丢弃种类数量；其中，丢弃种类数量为大于0的整数；对交互样本中任意的、且数量符合丢弃种类数量的领域内特征进行丢弃处理；对丢弃处理后的领域内特征进行池化处理。

在一些实施例中，关系确定模块2432，还用于：根据待对比的行为预测结果与交互样本中的交互行为之间的差异，确定第一损失值；将交互样本中的领域外特征与弱化处理后的领域内特征之间的信息散度，确定为第二损失值；将第一损失值与第二损失值进行加权处理，得到加权损失值；根据加权损失值在第一机器学习模型中进行反向传播，并在反向传播的过程中，沿梯度下降方向更新第一机器学习模型的权重参数。

在一些实施例中，关系确定模块2432，还用于：确定交互样本中的每个领域外特征与弱化处理后的领域内特征之间的子信息散度；对所有子信息散度进行累积处理，得到第二损失值；

关系确定模块2432，还用于：获取与第一损失值对应的第一损失权重，获取与第二损失值对应的第二损失权重；其中，第一损失权重大于第二损失权重；根据第一损失权重和第二损失权重，对第一损失值和第二损失值进行加权求和处理，得到加权损失值。

在一些实施例中，基于人工智能的对象推荐装置243还包括：第二模型接收模块，用于通过第二机器学习模型接收被推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征，并进行预测处理，得到待对比的行为预测结果；第二模型更新模块，用于根据待对比的行为预测结果和交互样本中的交互行为，更新第二机器学习模型的权重参数；第二模型预测模块，用于通过更新后的第二机器学习模型接收待推荐对象的对象特征、交互用户的领域外特征及交互用户的领域内特征，并进行预测处理，得到交互用户针对待推荐对象的行为预测结果；第二模型推荐模块，用于当基于第二机器学习模型得到的行为预测结果符合推荐条件时，执行向交互用户推荐待推荐对象的操作。

在一些实施例中，基于人工智能的对象推荐装置243还包括：密钥生成模块，用于生成包括公钥和私钥的密钥对；模型上链模块，用于根据公钥对更新后的第一机器学习模型进行加密处理，并将加密后的第一机器学习模型发送至区块链网络，以使区块链网络的节点将加密后的第一机器学习模型填充至新区块，并将新区块追加至区块链的尾部；

基于人工智能的对象推荐装置243还包括：模型请求模块，用于向区块链网络发送模型请求，以获取区块链存储的加密后的第一机器学习模型；解密模块，用于根据私钥对加密后的第一机器学习模型进行解密处理。

在一些实施例中，基于人工智能的对象推荐装置243还包括：样本上链模块，用于将交互样本发送至区块链网络，以使区块链网络的节点将交互样本存储至区块链，并根据区块链中的所有交互样本，对机器学习模型的权重参数进行更新，得到初始化机器学习模型；

基于人工智能的对象推荐装置243还包括：初始化模块，用于向区块链网络发送初始化模型请求，以获取区块链存储的初始化机器学习模型，并将初始化机器学习模型，确定为用于接收被推荐对象的对象特征、交互用户的领域外特征及弱化处理后的领域内特征的第一机器学习模型。

在一些实施例中，基于人工智能的对象推荐装置243还包括：第一结果确定模块，用于当行为预测结果用于表示无交互用户针对待推荐对象是否实施交互行为时，将表示实施交互行为的行为预测结果，确定为符合推荐条件的行为预测结果；第二结果确定模块，用于当行为预测结果用于表示无交互用户针对待推荐对象所实施的交互行为的时长时，将表示的时长超过时长阈值的行为预测结果，确定为符合推荐条件的行为预测结果。

在一些实施例中，推荐模块2434，还用于：将符合推荐条件的行为预测结果对应的待推荐对象，确定为目标对象；当目标对象的数量小于或等于数量阈值时，执行向无交互用户推荐所有目标对象的操作；当目标对象的数量大于数量阈值时，获取每个目标对象的热度数据，并执行向无交互用户推荐部分目标对象的操作，其中，部分目标对象与符合热度条件的热度数据对应。

在一些实施例中，推荐模块2434，还用于：将符合推荐条件的行为预测结果对应的、且注册时长超过设定时长的无交互用户，确定为目标用户；确定目标用户对应的行为预测结果的结果概率；执行向满足概率条件的目标用户推荐待推荐对象的操作。

本发明实施例提供一种存储有可执行指令的存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本发明实施例提供的基于人工智能的对象推荐方法，例如，如图5A、5B、5D或5E示出的基于人工智能的对象推荐方法。

在一些实施例中，存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件***中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

综上，本发明实施例通过强化领域外特征与被推荐对象之间的关联关系，提升了对无交互用户进行对象推荐的准确性，适用于冷启动场景；同时，对于交互用户，通过训练第二机器学习模型，也可进行更精准地推荐，提升了对不同类型用户的针对推荐效果；此外，通过结合区块链网络，提升了模型数据的准确性和安全性。

以上所述，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的对象推荐方法，其特征在于，包括：

获取交互样本；

其中，所述交互样本包括被推荐对象的对象特征、交互用户的领域外特征、所述交互用户的领域内特征及所述交互用户针对所述被推荐对象的交互行为；

其中，所述交互用户是针对所述被推荐对象实施交互行为的用户，所述领域外特征是与所述交互用户相关的、且与所述交互行为无关的特征；所述领域内特征是与所述交互行为相关的特征；

对所述交互样本中的领域内特征进行弱化处理；

通过第一机器学习模型接收所述被推荐对象的对象特征、所述交互用户的领域外特征及弱化处理后的所述领域内特征，并进行预测处理，得到待对比的行为预测结果；

根据所述待对比的行为预测结果和所述交互样本中的交互行为，更新所述第一机器学习模型的权重参数，以

强化所述交互用户的领域外特征与所述被推荐对象的对象特征之间的关联关系；

根据强化后的所述关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，所述无交互用户是针对所述待推荐对象未实施交互行为的用户；

2.根据权利要求1所述的对象推荐方法，其特征在于，所述根据强化后的所述关联关系，确定无交互用户针对待推荐对象的行为预测结果，包括：

通过更新后的所述第一机器学习模型接收所述待推荐对象的对象特征和所述无交互用户的领域外特征，并进行预测处理，得到至少一个初始行为预测结果及对应的结果概率；

将数值最大的结果概率对应的所述初始行为预测结果，确定为所述无交互用户针对所述待推荐对象的行为预测结果；

其中，所述被推荐对象的对象特征与所述待推荐对象的对象特征属于相同的特征种类。

3.根据权利要求2所述的对象推荐方法，其特征在于，

所述更新所述第一机器学习模型的权重参数之后，还包括：

生成包括公钥和私钥的密钥对；

根据所述公钥对更新后的所述第一机器学习模型进行加密处理，并将加密后的所述第一机器学习模型发送至区块链网络，以使

所述区块链网络的节点将加密后的所述第一机器学习模型填充至新区块，并将所述新区块追加至区块链的尾部；

所述通过更新后的所述第一机器学习模型接收所述待推荐对象的对象特征和所述无交互用户的领域外特征之前，还包括：

向所述区块链网络发送模型请求，以获取所述区块链存储的加密后的所述第一机器学习模型；

根据所述私钥对加密后的所述第一机器学习模型进行解密处理。

4.根据权利要求1所述的对象推荐方法，其特征在于，所述对所述交互样本中的领域内特征进行弱化处理，包括：

确定所述交互样本中领域内特征对应的特征种类总数；

将丢弃参数与所述特征种类总数进行乘积处理，得到丢弃种类数量；其中，所述丢弃种类数量为大于0的整数；

对所述交互样本中任意的、且数量符合所述丢弃种类数量的所述领域内特征进行丢弃处理；

对丢弃处理后的所述领域内特征进行池化处理。

5.根据权利要求1所述的对象推荐方法，其特征在于，所述根据所述待对比的行为预测结果和所述交互样本中的交互行为，更新所述第一机器学习模型的权重参数，包括：

根据所述待对比的行为预测结果与所述交互样本中的交互行为之间的差异，确定第一损失值；

将所述交互样本中的领域外特征与弱化处理后的所述领域内特征之间的信息散度，确定为第二损失值；

将所述第一损失值与所述第二损失值进行加权处理，得到加权损失值；

根据所述加权损失值在所述第一机器学习模型中进行反向传播，并在反向传播的过程中，沿梯度下降方向更新所述第一机器学习模型的权重参数。

6.根据权利要求5所述的对象推荐方法，其特征在于，

所述将所述交互样本中的领域外特征与弱化处理后的所述领域内特征之间的信息散度，确定为第二损失值，包括：

确定所述交互样本中的每个领域外特征与弱化处理后的所述领域内特征之间的子信息散度；

对所有所述子信息散度进行累积处理，得到第二损失值；

所述将所述第一损失值与所述第二损失值进行加权处理，得到加权损失值，包括：

获取与所述第一损失值对应的第一损失权重，获取与所述第二损失值对应的第二损失权重；其中，所述第一损失权重大于所述第二损失权重；

根据所述第一损失权重和所述第二损失权重，对所述第一损失值和所述第二损失值进行加权求和处理，得到加权损失值。

7.根据权利要求1所述的对象推荐方法，其特征在于，所述获取交互样本之后，还包括：

通过第二机器学习模型接收所述被推荐对象的对象特征、所述交互用户的领域外特征及所述交互用户的领域内特征，并进行预测处理，得到待对比的行为预测结果；

根据所述待对比的行为预测结果和所述交互样本中的交互行为，更新所述第二机器学习模型的权重参数；

通过更新后的所述第二机器学习模型接收所述待推荐对象的对象特征、所述交互用户的领域外特征及所述交互用户的领域内特征，并进行预测处理，得到所述交互用户针对所述待推荐对象的行为预测结果；

当基于所述第二机器学习模型得到的行为预测结果符合所述推荐条件时，执行向所述交互用户推荐所述待推荐对象的操作。

8.根据权利要求1所述的对象推荐方法，其特征在于，

所述获取交互样本之后，还包括

将所述交互样本发送至区块链网络，以使

区块链网络的节点将所述交互样本存储至区块链，并根据所述区块链中的所有所述交互样本，对机器学习模型的权重参数进行更新，得到初始化机器学习模型；

所述通过第一机器学习模型接收所述被推荐对象的对象特征、所述交互用户的领域外特征及弱化处理后的所述领域内特征之前，还包括：

向所述区块链网络发送初始化模型请求，以获取所述区块链存储的所述初始化机器学习模型，并

将所述初始化机器学习模型，确定为用于接收所述被推荐对象的对象特征、所述交互用户的领域外特征及弱化处理后的所述领域内特征的所述第一机器学习模型。

9.根据权利要求1所述的对象推荐方法，其特征在于，还包括：

当所述行为预测结果用于表示所述无交互用户针对所述待推荐对象是否实施交互行为时，将表示实施交互行为的所述行为预测结果，确定为符合推荐条件的所述行为预测结果；

当所述行为预测结果用于表示所述无交互用户针对所述待推荐对象所实施的交互行为的时长时，将表示的时长超过时长阈值的所述行为预测结果，确定为符合推荐条件的所述行为预测结果。

10.根据权利要求1至9任一项所述的对象推荐方法，其特征在于，

所述当所述行为预测结果符合推荐条件时，执行向所述无交互用户推荐所述待推荐对象的操作，包括：

将符合推荐条件的所述行为预测结果对应的待推荐对象，确定为目标对象；

当所述目标对象的数量小于或等于数量阈值时，执行向所述无交互用户推荐所有所述目标对象的操作；

当所述目标对象的数量大于所述数量阈值时，获取每个所述目标对象的热度数据，并

执行向所述无交互用户推荐部分目标对象的操作，其中，所述部分目标对象与符合热度条件的热度数据对应。

11.根据权利要求1至9任一项所述的对象推荐方法，其特征在于，

将符合推荐条件的所述行为预测结果对应的、且注册时长超过设定时长的所述无交互用户，确定为目标用户；

确定所述目标用户对应的所述行为预测结果的结果概率；

执行向满足概率条件的所述目标用户推荐所述待推荐对象的操作。

12.一种基于人工智能的对象推荐装置，其特征在于，包括：

获取模块，用于获取交互样本；

关系确定模块，用于：

对所述交互样本中的领域内特征进行弱化处理；

预测模块，用于根据强化后的所述关联关系，确定无交互用户针对待推荐对象的行为预测结果；其中，所述无交互用户是针对所述待推荐对象未实施交互行为的用户；

13.一种电子设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至11任一项所述的基于人工智能的对象推荐方法。

14.一种存储介质，其特征在于，存储有可执行指令，用于引起处理器执行时，实现权利要求1至11任一项所述的基于人工智能的对象推荐方法。