CN115858815A

CN115858815A - 确定映射信息的方法、广告推荐方法、装置、设备及介质

Info

Publication number: CN115858815A
Application number: CN202211673077.6A
Authority: CN
Inventors: 毛铭泽; 段煜茁; 黄庆亚; 余飞; 顾文婷; 赵东威; 周天力; 刘江涛; 马宝云
Original assignee: Baidu China Co Ltd
Current assignee: Baidu China Co Ltd
Priority date: 2022-12-23
Filing date: 2022-12-23
Publication date: 2023-03-28

Abstract

本公开提供了一种确定映射信息的方法、广告推荐方法、装置、设备及介质，涉及人工智能领域，尤其涉及自然语言处理、智能搜索、智能推荐、信息流等领域。具体实现方案为：根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息；根据至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，至少一个关键词与至少一个原始广告相对应；以及针对同一个信息对，构建目标文本信息和对应于目标关键词的目标原始广告之间的关系，得到映射信息中的第一映触信息。

Description

确定映射信息的方法、广告推荐方法、装置、设备及介质

技术领域

本公开涉及人工智能技术领域，尤其涉及自然语言处理、智能搜索、智能推荐、信息流等领域，更具体地，本公开提供了一种确定映射信息的方法、广告推荐方法、装置、电子设备、存储介质以及计算机程序产品。

背景技术

开屏广告是指在APP(应用，Application)启动时出现的广告，开屏广告展示完毕后自动进入主页面。开屏广告是一种特殊的广告形式，属于品牌广告的一种，具有短时、强曝光的特点。

虽然开屏广告全屏曝光的特点能够很好的吸引到用户注意，帮助广告客户获得用户的关注，满足推广目的，但是从用户群体中确定出的对广告感兴趣的目标用户的数量较少，导致推广效果有限。

发明内容

本公开提供了一种确定映射信息的方法、广告推荐方法、确定映射信息的装置、广告推荐装置、电子设备、存储介质以及计算机程序产品。

根据本公开的一方面，提供了一种确定映射信息的方法，包括：根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息；根据至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，至少一个关键词与至少一个原始广告相对应；以及针对同一个信息对，构建目标文本信息和对应于目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

根据本公开的另一方面，提供了一种广告推荐方法，包括：获取当前用户的当前用户信息；根据当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合；以及根据候选广告集合进行广告推荐；其中，映射信息是根据上述确定映射信息的方法得到的。

根据本公开的另一方面，提供了一种确定映射信息的装置，包括：文本确定模块、信息对确定模块和第一映射信息确定模块。文本确定模块用于根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息。信息对确定模块用于根据至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，至少一个关键词与至少一个原始广告相对应。第一映射信息确定模块用于针对同一个信息对，构建目标文本信息和对应于目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

根据本公开的另一方面，提供了一种广告推荐装置，包括：获取模块、集合确定模块和第一推荐模块，获取模块用于获取当前用户的当前用户信息。集合确定模块用于根据当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合，映射信息是根据上述确定映射信息的装置得到的。第一推荐模块用于根据候选广告集合进行广告推荐。

根据本公开的另一个方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开提供的方法。

根据本公开的另一个方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行本公开提供的方法。

根据本公开的另一个方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开提供的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例的确定映射信息的方法、广告推荐方法和装置的应用场景示意图；

图2是根据本公开实施例的确定映射信息的方法的示意流程图；

图3A是根据本公开实施例的确定用户向量-关键词向量组合的示意原理图；

图3B是根据本公开实施例的确定文本信息-原始广告的示意原理图；

图4是根据本公开实施例的聚类的示意原理图；

图5是根据本公开另一实施例的确定映射信息的方法的示意流程图；

图6是根据本公开实施例的点边图的示意结构图；

图7是根据本公开实施例的定制化拓量的示意原理图；

图8是根据本公开实施例的广告推荐方法的示意流程图；

图9A是根据本公开实施例的广告推荐方法的示意原理图；

图9B是根据本公开实施例的广告推荐方法的示意原理图；

图9C是根据本公开实施例的意图模型的示意原理图；

图10是根据本公开实施例的确定映射信息的装置的示意结构框图；

图11是根据本公开实施例的广告推荐装置的示意结构框图；以及

图12是用来实施本公开实施例的确定映射信息的方法和/或广告推荐方法的电子设备的结构框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本公开实施例的确定映射信息的方法、广告推荐方法和装置的应用场景示意图。

需要注意的是，图1所示仅为可以应用本公开实施例的***架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。

如图1所示，根据该实施例的***架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理，并将处理结果(例如需要映射信息、需要推荐给用户的广告等)反馈给终端设备。

需要说明的是，本公开实施例所提供的确定映射信息的方法和广告推荐方法一般可以由服务器105执行。相应地，本公开实施例所提供的确定映射信息的装置和广告推荐装置一般可以设置于服务器105中。本公开实施例所提供的确定映射信息的方法和广告推荐方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本公开实施例所提供的确定映射信息的装置和广告推荐装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

本公开提供了一种确定映射信息的方法和广告推荐方法，上述方法可以应用于开屏广告，也可以应用于其他具有信息搜索能力的广告产品。

在离线阶段，可以每隔一段时间执行一次确定映射信息的方法来更新映射信息，例如更新第一映射信息和第二映射信息，第一映射信息可以表征文本信息和广告之间的关系，第二映射信息可以表征用户和广告之间的关系。然后将更新的映射信息存储在缓存数据库中，供在线阶段使用。

在在线阶段，可以执行广告推荐方法，例如首先获取当前用户的用户信息，用户信息可以包括当前用户在过去一段时间内的历史搜索词和当前用户标识。接下来，可以基于获取的当前用户信息，在缓存数据库中查询与该当前用户信息对应的候选广告。例如基于第一映射信息查询与搜索词对应的广告，又例如基于第二映射信息查询与当前用户标识对应的广告，从而得到候选广告集合，进而向当前用户推荐候选广告集合中的广告。

以下将对本公开提供的确定映射信息的方法进行详细说明，然后对广告推荐方法进行详细说明。

图2是根据本公开实施例的确定映射信息的方法的示意流程图。

如图2所示，该确定映射信息的方法200可以包括操作S210～操作S230，该方法主要基于参考用户的行为挖掘出强意图人群，强意图人群可以表示：主动表达的偏好行为，能直接命中客户意图的目标人群，其中，偏好行为可以包括主动搜索、点击、收藏、关注、点赞等。需要说明的是，本公开实施例中，用户可以表示为使用目标应用(APP)的对象，客户可以表示与目标应用合作，需要目标应用向用户推荐自身广告的广告商。

在操作S210，根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息。

例如，该方法用于构建用户信息和广告之间的关系，进而向使用目标应用的用户推荐广告，参考用户可以包括使用目标应用的用户，也可以包括使用其他应用的用户。参考用户的数量是至少一个。

例如，预定时段可以表示过去一段时间，例如过去30天、过去15天、过去7天等。

例如，历史偏好行为可以包括搜索、点击、收藏、关注、点赞、评论等行为，还可以包括观看某个视频的时长大于预定时长的行为。可以理解的是，用户在浏览过程中，会针对资讯、广告等信息产生上述历史偏好行为。

在一种示例中，与历史偏好行为相关的文本信息可以包括上述资讯、广告等信息的标题、内容、描述等文本。例如，用户在上周点赞的一个视频标题为“如何通过大学生英语六级”，则针对该用户历史偏好行为相关的文本信息可以包括“如何通过大学生英语六级”。

在另一种示例中，与历史偏好行为相关的文本信息也可以包括对上述文本(例如点击的广告标题、收藏的视频标题)进行切词得到的子文本。例如，用户在上周点赞的一个视频标题为“如何通过大学生英语六级”，则针对该用户历史偏好行为相关的文本信息可以包括“英语六级”。

在另一种示例中，当上述资讯、广告等信息中包括图片时，与历史偏好行为相关的文本信息还可以包括图片中的文本。

在操作S220，根据至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，至少一个关键词与至少一个原始广告相对应。

例如，目标应用与若干个客户合作，并根据实际需求向用户展示这些客户的广告。客户可以提供与原始广告相对应的关键词。例如，与英语教育广告advl对应的关键词可以包括“英语口语”、“英语六级”等。

可以计算文本信息和关键词之间的相似度，相似度可以包括语义相似度、文本相似度中的至少一个，然后将相似度较高的文本信息和关键词确定为一个信息对。例如，某个文本信息为“如何通过大学生英语六级”，某个关键词为“英语六级”，二者之间的相似度较高，因此可以将文本信息“如何通过大学生英语六级”和关键词“英语六级”确定为一个信息对。

在操作S230，针对同一个信息对，构建目标文本信息和对应于目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

例如，对于上述信息对，关键词“英语六级”对应的原始广告为某个英语教育广告adv1，因此可以构建文本信息“如何通过大学生英语六级”与英语教育广告adv1之间的关系。

例如，可以按照键值对的形式来存储构建出的第一映射信息，例如将文本信息存储为键名key，将原始广告的标识存储为键值value。

本公开实施例提供的技术方案，根据参考用户的历史偏好行为，来构建文本信息和原始广告之间的关系，得到第一映射信息。在后续利用第一映射信息进行广告推荐的过程中，可以利用当前用户的历史搜索词，在第一映射信息中查询对应的原始广告，从而可以确保将广告推荐给感兴趣的用户。

需要说明的是，上文中的操作S220旨在确定信息对，在实际应用中，可以通过多种方案来确定信息对，并且多种确定信息对的方案可以组合使用。以下结合图3A～图4，对确定信息对的方案进行详细说明。

图3A是根据本公开实施例的确定用户向量-关键词向量组合的示意原理图，图3B是根据本公开实施例的确定文本信息-原始广告310的示意原理图。

如图3A和图3B所示，可以通过以下方式确定信息对：确定至少一个文本信息和至少一个关键词彼此之间的第一相似度。然后在确定文本信息和关键词之间的第一相似度大于等于第一相似度阈值的情况下，将文本信息和关键词分别确定为同一个信息对中的目标文本信息和目标关键词。

如图3A所示，例如，可以通过参考用户的信息流的推荐行为日志301、搜索行为日志302等，获取参考用户的搜索词、搜索点击标题、信息流点击标题、完播视频标题等文本信息，其中，完播视频表示播放时长超过预定时长的视频。

接下来，可以利用上述文本信息和深度学习模型来确定用于表征参考用户的用户向量304，利用原始广告的关键词305和深度学习模型确定关键词向量306。例如，将上述文本信息输入深度学习模型，深度学习模型输出用户向量304，以及将关键词305输入深度学习模型，深度学习模型输出关键词向量306。深度学习模型例如可以是语义模型303，语义模型303可以采用ERNIE(Enhanced Representation through Knowledge Integration)。

接下来，可以基于用户向量304使用检索算法检索关键词向量306，计算第一相似度，第一相似度表征用户向量304和关键词向量306之间的距离。上述第一相似度可以是余弦相似度。上述检索算法可以是HNSW(基于图的最近邻搜索算法，Hierarchical NavigableSmall World)，在大规模检索中可以将检索时间近似的缩短到O(N)，其中N为图的节点数。

接下来，可以利用第一相似度阈值进行过滤。例如，若用户向量304和关键词向量306之间的第一相似度小于等于第一相似度阈值，则将该用户向量304和关键词向量306滤除，否则进行保留，保留得到用户向量-关键词向量组合307。

如图3B所示，可以将用户向量-关键词向量组合307映射为文本信息-关键词组合308，该文本信息-关键词组合308即为上文提及的信息对。接下来，检索多个客户提供的关键词305的词包，将包含组合308中关键词305的原始广告筛选出来，进而将文本信息-关键词组合308映射为文本信息-原始广告组合309，供在线直接使用。

需要说明的是，可以通过人工采样评估结合小流量ABTest实验，确定第一相似度阈值。例如，初步给定一个第一相似度的初始阈值，例如抽取基于初始阈值得到的信息对，然后评估信息对是否准确，从而评估初始阈值是否合理，若不合理则对初始阈值进行调整。结合多次实验来调整初始阈值，从而得到第一相似度阈值。

本公开实施例通过计算文本信息和关键词之间的相似度，来确定信息对，可以从多个文本信息和多个关键词中准确确定出语义相近的信息对，从而确保第一映射信息的准确性。

图4是根据本公开实施例的聚类的示意原理图。

在一些实施例中，还可以通过以下方式确定信息对：对与同一个原始广告对应的多个关键词进行聚类，得到至少一个同义簇和每个同义簇对应的质心，每个同义簇包括至少一个关键词。接下来，针对至少一个同义簇中的目标同义簇，确定至少一个文本信息各自与目标同义簇的质心之间的第二相似度。然后在确定文本信息和目标同义簇的质心之间的第二相似度大于等于第二相似度阈值的情况下，将文本信息确定为目标文本信息，将目标同义簇中的每个关键词确定为与目标文本信息相对应的目标关键词。

如图4所示，可以对同一个客户提供的关键词的词包进行聚类，将相似主题内容的词汇集中在一起，形成同义簇。对词包401中的多个关键词进行聚类，得到同义簇402、403、404。

在一种示例中，可以将全部同义簇确定为目标同义簇，并进行后续处理。在另一种示例中，可以将关键词数量大于等于数量阈值的同义簇，确定为目标同义簇，数量阈值可以是1、2、3等。若某个同义簇中的关键词数量小于数量阈值，表示该同义簇中的关键词为泛词，可以进行剔除，从而避免泛词影响第一映射信息的准确性。

然后基于用户向量对目标同义簇进行召回。召回过程可以包括：对同义簇中包括的关键词的向量进行加权平均或者其他处理，得到该同义簇的质心。然后计算质心和用户向量之间的第二相似度，在第二相似度大于等于第二相似度阈值的情况下，召回该目标同义簇，例如召回该目标同义簇中的全部关键词。

在召回某个目标同义簇之后，可以将与该目标同义簇之间的第二相似度大于等于第二相似度阈值的文本信息确定为目标文本信息，将该目标同义簇中的各关键词分别确定为目标关键词，从而基于该目标同义簇得到多个信息对。

本公开实施例通过聚类形成同义簇，然后基于同义簇进行召回，增加了触发的效率，提高不同主题的词被召回的概率，减少同类词占据召回通道的影响。

在其他示例中，还可以通过以下方式确定信息对：可以使用TDM(Tree-based DeepMatch)深度树检索算法，对参考用户的文本信息构建索引，在构建索引之后可以得到树状结构，树的节点对应文本信息，父节点可以对应多个文本信息。然后使用关键词召回用户的文本信息，例如计算关键词和树中各节点的距离，然后将距离较小的节点进行召回，从而得到与该节点对应的关键词。接下来，基于召回的关键词和文本信息，即可构建信息对。通过构建索引，可以提升检索效率。

需要说明的是，上文中的确定映射信息的方法可以基于参考用户的行为挖掘强意图人群，从而提高广告的展现量。但是随着客户的增多和需求的多样化，上述方法可挖掘到的强意图人群有限，因此还可以通过相似人群挖掘策略，在强意图人群之外，挖掘出***人群。***人群可以表示：产生强意图行为之外的其他行为，需要估计该用户的偏好意图，再命中客户表达意图的人群。

以下结合图5和图6，对相似人群挖掘策略进行说明。图5是根据本公开另一实施例的确定映射信息的方法的示意流程图，图6是根据本公开实施例的点边图的示意结构图。

如图5所示，该确定映射信息的方法500可以包括操作S510，还可以包括操作S540～操作S560。该方法旨在挖掘出***人群。

在操作S510，根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息。

例如，该操作可以参考上文中的操作S210，在此不再赘述。在本实施例中，参考用户的数量可以是多个。

在操作S540，根据多个参考用户和至少一个文本信息，构建点边图。

点边图包括与多个参考用户对应的多个用户结点和与至少一个文本信息对应的至少一个文本结点，与目标参考用户对应的用户结点和与目标文本信息对应的文本结点之间经由边连接，目标文本信息与目标参考用户的历史偏好行为相关。

例如，文本信息可以参考上文，文本信息例如可以为用户点击的广告标题。例如，可以获取参考用户在贴吧等不同媒体的广告点击数据，来获取文本信息。文本信息也可以包括参考用户的搜索词。

接下来可以利用参考用户和文本信息构建点边图。以参考用户u1点击了某个广告adv1为例，对构建点边图的过程进行说明。

例如，点边图可以包括与参考用户u1对应的用户节点node_u1，以及与该广告adv1的标题(即文本信息)所对应的文本节点node_t1，用户节点node_u1和文本节点node_t1经由一个边连接。可以看出，若参考用户u1对应的文本信息与参考用户u2对应的文本信息相同，则可以在点边图中构建出“参考用户u1-文本信息-参考用户u2”的链路。

此外，还可以采用切词匹配的方式，来构建点边图中的边。例如，若参考用户u1点击的广告adv1标题中某个切词和参考用户u3点击的广告adv3标题中某个切词相同，还可以使用边连接参考用户u3对应的用户节点node_u3和文本节点node_t1，从而在点边图中构建出“用户A-切词-用户B”的链路。

如图6所示，图6是根据本公开实施例的点边图的示意结构图。例如本示例涉及用户A 611、用户B 612和用户C 613，用户A 611点击的广告标题包括点击标题621，搜索过的信息包括搜索词631、632。用户B 612点击的广告标题包括点击标题622，或者用户B 612点击的广告标题的某个切词与点击标题622中某个切词相同，搜索过的信息包括搜索词631。用户C 613点击的广告标题包括点击标题621，或者用户C 613点击的广告标题的某个切词与点击标题621中某个切词相同，搜索过的信息包括搜索词633，构建出的点边图如图6所示。

在操作S550，根据点边图，从多个参考用户中确定至少一个用户对。

示例性的，可以利用构建的点边图来生成用户向量。例如，可以预先训练图模型，模型的输入是图，输出是各个节点的向量。又例如，点边图中的节点可以具有各自的特征，例如，可以利用用户点击的广告标题、搜索词等文本信息确定用户节点的特征。然后基于用户节点的特征计算用户向量。

接下来，可以基于用户向量来确定用户对。可以将点击广告的用户称为种子用户，将未发生点击该广告行为的用户称为***，使用种子用户检索召回***，生成种子用户-***对(即用户对)。

在召回过程中，可以计算种子用户的用户向量和***的用户向量之间的相似度，并在相似度大于等于阈值的情况下，将种子用户和***确定为种子用户-***对。

在操作S560，针对同一个用户对，构建一个参考用户的用户标识和与另一个参考用户相关的原始广告之间的关系，得到映射信息中的第二映射信息。

例如，在某个种子用户-***对中，种子用户点击了某个商业广告，***未点击该商业广告，则可以构建该***的用户标识和该商业广告的关系，得到一个第二映射信息。可以按照键值对的形式来存储构建出的第二映射信息，例如将该***的用户标识作为键名key，将该商业广告的标识作为键值value。在得到该第二映射信息之后，在进行广告推荐的过程中，可以将该商业广告推送给与该***。

本公开实施例提供的技术方案根据参考用户和基于参考用户历史偏好行为确定的文本信息构建点边图，该点边图可以对***进行挖掘，从而确保向用户推荐感兴趣的广告，同时提高广告展现量。

需要说明书的是，在实际应用中，上述方法200和方法500可以任选其一来执行，也可以组合使用。

以上方法可以对强意图人群和潜在人群进行挖掘，但随着信息流的日渐壮大以及不同媒体之间的用途属性的不同，用户在媒体端的行为也逐渐多元化，还可以更进一步的覆盖用户兴趣和表征，针对不同客户进行定制化拓量。图7是根据本公开实施例的定制化拓量的示意原理图，以下结合图7对定制化拓展数量的流程进行说明。

如图7所示，例如，可以利用客户提供的关键词圈选人群，利用该人群的特征确定基础的正样本。还可以获取对该广告发生转化行为(例如填写表单等行为)的用户，并利用这些用户的特征确定增量的正样本。从剩余用户中随机采样，利用采样得到的用户的特征确定负样本。基于正样本和负样本训练深度学习模型。

在使用时，可以使用目标应用的用户群体中各个用户的特征输入经训练的深度学习模型，模型输出投放人群信息，然后建立该投放人群中各个用户与该广告之间的关系，从而对第二映射信息进行补充，来实现为客户拓展用户数量的效果。

以上对确定映射信息的方法进行了详细说明，以下将结合图8对广告推荐方法进行说明，图8是根据本公开实施例的广告推荐方法的示意流程图。

如图8所示，该广告推荐方法800可以包括操作S810～操作S830。

在操作S810，获取当前用户的当前用户信息。

例如，当前用户打开目标应用，可以在进入目标应用的主页之前，向当前用户推荐广告。

例如，当前用户信息可以包括当前用户在过去一段时间内的历史搜索词，也可以包括当前用户标识。

在操作S820，根据当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合。

例如，映射信息是根据上述确定映射信息的方法得到的，映射信息可以包括第一映射信息和第二映射信息中的至少一个。第一映射信息可以表征文本信息和原始广告之间关系，例如文本信息为键名key，原始广告的标识为键名value。第二映射信息可以表征参考用户的用户标识和原始广告之间关系，例如参考用户的标识为键名key，原始广告的标识为键名value。

例如，可以根据当前用户的历史搜索词，在第一映射信息中心查找与该历史搜索词相同或者相近的文本信息，并将查找到的文本信息所对应的广告确定为候选广告。

又例如，可以根据当前用户的当前用户标识，在第二映射信息中心查找与该当前用户标识相同的参考用户标识，并将查找到的参考用户标识所对应的广告确定为候选广告。

在操作S830，根据候选广告集合进行广告推荐。

例如，可以将候选广告集合中的全部广告推荐给当前用户，也可以从候选广告集合中随机选择或者结合策略来选择其中一部分广告作为目标广告，并将目标广告推荐给当前用户。

本公开实施例提供的技术方案，可以在目标应用开屏时获取当前用户的当前用户信息，然后基于当前用户信息和预先确定的映射信息，来向当前用户推荐广告，从而确保广告的展现量，以及确保向用户推荐感兴趣的广告。此外，由于可以直接基于映射信息检索广告，而无需实时确定映射信息，还能够提高数据处理效率，确保开屏广告的实时性。

根据本公开另一实施例，上述根据当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合的方法，可以包括以下操作：

从至少一个原始广告中确定当前原始广告。在第一映射信息中，与当前原始广告对应的文本信息称为当前文本信息。在第二映射信息中，与当前原始广告对应的参考用户称为当前参考用户。

接下来，在确定历史搜索词与至少一个原始广告对应的关键词不一致的情况下，可以确定历史搜索词与当前文本信息是否一致，也可以确定当前用户标识与当前参考用户的用户标识是否一致。若历史搜索词与当前文本信息一致和/或当前用户标识与当前参考用户的用户标识一致，则可以将当前原始广告作为候选广告添加至候选广告集合中，并且从至少一个原始广告中删除当前原始广告。

重复执行上述操作，直至至少一个原始广告的数量是0，即可依次对多个原始广告进行处理，确定是否将各原始广告添加至候选广告集合中。

图9A是根据本公开实施例的广告推荐方法的示意原理图，图9B是根据本公开实施例的广告推荐方法的示意原理图，图9C是根据本公开实施例的意图模型的示意原理图。

以下结合图9A～9C，对本公开课实施例提供的广告推荐方法进行说明。

本实施例以针对一个广告(下文称为当前原始广告)的处理流程为例进行说明，当目标应用与多个广告客户合作时，依次对多个广告客户提供的原始广告进行与当前原始广告类似的处理流程即可。针对当前原始广告的处理流程可以包括以下阶段：关键词匹配阶段、缓存数据库检索阶段和意图过滤阶段。

在关键词匹配阶段，可以获取当前用户的当前用户信息，当前用户信息可以包括当前用户标识和当前用户在过去一段时间内的历史搜索词。可以从关键词的词库(下文简称为关键词库)中拉取当前原始广告对应的关键词。然后确定当前用户的历史搜索词是否与当前原始广告对应的关键词一致。

若历史搜索词与关键词一致，则可以确定历史搜索词的搜索时刻与当前时刻之间的间隔时长是否小于等于预定时长，预定时长可以是5分钟。

若是，则表示当前用户在当前时刻对当前原始广告的兴趣较高，因此可以提高该当前原始广告的展现优先级，对当前原始广告进行推荐，确保向用户推荐感兴趣的广告，还能够提高客户流量质量。

若否，虽然用户对当前广告的兴趣不如“若是”的情况高，但是由于历史搜索词命中广告关键词，当前用户对当前原始广告仍具有较高兴趣，因此可以将当前原始广告作为候选广告添加至候选广告集合中，以便后续进行广告推荐。需要说明的是，后续进行广告推荐时，可以从候选广告集合中选择推荐给当前用户的目标广告，目标广告可以包括当前原始广告，也可以不包括当前原始广告。

若历史搜索词与关键词不一致，则进入缓存数据库检索阶段。

需要说明的是，由于关键词是客户基于对品牌目标人群的理解给出的，当某用户过去在APP上搜索过关键词时，可以对该用户展现该客户的广告，通过这种方式来保证对目标人群的精准触达。但是由于不同客户对于用户的理解以及买词能力往往层次不齐，有时客户提供的关键词并不准确。例如，客户保守或者不知道怎么选词，只提供了很少的关键词。又例如，客户希望增大曝光率，进而给出了较多泛词和长尾词，对精准匹配目标人群造成了难度。此外，搜索行为本身是用户及时兴趣的表达，也存在兴趣迁移甚至跳跃，这对客户期望每天定量完成曝光带来了挑战。以上情况会导致关键词匹配展现量的不足、曝光人群定位不准的问题，但是客户又对量和曝光效果有一定预期。本实施例通过缓存数据库检索阶段和意图过滤阶段，通过扩触发的方式，筛选强意图目标人群，提升展现量和曝光效果，实现满足客户展现量且提高其中感兴趣受众人群覆盖比例的效果。

在缓存数据库检索阶段，可以利用当前用户信息，在缓存数据库中检索广告，缓存数据库中存储有第一映射信息和第二映射信息。例如，利用当前用户标识在第一映射信息中检索是否存在对应的广告，利用当前用户的历史搜索词在第二映射信息中检索是否存在对应的广告。

若在缓存数据库中，当前原始广告与当前用户信息符合第一映射信息和/或第二映射信息，则将当前原始广告添加至候选广告集合中。

若在缓存数据库中，当前原始广告与当前用户信息不符合第一映射信息，且不符合第二映射信息，则可以进行意图过滤阶段，利用意图模型确定是否将当前原始广告添加至候选广告集合中。

在意图过滤阶段，可以请求外部模块，请求中可以携带当前用户信息，外部模块可以对当前用户的历史搜索词进行泛化处理，并将泛化处理后得到的词作为意图词，并返回意图词。接下来，可以确定意图词与当前原始广告的关键词是否一致。

若不一致，则可以结束针对当前原始广告的处理流程，确定不将当前原始广告添加至候选广告集合中。

若一致，则还可以利用意图模型，来确定是否将当前原始广告添加至候选广告集合中。

如图9C所示，可以预先训练意图模型。可以确定用户的历史搜索词与原始广告的关键词是否一致，将一致的用户作为正例用户，在不一致的用户随机筛选部分用户作为负例用户。利用正例用户的特征和广告特征构建正样本，利用负例用户的特征和广告特征构建负样本，利用正样本和负样本训练意图模型，从而建立人群意图和投放广告的相关性。

在训练意图模型之后，可以将当前用户的用户特征和当前广告的广告特征输入经训练的意图模型，意图模型输出评价值，若评价值高于阈值，则将当前原始广告添加至候选广告集合中，否则不将当前原始广告添加至候选广告集合中。利用意图模型进一步挖掘出用户的意图，补充对于***的发现。

本公开实施例首先通过APP用户的历史搜索词匹配到客户提供的关键词，筛选出一部分品牌目标用户，该部分客户为强意图客户。然后利用缓存数据库检索潜在人群，缓存数据库中的映射信息是通过行为挖掘策略、相似人群挖掘策略、定制化模型策略来实现为客户挖掘强意图用户和***。接下来，还进一步利用意图模型进行过滤。

根据本公开实施例提供的技术方案，在针对客户提供的关键词的基础上，利用算法策略进一步扩触发，为客户充分挖掘其目标人群，增加广告的曝光量，使投放的广告会更多的触达其受众群体，获得更优质的流量。此外，也能够为目标应用的用户提供感兴趣的广告。

图10是根据本公开实施例的确定映射信息的装置的示意结构框图。

如图10所示，该确定映射信息的装置1000可以包括文本确定模块1010、信息对确定模块1020和第一映射信息确定模块1030。

文本确定模块1010用于根据参考用户在预定时段内的历史偏好行为，确定与历史偏好行为相关的至少一个文本信息。

信息对确定模块1020用于根据至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，至少一个关键词与至少一个原始广告相对应。

第一映射信息确定模块1030用于针对同一个信息对，构建目标文本信息和对应于目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

根据本公开另一实施例，信息对确定模块包括：第一确定子模块和第二确定子模块。第一确定子模块用于确定至少一个文本信息和至少一个关键词彼此之间的第一相似度。第二确定子模块用于在确定文本信息和关键词之间的第一相似度大于等于第一相似度阈值的情况下，将文本信息和关键词分别确定为同一个信息对中的目标文本信息和目标关键词。

根据本公开另一实施例，信息对确定模块包括：聚类子模块、第三确定子模块和第四确定子模块。聚类子模块用于对与同一个原始广告对应的多个关键词进行聚类，得到至少一个同义簇和每个同义簇对应的质心，每个同义簇包括至少一个关键词。第三确定子模块用于针对至少一个同义簇中的目标同义簇，确定至少一个文本信息各自与目标同义簇的质心之间的第二相似度。第四确定子模块用于在确定文本信息和目标同义簇的质心之间的第二相似度大于等于第二相似度阈值的情况下，将文本信息确定为目标文本信息，将目标同义簇中的每个关键词确定为与目标文本信息相对应的目标关键词。

根据本公开另一实施例，上述装置还包括：目标簇确定模块，用于在得到至少一个同义簇之后，将关键词数量大于等于数量阈值的同义簇，确定为目标同义簇。

根据本公开另一实施例，参考用户的数量是多个，装置还包括：图构建模块、用户对确定模块和第二映射信息确定模块。图构建模块用于根据多个参考用户和至少一个文本信息，构建点边图；其中，点边图包括与多个参考用户对应的多个用户结点和与至少一个文本信息对应的至少一个文本结点，与目标参考用户对应的用户结点和与目标文本信息对应的文本结点之间经由边连接，目标文本信息与目标参考用户的历史偏好行为相关。用户对确定模块用于根据点边图，从多个参考用户中确定至少一个用户对。第二映射信息确定模块用于针对同一个用户对，构建一个参考用户的用户标识和与另一个参考用户相关的原始广告之间的关系，得到映射信息中的第二映射信息。

图11是根据本公开实施例的广告推荐装置的示意结构框图。

如图11所示，该广告推荐装置1100可以包括：获取模块1110、集合确定模块1120和第一推荐模块1130。

获取模块1110用于获取当前用户的当前用户信息。

集合确定模块1120用于根据当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合，映射信息是根据上述确定映射信息的装置得到的。

第一推荐模块1130用于根据候选广告集合进行广告推荐。

根据本公开另一实施例，当前用户信息包括历史搜索词，映射信息包括表征文本信息和原始广告之间关系的第一映射信息；集合确定模块包括：第一执行子模块，用于重复执行以下操作，直至至少一个原始广告的数量是0：从至少一个原始广告中确定当前原始广告；其中，当前原始广告与当前文本信息之间的关系符合第一映射信息；响应于历史搜索词与至少一个原始广告对应的关键词不一致，且历史搜索词与当前文本信息一致，将当前原始广告作为候选广告添加至候选广告集合中；以及从至少一个原始广告中删除当前原始广告。

根据本公开另一实施例，当前用户信息包括当前用户标识；映射信息包括表征参考用户的用户标识和原始广告之间关系的第二映射信息；集合确定模块包括：第二执行子模块，用于重复执行以下操作，直至至少一个原始广告的数量是0：从至少一个原始广告中确定当前原始广告；其中，当前原始广告与当前参考用户的用户标识之间的关系符合第二映射信息；响应于历史搜索词与至少一个原始广告对应的关键词不一致，且当前用户标识与当前参考用户的用户标识一致，将当前原始广告作为候选广告添加至候选广告集合中；以及从至少一个原始广告中删除当前原始广告。

根据本公开另一实施例，当前用户信息包括历史搜索词，装置还包括：添加模块，用于响应于历史搜索词与至少一个原始广告对应的关键词一致，将与历史搜索词一致的关键词所对应的原始广告作为候选广告添加至候选广告集合中。

根据本公开另一实施例，当前用户信息包括历史搜索词，装置还包括：第二推荐模块，用于响应于历史搜索词与至少一个原始广告对应的关键词一致，且历史搜索词的搜索时刻与当前时刻之间的间隔时长小于等于预定时长，推荐与历史搜索词一致的关键词所对应的原始广告。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

根据本公开的实施例，本公开还提供了一种电子设备，包括至少一个处理器；以及与至少一个处理器通信连接的存储器；存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述确定映射信息的方法和/或广告推荐方法。

根据本公开的实施例，本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行上述确定映射信息的方法和/或广告推荐方法。

根据本公开的实施例，本公开还提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述确定映射信息的方法和/或广告推荐方法。

图12是用来实施本公开实施例的确定映射信息的方法和/或广告推荐方法的电子设备的结构框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示，设备1200包括计算单元1201，其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序，来执行各种适当的动作和处理。在RAM.1203中，还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

设备1200中的多个部件连接至I/O接口1205，包括：输入单元1206，例如键盘、鼠标等；输出单元1207，例如各种类型的显示器、扬声器等；存储单元1208，例如磁盘、光盘等；以及通信单元1209，例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理，例如确定映射信息的方法和/或广告推荐方法。例如，在一些实施例中，确定映射信息的方法和/或广告推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1208。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时，可以执行上文描述的确定映射信息的方法和/或广告推荐方法的一个或多个步骤。备选地，在其他实施例中，计算单元1201可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行确定映射信息的方法和/或广告推荐方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种确定映射信息的方法，包括：

根据参考用户在预定时段内的历史偏好行为，确定与所述历史偏好行为相关的至少一个文本信息；

根据所述至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，所述至少一个关键词与至少一个原始广告相对应；以及

针对同一个信息对，构建所述目标文本信息和对应于所述目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

2.根据权利要求1所述的方法，其中，所述根据所述至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对包括：

确定所述至少一个文本信息和所述至少一个关键词彼此之间的第一相似度；以及

在确定文本信息和关键词之间的所述第一相似度大于等于第一相似度阈值的情况下，将所述文本信息和所述关键词分别确定为所述同一个信息对中的目标文本信息和目标关键词。

3.根据权利要求1所述的方法，其中，所述根据所述至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对包括：

对与同一个原始广告对应的多个关键词进行聚类，得到至少一个同义簇和每个同义簇对应的质心，所述每个同义簇包括至少一个关键词；

针对所述至少一个同义簇中的目标同义簇，确定所述至少一个文本信息各自与所述目标同义簇的质心之间的第二相似度；以及

在确定文本信息和所述目标同义簇的质心之间的所述第二相似度大于等于第二相似度阈值的情况下，将所述文本信息确定为所述目标文本信息，将所述目标同义簇中的每个关键词确定为与所述目标文本信息相对应的目标关键词。

4.根据权利要求3所述的方法，还包括：在得到至少一个同义簇之后，

将关键词数量大于等于数量阈值的同义簇，确定为所述目标同义簇。

5.根据权利要求1所述的方法，其中，所述参考用户的数量是多个，所述方法还包括：

根据多个参考用户和所述至少一个文本信息，构建点边图；其中，所述点边图包括与所述多个参考用户对应的多个用户结点和与所述至少一个文本信息对应的至少一个文本结点，与目标参考用户对应的用户结点和与目标文本信息对应的文本结点之间经由边连接，所述目标文本信息与所述目标参考用户的历史偏好行为相关；

根据所述点边图，从所述多个参考用户中确定至少一个用户对；以及

针对同一个用户对，构建一个参考用户的用户标识和与另一个参考用户相关的原始广告之间的关系，得到所述映射信息中的第二映射信息。

6.一种广告推荐方法，包括：

获取当前用户的当前用户信息；

根据所述当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合；以及

根据所述候选广告集合进行广告推荐；

其中，所述映射信息是根据权利要求1至5中任意一项所述的方法得到的。

7.根据权利要求6所述的方法，其中，所述当前用户信息包括历史搜索词，所述映射信息包括表征文本信息和原始广告之间关系的第一映射信息；

所述根据所述当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合包括：

重复执行以下操作，直至所述至少一个原始广告的数量是0：

从所述至少一个原始广告中确定当前原始广告；其中，所述当前原始广告与当前文本信息之间的关系符合所述第一映射信息；

响应于所述历史搜索词与所述至少一个原始广告对应的关键词不一致，且所述历史搜索词与所述当前文本信息一致，将所述当前原始广告作为所述候选广告添加至所述候选广告集合中；以及

从所述至少一个原始广告中删除所述当前原始广告。

8.根据权利要求6所述的方法，其中，所述当前用户信息包括当前用户标识；所述映射信息包括表征参考用户的用户标识和原始广告之间关系的第二映射信息；

重复执行以下操作，直至所述至少一个原始广告的数量是0：

从所述至少一个原始广告中确定当前原始广告；其中，所述当前原始广告与当前参考用户的用户标识之间的关系符合所述第二映射信息；

响应于所述历史搜索词与所述至少一个原始广告对应的关键词不一致，且所述当前用户标识与所述当前参考用户的用户标识一致，将所述当前原始广告作为所述候选广告添加至所述候选广告集合中；以及

从所述至少一个原始广告中删除所述当前原始广告。

9.根据权利要求6所述的方法，其中，所述当前用户信息包括历史搜索词，所述方法还包括：

响应于所述历史搜索词与所述至少一个原始广告对应的关键词一致，将与所述历史搜索词一致的关键词所对应的原始广告作为所述候选广告添加至所述候选广告集合中。

10.根据权利要求6所述的方法，其中，所述当前用户信息包括历史搜索词，所述方法还包括：

响应于所述历史搜索词与所述至少一个原始广告对应的关键词一致，且所述历史搜索词的搜索时刻与当前时刻之间的间隔时长小于等于预定时长，推荐与所述历史搜索词一致的关键词所对应的原始广告。

11.一种确定映射信息的装置，包括：

文本确定模块，用于根据参考用户在预定时段内的历史偏好行为，确定与所述历史偏好行为相关的至少一个文本信息；

信息对确定模块，用于根据所述至少一个文本信息和至少一个关键词之间的相似度，确定至少一个信息对，每个信息对包括相对应的目标文本信息和目标关键词；其中，所述至少一个关键词与至少一个原始广告相对应；以及

第一映射信息确定模块，用于针对同一个信息对，构建所述目标文本信息和对应于所述目标关键词的目标原始广告之间的关系，得到映射信息中的第一映射信息。

12.根据权利要求11所述的装置，其中，所述信息对确定模块包括：

第一确定子模块，用于确定所述至少一个文本信息和所述至少一个关键词彼此之间的第一相似度；以及

第二确定子模块，用于在确定文本信息和关键词之间的所述第一相似度大于等于第一相似度阈值的情况下，将所述文本信息和所述关键词分别确定为所述同一个信息对中的目标文本信息和目标关键词。

13.根据权利要求11所述的装置，其中，所述信息对确定模块包括：

聚类子模块，用于对与同一个原始广告对应的多个关键词进行聚类，得到至少一个同义簇和每个同义簇对应的质心，所述每个同义簇包括至少一个关键词；

第三确定子模块，用于针对所述至少一个同义簇中的目标同义簇，确定所述至少一个文本信息各自与所述目标同义簇的质心之间的第二相似度；以及

第四确定子模块，用于在确定文本信息和所述目标同义簇的质心之间的所述第二相似度大于等于第二相似度阈值的情况下，将所述文本信息确定为所述目标文本信息，将所述目标同义簇中的每个关键词确定为与所述目标文本信息相对应的目标关键词。

14.根据权利要求13所述的装置，还包括：

目标簇确定模块，用于在得到至少一个同义簇之后，将关键词数量大于等于数量阈值的同义簇，确定为所述目标同义簇。

15.根据权利要求11所述的装置，其中，所述参考用户的数量是多个，所述装置还包括：

图构建模块，用于根据多个参考用户和所述至少一个文本信息，构建点边图；其中，所述点边图包括与所述多个参考用户对应的多个用户结点和与所述至少一个文本信息对应的至少一个文本结点，与目标参考用户对应的用户结点和与目标文本信息对应的文本结点之间经由边连接，所述目标文本信息与所述目标参考用户的历史偏好行为相关；

用户对确定模块，用于根据所述点边图，从所述多个参考用户中确定至少一个用户对；以及

第二映射信息确定模块，用于针对同一个用户对，构建一个参考用户的用户标识和与另一个参考用户相关的原始广告之间的关系，得到所述映射信息中的第二映射信息。

16.一种广告推荐装置，包括：

获取模块，用于获取当前用户的当前用户信息；

集合确定模块，用于根据所述当前用户信息和映射信息，从至少一个原始广告中确定候选广告，得到候选广告集合；

第一推荐模块，用于根据所述候选广告集合进行广告推荐；

其中，所述映射信息是根据权利要求11至15中任意一项所述的装置得到的。

17.根据权利要求16所述的装置，其中，所述当前用户信息包括历史搜索词，所述映射信息包括表征文本信息和原始广告之间关系的第一映射信息；

所述集合确定模块包括：

第一执行子模块，用于重复执行以下操作，直至所述至少一个原始广告的数量是0：

从所述至少一个原始广告中删除所述当前原始广告。

18.根据权利要求16所述的装置，其中，所述当前用户信息包括当前用户标识；所述映射信息包括表征参考用户的用户标识和原始广告之间关系的第二映射信息；

所述集合确定模块包括：

第二执行子模块，用于重复执行以下操作，直至所述至少一个原始广告的数量是0：

从所述至少一个原始广告中删除所述当前原始广告。

19.根据权利要求16所述的装置，其中，所述当前用户信息包括历史搜索词，所述装置还包括：

添加模块，用于响应于所述历史搜索词与所述至少一个原始广告对应的关键词一致，将与所述历史搜索词一致的关键词所对应的原始广告作为所述候选广告添加至所述候选广告集合中。

20.根据权利要求16所述的装置，其中，所述当前用户信息包括历史搜索词，所述装置还包括：

第二推荐模块，用于响应于所述历史搜索词与所述至少一个原始广告对应的关键词一致，且所述历史搜索词的搜索时刻与当前时刻之间的间隔时长小于等于预定时长，推荐与所述历史搜索词一致的关键词所对应的原始广告。

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1至10中任一项所述的方法。