CN105335519B - 模型生成方法及装置、推荐方法及装置 - Google Patents

模型生成方法及装置、推荐方法及装置 Download PDF

Info

Publication number
CN105335519B
CN105335519B CN201510794561.8A CN201510794561A CN105335519B CN 105335519 B CN105335519 B CN 105335519B CN 201510794561 A CN201510794561 A CN 201510794561A CN 105335519 B CN105335519 B CN 105335519B
Authority
CN
China
Prior art keywords
entity
user
feature vector
obtaining
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510794561.8A
Other languages
English (en)
Other versions
CN105335519A (zh
Inventor
黄际洲
孙明明
丁世强
王海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510794561.8A priority Critical patent/CN105335519B/zh
Publication of CN105335519A publication Critical patent/CN105335519A/zh
Priority to PCT/CN2016/089648 priority patent/WO2017084362A1/zh
Application granted granted Critical
Publication of CN105335519B publication Critical patent/CN105335519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种模型生成方法及装置、推荐方法及装置。一方面,本发明实施例的模型生成方法中,通过获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;从而,根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。因此,本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体,满足了用户的搜索推荐需求,提高了推荐实体的点击率。

Description

模型生成方法及装置、推荐方法及装置
【技术领域】
本发明涉及搜索技术领域,尤其涉及一种模型生成方法及装置、推荐方法及装置。
【背景技术】
目前,在进行搜索推荐时,是基于在用户的主搜索需求得到满足的情况下,通过向用户提供与查询词相关的其他可能有兴趣的内容,来激发用户的潜在需求。例如,请参考图1,其为现有技术中基于知识图谱进行搜索推荐的第一示例图,如图所示,在用户查询“普林斯顿大学”时,在搜索结果页的非搜索结果区域可以推荐图1所示的普林斯顿大学的著名校友,这是与查询词“普林斯顿大学”非常相关的推荐实体。
然而,现有技术中,基于知识图谱进行搜索推荐时,推荐的实体往往是众所周知,不能引起的用户兴趣。因此,这种搜索推荐方式不能满足用户搜索推荐需求,导致推荐实体的点击率比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种模型生成方法及装置、推荐方法及装置,通过整合实体之间的各种关系生成深度融合模型,深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体,满足了用户的搜索推荐需求,提高了推荐实体的点击率。
本发明实施例的一方面,提供一种模型生成方法,包括:
获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获得各实体的用户行为关系特征向量,包括:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获得各实体的特征向量,包括:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
本发明实施例的一方面,提供一种推荐方法,包括:
获得指定实体对应的候选实体;
将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得指定实体对应的候选实体,包括:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体,包括:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
本发明实施例的一方面,提供一种模型生成装置,包括:
向量获取单元,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
模型生成单元,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述向量获取单元,具体用于:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述向量获取单元,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
本发明实施例的一方面,提供一种推荐装置,包括:
实体获取单元,用于获得指定实体对应的候选实体;
惊喜度获取单元,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求8至10中一项所述装置生成的;
实体处理单元,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述实体获取单元,具体用于:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述实体处理单元,具体用于:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:
向量调整单元,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
由以上技术方案可以看出,本发明实施例具有以下有益效果:
本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,该深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体。与现有技术中,仅基于知识图谱进行搜索推荐的方式相比,本发明实施例所提供的推荐实体能够更加引起用户的兴趣,所以能够满足用户的搜索推荐需求,提高了推荐实体的点击率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是现有技术中基于知识图谱进行搜索推荐的第一示例图;
图2是本发明实施例所提供的模型生成方法的流程示意图;
图3是本发明实施例所提供的深度融合模型的生成示例图;
图4是本发明实施例所提供的推荐方法的流程示意图;
图5是本发明实施例所提供的基于深度融合模型进行搜索推荐的第一示例图;
图6是现有技术中基于知识图谱进行搜索推荐的第二示例图;
图7是本发明实施例所提供的基于深度融合模型进行搜索推荐的第二示例图;
图8是本发明实施例所提供的模型生成装置的功能方块图;
图9是本发明实施例所提供的推荐装置的功能方块图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例一
本发明实施例给出一种模型生成方法,请参考图2,其为本发明实施例所提供的模型生成方法的流程示意图,如图所示,该方法包括以下步骤:
S201,获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个。
S202,根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
需要说明的是,知识图谱中定义了各实体以及各实体的相关信息;所述实体指的是现实生活中的事物,如人物、物品、虚拟人物或者地点等。
请参考图3,其为本发明实施例所提供的深度融合模型的生成示例图,如图所示,本发明实施例中,在生成深度融合模型之前,对于知识图谱中任意两个实体e1和e2,需要获得实体e1的文档内容特征向量s1、实体e2的文档内容特征向量s2、实体e1与实体e2之间的逻辑关联关系特征向量k、实体e1与实体e2的用户行为关系特征向量c、实体e1的特征向量p1以及实体e2的特征向量p2。
举例说明,本发明实施例中,获得各实体的文档内容特征向量的方法可以包括但不限于:可以利用卷积神经网络,对实体e1的文档d1进行建模,以及对实体e2的文档d2进行建模,以获得实体e1的文档内容特征向量s1,以及实体e2的文档内容特征向量s2。
例如,以实体e1为例进行说明:可以先从知识图谱中获得实体e1的文档d1,例如,实体e1的百科页中的文本可以作为实体e1的文档d1。然后,从文档d1中提取词特征向量w1~wn。接着,词特征向量w1~wn在卷积层中进行卷积运算,以获得向量特征。最后,在最大池化层对卷积层输出的向量特征进行最大值池化处理,以获得实体e1的文档内容特征向量s1。其中,实体的文档内容特征向量以和卷积运算时所使用的卷积模型,可以生成深度融合模型时,基于深度神经网络进行深度机器训练的过程中进行自动优化。
举例说明,本发明实施例中,获得各实体之间的逻辑关联关系特征向量的方法可以包括但不限于:可以从知识图谱中获得实体e1与实体e2的之间的逻辑关联关系特征向量k。可以理解的是,逻辑关联关系特征向量k可以表示在知识图谱中实体e1与实体e2之间的逻辑关联关系。
举例说明,本发明实施例中,获得用户行为关系向量的方法可以包括但不限于:
首先,获取用户的历史搜索行为记录。然后,根据所述用户的历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为。最后,根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
可以理解的是,本发明实施例中,各实体的用户行为关系特征向量中包含若干数值,每个数值可以表示该实体与另一实体之间的一种用户行为关系,所以用户行为关系特征向量也可以理解成一个实体与另一个实体之间的用户行为关系特征向量。
例如,用户在搜索引擎中搜索完实体e1之后,点击了搜索结果页面右侧的推荐实体中的实体e2,则实体e1与实体e2的用户行为关系特征向量的中点击次数加1。以及,用户在搜索引擎中搜索完实体e1之后,又在搜索引擎中搜索实体e2,则实体e1与实体e2的用户行为关系特征向量中的搜索次数加1;以及,用户在搜索引擎中搜索完实体e1之后,所点击的一个搜索结果中包含另一个实体e2的信息,则实体e1与实体e2的用户行为关系特征向量中的跳转次数加1。可以理解的是,上述获得用户行为关系特征向量中数值的统计方式仅为举例说明,本发明实施例中,对于根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量的方式不进行特别限定。
本发明实施例中,实体的特征向量中包含的是与该实体的相关性比较低但更能引起用户惊喜的其他实体,与该实体没有特别明显的关联关系。
举例说明,本发明实施例中,获得各实体的特征向量的方法可以包括但不限于:
可以根据知识图谱中定义的实体,为各实体随机生成所述特征向量。或者,还可以在根据随机生成的特征向量,生成深度融合模型之后,利用深度融合模型为指定实体获得对应的推荐实体,然后根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,然后,再利用调整后获得的特征向量,重新进行机器学习,以生成新的深度融合模型,从而实现了特征向量和深度融合模型的不断优化。或者,还可以在利用深度神经网络进行深度机器学习的过程中,通过训练误差的反向传播优化机制,调整所述指定实体的特征向量。
在一个具体的实现过程中,如图3所示,可以将获得的所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个输入深度神经网络,深度神经网络根据输入的向量对用户偏好进行深度机器学习,以生成深度融合模型。
实施例二
本发明实施例给出一种推荐方法,本实施例所提供的推荐方法中所使用的深度融合模型是利用上述实施例一所提供的模型生成方法中生成的深度融合模型。请参考图4,其为本发明实施例所提供的推荐方法的流程示意图,如图所示,该方法包括以下步骤:
S401,获得指定实体对应的候选实体。
S402,将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用上述模型生成方法获得的。
S403,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
举例说明,本发明实施例中,获得指定实体对应的候选实体的方法可以包括但不限于以下两种:
第一种:根据知识图谱中定义的实体,获得所述候选实体。例如,可以将知识图谱中定义的所有实体都作为所述候选实体。
第二种:根据用户输入的指定实体的名称,获得指定实体的若干用户行为关系特征向量;然后,根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体。
可以理解的是,在上述实施例一中可以在获得各实体的用户行为关系特征向量之后对其进行存储,这样,当需要利用深度融合模型获得推荐实体时,可以根据指定实体的名称,找到指定实体对应的若干用户行为关系特征向量,这些用户行为关系特征向量表示了指定实体与多个实体中每个实体之间的用户行为关系。本方法中,可以将与指定实体之间存在用户行为关系特征向量的多个实体作为指定实体对应的候选实体。
与第一种方法相比,第二种方法中利用了用户行为关系特征向量对知识图谱中定义的实体进行筛选,以缩小候选实体的范围,减少了利用深度融合模型获得推荐实体时的计算量,从而提高了深度融合模型获得推荐实体的效率。
本发明实施例中,在获得每个候选实体的惊喜度时,可以将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征向量中至少一个,以及,所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,深度融合模型可以计算并输出每个候选实体的惊喜度,从而获得了所述候选实体的惊喜度。
需要说明的是,这里输入深度融合模型的向量需要与生成深度融合模型时,在进行深度机器学习时所使用的向量一致,例如,在生成深度融合模型时,若使用指定实体与候选实体之间的逻辑关联关系特征向量进行深度机器学习,则这里需要将指定实体与候选实体之间的逻辑关联关系特征向量输入深度融合模型。或者,又例如,在生成深度融合模型时,若使用实体的特征向量进行深度机器学习,则这里需要将指定实体的特征向量与候选实体的特征向量输入深度融合模型。
可以理解的是,预期度指的是推荐结果中,来源于知识图谱以及规则产生的推荐实体占所有推荐实体的比例。惊喜度等于1减去预期度,惊喜度指的是推荐结果中,来源于知识图谱与规则生成的推荐实体之外的其他实体占所有推荐实体的比例,为预测的在用户输入指定实体的名称后,向用户提供推荐实体时用户对于推荐实体的惊喜程度。
举例说明,根据所述惊喜度和所述候选实体,获得所述第一实体对应的推荐实体的方法可以包括但不限于:
首先,根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果。然后,根据预设的推荐数目,提取排序结果中排序靠前的相应数目的至少一个候选实体,将提取出的至少一个候选实体作为所述指定实体对应的推荐实体。
可以理解的是,可以在向用户输出与指定实体相匹配的搜索结果时,将获得的推荐实体推荐给用户,例如,推荐实体可以展现在搜索结果页的右侧。
可选的,在本实施例的一个可能的实现方式中,还可以根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,指定实体的特征向量中包含的实体可以为所述推荐实体中的一个或者多个。进一步的,调整后获得的特征向量可以用于进行深度机器学习,以生成新的深度融合模型,新的深度融合模型进一步还可以用于获得推荐实体,以此类推,如此反复将可以不断对实体的特征向量进行优化调整,以及对深度融合模型进行优化调整,从而不断提高推荐实体的获取准确性,不断提高用户对推荐实体的满意度,提高推荐实体的点击率。
例如,请参考图5,其为本发明实施例所提供的基于深度融合模型进行搜索推荐的第一示例图,如图5所示,如果用户输入的指定实体的名称为“普林斯顿大学”,如果利用现有技术中基于知识图谱进行搜索推荐,将获得图1所示的推荐实体,这些推荐实体对于用户而言是众所周知的,无法引起用户的兴趣。然而,利用本发明实施例所提供的深度融合模型,可以获得图5所示的推荐实体,这些推荐实体是与指定实体没有明显相关的实体,而是一些学霸,显然这些学霸更能引起用户兴趣,进而触发用户的点击,激发用户潜在搜索需求,因此这些推荐实体更能满足用户需求,提高了推荐准确率和推荐实体的点击率。
或者,又例如,请参考图6和图7,分别为现有技术中基于知识图谱进行搜索推荐的第二示例图,以及,本发明实施例所提供的基于深度融合模型进行搜索推荐的第二示例图。
当用户搜索“万圣节”时,用户的潜在需求可以包括:惊悚恐怖的电影、万圣节相关的电影、准备万圣节所需的道具、万圣节聚会的游戏/主题、其他可怕的鬼/怪物/生物。如图6所示,基于知识图谱将向用户显示的推荐实体为万圣节相关的中西方节日,给用户带来的惊喜程度比较低。然而,如图7所示,如果利用深度融合模型生成的推荐实体包含了7个恐怖的电影(图7中虚线框标识出的实体)以及包含了全部5个其他的推荐实体(图7中实现框标识出的实体),这些推荐实体的覆盖面更广,图7中所示的推荐实体给用户带来的惊喜程度更大。图7中实线框和虚线框标示出的推荐实体表示实验中用户点击率高的实体。可以看出,深度融合模型挖掘出的实体的惊喜度的确获得了用户的更多的关注和兴趣。
本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图8,其为本发明实施例所提供的模型生成装置的功能方块图。如图所示,该装置包括:
向量获取单元81,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
模型生成单元82,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
在一个具体的实现过程中,所述向量获取单元81,具体用于:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
在一个具体的实现过程中,所述向量获取单元81,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
由于本实施例中的各单元能够执行图2所示的方法,本实施例未详细描述的部分,可参考对图2的相关说明。
请参考图9,其为本发明实施例所提供的推荐装置的功能方块图。如图所示,该装置包括:
实体获取单元91,用于获得指定实体对应的候选实体;
惊喜度获取单元92,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用模型生成装置生成的;
实体处理单元93,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
在一个具体的实现过程中,所述实体获取单元91,具体用于:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
在一个具体的实现过程中,所述实体处理单元93,具体用于:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
可选的,在本实施例的一个可能的实现方式中,所述装置还包括:
向量调整单元94,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
由于本实施例中的各单元能够执行图4所示的方法,本实施例未详细描述的部分,可参考对图4的相关说明。
本发明实施例的技术方案具有以下有益效果:
本发明实施例中,通过获得知识图谱中各实体的文档内容向量、各实体之间的逻辑关联关系向量、各实体的用户行为关系向量和各实体的特征向量;从而,根据所述文档内容向量、所述逻辑关联关系向量、所述用户行为关系向量和所述特征向量进行机器学习,生成深度融合模型。
本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,该深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体。与现有技术中,仅基于知识图谱进行搜索推荐的方式相比,本发明实施例所提供的推荐实体能够更加引起用户的兴趣,所以能够满足用户的搜索推荐需求,提高了推荐实体的点击率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种模型生成方法,其特征在于,所述方法包括:
获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;其中,所述各实体的用户行为关系特征向量是根据用户的历史搜索行为记录中用户针对所述各实体的搜索行为和点击行为获得的;
根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型;所述深度融合模型用于进行搜索推荐时针对用户输入的指定实体确定推荐实体。
2.根据权利要求1所述的方法,其特征在于,获得各实体的用户行为关系特征向量,包括:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
3.根据权利要求1所述的方法,其特征在于,获得各实体的特征向量,包括:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
4.一种推荐方法,其特征在于,所述方法包括:
获得用户在搜索时输入的指定实体对应的候选实体;
将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
5.根据权利要求4所述的方法,其特征在于,所述获得用户在搜索时输入的指定实体对应的候选实体,包括:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
6.根据权利要求4所述的方法,其特征在于,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体,包括:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
7.根据权利要求4至6中任一项所述的方法,其特征在于,所述方法还包括:
根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
8.一种模型生成装置,其特征在于,所述装置包括:
向量获取单元,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;其中,所述各实体的用户行为关系特征向量是根据用户的历史搜索行为记录中用户针对所述各实体的搜索行为和点击行为获得的;
模型生成单元,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型;所述深度融合模型用于进行搜索推荐时针对用户输入的指定实体确定推荐实体。
9.根据权利要求8所述的装置,其特征在于,所述向量获取单元,具体用于:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
10.根据权利要求8所述的装置,其特征在于,所述向量获取单元,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
11.一种推荐装置,其特征在于,所述装置包括:
实体获取单元,用于获得用户在搜索时输入的指定实体对应的候选实体;
惊喜度获取单元,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求8至10中一项所述装置生成的;
实体处理单元,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
12.根据权利要求11所述的装置,其特征在于,所述实体获取单元,具体用于:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
13.根据权利要求11所述的装置,其特征在于,所述实体处理单元,具体用于:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
14.根据权利要求11至13中任一项所述的装置,其特征在于,所述装置还包括:
向量调整单元,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
CN201510794561.8A 2015-11-18 2015-11-18 模型生成方法及装置、推荐方法及装置 Active CN105335519B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510794561.8A CN105335519B (zh) 2015-11-18 2015-11-18 模型生成方法及装置、推荐方法及装置
PCT/CN2016/089648 WO2017084362A1 (zh) 2015-11-18 2016-07-11 模型生成方法、推荐方法及对应装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510794561.8A CN105335519B (zh) 2015-11-18 2015-11-18 模型生成方法及装置、推荐方法及装置

Publications (2)

Publication Number Publication Date
CN105335519A CN105335519A (zh) 2016-02-17
CN105335519B true CN105335519B (zh) 2021-08-17

Family

ID=55286046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510794561.8A Active CN105335519B (zh) 2015-11-18 2015-11-18 模型生成方法及装置、推荐方法及装置

Country Status (2)

Country Link
CN (1) CN105335519B (zh)
WO (1) WO2017084362A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335519B (zh) * 2015-11-18 2021-08-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN105808931B (zh) * 2016-03-03 2019-05-07 北京大学深圳研究生院 一种基于知识图谱的针灸决策支持方法及装置
CN105912500B (zh) * 2016-03-30 2017-11-14 百度在线网络技术(北京)有限公司 机器学习模型生成方法和装置
CN106022877A (zh) * 2016-05-19 2016-10-12 华南理工大学 一种基于用户手游行为图谱的游戏推荐方法
CN106649774A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于人工智能的对象推送方法及装置
CN108804387B (zh) * 2017-04-27 2021-07-23 腾讯科技(深圳)有限公司 目标用户确定方法及装置
CN107330050A (zh) * 2017-06-28 2017-11-07 达而观信息科技(上海)有限公司 一种个性化推荐方法及***
CN109388793B (zh) * 2017-08-03 2023-04-07 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN107463701B (zh) * 2017-08-15 2020-09-08 北京百度网讯科技有限公司 基于人工智能推送信息流的方法和装置
CN107506486A (zh) * 2017-09-21 2017-12-22 北京航空航天大学 一种基于实体链接的关系扩充方法
TWI651664B (zh) * 2017-11-15 2019-02-21 財團法人資訊工業策進會 模型生成伺服器及其模型生成方法
CN108509479B (zh) * 2017-12-13 2022-02-11 深圳市腾讯计算机***有限公司 实体推荐方法及装置、终端及可读存储介质
CN108334588B (zh) * 2018-01-29 2021-03-23 北京搜狐新媒体信息技术有限公司 一种用户标签构建方法及装置
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
CN108665394B (zh) * 2018-05-07 2021-11-30 北京文华在线教育科技股份有限公司 自适应学习方法及***
CN108829854B (zh) * 2018-06-21 2021-08-31 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN109657069B (zh) * 2018-12-11 2021-03-23 北京百度网讯科技有限公司 知识图谱的生成方法及其装置
CN109697050B (zh) * 2019-01-07 2021-04-27 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN109828965B (zh) * 2019-01-09 2021-06-15 千城数智(北京)网络科技有限公司 一种数据处理的方法及电子设备
CN109829116B (zh) * 2019-02-14 2021-07-30 北京达佳互联信息技术有限公司 一种内容推荐方法、装置、服务器及计算机可读存储介质
CN111782774B (zh) * 2019-04-03 2024-04-19 北京嘀嘀无限科技发展有限公司 一种问题推荐的方法及装置
CN110555753A (zh) * 2019-08-14 2019-12-10 中国平安人寿保险股份有限公司 基于推荐的排序控制方法、装置、计算机设备及存储介质
CN110674394B (zh) * 2019-08-20 2024-03-15 腾讯科技(深圳)有限公司 一种基于知识图谱的信息推荐方法、装置及存储介质
CN110728783A (zh) * 2019-08-31 2020-01-24 苏州浪潮智能科技有限公司 一种人脸识别***的自我纠正方法、***及设备
CN110717099B (zh) * 2019-09-25 2022-04-22 优地网络有限公司 一种推荐影片的方法及终端
CN110888990B (zh) * 2019-11-22 2024-04-12 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN111428053B (zh) * 2020-03-30 2023-10-20 西安交通大学 一种面向税务领域知识图谱的构建方法
CN111949803B (zh) * 2020-08-21 2024-05-28 深圳供电局有限公司 一种基于知识图谱的网络异常用户检测方法、装置和设备
CN112182115A (zh) * 2020-09-10 2021-01-05 珠海格力电器股份有限公司 关系的展示方法和装置、存储介质、电子装置
CN112291272B (zh) * 2020-12-24 2021-05-11 鹏城实验室 网络威胁检测方法、装置、设备及计算机可读存储介质
CN112950321A (zh) * 2021-03-10 2021-06-11 北京汇钧科技有限公司 一种物品推荐方法和装置
CN113536137A (zh) * 2021-08-13 2021-10-22 北京字节跳动网络技术有限公司 一种信息展示方法、装置以及计算机存储介质
CN117787392A (zh) * 2024-02-23 2024-03-29 支付宝(杭州)信息技术有限公司 一种知识图谱的融合方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593792A (zh) * 2013-11-13 2014-02-19 复旦大学 一种基于中文知识图谱的个性化推荐方法与***
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
CN104346446A (zh) * 2014-10-27 2015-02-11 百度在线网络技术(北京)有限公司 一种基于知识图谱的论文关联信息推荐方法及装置
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114294A (zh) * 2007-08-22 2008-01-30 杭州经合易智控股有限公司 自助式智能垂直搜索方法
CN101436191A (zh) * 2007-11-13 2009-05-20 日电(中国)有限公司 用于计算对象之间竞争性度量的方法与***
CN104035917B (zh) * 2014-06-10 2017-07-07 复旦大学 一种基于语义空间映射的知识图谱管理方法和***
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置
CN105335519B (zh) * 2015-11-18 2021-08-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593792A (zh) * 2013-11-13 2014-02-19 复旦大学 一种基于中文知识图谱的个性化推荐方法与***
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
CN104346446A (zh) * 2014-10-27 2015-02-11 百度在线网络技术(北京)有限公司 一种基于知识图谱的论文关联信息推荐方法及装置
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置

Also Published As

Publication number Publication date
CN105335519A (zh) 2016-02-17
WO2017084362A1 (zh) 2017-05-26

Similar Documents

Publication Publication Date Title
CN105335519B (zh) 模型生成方法及装置、推荐方法及装置
CN109190043B (zh) 推荐方法及装置,存储介质,电子设备及推荐***
CN109166017B (zh) 基于重聚类的推送方法、装置、计算机设备及存储介质
US10180967B2 (en) Performing application searches
KR20190038751A (ko) 사용자 키워드 추출장치, 방법 및 컴퓨터 판독 가능한 저장매체
US11487946B2 (en) Content editing using content modeling and semantic relevancy scoring
CN108108821A (zh) 模型训练方法及装置
EP2778960A1 (en) Generating insightfull connections between graph entities
CN103258025B (zh) 生成共现关键词的方法、提供关联搜索词的方法以及***
CN109325182B (zh) 基于会话的信息推送方法、装置、计算机设备及存储介质
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
CN109948036B (zh) 一种分词词项权重的计算方法和装置
CN105809473B (zh) 匹配模型参数的训练方法、服务推荐方法及对应装置
US20150248721A1 (en) Recommendation engine with profile analysis
US20160125028A1 (en) Systems and methods for query rewriting
CN104933100A (zh) 关键词推荐方法和装置
CN109241243B (zh) 候选文档排序方法及装置
US10467307B1 (en) Grouping of item data using seed expansion
EP4064071A1 (en) Text search method, device, server, and storage medium
CN104536979B (zh) 主题模型的生成方法及装置、主题分布的获取方法及装置
CN105512156B (zh) 点击模型生成方法和装置
CN112446727B (zh) 广告触发的方法、装置、设备及计算机可读存储介质
EP2766826B1 (en) Searching information
CN111639255B (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备
WO2018058118A1 (en) Method, apparatus and client of processing information recommendation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant