CN111353106B - 推荐方法和装置、电子设备和存储介质 - Google Patents

推荐方法和装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111353106B
CN111353106B CN202010121352.8A CN202010121352A CN111353106B CN 111353106 B CN111353106 B CN 111353106B CN 202010121352 A CN202010121352 A CN 202010121352A CN 111353106 B CN111353106 B CN 111353106B
Authority
CN
China
Prior art keywords
related information
target area
node
knowledge
position related
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010121352.8A
Other languages
English (en)
Other versions
CN111353106A (zh
Inventor
邢可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seashell Housing Beijing Technology Co Ltd
Original Assignee
Seashell Housing Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seashell Housing Beijing Technology Co Ltd filed Critical Seashell Housing Beijing Technology Co Ltd
Priority to CN202010121352.8A priority Critical patent/CN111353106B/zh
Publication of CN111353106A publication Critical patent/CN111353106A/zh
Application granted granted Critical
Publication of CN111353106B publication Critical patent/CN111353106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种推荐方法和装置、电子设备和存储介质,其中,推荐方法包括:接收推荐请求,其中包括参考位置相关信息;获取第一知识图谱中与参考位置相关信息匹配的起始位置相关信息;通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及所述神经网络生成所述第一知识图谱中各目标区域的特征向量;分别获取所述匹配的起始位置相关信息的特征向量和各目标区域的特征向量之间的相关性;基于所述匹配的起始位置相关信息的特征向量和各目标区域的特征向量之间的相关性,确定至少一个目标区域作为推荐对象。本公开实施例可以针对起始位置相关信息推荐相应的目标区域,可以提高推荐准确率,并且提高寻找目标区域的效率。

Description

推荐方法和装置、电子设备和存储介质
技术领域
本公开涉及互联网技术,尤其是一种推荐方法和装置、电子设备和存储介质。
背景技术
在实际生活中,用户由于生活需要、工作变动、买卖房屋等各种因素影响,经常需要租房。经调研发现,北京市每年由于工作变动(例如换工作、应届生入职等)因素影响,有租房需求人次在百万量级。用户租房时需要考察诸多因素,例如租金、通勤、社区环境、周边公共设施等。
目前的租房方式是,用户通过向房屋中介说明租房需求,由房屋中介帮忙推荐多套房源,然后由用户根据每套房源的情况(租金、通勤、社区环境、周边公共设施等)选择是否有适合的房源;或者,在租房软件或者租房网站上逐一浏览房源信息,寻找合适的房源。现有的租房方式需要耗费大量的精力、通过较长时间去寻找满足的房源,租房效率低。
发明内容
本公开实施例提供一种推荐方法和装置、电子设备和存储介质,可用于租房推荐来提高租房效率。
本公开实施例的一个方面,提供一种推荐方法,包括:
接收推荐请求,所述推荐请求中包括参考位置相关信息;
获取第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息;其中,所述第一知识图谱基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到;
通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量;其中,所述神经网络预先基于对第一知识图谱进行特征学习得到;
分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性;
基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象。
可选地,在基于本公开上述任一实施例的方法中,所述起始位置相关信息包括以下任意一项或多项:公司标识ID,办公楼ID,办公园区ID,位置信息,区域信息;所述目标区域包括:居住区域ID;
所述目标区域的属性包括以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性。
可选地,在基于本公开上述任一实施例的方法中,所述起始位置相关信息包括以下任意一项或多项:居住区域ID,位置信息,区域信息;所述目标区域包括:办公楼ID,办公园区ID,区域信息;所述目标区域的属性包括以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性。
可选地,在基于本公开上述任一实施例的方法中,所述确定至少一个所述目标区域作为推荐对象之后,还包括:
从数据库中或者所述第一知识图谱中获取所述推荐对象的属性及属性值;
生成并输出推荐对象列表;其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息包括:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
可选地,在基于本公开上述任一实施例的方法中,基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到所述第一知识图谱的操作,包括:
从数据库中采集指定范围内的元数据,所述元数据包括:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值;
确定所述元数据中各起始位置相关信息和各目标区域之间的关系;
基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源;
基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建所述第一知识图谱。
可选地,在基于本公开上述任一实施例的方法中,所述确定所述元数据中各起始位置相关信息和各目标区域之间的关系,包括:
若同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中起始位置相关信息和目标区域之间的关系为喜爱。
可选地,在基于本公开上述任一实施例的方法中,所述从数据库中采集指定范围内的元数据之后,还包括:
对所述元数据进行预处理,所述预处理包括以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对所述元数据中的节点进行实体对齐,所述节点包括:起始位置相关信息节点、目标区域节点和属性值节点。
可选地,在基于本公开上述任一实施例的方法中,所述通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量,包括:
将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;其中,所述第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值;
通过带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;其中,每个所述节点序列包括对应的所述第二知识图谱或者所述第三知识图谱中的多个具有一定的顺序的节点,所述第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,所述第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点;
将所述第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量,其中,所述第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各所述第三知识图谱中各目标区域的特征向量;
分别针对各目标区域,基于多个所述第三知识图谱中目标区域的特征向量,得到所述目标区域融合各属性的融合特征向量。
可选地,在基于本公开上述任一实施例的方法中,所述分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,包括:
分别获取所述匹配的起始位置相关信息的特征向量与各所述目标区域的融合特征向量之间的相关性。
可选地,在基于本公开上述任一实施例的方法中,基于对第一知识图谱进行特征学习得到所述神经网络的操作,包括:
将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;
通过所述带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;
将所述第二知识图谱的节点序列输入初始神经网络,经所述初始神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各所述第三知识图谱中各目标区域的特征向量;
获取各所述节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值;
调整所述初始神经网络的参数,以使所有所述节点序列中,每一个节点与所述每一个节点的所述上下文节点之间的对数似然函数值之和最大化。
本公开实施例的另一个方面,提供一种推荐装置,包括:
接收模块,用于接收推荐请求,所述推荐请求中包括参考位置相关信息;
第一获取模块,用于获取第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息;其中,所述第一知识图谱基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到;
第一生成模块,用于通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量;其中,所述神经网络预先基于对第一知识图谱进行特征学习得到;
第二获取模块,用于分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性;
确定模块,用于基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象。
可选地,在基于本公开上述任一实施例的装置中,所述起始位置相关信息包括以下任意一项或多项:公司标识ID,办公楼ID,办公园区ID,位置信息,区域信息;所述目标区域包括:居住区域ID;
所述目标区域的属性包括以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性。
可选地,在基于本公开上述任一实施例的装置中,所述起始位置相关信息包括以下任意一项或多项:居住区域ID,位置信息,区域信息;所述目标区域包括:办公楼ID,办公园区ID,区域信息;所述目标区域的属性包括以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性。
可选地,在基于本公开上述任一实施例的装置中,还包括:
第三获取模块,用于从数据库中或者所述第一知识图谱中获取所述推荐对象的属性及属性值;
第二生成模块,用于生成并输出推荐对象列表;其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息包括:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
可选地,在基于本公开上述任一实施例的装置中,还包括:用于基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到所述第一知识图谱的构建模块;所述构建模块包括:
采集单元,用于从数据库中采集指定范围内的元数据,所述元数据包括:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值;
确定单元,用于确定所述元数据中各起始位置相关信息和各目标区域之间的关系;
第一获取单元,用于基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源;
构建单元,用于基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建所述第一知识图谱。
可选地,在基于本公开上述任一实施例的装置中,所述确定单元,具体用于:
若同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中起始位置相关信息和目标区域之间的关系为喜爱。
可选地,在基于本公开上述任一实施例的装置中,所述构建模块还包括:
预处理单元,用于对所述元数据进行预处理,所述预处理包括以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对所述元数据中的节点进行实体对齐,所述节点包括:起始位置相关信息节点、目标区域节点和属性值节点。
可选地,在基于本公开上述任一实施例的装置中,所述第一获取模块包括:
分割单元,用于将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;其中,所述第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值;
生成单元,用于通过带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;其中,每个所述节点序列包括对应的所述第二知识图谱或者所述第三知识图谱中的多个具有一定的顺序的节点,所述第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,所述第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点;
第二获取单元,用于将所述第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量,其中,所述第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各所述第三知识图谱中各目标区域的特征向量;
融合单元,用于分别针对各目标区域,基于多个所述第三知识图谱中目标区域的特征向量,得到所述目标区域融合各属性的融合特征向量。
可选地,在基于本公开上述任一实施例的装置中,所述第二获取模块,具体用于:
分别获取所述匹配的起始位置相关信息的特征向量与各所述目标区域的融合特征向量之间的相关性。
可选地,在基于本公开上述任一实施例的装置中,所述第二获取单元,还用于将所述第二知识图谱的节点序列输入初始神经网络,经所述初始神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各所述第三知识图谱中各目标区域的特征向量;
所述装置还包括:
训练模块,用于获取各所述节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值;调整所述初始神经网络的参数,以使所有所述节点序列中,每一个节点与所述每一个节点的所述上下文节点之间的对数似然函数值之和最大化,从而得到所述神经网络。
本公开实施例的又一个方面,提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的方法。
本公开实施例的再一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本公开上述任一实施例所述的方法。
基于本公开上述实施例提供的推荐方法和装置、电子设备和存储介质,可以预先基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建第一知识图谱,基于对第一知识图谱进行特征学习得到神经网络,接收到推荐请求后,首先获取第一知识图谱中、与推荐请求中的参考位置相关信息匹配的起始位置相关信息,然后,通过神经网络生成所述匹配的起始位置相关信息的特征向量和所述第一知识图谱中各目标区域的特征向量,之后,分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,进而,基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象以反馈给用户,从而可针对起始位置相关信息推荐相应的目标区域,可以提高推荐准确率,并且提高寻找目标区域的效率。
在本公开实施例的一种应用中,可用于针对用户的工作区域相关信息(即起始位置相关信息,如公司ID、办公楼ID、办公园区ID、位置信息、区域信息等),综合各居住区域(即目标区域,如居住区域ID等)的各种条件(即各种属性的属性值,如租金、社区环境、社区年代、物业管理、房源品质、周边设施、通勤便利性、购物便利性等)为用户推荐合适的居住区域,提高了推荐准确率,并且可以提高用户租房或者买房的效率。
在本公开实施例的另一种应用中,可用于针对用户的居住区域相关信息(即起始位置相关信息,如居住区域ID、位置信息、区域信息等),综合各工作区域(即目标区域,如办公楼ID、办公园区ID、区域信息等)的各种条件(即各种属性的属性值,如区域环境、物业管理、停车便利性、停车费、就餐便利性、通勤便利性、购物便利性等)为用户推荐合适的工作区域,提高了推荐准确率,并且可以提高用户工作、通行等方面的便利性。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开推荐方法一个实施例的流程图。
图2为本公开推荐方法另一个实施例的流程图。
图3为本公开实施例中构建第一知识图谱的一个实施例的流程图。
图4为本公开实施例中第一知识图谱的模式图的一个示意图。
图5为本公开实施例中生成匹配的起始位置相关信息的特征向量和各目标区域的特征向量的一个实施例的流程图。
图6a为本公开实施例中第二知识图谱和第三知识图谱的模式图的一个示意图。
图6b为本公开实施例中第二知识图谱和第三知识图谱的模式图的一个示意图。
图7为本公开实施例中偏执的随机游走策略的一个游走示例图。
图8为本公开实施例中对第一知识图谱进行特征学习得到神经网络一个实施例的流程图。
图9为本公开实施例中神经网络处理节点序列的一个示意图。
图10为本公开推荐装置一个实施例的结构示意图。
图11为本公开推荐装置另一个实施例的结构示意图。
图12为本公开电子设备一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机***、服务器等电子设备,其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于:个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***﹑大型计算机***和包括上述任何***的分布式云计算技术环境,等等。
终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算***存储介质上。
图1为本公开推荐方法一个实施例的流程图。如图1所示,该实施例的推荐方法包括:
102,接收推荐请求,所述推荐请求中包括参考位置相关信息。
104,获取第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息。
其中,所述第一知识图谱基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到。
106,通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过神经网络生成第一知识图谱中各目标区域的特征向量。
其中,所述神经网络预先基于对第一知识图谱进行特征学习得到。
108,分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性。
110,基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个目标区域作为推荐对象。
知识图谱是近年来新兴的一种辅助信息,其基本结构是一种有向异构图。知识图谱是Google于2012年5月17日正式提出的,是一种揭示实体之间关系的异构语义网络,可以对现实世界的事物及其相互关系进行形式化的描述。知识图谱中,节点E={e1,e2,e3,...,e|E|}代表实体(也称为概念,对应于事物的语义),边R={r1,r2,r3,...,r|R|}代表实体/概念之间的各种语义关系(对应于事物之间的关系)。一个三元组(h,r,t)表示一条知识,两个实体间存在着某种关系,其中h表示知识的头节点,t表示尾节点。若干三元组的集合构成一个知识图谱。
知识图谱特征学习(knowledge graph embedding,KGE)是网络特征学习的一个子领域,它为知识图谱中的每个实体和关系学习得到一个低维特征向量,降低知识图谱的高维性和异构性,同时保持图中原有的结构或语义信息。
基于本公开上述实施例提供的推荐方法,预先基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建第一知识图谱,来表示数据源中各起始位置相关信息和目标区域之间的各种语义关系、以及各目标区域与各属性的属性值之间的语义关系,并基于对第一知识图谱进行特征学习得到神经网络,在针对推荐请求进行推荐时,可以首先获取第一知识图谱中、与推荐请求中的参考位置相关信息匹配的起始位置相关信息,然后,通过神经网络生成所述匹配的起始位置相关信息的特征向量、以及第一知识图谱中各目标区域的特征向量,之后,分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,进而,基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象以反馈给用户,从而可针对起始位置相关信息推荐相应的目标区域,可以提高推荐准确率,并且提高寻找目标区域的效率。
在本公开实施例的一些可能的实现方式中,起始位置相关信息例如可以包括但不限于以下任意一项或多项:公司标识(ID),办公楼ID,办公园区ID,位置信息,区域信息,等等办公区域相关信息,其中的ID例如可以是名称、编号等等,唯一标识一个对应的公司、办公楼、办公园区等。对应的,目标区域例如可以包括但不限于:居住区域ID等居住区域相关信息,该居住区域ID唯一标识一个居住区域,其中的居住区域例如可以是社区或者居住区域范围。
可选地,在上述实现方式中,目标区域的属性例如可以包括但不限于以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性等等任意可以表示居住区域品质和便利性的属性。
本实施例中,可用于针对用户的工作区域相关信息(即起始位置相关信息,如公司ID、办公楼ID、办公园区ID、位置信息、区域信息等),综合各居住区域(即目标区域,如居住区域ID等)的各种条件(即各种属性的属性值,如租金、社区环境、社区年代、物业管理、房源品质、周边设施、通勤便利性、购物便利性等)为用户推荐合适的居住区域,提高了推荐准确率,并且可以提高用户租房或者买房的效率。
或者,在本公开实施例的另一些可能的实现方式中,起始位置相关信息例如可以包括但不限于以下任意一项或多项:居住区域ID,位置信息,区域信息,等等居住区域相关信息。对应的,目标区域例如可以包括但不限于:办公楼ID,办公园区ID,区域信息,等等办公区域相关信息。
可选地,在该实现方式中,目标区域的属性例如可以包括但不限于以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性,购物便利性等等任意可以表示工作区域便利性的属性。
在本实施例中,可用于针对用户的居住区域相关信息(即起始位置相关信息,如居住区域ID、位置信息、区域信息等),综合各工作区域(即目标区域,如办公楼ID、办公园区ID、区域信息等)的各种条件(即各种属性的属性值,如区域环境、物业管理、停车便利性、停车费、就餐便利性、通勤便利性、购物便利性等)为用户推荐合适的工作区域,提高了推荐准确率,并且可以提高用户工作、通行等方面的便利性。
图2为本公开推荐方法另一个实施例的流程图。如图2所示,在图1所示实施例的基础上,操作110之后,还可以包括:
112,从数据库中或者第一知识图谱中获取推荐对象的属性及属性值。
114,生成并输出推荐对象列表。
其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息例如可以包括但不限于:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
例如,在一个可选例子中,推荐对象为3个居住区域ID,该居住区域ID为社区名称时,所述推荐对象列表包括这3个社区名称、以及每个社区名称对应的租金、社区环境、社区年代、物业管理、房源品质、周边设施、通勤便利性、购物便利性及其具体信息。如下表1所示,为该推荐对象列表的一个具体内容示例。
表1
Figure BDA0002393071550000091
Figure BDA0002393071550000101
可选地,在本公开实施例的推荐方法中,还包括基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到所述第一知识图谱的操作。如图3所示,为本公开实施例中构建第一知识图谱的一个实施例,其包括:
202,从数据库中采集指定范围内(例如北京市)的元数据,所述元数据例如可以包括但不限于:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值,其中的用户信息例如用户姓名、用户ID等用于唯一标识一个用户的信息。
上述该元数据,记录了各起始位置相关信息分别涉及哪些用户,每个用户对应的目标区域信息、以及各目标区域的属性及属性值。例如,在一个具体例子中,元数据记录了,XX园区中有120个用户提供了居住区域信息,这120个用户的用户信息,其中每个用户具体的居住区域,每个居住区域的租金、社区环境、社区年代、物业管理、房源品质、周边设施、通勤便利性、购物便利性的具体信息。
204,确定所述元数据中各起始位置相关信息和各目标区域之间的关系。
在本公开实施例的一些可能的实现方式中,起始位置相关信息和各目标区域之间的关系可以包括:喜爱,无关;或者,起始位置相关信息和各目标区域之间的关系也可以分为多个等级:喜爱,一般,不喜爱。或者,起始位置相关信息和各目标区域之间的关系也可以按照其他方式划分,本公开实施例不限制起始位置相关信息和各目标区域之间的关系的具体划分情况。
在一个可选例子中,起始位置相关信息和各目标区域之间的关系包括喜爱、无关时,可以在同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中该起始位置相关信息和目标区域之间的关系为喜爱。否则,若同一起始位置相关信息对应同一目标区域的用户数量不大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值不大于第二预设值,可以确定所述元数据中该起始位置相关信息和目标区域之间的关系为无关。
例如,在XX园区工作的用户在AA花园居住的用户数量大于20,或者在XX园区工作的用户在AA花园居住的用户数量、与在该XX园区工作的用户在所有居住区域居住的总用户数量之间的比例大于10%,可以确定该起始位置相关信息和目标区域之间的关系为喜爱;否则,可以确定该起始位置相关信息和目标区域之间的关系为无关。
基于本实施例,可以确定所述元数据中该起始位置相关信息和目标区域之间的关系,以便基于起始位置相关信息和目标区域之间的关系来进行后续的目标区域预测。
206,基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源。
208,基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建第一知识图谱。
基于本实施例,可以从数据库中采集指定范围内的元数据进行处理得到数据源,从而实现了对第一知识图谱的构建,以便后续基于该第一知识图谱进行目标区域的预测。
可选地,在图3所示实施例的基础上,操作302之后,还可以包括:
对所述元数据进行预处理,其中的预处理,例如可以包括但不限于以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对元数据中的节点进行实体对齐,其中的节点包括:起始位置相关信息节点(即起始位置相关信息在知识图谱中对应的节点)、目标区域节点(即目标区域在知识图谱中对应的节点)和属性值节点(即属性值在知识图谱中对应的节点)。
其中,对用户信息对应的目标区域信息进行去重,即对提供起始位置相关信息的同一用户信息对应的目标区域信息进行去重,例如,在租房场景中,对重复的租客信息进行去重;同一租客信息提供多个作为目标区域的居住区域信息时,针对同一租客仅保留其最近的居住区域信息作为该租客的居住区域信息。
其中,对元数据中的节点进行实体对齐,用于将不同指称对应的同一事物统一为同一指称,例如,将“北京市”和“北京”指代相同,统一为同一个名称。
基于本实施例,对元数据进行预处理,可以确保数据源中信息的精简性、准确性、唯一性,使得构建得到的第一知识图谱可以更准确的反应真实的语义结构关系,从而提高后续推荐目标区域的准确率。
图4为本公开实施例中第一知识图谱的模式图的一个示意图。如图4所示,在本公开实施例应用于租房场景的一个具体应用中,起始位置相关信息具体为一个公司名称,用于记录该公司的员工在哪个居住区域租房;租房热区即为居住区域(即目标区域)中被确认为喜爱关系的居住区域;居住区域的属性包括:租金、社区环境、周边设施、通勤便利性、购物便利性。
第一知识图谱按照图4所示模式架构后,可以通过该第一知识图谱表示出各节点及其之间的关系,即:各起始位置相关信息与各目标区域之间的关系,在应用于租房场景时,可以表示各公司的员工与各居住区域之间的关系。
在本公开实施例的一些可能的实现方式中,操作106中,可以通过神经网络,利用节点到向量(Node2Vec)可以把结构相似和属性值相同的节点聚集在一起的性质,通过带偏执的随机游走策略,对第一知识图谱进行节点序列生成,然后,将生成的各节点序列分别输入到一个词到向量(Word2Vec)的神经网络中,将各节点序列分别映射到低维空间,得到每个起始位置相关信息和每个目标区域节点的特征向量表示,具有相似结构和相同属性的节点的语义值更加相似。
图5为本公开实施例中生成匹配的起始位置相关信息的特征向量和各目标区域的特征向量的一个实施例的流程图。如图5所示,在上述实施例的基础上,操作106包括:
302,将第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱。
其中,第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值。
如图6a所示,分别为图4所示租房场景应用中的第一知识图谱分割得到的第二知识图谱;如图6b所示,为图4所示租房场景应用中的第一知识图谱分割得到的属性为社区环境的一个第三知识图谱的模式图的一个示意图,图4所示租房场景应用中的第一知识图谱分割得到的其他属性的第三知识图谱的模式图与此类似,不再特别说明。
304,通过带偏执的随机游走策略,分别生成第二知识图谱的节点序列和各第三知识图谱的节点序列(node sequence)。
其中,每个节点序列包括对应的第二知识图谱或者第三知识图谱中的多个具有一定的顺序的节点,第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点,即,本公开各实施例中的节点即为知识图谱中的概念/实体。
306,将第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到第二知识图谱中各起始位置相关信息的特征向量。以及,分别将各第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各第三知识图谱中各目标区域的特征向量,由此,可以得到每个目标区域在特定属性空间下的特征向量表示,具有相似结构和相同属性的目标区域节点在该属性空间的语义值更加相似。
其中,第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量。
308,分别针对各目标区域,基于多个第三知识图谱中目标区域的特征向量,得到目标区域融合各属性的融合特征向量。
与图5所示实施例相应地,操作108中,可以分别获取所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的相关性。
因为不同属性的知识图谱具有不同的语义值,例如,在租房场景中,不同的租房热区可能有相同的租金,但其购物便利性或通勤便利性可能不一样,如果处理整个知识图谱(即第一知识图谱),可能忽略了目标区域不同属性的语义。
本实施例中,针对目标区域具有的多个属性,将第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱,以便体现各属性的知识图谱的语义值;通过带偏执的随机游走策略对第二知识图谱和各属性的第三知识图谱分别进行节点序列生成,并通过神经网络模型得到各节点序列的特征向量,从而得到各起始位置相关信息的特征向量和各目标区域在特定属性空间下的特征向量表示,具有相似结构和相同属性的节点的语义值更加相似;基于多个第三知识图谱中目标区域的特征向量,得到各目标区域的融合特征向量,该融合特征向量所表示的语义信息更加准确、全面,基于所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的相关性来确定推荐对象,使得对推荐对象的预测更加全面、准确、合理,从而进一步提高推荐准确率。
在其中一种可能的实现方式中,继续图4和图6a、图6b的租房场景应用实例,例如通过数据库查询语言和数据获取协议(SPARQL)分割技术,将第一知识图谱分割得到如下6个知识图谱:1个第二知识图谱和5个属性对应的5个第三知识图谱,针对每个知识图谱(以下特指第二知识图谱和各第三知识图谱),分别通过带偏执的随机游走策略生成相应节点序列S={u1,u2…un},其中,n为大于1的整数。对于一个给定的源节点u,模拟一个固定长度L的随机游走,uj表示游走过程中的第j个节点,初始节点u0=u,j为大于或等于0的整数。节点uj由概率分布生成,即:
Figure BDA0002393071550000131
公式(1)中,D表示知识图谱中边的集合,πvx表示节点v和x之间的转移概率,Z为预设的归一化常数。如图7所示,随机游走遍历了边(v,x),并停留在节点v。通过计算边(v,x)上的转移概率πvx来判断节点序列中的下一个节点,计算公式为:
πvx=α(t,x)*ωvx (2)
公式(2)中,ωvx是边上的权重,可以预先设置,没有设置时可以默认为1;α(t,x)表示节点之间的边上的偏执,计算公式为:
Figure BDA0002393071550000132
公式(3)中,dtx表示节点t和x之间的最小跳数,在图7中,dtx的取值属于(0,1,2)。如图7所示,dtx=0时,表示节点x就是节点t本身;dtx=1时,表示节点x为节点x1或者x3;dtx=2时,表示节点x为x2。p和q是两个监督随机游走的参数,取值均为大于0的数。
其中,p为返回参数(Return parameter),它控制着重新回到原节点的概率。将p设置为较大的值(p>max(q,1))时,可以确保在后续过程中不会对已经访问的节点进行采样(除非下一个节点没有其他的邻居节点)。如果将p设置为较小的值(p<max(q,1)),随机游走采样将会回退一步,这将使得采样的节点靠近初始节点t。
q为出入参数(In-out parameter),它控制着广度优先搜索(Breadth-firstSampling,BFS)和深度优先搜索(Depth-first Sampling,DFS)的关系。q允许在当前节点周围或者远离当前节点采样。如果q>1,随机游走采样的节点序列将靠近初始节点t,这样随机游走采集到的节点序列和BFS类似。相反,如果q<1,随机游走采样的节点将逐渐远离初始节点t,这样采集到的节点序列和DFS类似。通过设置合适的参数q可以使得采样在BFS和DFS之间达到平衡。当p=q=1时,相当于传统的深度游走(DeepWalk)。
通过设置不同的p和q,就可以得到不一样偏执的节点序列。本公开实施例中,可以根据具体的应用场景来设置p和q的取值,也可以在对随机游走策略的模型进行训练时,使用网格搜索法(grid search)来寻找最优的p和q。本公开实施例对p和q的具体取值及其获取方式不做限制。
基于本实施例,可以通过带偏执的随机游走策略,分别生成第二知识图谱的节点序列和各第三知识图谱的节点序列,从而确定节点之间可能的转移情况。
在其中一种可能的实现方式中,操作308中,可以分别针对各目标区域,将其所有属性的第三知识图谱的特征向量相加,得到特征向量之和,然后对该特征向量之和对属性数量求平均值,得到各居住区域融合所有属性语义的融合特征向量。例如,针对图4和图6a、图6b所示的租房场景,得到同一租房热区节点在不同属性的第三知识图谱中的特征向量表示后,通过如下公式(4),对其5个属性的特征向量求和然后、求其平均值,得到各租房热区分别融合所有属性语义的融合特征向量,该融合特征向量所表示的语义信息更加全面。
Figure BDA0002393071550000141
公式(4)中,v(attract)各目标区域包含所有属性语义的融合特征向量;m表示目标区域的属性的数量,m=5时即表示目标区域具有5个属性,例如图4和图6a、图6b所示的租房场景,租房热区具有5个属性。
在其中一些可能的实现方式中,通过操作306得到各起始位置相关信息的特征向量,可以表示为:
v(tenant)vf (5)
在其中一种可能的实现方式中,得到各起始位置相关信息在向量空间中的特征向量和各目标区域在同一向量空间中的融合特征向量后,操作108中,可以通过如下方式,通过计算所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的余弦相似度,来获取所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的相关性得分:
Rel(attract,tenant)=sim(v(attract),v(tenant)) (6)
公式(6)中,sim()为余弦相似度。另外,也可以通过其他方式,例如余弦距离,来计算所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的相关性得分,本公开实施例不限定相关性得分的具体计算方式。
在其中一种可能的实现方式中,得到所述匹配的起始位置相关信息的特征向量与各目标区域的融合特征向量之间的相关性得分后,在操作110中,可以按照相关性得分从高到低的顺序,选取预设数量(例如5个)的目标区域作为推荐对象。或者,可以通过如下方式进一步对上述相关性得分进行归一化处理,然后按照归一化后相关性得分从高到低的顺序,选取预设数量(例如5个)的目标区域作为推荐对象:将上述相关性得分规约1-5中的一个数值并向上取整得到对应目标区域的预测评分:
Figure BDA0002393071550000142
由此,可以选取相关性得分选择与所述匹配的起始位置相关信息最相关的前几个目标区域作为推荐对象推荐给用户。本实施例应用于租房场景时,可以利用余弦相似度计算各公司作为租房用户与各租房热区的相关性得分,选取预测评分最高的几个租房热区推荐给租房用户。
可选地,在本公开实施例的推荐方法中,还包括对第一知识图谱进行特征学习得到所述神经网络的操作。如图8所示,为本公开实施例中对第一知识图谱进行特征学习得到神经网络的一个实施例,该实施例包括:
402,将第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱。
404,通过所述带偏执的随机游走策略,分别生成第二知识图谱的节点序列和各第三知识图谱的节点序列。
406,将第二知识图谱的节点序列输入初始神经网络,经初始神经网络得到第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各第三知识图谱中各目标区域的特征向量。
408,获取各节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值。
410,调整所述初始神经网络的参数,以使所有节点序列中,每一个节点与所述每一个节点的上下文节点之间的对数似然函数值之和最大化。
基于本实施例,获取各节点序列中,每一个节点与其在所在节点序列中的上下文节点之间的对数似然函数值,调整初始神经网络的参数,以使所有节点序列中,每一个节点与其上下文节点之间的对数似然函数值之和最大化,这样,可以得到更准确、合理的节点序列,可以更好的利用一个节点序列中上下文节点的特征向量来学习当前节点(即目标节点)的特征向量,从而准确预测当前节点的下一跳节点,由此,即可准确预测当前起始位置相关信息节点最可能走向的目标区域节点。
以下结合一个具体示例,对对第一知识图谱进行特征学习得到神经网络进行解释说明,本实施例中的节点即为知识图谱中的概念/实体,包括:起始位置相关信息节点,目标区域节点和属性值节点这三种类型中任一类型的节点。
1,神经网络模型:对应于初始神经网络或者训练好的所述神经网络
通过操作404已经分别针对多个独立的知识图谱(第二知识图谱和各第三知识图谱),生成各知识图谱的至少一个节点序列。以其中一个的节点序列S={u1,u2…un}为例,将Word2Vec的模型扩展为基于图节点序列表示模型,由三层神经网络构建的图节点序列表示模型,其网络结构如图9所示。基于神经网络模型的目标函数通常取为如下对数似然函数:
Figure BDA0002393071550000151
公式(4)中,N表示当前序列节点中的节点数量;
Figure BDA0002393071550000152
表示目标节点uj的特征向量,由目标节点uj的上下文节点组成。
Figure BDA0002393071550000153
的每一维分别表示特定的上下文节点。简单地说,假设
Figure BDA0002393071550000154
是一个非负的特征向量,其中每一项都表示相应上下文中一个节点的出现次数,第f个上下文节点的特征向量为一个d维特征向量,可以表示为vf∈Rd
可以选取节点序列中节点的前后2c个位置节点作为训练样本举例说明:神经网络模型的:
输入层:包含节点序列中2c个位置的随机初始化的特征向量序列;
投影层:将输入层的2c个特征向量进行求和平均,得到投影向量;
输出层:其结果为一颗完全二叉树,是由节点序列中出现过的节点作为叶子节点,以各个节点在节点序列中出现的次数作为权值所构造的哈夫曼(Huffman)树,(Huffman树中每条分支均可作为一次二分类,建立哈夫曼树的过程即为多个二分类拟合多分类的过程。此处将非叶子节点的左子节点划分为负例,即编码为
Figure BDA0002393071550000161
非叶子节点的左右节点划分为正例,编码为
Figure BDA0002393071550000162
该哈夫曼树的叶子节点共有N个,每个叶子节点即为该节点的特征向量;非叶子节点共有N-1个。
2,神经网络模型的参数调整与优化
通过各知识图谱(第二知识图谱、各第三知识图谱)实例化公式(1)中各上下文节点的特征向量,在生成的各个特定属性的节点序列中定义如下对数似然函数作为目标函数:
Figure BDA0002393071550000163
式中:E表示各知识图谱中的节点集合;Tu表示从节点u开始生成的节点序列;Nt是每一个节点序列t的长度。
想要得到目标函数,需要对其进行参数学习和优化。在神经网络模型中,需要进行参数学习,以为了更好地利用上下文节点的特征向量vf来学习目标节点的特征向量vu。本公开实施例中,通过最大化公式(9)的对数似然函数值来学习神经网络的参数。在其中一些可选示例中,可以采用损失函数(softmax)、或分层损失函数(hierarchical softmax)来对对数似然函数进行优化,采用hierarchical softmax函数时,可以简化由softmax进行优化时所带来的计算量大的问题,从而提高参数学习效率。
给定一个目标节点uj的投影向量
Figure BDA0002393071550000164
L(uj)表示根节点到目标节点uj的路径长度,使
Figure BDA0002393071550000165
利用hierarchical softmax可以定义
Figure BDA0002393071550000166
为如下形式:
Figure BDA0002393071550000167
公式(10)中:
Figure BDA0002393071550000168
Figure BDA0002393071550000169
表示路径L(uj)中第n个非叶子节点的特征向量,采用梯度上升方法训练神经网络的参数。在训练的过程中,遍历所有的节点序列,在这个过程中目标节点uj和其上下文节点的特征向量都随之更新。计算出损失函数值之后,通过反向传播获得误差梯度,使用该误差梯度来更新神经网络模型中的参数。为了方便更新每一步中的θ,通过如下方式来计算
Figure BDA00023930715500001610
的梯度:
Figure BDA00023930715500001611
因此,
Figure BDA00023930715500001612
可通过以下方式进行更新:
Figure BDA0002393071550000171
其中,μ表示神经网络的学习率,可以由神经网络的性能确定。
通过上述计算,目标节点uj的上下文节点的特征向量可通过以下方式更新:
Figure BDA0002393071550000172
通过上述对神经网络的训练,可以对每一个节点uj及其所在节点序列中上下文节点的特征向量进行逐步的调整、优化,在神经网络训练完成后,可以得到优化的每一个节点及其所在节点序列中上下文节点的特征向量,从而使得每一个节点的特征向量的表示更准确、合理。
本公开实施例提供的任一种推荐方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种推荐方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种推荐方法。下文不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图10为本公开推荐装置一个实施例的结构示意图。该实施例的推荐装置可用于实现本公开上述各推荐方法实施例。如图10所示,该实施例的推荐装置包括:接收模块,第一获取模块,第一生成模块,第二获取模块和确定模块。其中:
接收模块,用于接收推荐请求,所述推荐请求中包括参考位置相关信息。
第一获取模块,用于获取第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息。其中,所述第一知识图谱基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到。
第一生成模块,用于通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量;其中,所述神经网络预先基于对第一知识图谱进行特征学习得到。
第二获取模块,用于分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性。
确定模块,用于基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象。
基于本公开上述实施例提供的推荐方法,可以预先基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建第一知识图谱,基于对第一知识图谱进行特征学习得到神经网络,接收到推荐请求后,首先获取第一知识图谱中、与推荐请求中的参考位置相关信息匹配的起始位置相关信息,然后,通过神经网络生成所述匹配的起始位置相关信息的特征向量和所述第一知识图谱中各目标区域的特征向量,之后,分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,进而,基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象以反馈给用户,从而可针对起始位置相关信息推荐相应的目标区域,可以提高推荐准确率,并且提高寻找目标区域的效率。
在本公开实施例的一些可能的实现方式中,起始位置相关信息例如可以包括但不限于以下任意一项或多项:公司标识(ID),办公楼ID,办公园区ID,位置信息,区域信息,等等办公区域相关信息,其中的ID例如可以是名称、编号等等,唯一标识一个对应的公司、办公楼、办公园区等。对应的,目标区域例如可以包括但不限于:居住区域ID等居住区域相关信息,该居住区域ID唯一标识一个居住区域,其中的居住区域例如可以是社区或者居住区域范围。
可选地,在上述实现方式中,目标区域的属性例如可以包括但不限于以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性等等任意可以表示居住区域品质和便利性的属性。
基于本实施例,可用于针对用户的工作区域相关信息(即起始位置相关信息,如公司ID、办公楼ID、办公园区ID、位置信息、区域信息等),综合各居住区域(即目标区域,如居住区域ID等)的各种条件(即各种属性的属性值,如租金、社区环境、社区年代、物业管理、房源品质、周边设施、通勤便利性、购物便利性等)为用户推荐合适的居住区域,提高了推荐准确率,并且可以提高用户租房或者买房的效率。
或者,在本公开实施例的另一些可能的实现方式中,起始位置相关信息例如可以包括但不限于以下任意一项或多项:居住区域ID,位置信息,区域信息,等等居住区域相关信息。对应的,目标区域例如可以包括但不限于:办公楼ID,办公园区ID,区域信息,等等办公区域相关信息。
可选地,在该实现方式中,目标区域的属性例如可以包括但不限于以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性,购物便利性等等任意可以表示工作区域便利性的属性。
基于本实施例,可用于针对用户的居住区域相关信息(即起始位置相关信息,如居住区域ID、位置信息、区域信息等),综合各工作区域(即目标区域,如办公楼ID、办公园区ID、区域信息等)的各种条件(即各种属性的属性值,如区域环境、物业管理、停车便利性、停车费、就餐便利性、通勤便利性、购物便利性等)为用户推荐合适的工作区域,提高了推荐准确率,并且可以提高用户工作、通行等方面的便利性。
图11为本公开推荐装置另一个实施例的结构示意图。如图11所示,与图10所示的实施例相比,该实施例的推荐装置还包括:第三获取模块和第二生成模块。其中:
第三获取模块,用于从数据库中或者所述第一知识图谱中获取所述推荐对象的属性及属性值。
第二生成模块,用于生成并输出推荐对象列表。其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息包括:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
另外,再参见图11,本公开推荐装置的又一个实施例中,还可以包括:用于基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到所述第一知识图谱的构建模块。
在其中一些可能的实现方式中,所述构建模块包括:采集单元,用于从数据库中采集指定范围内的元数据,所述元数据包括:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值;确定单元,用于确定所述元数据中各起始位置相关信息和各目标区域之间的关系;第一获取单元,用于基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源;构建单元,用于基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建所述第一知识图谱。
在其中一些可选示例中,所述确定单元,具体用于:若同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中起始位置相关信息和目标区域之间的关系为喜爱。
另外,在另一些可能的实现方式中,所述构建模块还可以包括:预处理单元,用于对所述元数据进行预处理,所述预处理包括以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对所述元数据中的节点进行实体对齐,所述节点包括:起始位置相关信息节点、目标区域节点和属性值节点。
在其中一些可能的实现方式中,所述第一获取模块包括:分割单元,用于将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;其中,所述第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值;生成单元,用于通过带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;其中,每个所述节点序列包括对应的所述第二知识图谱或者所述第三知识图谱中的多个具有一定的顺序的节点,所述第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,所述第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点;第二获取单元,用于将所述第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量,其中,所述第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各所述第三知识图谱中各目标区域的特征向量;融合单元,用于分别针对各目标区域,基于多个所述第三知识图谱中目标区域的特征向量,得到所述目标区域融合各属性的融合特征向量。
在其中一些可能的实现方式中,所述第二获取模块,具体用于:分别获取所述匹配的起始位置相关信息的特征向量与各所述目标区域的融合特征向量之间的相关性。
另外,其中一些可能的实现方式中,所述第二获取单元,还用于将所述第二知识图谱的节点序列输入初始神经网络,经所述初始神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各所述第三知识图谱中各目标区域的特征向量。相应地,再参见图11,本公开推荐装置的再一个实施例中,还可以包括:训练模块,用于获取各所述节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值;调整所述初始神经网络的参数,以使所有所述节点序列中,每一个节点与所述每一个节点的所述上下文节点之间的对数似然函数值之和最大化,从而得到所述神经网络。
另外,本公开实施例还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的推荐方法。
下面,参考图12来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图12为本公开电子设备一个实施例的结构示意图。如图12所示,电子设备包括一个或多个处理器和存储器。
处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本公开的各个实施例的推荐方法以及/或者其他期望的功能。
在一个示例中,电子设备还可以包括:输入装置和输出装置,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
此外,该输入装置还可以包括例如键盘、鼠标等等。
该输出装置可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出装置等等。
当然,为了简化,图12中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的推荐方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的推荐方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (16)

1.一种推荐方法,其特征在于,包括:
接收推荐请求,所述推荐请求中包括参考位置相关信息;
获取第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息;其中,所述第一知识图谱基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到;
通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量;其中,所述神经网络预先基于对第一知识图谱进行特征学习得到;
分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性;
基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象;
其中,所述起始位置相关信息包括以下任意一项或多项:公司标识ID,办公楼ID,办公园区ID,位置信息,区域信息;所述目标区域包括:居住区域ID;所述目标区域的属性包括以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性;
或者,所述起始位置相关信息包括以下任意一项或多项:居住区域ID,位置信息,区域信息;所述目标区域包括:办公楼ID,办公园区ID,区域信息;所述目标区域的属性包括以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性;
基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到所述第一知识图谱,包括:
从数据库中采集指定范围内的元数据,所述元数据包括:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值;
确定所述元数据中各起始位置相关信息和各目标区域之间的关系;
基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源;
基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建所述第一知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述确定至少一个所述目标区域作为推荐对象之后,还包括:
从数据库中或者所述第一知识图谱中获取所述推荐对象的属性及属性值;
生成并输出推荐对象列表;其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息包括:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
3.根据权利要求1所述的方法,其特征在于,所述确定所述元数据中各起始位置相关信息和各目标区域之间的关系,包括:
若同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中起始位置相关信息和目标区域之间的关系为喜爱。
4.根据权利要求1所述的方法,其特征在于,所述从数据库中采集指定范围内的元数据之后,还包括:
对所述元数据进行预处理,所述预处理包括以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对所述元数据中的节点进行实体对齐,所述节点包括:起始位置相关信息节点、目标区域节点和属性值节点。
5.根据权利要求1-4任一所述的方法,其特征在于,所述通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量,包括:
将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;其中,所述第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值;
通过带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;其中,每个所述节点序列包括对应的所述第二知识图谱或者所述第三知识图谱中的多个具有一定的顺序的节点,所述第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,所述第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点;
将所述第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量,其中,所述第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各所述第三知识图谱中各目标区域的特征向量;
分别针对各目标区域,基于多个所述第三知识图谱中目标区域的特征向量,得到所述目标区域融合各属性的融合特征向量。
6.根据权利要求5所述的方法,其特征在于,所述分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,包括:
分别获取所述匹配的起始位置相关信息的特征向量与各所述目标区域的融合特征向量之间的相关性。
7.根据权利要求5所述的方法,其特征在于,基于对第一知识图谱进行特征学习得到所述神经网络的操作,包括:
将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;
通过所述带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;
将所述第二知识图谱的节点序列输入初始神经网络,经所述初始神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各所述第三知识图谱中各目标区域的特征向量;
获取各所述节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值;
调整所述初始神经网络的参数,以使所有所述节点序列中,每一个节点与所述每一个节点的所述上下文节点之间的对数似然函数值之和最大化。
8.一种推荐装置,其特征在于,包括:
构建模块,用于基于数据源中起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系、目标区域的属性及属性值构建得到第一知识图谱;所述构建模块包括:采集单元,用于从数据库中采集指定范围内的元数据,所述元数据包括:起始位置相关信息涉及的用户信息、各用户信息对应的目标区域信息、以及各目标区域的属性及属性值;确定单元,用于确定所述元数据中各起始位置相关信息和各目标区域之间的关系;第一获取单元,用于基于所述元数据、所述元数据中各起始位置相关信息和各目标区域之间的关系,得到所述数据源;构建单元,用于基于由所述元数据、以及所述元数据中各起始位置相关信息和各目标区域之间的关系构成的数据源,构建所述第一知识图谱;
接收模块,用于接收推荐请求,所述推荐请求中包括参考位置相关信息;
第一获取模块,用于获取所述第一知识图谱中与所述参考位置相关信息匹配的起始位置相关信息;
第一生成模块,用于通过神经网络生成所述匹配的起始位置相关信息的特征向量,以及通过所述神经网络生成所述第一知识图谱中各目标区域的特征向量;其中,所述神经网络预先基于对第一知识图谱进行特征学习得到;
第二获取模块,用于分别获取所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性;
确定模块,用于基于所述匹配的起始位置相关信息的特征向量和各所述目标区域的特征向量之间的相关性,确定至少一个所述目标区域作为推荐对象;
其中,所述起始位置相关信息包括以下任意一项或多项:公司标识ID,办公楼ID,办公园区ID,位置信息,区域信息;所述目标区域包括:居住区域ID;所述目标区域的属性包括以下任意一项或多项:租金,社区环境,社区年代,物业管理,房源品质,周边设施,通勤便利性,购物便利性;
或者,所述起始位置相关信息包括以下任意一项或多项:居住区域ID,位置信息,区域信息;所述目标区域包括:办公楼ID,办公园区ID,区域信息;所述目标区域的属性包括以下任意一项或多项:区域环境,物业管理,停车便利性,停车费,就餐便利性,通勤便利性,购物便利性。
9.根据权利要求8所述的装置,其特征在于,还包括:
第三获取模块,用于从数据库中或者所述第一知识图谱中获取所述推荐对象的属性及属性值;
第二生成模块,用于生成并输出推荐对象列表;其中,所述推荐对象列表包括至少一个推荐对象的相关信息,所述至少一个推荐对象的相关信息包括:推荐对象的目标区域ID,推荐对象的至少一项属性及属性值。
10.根据权利要求8所述的装置,其特征在于,所述确定单元,具体用于:
若同一起始位置相关信息对应同一目标区域的用户数量大于第一预设值、或者同一起始位置相关信息对应同一目标区域的用户数量与所述同一起始位置相关信息对应所有目标区域的总用户数量之间的比值大于第二预设值,确定所述元数据中起始位置相关信息和目标区域之间的关系为喜爱。
11.根据权利要求8所述的装置,其特征在于,所述构建模块还包括:
预处理单元,用于对所述元数据进行预处理,所述预处理包括以下任意一项或多项:对用户信息对应的目标区域信息进行去重,对所述元数据中的节点进行实体对齐,所述节点包括:起始位置相关信息节点、目标区域节点和属性值节点。
12.根据权利要求8-11任一所述的装置,其特征在于,所述第一获取模块包括:
分割单元,用于将所述第一知识图谱分割为第二知识图谱和多个分别针对目标区域的各属性的第三知识图谱;其中,所述第二知识图谱包括:起始位置相关信息、目标区域、起始位置相关信息和目标区域之间的关系;针对目标区域的一个属性的所述第三知识图谱包括:目标区域、所述一个属性和所述一个属性的属性值;
生成单元,用于通过带偏执的随机游走策略,分别生成所述第二知识图谱的节点序列和各所述第三知识图谱的节点序列;其中,每个所述节点序列包括对应的所述第二知识图谱或者所述第三知识图谱中的多个具有一定的顺序的节点,所述第二知识图谱中的节点包括用于表示起始位置相关信息的起始位置相关信息节点和用于表示目标区域的目标区域节点,所述第三知识图谱中的节点包括用于表示目标区域的目标区域节点和用于表示属性的属性节点;
第二获取单元,用于将所述第二知识图谱的节点序列输入所述神经网络,经所述神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量,其中,所述第二知识图谱中各起始位置相关信息的特征向量包括所述匹配的起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述神经网络,经所述神经网络得到各所述第三知识图谱中各目标区域的特征向量;
融合单元,用于分别针对各目标区域,基于多个所述第三知识图谱中目标区域的特征向量,得到所述目标区域融合各属性的融合特征向量。
13.根据权利要求12所述的装置,其特征在于,所述第二获取模块,具体用于:
分别获取所述匹配的起始位置相关信息的特征向量与各所述目标区域的融合特征向量之间的相关性。
14.根据权利要求12所述的装置,其特征在于,所述第二获取单元,还用于将所述第二知识图谱的节点序列输入初始神经网络,经所述初始神经网络得到所述第二知识图谱中各起始位置相关信息的特征向量;以及,分别将各所述第三知识图谱的节点序列输入所述初始神经网络,经所述初始神经网络得到各所述第三知识图谱中各目标区域的特征向量;
所述装置还包括:
训练模块,用于获取各所述节点序列中,每一个节点与所述每一个节点在所在节点序列中的上下文节点之间的对数似然函数值;调整所述初始神经网络的参数,以使所有所述节点序列中,每一个节点与所述每一个节点的所述上下文节点之间的对数似然函数值之和最大化,从而得到所述神经网络。
15.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现上述权利要求1-7任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现上述权利要求1-7任一所述的方法。
CN202010121352.8A 2020-02-26 2020-02-26 推荐方法和装置、电子设备和存储介质 Active CN111353106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010121352.8A CN111353106B (zh) 2020-02-26 2020-02-26 推荐方法和装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010121352.8A CN111353106B (zh) 2020-02-26 2020-02-26 推荐方法和装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111353106A CN111353106A (zh) 2020-06-30
CN111353106B true CN111353106B (zh) 2021-05-04

Family

ID=71194111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010121352.8A Active CN111353106B (zh) 2020-02-26 2020-02-26 推荐方法和装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111353106B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930518B (zh) * 2020-09-22 2021-01-22 北京东方通科技股份有限公司 面向知识图谱表示学习的分布式框架构建方法
CN112182431A (zh) * 2020-09-22 2021-01-05 汉海信息技术(上海)有限公司 参考地点推荐方法、装置、设备以及存储介质
CN112348625B (zh) * 2020-09-25 2022-11-01 重庆锐云科技有限公司 基于全息投影的房屋推荐方法
CN112365576B (zh) * 2020-11-10 2023-07-25 网易(杭州)网络有限公司 庄园组件位置的推荐方法、装置及服务器
CN112767054A (zh) * 2021-01-29 2021-05-07 北京达佳互联信息技术有限公司 数据推荐方法、装置、服务器和计算机可读存储介质
CN112905903A (zh) * 2021-04-06 2021-06-04 北京百度网讯科技有限公司 一种租房推荐方法、装置、电子设备及存储介质
CN113656589B (zh) * 2021-04-19 2023-07-04 腾讯科技(深圳)有限公司 对象属性确定方法、装置、计算机设备及存储介质
CN113742580B (zh) * 2021-08-20 2024-06-28 杭州网易云音乐科技有限公司 目标类型数据的召回方法、装置、电子设备及存储介质
CN114218487B (zh) * 2021-12-16 2023-02-03 天翼爱音乐文化科技有限公司 一种视频推荐方法、***、装置及存储介质
CN114550705B (zh) * 2022-02-18 2024-04-12 北京百度网讯科技有限公司 对话推荐方法、模型的训练方法、装置、设备及介质
CN116501972B (zh) * 2023-05-06 2024-01-05 广州市巨应信息科技有限公司 基于大数据在线服务的内容推送方法及ai智能推送***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN110489547A (zh) * 2019-07-11 2019-11-22 桂林电子科技大学 一种基于混合式监督学习的旅游景点推荐方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008134595A1 (en) * 2007-04-27 2008-11-06 Pelago, Inc. Determining locations of interest based on user visits
CN106528785A (zh) * 2016-11-03 2017-03-22 杜剑峰 基于问题合成的用户租房偏好捕获方法
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
CN109902224A (zh) * 2019-01-17 2019-06-18 平安城市建设科技(深圳)有限公司 基于用户行为分析的房源推荐方法、装置、设备和介质
CN109977283B (zh) * 2019-03-14 2021-03-05 中国人民大学 一种基于知识图谱和用户足迹的旅游推荐方法和***
CN109992673A (zh) * 2019-04-10 2019-07-09 广东工业大学 一种知识图谱生成方法、装置、设备及可读存储介质
CN110245204A (zh) * 2019-06-12 2019-09-17 桂林电子科技大学 一种基于定位及知识图谱的智能推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN110489547A (zh) * 2019-07-11 2019-11-22 桂林电子科技大学 一种基于混合式监督学习的旅游景点推荐方法及装置

Also Published As

Publication number Publication date
CN111353106A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN111353106B (zh) 推荐方法和装置、电子设备和存储介质
CN111782965B (zh) 意图推荐方法、装置、设备及存储介质
Zhang et al. Collaborative knowledge base embedding for recommender systems
Majid et al. A system for mining interesting tourist locations and travel sequences from public geo-tagged photos
Gilson et al. From web data to visualization via ontology mapping
WO2023065211A1 (zh) 一种信息获取方法以及装置
US11468136B2 (en) Item inventory locating from search queries
Chen et al. Research on personalized recommendation hybrid algorithm for interactive experience equipment
JP2013519138A (ja) アイテム関連付けのための結合埋込
CN110069713B (zh) 一种基于用户上下文感知的个性化推荐方法
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN110019616A (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN109408578A (zh) 一种针对异构环境监测数据融合方法
CN111966793A (zh) 基于知识图谱的智慧问答方法、***和知识图谱更新***
CN113220904A (zh) 数据处理方法及数据处理装置、电子设备
Cheng et al. Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations
Matsumoto et al. Music video recommendation based on link prediction considering local and global structures of a network
Clarizia et al. A sentiment analysis approach for evaluation of events in field of cultural heritage
CN112861474A (zh) 一种信息标注方法、装置、设备及计算机可读存储介质
Sun Music Individualization Recommendation System Based on Big Data Analysis
CN116662583A (zh) 一种文本生成方法、地点检索方法及相关装置
CN116166977A (zh) 一种基于时序图神经网络的物联网服务聚类方法
CN114168733B (zh) 一种基于复杂网络的法规检索方法及***
CN109104466B (zh) 一种基于P2P的WoT资源管理方法
Qu et al. The application of interactive methods under swarm computing and artificial intelligence in image retrieval and personalized analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200721

Address after: 100085 Floor 102-1, Building No. 35, West Second Banner Road, Haidian District, Beijing

Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd.

Address before: 300 457 days Unit 5, Room 1, 112, Room 1, Office Building C, Nangang Industrial Zone, Binhai New Area Economic and Technological Development Zone, Tianjin

Applicant before: BEIKE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant