CN116127186A - 一种基于知识图谱人岗个性化匹配推荐方法及*** - Google Patents

一种基于知识图谱人岗个性化匹配推荐方法及*** Download PDF

Info

Publication number
CN116127186A
CN116127186A CN202211583266.4A CN202211583266A CN116127186A CN 116127186 A CN116127186 A CN 116127186A CN 202211583266 A CN202211583266 A CN 202211583266A CN 116127186 A CN116127186 A CN 116127186A
Authority
CN
China
Prior art keywords
user
entity
graph
job
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211583266.4A
Other languages
English (en)
Inventor
刘海丰
黄程韦
朱晓明
阚保春
魏伟
郑海天
陈圆谜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Hanggang Vocational Education Group Co ltd
Zhejiang Lab
Original Assignee
Zhejiang Hanggang Vocational Education Group Co ltd
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Hanggang Vocational Education Group Co ltd, Zhejiang Lab filed Critical Zhejiang Hanggang Vocational Education Group Co ltd
Priority to CN202211583266.4A priority Critical patent/CN116127186A/zh
Publication of CN116127186A publication Critical patent/CN116127186A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Algebra (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于知识图谱人岗个性化匹配推荐方法及***,该方法收集招聘企业发布的招聘职位信息,进行数据处理,并通过关系抽取得到招聘职位三元组,得到职位知识图谱;采集用户包括点击浏览、评论、收藏在内的历史求职行为数据,得到用户偏好的职位数据集合;将用户偏好的职位数据集合作为种子,应用RippleNet算法从所述职位知识图谱中获取多跳职位信息及其关系,得到用户与所述职位知识图谱的实体交互的三元组;构建并训练基于知识图谱并融合用户偏好的多任务推荐模型,包括用户‑图谱实体交互模块、推荐模块、职位‑图谱实体交互模块;根据用户和职位交互的评分,得出职位排序列表。本发明能够改善推荐结果,给出符合用户个性化的推荐需求。

Description

一种基于知识图谱人岗个性化匹配推荐方法及***
技术领域
本发明涉及信息推荐技术领域,具体涉及一种基于知识图谱人岗个性化匹配推荐方法及***。
背景技术
目前线上招聘已成为求职和招聘主流渠道,海量的求职信息和招聘信息让招聘企业和求职者难以选择匹配。招聘企业需要从大量的求职者简历信息找到满足企业需求的求职人员,同时求职者也需要从海量的招聘职位中找到满足自身兴趣爱好的个性化的职位进行匹配。为了满足个性化职聘需求,通过分析求职者搜索、浏览、评价等行为,发现用户对求职岗位的兴趣,然后将求职者感兴趣的岗位信息推荐给用户展示。但是传统的推荐***存在冷启动和数据稀疏的问题,同时忽略了用户的个性化兴趣偏好,从而影响推荐***的准确性和可解释性。
将知识图谱(Knowledge Graph,KG)引入推荐***(Recommend Systems,RS)对于解决传统求职推荐***存在问题提供新的解决方法,知识图谱包含丰富的语义信息,可以一定程度解决目前推荐***数据稀疏性问题,同时应用知识图谱的推理能够补充推荐***的辅助数据,通过引入知识图谱三元组语义信息和属性信息,可以更深层次发现用户的个人兴趣爱好,这样可以提高个性化推荐准确性和可解释性,基于知识图谱的推荐***已经成为推荐***研究方向的热门分支领域。
在职聘推荐领域中通常采用协同过滤算法,推荐数据包含海量的用户简历和职位数据,用户只会对部分职位数据进行点击浏览和评价,从而导致用户和职位评分矩阵稀疏,影响相似用户群体的计算;如果一个新用户从未对***中职位进行点击和评价、或者一个新加入的职位从未被评价,那么这个新用户或新职位在传统的推荐***中就得不到推荐,这就是数据稀疏性和冷启动问题。解决稀疏性和冷启动问题的一个常见思路是在职位推荐算法中额外引入一些辅助信息作为输入,如社交网络信息、用户或者职位的属性、上下文信息等。辅助信息可以丰富***中用户和职位的信息描述,很好地补充***中交互信息的稀疏,使得推荐效果更加个性化。而知识图谱本身拥有丰富的语义信息,可以作为辅助信息引入推荐***中,解决稀疏性和冷启动问题,提高推荐的准确性。
现有的推荐算法往往忽略用户的行为偏好或没有考虑用户的偏好所占权重,导致推荐的物品不合理,目前融合知识图谱的推荐算法考虑了知识图谱的结构和语义信息,但往往忽略了用户和知识图谱的联系。
发明内容
针对现有技术的不足,本发明提出一种基于知识图谱人岗个性化匹配推荐方法及***,通过引入用户的偏好兴趣,采用多任务学习的方法同时训练职位图谱学习模块和推荐模块,并得到求职者和招聘职位的特征向量,最后,将得到的求职者特征向量和招聘职位的特征向量进行相似度计算,并将计算结果推荐给用户,从而实现人岗个性化匹配。
本发明的目的通过如下的技术方案来实现:
一种基于知识图谱人岗个性化匹配推荐方法,该方法包括如下步骤:
步骤一:收集招聘企业发布的招聘职位信息,进行数据处理,并通过关系抽取得到招聘职位三元组,再进行知识融合,得到职位知识图谱;
步骤二:采集用户包括点击浏览、评论、收藏在内的历史求职行为数据,得到用户偏好的职位数据集合;
步骤三:将所述用户偏好的职位数据集合作为种子,应用RippleNet算法从所述职位知识图谱中获取多跳职位信息及其关系,得到用户与所述职位知识图谱的实体交互的三元组;
步骤四:构建并训练基于知识图谱并融合用户偏好的多任务推荐模型,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块;
通过用户-图谱实体交互模块,得到用户和所述知识图谱之间的关系;
通过职位-图谱实体交互模块,得到职位和图谱实体之间的相似度关系;
通过推荐模块,得到用户和职位交互的评分;
步骤五:根据所述用户和职位交互的评分,得出推荐给用户的职位排序列表。
进一步地,所述步骤三中,用户与所述职位知识图谱的实体交互的三元组表示为<hu,ru,tu>,其中,hu是头实体,表示用户;ru是关系或属性;tu是尾实体;
通过用户-图谱实体交互模块,得到用户和所述知识图谱之间的关系,具体包括:
在用户-图谱实体交互模块中,将tu、ru分别通过深度神经网络进行信息提取,分别得到tu′、ru′;将hu与所述职位知识图谱中的用户集合u进行交叉压缩信息提取,分别得到hu′和u′;并将ru′与h u′输入深度神经网络,得到尾实体的预测值
Figure BDA0003990222430000021
最后使用相似度函数评估预测值
Figure BDA0003990222430000022
的预测结果。
进一步地,所述招聘职位三元组表示为<hv,rv,tv>,其中,hv为头实体,表示职位;rv为从头实体到尾实体的关系;tv为尾实体;
通过职位-图谱实体交互模块,得到职位和图谱实体之间的相似度关系,具体包括:
在职位-图谱实体交互模块中,将rv和tv分别通过深度神经网络信息提取,分别得到tv″、rv′;将hv与所述职位知识图谱中的职位集合v进行交叉压缩信息提取,分别得到h v′和v′;并将rv′与h v′输入深度神经网络,得到尾实体的预测值
Figure BDA0003990222430000031
最后使用相似度函数评估预测值
Figure BDA0003990222430000032
的预测结果。
进一步地,在推荐模块中,将所述用户偏好的职位数据集合输入基于注意力机制的双向LSTM网络,得到用户兴趣偏好向量;并融合所述用户兴趣偏好向量、u′、v″;得到用户和所有职位的交互概率
Figure BDA0003990222430000033
进一步地,基于知识图谱并融合用户偏好的多任务推荐模型训练完成后,保存用户特征向量、职位的特征向量及用户的兴趣偏好向量。
进一步地,所述步骤五通过如下子步骤来实现:
根据用户ID,索引到对应的用户特征向量和用户兴趣向量;利用融合用户兴趣偏好后推荐公式计算用户和所有职位的相似度;对相似度进行排序,选出最大相似度前n职位个推荐给用户。
进一步地,所述深度神经网络选用多层感知机。
一种基于知识图谱人岗个性化匹配推荐***,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块、交叉压缩模块;
所述交叉压缩模块包括交叉压缩单元一和交叉压缩单元二;所述交叉压缩单元一用于自动学习用户与所述职位知识图谱的实体之间的高阶交互特征;所述交叉压缩单元二用于自动学习用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征;
所述用户-图谱实体交互模块用于学习用户和所述职位知识图谱的实体之间的三元组关系;
所述职位-图谱实体交互模块用于学习用户偏好的职位与所述职位知识图谱的职位实体之间的三元组关系;
所述推荐模块用于将用户与所述职位知识图谱的实体之间的高阶交互特征、用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征,以及用户偏好融合起来,预测用户与所述职位知识图谱的所有职位之间的交互得分。
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述电子设备执行时,使得所述电子设备实现所述的基于知识图谱人岗个性化匹配推荐方法。
一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于知识图谱人岗个性化匹配推荐方法。
本发明的有益效果如下:
(1)本发明的基于知识图谱人岗个性化匹配推荐方法及***,融合用户的行为偏好,提出了基于知识图谱并融合用户偏好的多任务学习的混合推荐***模型,同时考虑了用户和图谱关系,及职位实体与图谱实体之间关系,既考虑了知识图谱架构和语义信息,也考虑了用户和知识图谱之间的联系,并有效利用知识图谱信息来增强推荐性能;
(2)根据用户简历信息及对感兴趣的职位信息有浏览点击、评价等行为,建立用户点击浏览职位历史数据集合作为种子,应用RippleNet算法提取用户和知识图谱联系,并将该联系和知识图谱的联系融合到推荐任务中来提升推荐性能。
(3)模型同时学习用户和知识图谱语义匹配和推荐这两个任务,同样,也能学习到职位和知识图谱实体语义匹配和推荐这两个任务。推荐模块加入用户的兴趣偏好因素,使推荐***学习到用户偏好信息,从而改善推荐结果,给出符合用户个性化的推荐需求。
附图说明
图1为基于知识图谱的个性化职位推荐方法框架流程示意图。
图2为职位知识图谱构建的流程图。
图3为职位知识图谱局部示意图。
图4为通过Ripple算法从职位知识图谱中获取多跳职位信息及其关系的示意图。
图5为基于知识图谱多任务个性化推荐服务模型的示意图;其中,左图为用户-图谱实体交互模块;中图为推荐模块,右图为职位-图谱实体交互模块。
图6为交叉压缩单元一CCu和交叉压缩单元二CCv进行交叉压缩的示意图。
图7为基于注意力机制的双向LSTM网络架构。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基于知识图谱人岗个性化匹配推荐方法及***,引入知识图谱来解决推荐数据的稀疏性,提高推荐排序的准确性,通过构建职聘知识图谱,对岗位和属性等信息进行融合对齐,利用图谱中的语义信息和属性信息,挖掘用户的深层喜好;利用知识图谱中的不同关系链接信息,有利于推荐结果的发散;同时岗位图谱可以连接用户的历史记录和推荐结果,增强职位推荐的可解释性。
如图1所示,本发明的基于知识图谱人岗个性化匹配推荐方法,包括如下几个步骤。
步骤一:收集招聘企业发布的招聘职位信息,进行数据处理,并通过关系抽取得到招聘职位三元组,再进行知识融合,得到职位知识图谱。
如图2所示,首先构建人岗招聘领域的知识图谱的本体,采用自上而下的方法,然后根据来自各大求职招聘网站中的职位数据进行数据采集和处理,根据本体对数据进行命名实体识别和关系抽取,形成三元组形式<实体,关系,实体>或<实体,属性,属性值>,对于异构数据源进行知识融合。其中,企业发布的职位实体主要包括以下8个属性:职位名称、工作地点、工作经验、学历要求、职位描述、公司名称、所属行业、职位要求等。求职用户信息以简历形式体现,主要包括:姓名、年龄、求职意向、学历、工作地点、工作经历、项目经验、个人技能等。招聘职位三元组表示为<hv,rv,tv>,其中,hv为头实体,表示职位;rv为从头实体到尾实体的关系;tv为尾实体。职位知识图谱以G表示,且G={(hv,rv,tv)|hv,tv∈E,rv∈R}。其中,E和R表示知识图谱中的实体集和关系集。图3为其中一个招聘职位知识图谱的局部示意图。职位知识图谱中的用户集合表示为U=u1,u2,...,招聘职位集合表示为V=v1,v2,...。
步骤二:采集用户包括点击浏览、评论、收藏在内的历史求职行为数据,得到用户偏好的职位数据集合。
用户偏好的职位数据集合表示为vu,基于用户偏好的职位数据集合,建立求职用户和招聘职位的交互矩阵Y,
Figure BDA0003990222430000051
表征用户的隐式反馈,定义如下:
Figure BDA0003990222430000052
其中,
Figure BDA0003990222430000053
=1表示求职用户u和职位v之间存在隐形交互,例如点击行为、浏览行为、收藏行为、投递简历行为和评价行为等。
步骤三:将用户偏好的职位数据集合作为种子,应用RippleNet算法从所述职位知识图谱中获取多跳职位信息及其关系,得到用户与所述职位知识图谱的实体交互的三元组。
用户与职位知识图谱的实体交互的三元组表示为(用户,关系,实体)。应用RippleNet算法从所述职位知识图谱中获取多跳职位信息及其关系的过程如下:以用户的行为数据为兴趣中心,模拟用户的兴趣在知识图谱上逐层向外扩散,且不断衰减过程,类似水中波纹。最后将得到的RippleNet(用户,关系,图谱实体)三元组参与训练,用于构建更全面的用户表示向量。RippleNet的传播过程如图4所示。最后得到的用户与职位知识图谱的实体交互的三元组表示为<hu,ru,tu>,其中,hu是头实体,表示用户;ru是关系或属性;tu是尾实体。
步骤四:构建并训练基于知识图谱并融合用户偏好的多任务推荐模型,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块;通过用户-图谱实体交互模块,得到用户和所述知识图谱之间的关系;通过职位-图谱实体交互模块,得到职位和图谱实体之间的相似度关系;通过推荐模块,得到用户和职位交互的评分。
该模型的结构如图5所示,该模型采用多任务学习将知识图谱模块和推荐***模块同时训练学习,充分考虑用户-职位图谱实体交互和职位-图谱实体交互,从这两个方面建模用户表示和职位实体表示,并以此作为推荐算法最终输入,同时加入注意力机制的双向LSTM(Long Short-Term Memory)网路从用户的历史行为交互系列提取用户的偏好到推荐模型,从而给出个性化人岗匹配推荐结果。
下面为了方便介绍各个模块,深度神经网络选取多层感知机作为代表进行说明。
1.交叉压缩模块(CCu,Cv)
交叉压缩模块包括交叉压缩单元一和交叉压缩单元二,其中,交叉压缩单元一CCu用于自动学习用户与所述职位知识图谱的实体之间的高阶交互特征;所述交叉压缩单元二CCv用于自动学习用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征。
交叉压缩单元采用的是MKR(Multi-Task Feature Learning for KnowledgeGraph Enhanced Recommendation)模型提出的,其自动学习推荐***中项目与KG中实体之间的高阶特征交互特征,其结构如图6所示。
这里以交叉压缩单元二CCv为例进行介绍,交叉压缩单元一CCu与其类似。
对于一个招聘职位v和一个知识图谱里和职位v对应的实体h,首先构建交叉矩阵
Figure BDA0003990222430000061
其中d为v和h的维度。
Figure BDA0003990222430000062
招聘职位v和实体h经过交叉压缩单元二CCv的输出为:
Figure BDA0003990222430000063
其中,
Figure BDA0003990222430000064
是交叉单元权重和偏置参数。调整该参数可以同时学习知识图谱语义匹配和推荐这两个任务。同样对CCu用户u的特征向量计算也是如此。
2.职位-图谱实体交互模块
职位-图谱实体交互模块采用深度语义匹配机制,将招聘职位三元组<hv,rv,tv>中的rv和tv分别通过深度神经网络信息提取,分别得到tv″、rv″;将hv与所述职位知识图谱中的职位集合v进行交叉压缩信息提取,分别得到h v′和v′;并将rv″与h v″输入深度神经网络,得到尾实体的预测值
Figure BDA0003990222430000071
最后使用相似度函数评估预测值
Figure BDA0003990222430000072
的预测结果。
h′v=CCv(…CCv(v,hv))[h]
r′v=MLP(…MLP(rv))
t′v=MLP(…MLP(tv))
Figure BDA0003990222430000073
其中,CCv代表压缩交叉单元二,MLP为多层感知机,MLP(x)=σ(wx+b),其中w为权重参数,σ为非线性激活sigmoid函数。相似度函数为:
Figure BDA0003990222430000074
3.用户-图谱实体交互模块
用户-图谱实体交互模块为了学习用户和知识图谱实体的关系,将tu、ru分别通过深度神经网络进行信息提取,分别得到tu′、ru′;将hu与所述职位知识图谱中的用户集合u进行交叉压缩信息提取,分别得到hu′和u′;并将ru′与hu′输入深度神经网络,得到尾实体的预测值
Figure BDA0003990222430000075
最后使用相似度函数评估预测值
Figure BDA0003990222430000076
的预测结果。
h′u=CCu(…CCu(u,hu))[h]
r′u=MLP(…MLP(ru))
t′u=MLP(…MLP(tu))
Figure BDA0003990222430000077
其中,CCu代表压缩交叉单元,MLP为多层感知机,MLP(x)=σ(wx+b),其中w为权重参数,σ为非线性激活sigmoid函数。相似度函数为:
Figure BDA0003990222430000078
4.推荐模块
(1)用户兴趣偏好获取
在推荐模块中,使用双向LSTM网络加上注意力机制来优化用户偏好学习能力,网络输入为用户求职过程交互行为数据系列(sequv)。LSTM可解决长期记忆和反向传播中的梯度等问题,它采用门控机制控制输入、记忆等信息并在当前时间步做出预测。可以从用户和职位交互序列中提取用户的偏好,加上使用注意力机制调节各个职位的权重,这样可以更准确地提取用户对职位兴趣偏好,网络结构如图7所示。计算公式如下:
hout=BILSTM(sequv)
Figure BDA0003990222430000079
Figure BDA00039902224300000710
α=sofrmax(wTtanh(cn,hout))
r=houtαT
uip=MLP(r)
其中,hout为双向LSTM输出隐藏层的结果,αnj为hn,hj的注意力权重,wα和wT为参数矩阵,α为注意力权重,r为加入权重后LSTM输出,再经过MLP得到用户兴趣偏好(userinterest preference)UIP。将获取用户兴趣偏好简写为:UIP=AttentionLSTM(sequv)。
(2)推荐
推荐模块的输入为用户交互矩阵Y和求职用户历史行为数据系列(User interactterm sequence)记为Sequv。推荐模块则是将所述用户偏好的职位数据集合输入基于注意力机制的双向LSTM网络,得到用户兴趣偏好向量;并融合所述用户兴趣偏好向量、u′、v′;得到用户和所有职位的交互概率
Figure BDA0003990222430000081
其中,给定用户特征向量u,经过交叉压缩单元一CCu和MLP处理后得到u′为:
ucc=CCu(u,hu)[u]
u′=MLP(MLP(…MLP(ucc)))
同样,经过处理后的v为:
vcc=CCv(v,hv)[v]
v′=MLP(MLP(…MLP(vcc)))
融合用户兴趣偏好后推荐公式为:
Figure BDA0003990222430000082
其中,λ为用户兴趣偏好所占权重,AttentionLSTM(sequv)为用户的兴趣偏好。
基于知识图谱并融合用户偏好的多任务推荐模型的损失函数为:
Figure BDA0003990222430000083
式中θ为交叉熵损失函数,Lrs为推荐模块的损失,
Figure BDA0003990222430000084
为用户和职位图谱实体交互(用户,关系,实体)三元组拟合的损失值,
Figure BDA0003990222430000085
为知识图谱实体与实体交互(职位,关系,实体)三元组拟合的损失值,λ为正则化系数,
Figure BDA0003990222430000086
为正则化项。
模型经过训练后,保存用户特征向量、职位的特征向量及用户的兴趣偏好向量。
步骤五:根据所述用户和职位交互的评分,得出推荐给用户的职位排序列表。
在该步骤中,根据用户ID,索引到对应的用户特征向量和用户兴趣向量;利用融合用户兴趣偏好后推荐公式计算用户和所有职位的相似度;对相似度进行排序,选出最大相似度前n职位个推荐给用户。
为实现上述基于知识图谱人岗个性化匹配推荐方法,本发明还公开一种基于知识图谱人岗个性化匹配推荐***,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块、交叉压缩模块;
所述交叉压缩模块包括交叉压缩单元一和交叉压缩单元二;所述交叉压缩单元一用于自动学习用户与所述职位知识图谱的实体之间的高阶交互特征;所述交叉压缩单元二用于自动学习用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征;
所述用户-图谱实体交互模块用于学习用户和所述职位知识图谱的实体之间的三元组关系;
所述职位-图谱实体交互模块用于学习用户偏好的职位与所述职位知识图谱的职位实体之间的三元组关系;
所述推荐模块用于将用户与所述职位知识图谱的实体之间的高阶交互特征、用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征,以及用户偏好融合起来,预测用户与所述职位知识图谱的所有职位之间的交互得分。
本发明基于知识图谱人岗个性化匹配推荐***的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的基于知识图谱人岗个性化匹配推荐方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(SmartMedia card,SMC)、SD卡、闪存卡(Flash card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算仉程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储己经输出或者将要输出的数据。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (10)

1.一种基于知识图谱人岗个性化匹配推荐方法,其特征在于,该方法包括如下步骤:
步骤一:收集招聘企业发布的招聘职位信息,进行数据处理,并通过关系抽取得到招聘职位三元组,再进行知识融合,得到职位知识图谱;
步骤二:采集用户包括点击浏览、评论、收藏在内的历史求职行为数据,得到用户偏好的职位数据集合;
步骤三:将所述用户偏好的职位数据集合作为种子,应用RippleNet算法从所述职位知识图谱中获取多跳职位信息及其关系,得到用户与所述职位知识图谱的实体交互的三元组;
步骤四:构建并训练基于知识图谱并融合用户偏好的多任务推荐模型,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块;
通过用户-图谱实体交互模块,得到用户和所述知识图谱之间的关系;
通过职位-图谱实体交互模块,得到职位和图谱实体之间的相似度关系;
通过推荐模块,得到用户和职位交互的评分;
步骤五:根据所述用户和职位交互的评分,得出推荐给用户的职位排序列表。
2.根据权利要求1所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,所述步骤三中,用户与所述职位知识图谱的实体交互的三元组表示为<hu,ru,tu>,其中,hu是头实体,表示用户;ru是关系或属性;tu是尾实体;
通过用户-图谱实体交互模块,得到用户和所述知识图谱之间的关系,具体包括:
在用户-图谱实体交互模块中,将tu、ru分别通过深度神经网络进行信息提取,分别得到tu′、ru′;将hu与所述职位知识图谱中的用户集合u进行交叉压缩信息提取,分别得到hu′和u′;并将ru′与h u′输入深度神经网络,得到尾实体的预测值
Figure FDA0003990222420000011
最后使用相似度函数评估预测值
Figure FDA0003990222420000012
的预测结果。
3.根据权利要求2所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,所述招聘职位三元组表示为<hv,rv,tv>,其中,hv为头实体,表示职位;rv为从头实体到尾实体的关系;tv为尾实体;
通过职位-图谱实体交互模块,得到职位和图谱实体之间的相似度关系,具体包括:
在职位-图谱实体交互模块中,将rv和tv分别通过深度神经网络信息提取,分别得到tv′、rv′;将hv与所述职位知识图谱中的职位集合v进行交叉压缩信息提取,分别得到h v′和v′;并将rv′与h v′输入深度神经网络,得到尾实体的预测值
Figure FDA0003990222420000013
最后使用相似度函数评估预测值
Figure FDA0003990222420000021
的预测结果。
4.根据权利要求3所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,
在推荐模块中,将所述用户偏好的职位数据集合输入基于注意力机制的双向LSTM网络,得到用户兴趣偏好向量;并融合所述用户兴趣偏好向量、u′、v′;得到用户和所有职位的交互概率
Figure FDA0003990222420000022
5.根据权利要求4所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,基于知识图谱并融合用户偏好的多任务推荐模型训练完成后,保存用户特征向量、职位的特征向量及用户的兴趣偏好向量。
6.根据权利要求5所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,所述步骤五通过如下子步骤来实现:
根据用户ID,索引到对应的用户特征向量和用户兴趣向量;利用融合用户兴趣偏好后推荐公式计算用户和所有职位的相似度;对相似度进行排序,选出最大相似度前n职位个推荐给用户。
7.根据权利要求1所述的基于知识图谱人岗个性化匹配推荐方法,其特征在于,所述深度神经网络选用多层感知机。
8.一种基于知识图谱人岗个性化匹配推荐***,其特征在于,包括用户-图谱实体交互模块、推荐模块、职位-图谱实体交互模块、交叉压缩模块;
所述交叉压缩模块包括交叉压缩单元一和交叉压缩单元二;所述交叉压缩单元一用于自动学习用户与所述职位知识图谱的实体之间的高阶交互特征;所述交叉压缩单元二用于自动学习用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征;
所述用户-图谱实体交互模块用于学习用户和所述职位知识图谱的实体之间的三元组关系;
所述职位-图谱实体交互模块用于学习用户偏好的职位与所述职位知识图谱的职位实体之间的三元组关系;
所述推荐模块用于将用户与所述职位知识图谱的实体之间的高阶交互特征、用户偏好的职位与所述职位知识图谱的职位实体之间的高阶交互特征,以及用户偏好融合起来,预测用户与所述职位知识图谱的所有职位之间的交互得分。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述电子设备执行时,使得所述电子设备实现如权利要求1至7中任一项所述的基于知识图谱人岗个性化匹配推荐方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于知识图谱人岗个性化匹配推荐方法。
CN202211583266.4A 2022-12-09 2022-12-09 一种基于知识图谱人岗个性化匹配推荐方法及*** Pending CN116127186A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211583266.4A CN116127186A (zh) 2022-12-09 2022-12-09 一种基于知识图谱人岗个性化匹配推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211583266.4A CN116127186A (zh) 2022-12-09 2022-12-09 一种基于知识图谱人岗个性化匹配推荐方法及***

Publications (1)

Publication Number Publication Date
CN116127186A true CN116127186A (zh) 2023-05-16

Family

ID=86309021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211583266.4A Pending CN116127186A (zh) 2022-12-09 2022-12-09 一种基于知识图谱人岗个性化匹配推荐方法及***

Country Status (1)

Country Link
CN (1) CN116127186A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452169A (zh) * 2023-06-14 2023-07-18 北京华品博睿网络技术有限公司 一种在线招聘生成式推荐***及方法
CN117056458A (zh) * 2023-08-04 2023-11-14 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117112116A (zh) * 2023-10-16 2023-11-24 成都市蓉通数智信息技术有限公司 基于数字政务的用户管理***
CN117171428A (zh) * 2023-08-04 2023-12-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN118132616A (zh) * 2024-05-08 2024-06-04 江西工业贸易职业技术学院(江西省粮食干部学校、江西省粮食职工中等专业学校) 一种职业规划辅助分析方法及***
CN118193746A (zh) * 2024-02-19 2024-06-14 徐州市云鹤科技有限公司 一种基于大数据的知识图谱应用***

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452169A (zh) * 2023-06-14 2023-07-18 北京华品博睿网络技术有限公司 一种在线招聘生成式推荐***及方法
CN116452169B (zh) * 2023-06-14 2023-11-24 北京华品博睿网络技术有限公司 一种在线招聘生成式推荐***及方法
CN117056458A (zh) * 2023-08-04 2023-11-14 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117171428A (zh) * 2023-08-04 2023-12-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN117171428B (zh) * 2023-08-04 2024-04-05 北京网聘信息技术有限公司 一种提升搜索和推荐结果准确性的方法
CN117056458B (zh) * 2023-08-04 2024-04-19 北京网聘信息技术有限公司 基于向量空间算法进行前端检索的方法
CN117112116A (zh) * 2023-10-16 2023-11-24 成都市蓉通数智信息技术有限公司 基于数字政务的用户管理***
CN117112116B (zh) * 2023-10-16 2024-02-02 成都市蓉通数智信息技术有限公司 基于数字政务的用户管理***
CN118193746A (zh) * 2024-02-19 2024-06-14 徐州市云鹤科技有限公司 一种基于大数据的知识图谱应用***
CN118132616A (zh) * 2024-05-08 2024-06-04 江西工业贸易职业技术学院(江西省粮食干部学校、江西省粮食职工中等专业学校) 一种职业规划辅助分析方法及***
CN118132616B (zh) * 2024-05-08 2024-07-19 江西工业贸易职业技术学院(江西省粮食干部学校、江西省粮食职工中等专业学校) 一种职业规划辅助分析方法及***

Similar Documents

Publication Publication Date Title
Chen et al. Exploration of social media for sentiment analysis using deep learning
Shu et al. Host–parasite: Graph LSTM-in-LSTM for group activity recognition
CN116127186A (zh) 一种基于知识图谱人岗个性化匹配推荐方法及***
CN111931062B (zh) 一种信息推荐模型的训练方法和相关装置
CN111241311B (zh) 媒体信息推荐方法、装置、电子设备及存储介质
Guo et al. Efficient hyperparameter optimization for convolution neural networks in deep learning: A distributed particle swarm optimization approach
Kavasidis et al. An innovative web-based collaborative platform for video annotation
CN111680217B (zh) 内容推荐方法、装置、设备及存储介质
CN110442790A (zh) 推荐多媒体数据的方法、装置、服务器和存储介质
US20220171760A1 (en) Data processing method and apparatus, computer-readable storage medium, and electronic device
CN111400603A (zh) 一种信息推送方法、装置、设备及计算机可读存储介质
Wang et al. Deep user modeling for content-based event recommendation in event-based social networks
CN114201516B (zh) 一种用户画像构建的方法、信息推荐的方法以及相关装置
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及***
Ni et al. Comparative convolutional dynamic multi-attention recommendation model
Zhang et al. Emotion attention-aware collaborative deep reinforcement learning for image cropping
Zhu et al. Multimodal emotion classification with multi-level semantic reasoning network
Sun et al. Multi-interest sequence modeling for recommendation with causal embedding
Zhang et al. Hybrid structural graph attention network for POI recommendation
Zhang et al. Probabilistic matrix factorization recommendation of self-attention mechanism convolutional neural networks with item auxiliary information
CN113407704A (zh) 文本匹配方法、装置、设备及计算机可读存储介质
Gao et al. Sequential label enhancement
Chang et al. Personalized Chinese Course Recommendation Model of Online Vocational Education Learning Platform based on Collaborative Filtering Algorithm
Song Aspect-Based Sentiment Analysis on Mobile Game Reviews Using Deep Learning
Rubinovitz News Matter: Embedding human intuition in machine intelligence through interactive data visualizations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination