CN117076484B - 基于时序知识图谱的人力资源数据分析方法 - Google Patents

基于时序知识图谱的人力资源数据分析方法 Download PDF

Info

Publication number
CN117076484B
CN117076484B CN202311129301.XA CN202311129301A CN117076484B CN 117076484 B CN117076484 B CN 117076484B CN 202311129301 A CN202311129301 A CN 202311129301A CN 117076484 B CN117076484 B CN 117076484B
Authority
CN
China
Prior art keywords
index
data
knowledge graph
calculation
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311129301.XA
Other languages
English (en)
Other versions
CN117076484A (zh
Inventor
杜鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202311129301.XA priority Critical patent/CN117076484B/zh
Publication of CN117076484A publication Critical patent/CN117076484A/zh
Application granted granted Critical
Publication of CN117076484B publication Critical patent/CN117076484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于时序知识图谱的人力资源数据分析方法,该方法包括:S101:建立人力资源时序数据知识图谱,该人力资源时序数据知识图谱包括节点、边和该节点的属性;S102:同步分析事实数据,将变更的事实数据同步到人力资源时序数据知识图谱中;S103:同步分析指标数据,将增加的指标数据同步到人力资源时序数据知识图谱中;S104:建立数据分析方法,包括统计、检索和推荐,获取数据分析结果。通过增量更新的方式来适应需求和数据源的变化,显著提升了人力资源数据统计、检索及推荐分析方法的适应性和灵活性,解决了人力资源分析数据管理的有效性,实现了分析事实数据和分析指标数据的同步更新,对指标、度量和事实数据的随时间变更更新有较强的适应性。

Description

基于时序知识图谱的人力资源数据分析方法
技术领域
本申请属于数据处理技术领域,具体涉及基于时序知识图谱的人力资源数据分析方法。
背景技术
人力资源数据分析常用的模型有关系模型和多维数据集,基于不同数据模型表示的数据分析技术具有其各自特征和适应特性。
基于关系模型的数据分析采用实体关系模型建模数据分析中的指标和度量,指标以层次型的指标表来存储,度量存储在事实表中,事实表与指标表之间采用主外键关系的方式建立联系,数据分析一般基于SQL实现,事实表和指标表之间的关联采用多表关联JOIN实现,这种方式可基于现有的事务数据直接构建,数据同步代价小,且采用SQL来访问可以适应灵活多变的数据分析需求。但是,时间度量与其它度量之间的隐含关系被削弱,基于关系模型的数据分析采用多表关联的方式实现,数据量大或计算量大时***性能下降明显,同时采用主外键的建模方式结构固化,分析需求变更引起的指标或度量变化时,对应表结构的变化代价较大。
基于多维数据集的数据分析采用传统数据仓库中的建模方法实现,指标和度量分别建模为多维数据集中的指标和度量,采用专用的ETL工具将数据定期抽取到数据仓库中,形成多维数据集,形成了对应的维度和事实数据。基于多维数据集的数据分析采用专门的多维查询语言实现,此种方式专门针对大规模多维数据分析的场景设计,数据分析操作友好、性能良好。但是,基于多维数据集的数据分析,指标和度量需要在建模时确定,模型指标维度固定,且数据同步时一般以全量生成为主,对随时间变化的数据和由于需求变化带来的指标的变化不友好。基于知识图谱的信息检索代表性的方法有基于实体链接的检索和基于关系路径的检索。
基于实体链接的检索是基于实体之间的识别信息,将同一实体链接在一起,形成识别链,实现对实体的链接检索。由于实体可以具有丰富的属性信息,如词性、分类、属性值等,因此可以直接利用实体属性信息进行检索。
基于关系路径的检索是基于关系连接的路径,将关系路径转化成查询语句,然后对实体的属性信息进行检索。通过解析关系路径,可以得到一系列的条件约束,然后再利用这些约束条件进行查询,从而实现信息检索。常用的序列推荐模型有基于马尔科夫链的推荐模型和基于深度学习的推荐模型。
基于马尔科夫链的推荐模型,可以把一个状态到另外一个状态的转移概率计算出来,随机过程相关状态如果向之前的状态推广,那么过程中的每个状态的转移依赖于之前的n个状态,此模型就为n阶模型。当n为1时,每个状态的转移都只依赖于前一个状态。使用一阶马尔科夫条件概率转移矩阵可以捕获序列特征,有效利用了时序数据的顺序信息。使用高阶马尔科夫链的方法,并构建概率转移矩阵用于计算序列的转移概率,可以捕获短期序列隐含的规律特点,能够一定程度上解决数据稀疏和“冷用户”的问题。但是,序列串长不固定时,采用固定阶数的传统马尔科夫链模型并不能准确地对序列隐含的规律行为建模,转移矩阵是稀疏矩阵,采用什么样的数据结构来存储转移矩阵需要根据特定使用场景进行设计。
基于深度学习的推荐模型,使用循环神经网络的模型对时序数据中时间依赖关系进行学习,经常会面临梯度消失的难题,循环的神经网络在序列的长期依赖建模能力上相对较弱,虽然使用LSTM和GRU可以改进这方面的问题,但序列数据项之间是互相依赖的,使得并行计算困难,很容易产生伪依赖;基于卷积神经网络的模型没有严格的顺序性假设,降低了基于循环的神经网络模型强顺序依赖性,但由于模型中滤波器尺寸的限制,此类模型难以处理和学习序列中的长期依赖关系;基于图卷积神经网络的模型能够通过图结构学习捕获序列数据之间的复杂转移关系,具有较强的可解释性,但由于图的复杂性,模型的计算复杂度相对较高;现有的深度学习推荐模型虽然考虑任职岗位的前后顺序问题,但没有把岗位的任职时间这个关键因素纳入模型,导致计算结果偏离现实中人岗推荐的实际需求。
发明内容
有鉴于此,一些实施例公开了基于知识图谱的人力资源时序数据分析方法,该方法包括:
S101:建立人力资源时序数据知识图谱,该人力资源时序数据知识图谱包括节点、边和该节点的属性;其中,节点包括基础指标、计算指标和分析对象,边是指节点之间的关系;
S102:同步分析事实数据,将变更的事实数据同步到人力资源时序数据知识图谱中;
S103:同步分析指标数据,将增加的指标数据同步到人力资源时序数据知识图谱中;
S104:建立数据分析方法,获取数据分析结果。
进一步,一些实施例公开的基于知识图谱的人力资源时序数据分析方法,基础指标是指不可分解的指标分类。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,计算指标是指由多个基础分类指标组合而成的指标分类。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,边包括计算指标与基础指标之间的计算关系,计算指标与分析对象之间的计算关系,以及分析对象与基础指标之间的所属关系。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,分析对象与基础指标之间的时间关系,通过起始时间和结束时间表示有效时间范围。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,同步分析事实数据具体包括:
增加分析对象:在人力资源时序数据知识图谱中添加分析对象的节点,并对添加的分析对象运行所有基础指标的计算逻辑,并与满足条件的基础指标、计算指标通过添加边建立关系;
修改分析对象:同步修改信息到人力资源时序数据知识图谱中的对应节点,并对该分析对象运行所有基础指标的计算逻辑,添加或删除基础指标、计算指标与该分析对象的关系;
删除分析对象:删除人力资源时序数据知识图谱中的对应节点,同步删除与该对应节点连接的所有边。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,同步分析指标数据具体包括:
添加基础指标:在人力资源时序数据知识图谱中添加基础指标类型的节点,对人力资源时序数据知识图谱中所有的分析对象运行该添加的基础指标的运算逻辑,并根据计算结果添加边;
添加计算指标:在人力资源时序数据知识图谱中添加计算指标类型的节点。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,建立的数据分析方法包括基于基础指标的数据分析方法和基于计算指标的数据分析方法。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,基于基础指标的数据分析方法包括:
以所述基础指标为起点,获取所述基础指标所指向的所有分析对象实体节点;
通过计数求得基础指标的统计结果。
一些实施例公开的基于知识图谱的人力资源时序数据分析方法,基于计算指标的数据分析方法包括:
以所述计算指标为起点,获得所述计算指标所指向的计算指标或基础指标;
计算所指向的所有基础指标对应的分析对象集合;
合并全部结果得到所述计算指标对应的分析对象集合;
在所述分析对象集合基础上计数或进行相关计算,得到基于计算指标的数据分析结果;
分析对象集合的计算指标或基础指标时间序列,预测具体分析对象的计算指标或基础指标时间序列的未来值。
本发明实施例公开的人力资源时序数据分析方法基于建立的人力资源时序数据知识图谱进行数据分析,能够动态实现分析事实数据和分析指标数据的同步更新,有效提高了数据建模的灵活性和有效性,对指标、度量和事实数据的随机变更更新有较强的适应性,特别是对于指标随需求随时变化、随人力资源业务数据随机变化的场景,基于时序知识图谱的人力资源数据分析方法通过增量更新的方式来适应需求和数据源的变化,显著提升了人力资源数据分析方法的适应性和灵活性,在人力资源时序数据分析技术领域有良好应用前景。
附图说明
图1、基于知识图谱的人力资源时序数据分析方法流程图;
图2、实施例2人力资源时序数据知识图谱示意图;
图3、实施例3干部、岗位、单位、考核时序知识图谱示意图;
图4、实施例4人力资源时序知识图谱信息检索结果示意图;
图5、实施例5干部任职时序知识图谱岗位关系示意图;
图6、实施例5干部、岗位及属性之间关系的异质图。
具体实施方式
在这里专用的词“实施例”,作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。本申请实施例中性能指标测试,除非特别说明,采用本领域常规试验方法。应理解,本申请中所述的术语仅仅是为描述特别的实施方式,并非用于限制本申请公开的内容。
除非另有说明,否则本文使用的技术和科学术语具有本申请所属技术领域的普通技术人员通常理解的相同含义;作为本申请中其它未特别注明的试验方法和技术手段均指本领域内普通技术人员通常采用的实验方法和技术手段。
本文所用的术语“基本”和“大约”用于描述小的波动。例如,它们可以是指小于或等于±5%,如小于或等于±2%,如小于或等于±1%,如小于或等于±0.5%,如小于或等于±0.2%,如小于或等于±0.1%,如小于或等于±0.05%。在本文中以范围格式表示或呈现的数值数据,仅为方便和简要起见使用,因此应灵活解释为不仅包括作为该范围的界限明确列举的数值,还包括该范围内包含的所有独立的数值或子范围。例如,“1~5%”的数值范围应被解释为不仅包括1%至5%的明确列举的值,还包括在所示范围内的独立值和子范围。因此,在这一数值范围中包括独立值,如2%、3.5%和4%,和子范围,如1%~3%、2%~4%和3%~5%等。这一原理同样适用于仅列举一个数值的范围。此外,无论该范围的宽度或所述特征如何,这样的解释都适用。
在本文中,包括权利要求书中,连接词,如“包含”、“包括”、“带有”、“具有”、“含有”、“涉及”、“容纳”等被理解为是开放性的,即是指“包括但不限于”。只有连接词“由……构成”和“由……组成”是封闭连接词。
为了更好的说明本申请内容,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在实施例中,对于本领域技术人员熟知的一些方法、手段、仪器、设备等未作详细描述,以便凸显本申请的主旨。
在不冲突的前提下,本申请实施例公开的技术特征可以任意组合,得到的技术方案属于本申请实施例公开的内容。
以下结合实施例以及附图1、2、3、4、5、6对技术细节做进一步示例性说明。
在一些实施方式中,一些实施例公开了基于知识图谱的人力资源时序数据分析方法,该方法包括:
S101:建立人力资源时序数据知识图谱,该人力资源时序数据知识图谱包括节点、边和该节点的属性;其中,节点包括基础指标、计算指标和分析对象,边是指节点之间的关系;
S102:同步分析事实数据,将变更的事实数据同步到人力资源时序数据知识图谱中;
S103:同步分析指标数据,将增加的指标数据同步到人力资源时序数据知识图谱中;
S104:建立数据分析方法,获取数据分析结果。
一般地,人力资源时序数据知识图谱包括有节点、边和属性,其中的节点包括基础指标、计算指标和分析对象这些一类节点要素。
一般地,分析对象是指人力资源管理***中的每一个成员,是一个最基本的度量。作为可选实施例,可以添加分析对象的属性扩展度量内容,例如添加分析对象的年龄属性、收入属性,能够在计算时度量分析对象的平均年龄或总收入。
一般地,基础指标代表一个业务分析需要对分析对象进行的一种基础分类,这种分类方式不可再进行分解为其他指标分类,例如,汉族代表对人力资源管理对象从民族角度的一个基础分类。一般地,每一个基础指标类型的节点中保存计算逻辑F_T,描述能够与此节点建立关系的分析对象特征。
一般地,计算指标代表一个业务分析需要对分析对象进行的一种分类方式,该分类方式可以由多个基础分类方式组合而成,组合方式可以通过计算表示。例如,“少数民族”代表所有非汉族的民族的一种组合,一般地,每一个计算指标类型的节点中保存计算逻辑F_C,描述了能够与此建立指标关系的基础指标。
一般地,边是指人力资源时序数据知识图谱中节点之间的关系,例如,边包括计算指标与基础指标之间的计算关系,计算指标与分析对象之间的计算关系,分析对象与基础指标之间的所属关系。
一般地,建立人力资源分析数据知识图谱的过程包括:分析事实数据和指标数据,确定节点内容和节点之间的关系,确定节点的属性,确定节点之间关系的表达方式,基于确定的节点、节点关系和属性内容,构建人力资源时序数据知识图谱。
作为可选实施例,对于存在时间因素的关系,通过起始时间和结束时间表示有效时间范围。例如,在关系上通过属性的开始时间和结束时间表示此关系的有效时间范围;也可以通过级别的开始时间和结束时间表示此关系的有效时间范围。
作为可选实施例,分析对象与计算指标之间的时间关系,如果组成计算指标的基础指标分别与分析对象之间有时间关系,则通过起始时间和结束时间的交集表示有效时间范围;如果组成计算指标的基础指标与分析对象之间有的有时间关系,有的无时间关系,则通过起始时间与结束时间的并集表示有效时间范围。
作为可选实施例,同步分析事实数据具体包括:
增加分析对象:在人力资源时序数据知识图谱中添加分析对象的节点,并对添加的分析对象运行所有基础指标的计算逻辑,并与满足条件的基础指标、计算指标通过添加边建立关系;
修改分析对象:同步修改信息到人力资源时序数据知识图谱中的对应节点,并对该分析对象运行所有基础指标的计算逻辑,添加或删除基础指标、计算指标与该分析对象的关系;
删除分析对象:删除人力资源时序数据知识图谱中的对应节点,同步删除与该对应节点连接的所有边。
作为可选实施例,同步分析指标数据具体包括:
基础指标的添加:在人力资源时序数据知识图谱中添加基础指标类型的节点,对人力资源时序数据知识图谱中所有的分析对象运行该添加的基础指标的运算逻辑,并根据计算结果添加边;
计算指标的添加:在人力资源时序数据知识图谱中添加计算指标类型的节点。
作为可选实施例,建立的数据分析方法包括基于基础指标的数据分析方法和基于计算指标的数据分析方法。
作为可选实施例,基于基础指标的数据分析方法包括:以该基础指标为起点,获取该基础指标所指向的所有分析对象实体节点;通过计数求得基础指标对应的所有分析对象实体的统计结果。例如,求“汉族”人员的数量,可以通过对节点列表相应属性进行运算得到,求“汉族”人员的平均年龄,可以针对有时序关系的基础指标进行计算,通过基于关系上的时间进行过滤的方式来实现。
作为可选实施例,基于计算指标的数据分析方法包括:
以该计算指标为起点,获得该计算指标所指向的计算指标或基础指标;
计算对应的所有基础指标对应的分析对象集合;
合并全部结果得到所述计算指标对应的分析对象集合;
在分析对象集合基础上计数或进行相关计算,得到基于计算指标的数据分析结果;例如,求“处级干部”人员的平均年龄,首先要得到所有的处级干部类别,然后得到每个级别的人员集合,将所有处级干部的人员集合进行合并,得到全部“处级干部”的集合,再求年龄平均值即可。
作为可选实施例,多指标检索方法包括:
设定检索信息;
从人力资源库中进行信息检索;
利用知识图谱对筛选项进行结构化信息展示。
作为可选实施例,基于特定对象多指标的匹配推荐方法包括:
以具体分析对象实体节点为起点,按照时间先后顺序循环获取由基础指标或计算指标串起的序列集合;
构建对象集合的计算指标或基础指标时间序列矩阵;
把序列集合中的样本序列输入基于图神经网络的序列预测模型,训练得到对应的指标预测结果,根据匹配程度优化指标预测模型和参数;
将目标对象指标序列输入序列预测模型,通过匹配度预测目标对象的指标更新选项的最优结果。
实施例1
实施例1中实现人力资源时序知识图谱的构建,以G=(C,B,O,R,T,P)表示人力资源分析数据知识图谱,其中,其中C、B和O均为G中的一类节点,B表示基础指标,C表示计算指标,O表示分析对象,R为G中的边,表示指标与对象之间的关系,T为时间关系,P为C、B、O的属性。
1.时序知识图谱的构建
(1)O:分析对象,主要是人力资源管理***中的每个人员。是一个最基本的度量,同时可以添加分析对象的属性来扩展度量内容,比如添加分析对象的年龄、收入属性,可以在计算时度量分析对象的平均年龄或总收入。
(2)B:基础指标,代表一个业务分析需要对分析对象的一种基础分类方式,此种分类方式不可再进行分解。比如“汉族”代表对人力资源管理对象从民族角度的一个基础分类。每个B类型的节点中保存计算逻辑F_T,描述了能够与此节点建立关系的分析对象特征。
(3)C:计算指标,代表一个业务分析需要对分析对象的一种分类方式,此种分类方式可以由多个基础分类方式组合而成,组合方式通过计算可以表示。比如“少数民族”代表所有非汉族的民族的一种组合。每个C类型的节点中保存计算逻辑F_C,描述了能够与此指标建立关系的基础指标。
(4)R:G中节点间的关系,一种是C和B间的关系,表示C由B计算而来,另一种是B与O间的关系,表示O属于此B分类。
(5)T:时间,通过属性startDate、endDate来表示时间范围,比如职级通过startDate和endDate来表示其生效和失效的时间。
(6)P:O、B、C的特征属性,代表分析对象、基础指标或计算指标的一种特征分类,比如基础指标“苗族”的特征分类是“少数民族”。
2.分析事实数据同步
分析事实数据一般保存在业务***的数据库中,通常存储在关系数据库中。数据的变更随机,数据发生变更后,需要及时同步到分析知识图谱中,以反映最新的数据情况。
新增人员:在知识图谱中添加O类型的节点,代表新增的人员。对此对象运行所有基础指标的计算逻辑,并与满足条件的指标通过添加边来建立关系;
修改人员:同步信息到知识图谱中的对应节点。对此对象运行所有基础指标的计算逻辑,通过添加或删除基础指标与此对象的关系来同步其间的关系;
删除人员:删除知识图谱中的对应节点,同步删除与此节点连接的所有边。
3.分析指标数据同步
分析指标数据通常代表一种业务关注点,是对管理的数据对象的一种分类方式,通常会通过添加指标来满足新的分析需求。
基础指标添加:在知识图谱中添加B类型的节点表示新添加的基础指标,对当前知识图谱中所有的分析对象运行新添加指标的运算逻辑,并根据计算结果来添加边,建立关系,赋值时间;
计算指标添加:在知识图谱中添加C类型的节点表示新添加的计算指标。
实施例2
实施例2中实现人力资源时序知识图谱的数据统计计算模型,建立数据统计计算方法,用于满足不同场景数据统计的需要。
基础指标运行:要计算某个基础指标,只需要以此指标为起点,获取此指标指向的所有实体节点即可,通过计数可以求指标的统计结果,例如求“汉族”人员的个数,通过对节点列表相应属性运算即可,例如求“汉族”人员的平均年龄。针对有时序关系的基础指标计算,可以通过基于关系上的时间进行过滤的方式来实现。
计算指标运行:要计算某个计算指标,首先以此计算指标为起点,得到全部指向的计算或基础指标,计算对应的所有基础指标对应的人员集合,然后通过合并全部结果得到计算指标对应的人员集合,再在此集合上计数或进行相关计算,即可得到计算指标的运行结果,例如求“少数民族”人员的平均年龄,首先需要得到全员少数民族,然后得到每个民族的人员集合,合并后得到全部“少数民族”的集合,再求年龄平均值即可。
多指标统计:计算结果result=count({o,where o has relation with b_1}∪{o,where o has relation with b_2}∩{o,when t in the duration from startdate1to enddate2})。
多指标度量:计算结果result=f({o,where o has relation with b_1}U{o,where o has relation with b_2}∩{o,when t in the duration from startdate1 toenddate2},p),其中,f是对属性p的计算,可以为求和sum、求最大值max、求最小值min、求平均值avg等操作。
如图2所示,给出一个具体事例,人力资源数据知识图谱包括的分析对象为张三、李四、王五、赵七,基础指标为汉族、布依族、处级、局级,计算指标为少数民族、管理干部,节点属性为实体描述、类型等,边包括如下关系:民族所属关系、干部所属关系、级别所属关系、以及任职时间、免职时间;例如,张三、李四是汉族;王五是布依族,属于少数民族;王五任处级的时间为2010年10月,免处级的时间为2015年12月,任局级的时间为2015年12月,免局级的时间为2018年6月;赵七任局级的时间为2016年11月,免局级的时间为2021年3月。
实施例2中实现人力资源数据的指标统计,统计“汉族”人员的数量,可以通过对节点列表的“汉族”节点的入度及时间进行运算,得到数量为2。
实施例2中实现人力资源数据的指标度量,任“局级”最长时间,可通过对节点列表的“局级干部人才”节点的入度和时间跨度进行运算,得到结果为4.4年。
实施例3
实施例3中实现人力资源时序知识图谱的数据检索模型,建立数据检索计算方法,用于满足不同场景数据检索的需要。
多指标检索:计算结果result=select({o,where o has relation with b_1}∪{o,where o has relation with b_2}∩{o,when t in the duration from startdate1to enddate2})。
如图3所示,给出一个具体事例,人力资源时序数据知识图谱包括的分析对象为李四、王五、赵七,计算指标为管理干部,基础指标为第一分公司、第二分公司、第三分公司、班组、部门经理、分公司经理、考核结果,节点属性为生产一线经历、奖励、专业技术,边包括如下关系:干部任职隶属关系、职级隶属关系、考核隶属关系以及任职务或任职级的任职时间、免职时间、考核优秀和称职的时间段等关系;例如,李四、王五工作单位曾隶属第一分公司;王五、赵七工作单位曾隶属第二分公司,赵七工作单位曾隶属第三分公司和总公司;王五在第一分公司曾是组长和部门副经理,组长任职时间为2013年2月,免职时间为2018年5月,副经理任职时间为2018年5月,免职时间为2022年7月,王五2019年、2020年、2021年考核均为优秀。赵七任经理的时间开始于2003年2月,在第二分公司任部门经理的时间为2004年5月,在第二分公司免部门经理的时间为2006年6月,在第二分公司任副总经理的时间为2006年6月,在第二分公司免副总经理的时间为2013年1月,在第三分公司任副总经理的时间为2013年1月,在第三分公司免副总经理的时间为2016年9月,赵七在总公司任总经理的时间为2016年9月至2022年3月,赵七2019年、2020年、2021年考核结果分别为称职、称职和优秀。
实施例3中实现人力资源数据的信息检索,检索卫健***连续三年考核优秀副处级的实体对象列表,可通过对节点列表的“第二分公司-副经理-年度考核优秀”的入度和时间进行聚合运算,得到第二分公司近三年考核优秀的副经理干部人才实体对象,如图4所示,对应的分析实体对象为王五。
实施例4
实施例4给出一个基于以G=(C,B,O,R,T,P)表示的人力资源时序知识图谱进行数据分析的方法,设定分析对象O代表人员,计算指标C代表岗位,T代表人员在岗位的任职时间,P代表人员、岗位的属性。构建人岗及属性的异质图。
通过随机游走生成由人员对象o(i)的若干时间序列。序列蕴涵了人员和岗位之间关联信息,应用分布假说,即一个岗位的对人员的需求条件可由岗位时间序列中前后若干岗位反映出来。基于bert和预训练模型的方法,利用人员和岗位特征表示来预测上下文节点。岗位的特征表示向量是随机初始化的,在训练模型过程中,特征向量不断优化,直至可较为准确地预测上下文节点。此时,节点特征向量已经蕴涵了图中的关联结构信息。考虑到该异质网络的计算指标是多类型的及边的时间变化,采用基于岗位序列路径随机游走方法,可针对各种类型的节点生成含有语义的异质邻居。给定任职序列,从类型为c(j)的节点出发,随机游走,下一步只会访问类型为c(j+1)的节点。元路径指导的随机游走在网络上生成节点序列,将节点序列输入模型中进行训练。
人员o(i)的任职时间序列G表示为:G(o(i)):<o(i),c(1),t(1)>-><o(i),c(2),t(2)>-><o(i)游走在网,c(j),t(k)>。其中,i为人员ID,j,k为人员任职岗位的序号及任职时间的序号。
由于人员与岗位均为图中的节点,利用上述过程得到人员与岗位的特征表示向量,即可进行人岗关系分析。人岗关系分析的核心为计算人员节点与岗位节点的特征向量的相似度。人岗匹配程度通过计算相应向量的余弦相似度或内积进行量化。对于岗位推荐,视其为链接预测任务,通过人岗关系数据,在特征向量的基础上预训练分类模型,可判断网络中哪些人岗存在潜在的链接,即人岗适配。
如图5所示,给出一个具体事例,人力资源时序知识图谱包含分析对象刘一、钱二、张三、李四、王五、孙六、赵七;计算指标为岗位,包含组织部副科、杨柳镇副处、卫健委正处、国企总经理、区直单位副局等;基础指标包含组织部、教委、卫健委、杨柳镇、区直单位等和副科、正科、副处、正处、副局等;边包括计算指标之间的时序关系。
实施例4基于人力资源时序知识图谱构建人岗关系异质图进行对比学习实现信息推荐,例如人岗关系异质图N={人员,岗位,任职时间},其中人员W=(workerid,properties),其中属性值包括年龄、学历、民族、政治面貌等特征信息,岗位S=(roleid,properties),其中属性值包括类别、级别等特征信息,任职时间T=(workerid,roleid,duration),其中任职时间duration由begindate和enddate换算得出。
如图6所示,使用图5的部分数据构建人岗关系异质图,包括人员对象张三、李四、王五,岗位对象包括团委正科、马镇副处、国企总经理、区直单位副局等,人员的属性为民族,岗位的属性为类别。
本发明实施例公开的人力资源时序数据分析方法基于建立的人力资源时序数据知识图谱进行数据分析,能够动态实现分析事实数据和分析指标数据的同步更新,有效提高了数据建模的灵活性和有效性,对指标、度量和事实数据的随机变更更新有较强的适应性,特别是对于指标随需求随时变化、随人力资源业务数据随机变化的场景,基于知识图谱的人力资源时序数据分析方法通过增量更新的方式来适应需求和数据源的变化,显著提升了人力资源时序数据分析方法的适应性和灵活性,在人力资源时序数据分析技术领域有良好应用前景。
本申请公开的技术方案和实施例中公开的技术细节,仅是示例性说明本申请的发明构思,并不构成对本申请技术方案的限定,凡是对本申请公开的技术细节所做的常规改变、替换或者组合,都与本申请具有相同的发明构思,都在本申请权利要求的保护范围之内。

Claims (7)

1.基于时序知识图谱的人力资源数据分析方法,其特征在于,该方法包括:
S101:建立人力资源时序数据知识图谱的方法,所述人力资源时序数据知识图谱包括节点、边和所述节点的属性;其中,所述节点包括基础指标、计算指标和分析对象;所述基础指标是不可分解的指标分类,所述计算指标是指由多个基础指标组合而成的指标分类,所述分析对象是指人力资源管理***中的每一个成员;所述边是指所述节点之间的关系,包括分析对象与基础指标之间的所属关系、计算指标与基础指标之间的计算关系和计算指标与分析对象之间的计算关系;
S102:同步分析事实数据,将变更的事实数据同步到所述人力资源时序数据知识图谱中;
S103:同步分析指标数据,将增加的指标数据同步到所述人力资源时序数据知识图谱中;
S104:建立数据分析方法,获取数据分析结果;具体地,所述数据分析方法为基于特定对象多指标的匹配推荐方法,包括:
以具体分析对象实体节点为起点,按照时间先后顺序循环获取由基础指标或计算指标串起的序列集合;
构建对象集合的计算指标或基础指标时间序列矩阵;
把序列集合中的样本序列输入基于图神经网络的序列预测模型,训练得到对应的指标预测结果,根据匹配程度优化指标预测模型和参数;
将目标对象指标序列输入序列预测模型,通过匹配度预测目标对象的指标更新选项的最优结果;
以G=(C,B,O,R,T,P)表示的人力资源时序知识图谱进行数据分析,设定分析对象O代表人员,计算指标C代表岗位,T代表人员在岗位的任职时间,P代表人员、岗位的属性;B代表基础指标,R表示节点之间关系;
构建人岗及属性的异质图;
通过随机游走生成由人员对象o(i)的若干时间序列;
基于bert和预训练模型的方法,利用人员和岗位特征表示来预测上下文节点;
给定任职序列,从类型为c(j)的节点出发,随机游走,下一步只访问类型为c(j+1)的节点;
元路径指导的随机游走在网络上生成节点序列,将节点序列输入模型中进行训练;
人员o(i)的任职时间序列G表示为:G(o(i)):<o(i) ,c(1) ,t(1)>-><o(i) ,c(2) ,t(2)>-><o(i)游走在网,c(j) ,t(k)>;其中,i为人员ID,j,k为人员任职岗位的序号及任职时间的序号;
利用上述过程得到人员与岗位的特征表示向量,进行人岗关系分析。
2.根据权利要求1所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述分析对象与基础指标之间的时间关系,以及所述分析对象与所述计算指标之间的时间关系,通过起始时间和结束时间表示有效时间范围。
3.根据权利要求1所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述步骤S102具体包括:
增加分析对象:在人力资源时序数据知识图谱中添加分析对象的节点,并对添加的分析对象运行所有基础指标的计算逻辑,并与满足条件的基础指标、计算指标通过添加边建立关系;
修改分析对象:同步修改信息到人力资源时序数据知识图谱中的对应节点,并对该分析对象运行所有基础指标的计算逻辑,添加或删除基础指标、计算指标与该分析对象的关系;
删除分析对象:删除人力资源时序数据知识图谱中的对应节点,同步删除与该对应节点连接的所有边。
4.根据权利要求1所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述步骤S103具体包括:
添加基础指标:在人力资源时序数据知识图谱中添加基础指标类型的节点,对人力资源时序数据知识图谱中所有的分析对象运行该添加的基础指标的运算逻辑,并根据计算结果添加边;
添加计算指标:在人力资源时序数据知识图谱中添加计算指标类型的节点。
5.根据权利要求1所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述步骤S104中,数据分析方法包括基于基础指标的数据分析方法和基于计算指标的数据分析方法。
6.根据权利要求5所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述基于基础指标的数据分析方法包括:
以所述基础指标为起点,获取所述基础指标所指向的所有分析对象实体节点;
通过计数求得基础指标的统计结果。
7.根据权利要求5所述的基于时序知识图谱的人力资源数据分析方法,其特征在于,所述基于计算指标的数据分析方法包括:
以所述计算指标为起点,获得所述计算指标所指向的计算指标或基础指标;
计算所指向的所有基础指标对应的分析对象集合;
合并全部结果得到所述计算指标对应的分析对象集合;
在所述分析对象集合基础上计数或进行相关计算,得到基于计算指标的数据分析结果;
分析对象集合的计算指标或基础指标时间序列,预测具体分析对象的计算指标或基础指标时间序列的未来值。
CN202311129301.XA 2023-09-04 2023-09-04 基于时序知识图谱的人力资源数据分析方法 Active CN117076484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311129301.XA CN117076484B (zh) 2023-09-04 2023-09-04 基于时序知识图谱的人力资源数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311129301.XA CN117076484B (zh) 2023-09-04 2023-09-04 基于时序知识图谱的人力资源数据分析方法

Publications (2)

Publication Number Publication Date
CN117076484A CN117076484A (zh) 2023-11-17
CN117076484B true CN117076484B (zh) 2024-04-19

Family

ID=88719429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311129301.XA Active CN117076484B (zh) 2023-09-04 2023-09-04 基于时序知识图谱的人力资源数据分析方法

Country Status (1)

Country Link
CN (1) CN117076484B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125352A (zh) * 2019-12-23 2020-05-08 同方知网(北京)技术有限公司 一种基于知识图谱的关联数据可视化数据驾驶舱构建方法
CN111966836A (zh) * 2020-08-29 2020-11-20 深圳呗佬智能有限公司 知识图谱向量表示方法、装置、计算机设备及存储介质
WO2021051630A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于数据关系分析的知识融合方法、装置、计算机设备和存储介质
CA3119416A1 (en) * 2019-11-25 2021-05-25 Intuit Inc. Combining statistical methods with a knowledge graph
CN113012803A (zh) * 2019-12-19 2021-06-22 京东方科技集团股份有限公司 计算机设备、***、可读存储介质及医学数据分析方法
CN114331679A (zh) * 2021-12-29 2022-04-12 中国工商银行股份有限公司 数据问题的分析方法及相关装置
CN114416891A (zh) * 2022-03-28 2022-04-29 支付宝(杭州)信息技术有限公司 在知识图谱中进行数据处理的方法、***、装置和介质
CN114911943A (zh) * 2021-10-29 2022-08-16 上海宝信软件股份有限公司 基于知识图谱的经营指标体系构建方法和***
CN115062779A (zh) * 2022-05-24 2022-09-16 中国科学院自动化研究所 基于动态知识图谱的事件预测方法及装置
CN115238094A (zh) * 2022-07-26 2022-10-25 北京元年科技股份有限公司 基于知识图谱的指标数据分析方法、装置、设备及介质
CN115757813A (zh) * 2022-10-28 2023-03-07 浙江工业大学 一种基于故障时序知识图谱的装备剩余寿命预测方法
CN116340541A (zh) * 2023-03-30 2023-06-27 广州凡拓数字创意科技股份有限公司 一种文博知识图谱***构建方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021051630A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于数据关系分析的知识融合方法、装置、计算机设备和存储介质
CA3119416A1 (en) * 2019-11-25 2021-05-25 Intuit Inc. Combining statistical methods with a knowledge graph
CN113012803A (zh) * 2019-12-19 2021-06-22 京东方科技集团股份有限公司 计算机设备、***、可读存储介质及医学数据分析方法
CN111125352A (zh) * 2019-12-23 2020-05-08 同方知网(北京)技术有限公司 一种基于知识图谱的关联数据可视化数据驾驶舱构建方法
CN111966836A (zh) * 2020-08-29 2020-11-20 深圳呗佬智能有限公司 知识图谱向量表示方法、装置、计算机设备及存储介质
CN114911943A (zh) * 2021-10-29 2022-08-16 上海宝信软件股份有限公司 基于知识图谱的经营指标体系构建方法和***
CN114331679A (zh) * 2021-12-29 2022-04-12 中国工商银行股份有限公司 数据问题的分析方法及相关装置
CN114416891A (zh) * 2022-03-28 2022-04-29 支付宝(杭州)信息技术有限公司 在知识图谱中进行数据处理的方法、***、装置和介质
CN115062779A (zh) * 2022-05-24 2022-09-16 中国科学院自动化研究所 基于动态知识图谱的事件预测方法及装置
CN115238094A (zh) * 2022-07-26 2022-10-25 北京元年科技股份有限公司 基于知识图谱的指标数据分析方法、装置、设备及介质
CN115757813A (zh) * 2022-10-28 2023-03-07 浙江工业大学 一种基于故障时序知识图谱的装备剩余寿命预测方法
CN116340541A (zh) * 2023-03-30 2023-06-27 广州凡拓数字创意科技股份有限公司 一种文博知识图谱***构建方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于科学知识图谱的国际人力资源管理研究前沿的可视化分析;李作学;齐艳霞;王永东;;沈阳航空航天大学学报;20170625(03);第92-98页 *
基金行业知识图谱的构建与应用;赵紫英;张化军;刘振业;;金融纵横;20200825(08);第11-17页 *
孙睿.复杂网络演化和网络舆论传播模型及关键技术研究.吉林大学出版社,2021,第 136-139页. *

Also Published As

Publication number Publication date
CN117076484A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
US9916350B2 (en) Automated creation of join graphs for unrelated data sets among relational databases
Wick et al. Scalable probabilistic databases with factor graphs and MCMC
CN110674840B (zh) 一种多方证据关联模型构建方法和证据链提取方法及装置
CN111316296B (zh) 学习层级提取模型的结构
US20160055217A1 (en) Time-based graph data model
Giabelli et al. GraphLMI: A data driven system for exploring labor market information through graph databases
Rost et al. Temporal graph analysis using gradoop
Plaue Data science
Ma et al. Content Feature Extraction-based Hybrid Recommendation for Mobile Application Services.
CN117251685B (zh) 一种基于知识图谱的标准化政务数据构建方法和装置
CN112784049B (zh) 一种面向文本数据的在线社交平台多元知识获取方法
Chen et al. Identifying the role of media discourse in tourism demand forecasting
CN117076484B (zh) 基于时序知识图谱的人力资源数据分析方法
Tao et al. A new version of distance and similarity measures for hesitant fuzzy linguistic term sets and its application
CN104636422B (zh) 用于挖掘数据集中的模式的方法和***
Liu et al. Learning cp-nets structure from preference data streams
Ribeiro et al. StreamPref: a query language for temporal conditional preferences on data streams
Blake et al. The Effects and Interactions of Data Quality and Problem Complexity on Data Mining.
Chen et al. A multi-source heterogeneous spatial big data fusion method based on multiple similarity and voting decision
Bhattacharjee et al. Ontology based spatial clustering framework for implicit knowledge discovery
Feng et al. ASMaaS: Automatic Semantic Modeling as a Service
Hidalgo-León Gender Violence's Models and Discrimination-aware Data Mining.
CN117556118B (zh) 基于科研大数据预测的可视化推荐***及方法
Li et al. Adapative algorithms for crowd-aided categorization
Huang Link Prediction Model for Anchor Chain Connection Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant