CN110378543A - 离职风险预测方法、装置、计算机设备和存储介质 - Google Patents

离职风险预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110378543A
CN110378543A CN201810325419.2A CN201810325419A CN110378543A CN 110378543 A CN110378543 A CN 110378543A CN 201810325419 A CN201810325419 A CN 201810325419A CN 110378543 A CN110378543 A CN 110378543A
Authority
CN
China
Prior art keywords
employee
communication behavior
relational network
leaving office
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810325419.2A
Other languages
English (en)
Inventor
朱琛
宋欣
祝恒书
熊辉
徐童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810325419.2A priority Critical patent/CN110378543A/zh
Publication of CN110378543A publication Critical patent/CN110378543A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种离职风险预测方法、装置、计算机设备和存储介质,其中,该方法包括:依据员工的级别信息和通信行为信息构建通信行为特征数据库;基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。本发明实施例无需人为干预,基于人工智能技术提供客观的离职风险分析预测结果,帮助管理者及早发现组织变革产生的问题并予以解决。

Description

离职风险预测方法、装置、计算机设备和存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种离职风险预测方法、装置、计算机设备和存储介质。
背景技术
当今商界,企业内的组织变革愈发频繁和普遍,但据统计,过去几十年间,近70%的组织变动进程都以失败告终,因此,如何进行组织变革成为了企业管理者所面临的重要问题。
现有技术中并没有智能化的对员工的离职风险进行预测的方法。传统的组织变革管理方法旨在研究如何降低员工对于组织变动所付出的代价以及所产生的抗拒性,并且同时最大化组织变动带来的有利影响,如Lewin提出的三步模型以及Kotter提出的八步计划模型等。这些都是由经验丰富的专业人士通过分析历史结果与数据统计信息,根据经验得出的,具有一定的主观性,而且并不能做到对变动产生的影响进行定量分析,并且受人力成本限制,并不能对海量数据进行全面分析。此外,还具有滞后性,缺乏对组织变革影响的预测能力,无法做到未雨绸缪。
发明内容
本发明实施例提供一种离职风险预测方法、装置、计算机设备和存储介质,以解决现有技术中无法对员工的离职风险进行智能化预测的问题。
第一方面,本发明实施例提供了一种离职风险预测方法,该方法包括:
依据员工的级别信息和通信行为信息构建通信行为特征数据库;
基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
第二方面,本发明实施例还提供了一种离职风险预测装置,该装置包括:
数据库构建模块,用于依据员工的级别信息和通信行为信息构建通信行为特征数据库;
关系网络图构建模块,用于基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
组织特征提取模块,用于对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
风险预测模块,用于利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
第三方面,本发明实施例还提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的离职风险预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的离职风险预测方法。
本发明实施例利用员工的级别信息和通信行为信息构建关系网络图,并通过图信号的特征提取,得到组织架构的组织特征,利用该组织特征和机器学习的方法进行训练得到离职风险预测模型,通过离职风险预测模型预测组织架构中员工的离职风险,无需人为干预,基于人工智能技术提供客观的分析预测结果,帮助管理者及早发现组织变革产生的问题并予以解决。
附图说明
图1是本发明实施例一提供的离职风险预测方法的流程图;
图2是本发明实施例二提供的离职风险预测方法的流程图;
图3是本发明实施例三提供的离职风险预测方法的流程图;
图4是本发明实施例四提供的离职风险预测装置的结构示意图;
图5是本发明实施例五提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的离职风险预测方法的流程图,本实施例可适用于预测组织架构中员工离职风险的情况,该方法可以由离职风险预测装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在一种计算机设备中。如图1所示,该方法具体包括:
S110、依据员工的级别信息和通信行为信息构建通信行为特征数据库。
不同的组织其组织架构情况不同,但每一个组织中都会设置有不同的级别,每一个员工对应一个级别。员工的通信行为与员工的工作表现和工作状态相关,因此,本发明实施例通过对员工的通信行为进行分析,从而对组织的稳定性以及员工的离职风险进行预测。其中,所述通信行为可以包括通过邮件、实时通信软件等组织公共的通信途径所进行的通信。
优选的,所述依据员工的级别信息和通信行为信息构建通信行为特征数据库,包括:
获取组织架构信息、员工基本信息和员工之间的通信行为信息,其中,所述员工基本信息包括员工所属组织和员工级别;
根据所述组织架构信息、员工基本信息和员工之间的通信行为信息进行筛选统计,得到每个员工与其不同级别的员工之间和与其相同级别的员工之间发生通信行为的次数;
将每个员工的级别和发生通信行为的对象和次数表示为特征向量,并存储到数据库中,得到通信行为特征数据库。其中,所述数据库包括关系型数据库(如MySQL、Oracle)和非关系型数据库(如Hbase、MongoDB)。
具体的,由于组织架构信息和员工基本信息可能会存在变化,比如已有的部门遭到取消或者突然离职的员工,因此,需要对组织架构信息、员工基本信息进行清洗和筛选,去除掉已经失效的部门,并去除离职等异常员工的信息,从剩余的信息里统计员工的通信行为信息,以每个员工为单位,统计出其分别与同级别员工和不同级别员工的通信次数。在一种实施方式中,例如可以统计最近三个月内的通信次数。
此外,还需要说明的是,可以根据组织的特点,去除掉一些与离职风险不相关的通信行为,例如,人力资源或财务等平台部门的员工之间的通信行为。
S120、基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为。
图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。关系网络图的构建目的在于使用一种特殊的数据结构,将已经建立的通信行为特征数据库中的原始数据结合在一起,用于通过描述不同级别的员工之间和相同级别的员工之间的通信行为来表示某一时间段内组织的特征,其构建方式可以根据组织的特点进行设置。
在一种具体的实现方式中,作为一种优选,可以进行如下设置:
关系网络图中的节点表示通信行为类型,该通信行为类型包括任意两个不同级别的员工之间的通信和每一个级别中员工之间的通信,相应的,关系网络图中节点的值由该节点表示的通信行为类型发生的通信次数来表示;
关系网络图中的边表示不同通信行为类型同时发生的概率,相应的,关系网络图中边的权重由同时拥有该边对应的两个节点所表示的通信行为类型的员工数量来表示。
具体的,可以将关系网络图表示为G=<V,E>,其中,每个节点v∈V。节点vi和vj间的边e∈E,其权重wij的计算方式如下:
其中,k和θ是预设参数,sim(i,j)表示两种通信行为类型间的共现性,即同时发生这两种通信行为类型的概率,其表示方法包括但不限于由同时拥有这两种通信类型的员工数量来表示。例如,假设某个组织中有两种级别的职位A和B,并且在A和A之间、A和B之间的通信非常频繁,则一种关系网络图的构建方式是,该图包含三个节点A-B、A-A和B-B,并且A-A和A-B的节点值会相对大一些。
S130、对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征。
由于关系网络图中的节点间具有共现性,因此,临近节点中的局部关系可以很好的帮助提取关系网络图上图信号(graph signal)中蕴含的特征信息。其中,关系网络图中的局部关系挖掘方法包括但不限于复杂网络分析法、社交影响力模型IC mode和LT mode、最大流-最小割算法以及图卷积方法等。提取出图信号的特征即作为组织架构的组织特征,用于训练离职风险预测模型。
S140、利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
具体的,可以利用历史一段时间内的通信行为数据按照上述操作分析得到组织特征作为输入,将这一历史阶段该组织的离职风险情况作为输出,利用机器学习的方法进行训练,得到离职风险预测模型,预测目标包括但不限于组织的离职率、离职人数和离职环比/同比增幅等数据。其中,可以采用神经网络进行训练,包括卷积神经网络CNN或循环神经网络RNN,此外,还可以利用支持向量机SVM、条件随机场CRF、逻辑回归LR、随机森林randomforest等算法进行模型训练。
本实施例的技术方案利用员工的级别信息和通信行为信息构建关系网络图,并通过图信号的特征提取,得到组织架构的组织特征,利用该组织特征和机器学习的方法进行训练得到离职风险预测模型,通过离职风险预测模型预测组织架构中员工的离职风险,无需人为干预,基于人工智能技术提供客观的分析预测结果,帮助管理者及早发现组织变革产生的问题并予以解决。
实施例二
图2是本发明实施例二提供的离职风险预测方法的流程图,本实施例是在上述实施例的基础上进一步进行优化。如图2所示,该方法包括:
S210、依据员工的级别信息和通信行为信息构建通信行为特征数据库。
S220、基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为。
S230、利用图卷积操作对所述关系网络图进行分析,得到图信号的特征,将该图信号的特征作为所述组织架构的组织特征,其中,所述图信号由所述关系网络图中各节点的值组成的向量表示。
具体的,本发明实施例是采用图卷积操作对关系网络图进行分析,图卷积是基于频谱图理论对关系网络图进行卷积操作,由于图卷积能够考虑关系网络图中整体结构的特征,因此特征提取更加全面和精确。可采用包括但不限于归一化图的拉普拉斯矩阵L来表示关系网络图,而所述图卷积操作是通过对图信号进行傅里叶变换实现,表示为:
其中,cG表示图信号,UT表示拉普拉斯矩阵L的特征向量矩阵的转置。
此外,为了降低复杂度以及满足卷积要挖掘局部特征的要求,可以进一步对卷积操作进行修正,具体方法包括但不限于使用多项式过滤器hθ来代替卷积算子。例如K维局部多项式过滤器,定义为:
其中,表示多项式系数,以关系网络图中节点vi为中心的过滤器中节点vj的值由公式计算,如果vi和vj的距离超过k(预设参数),则有因为图卷积是对图信号进行的傅里叶变换,因此,用该公式来计算节点的值,就得到了修正后的图信号,然后对修正后的图信号进行傅里叶变换,从而提取图信号的特征。
其中,是一个k阶切比雪夫多项式,由公式计算。切比雪夫多项式是可以递归定义的正交多项式的序列,有Tn+1(x)=2xTn(x)-Tn-1(x),其中T0(x)=1以及T1(x)=x。它在逼近理论中得到了广泛的应用,同时也降低了卷积的时间成本。
此外,卷积操作后还可以进行池化操作,可以减少特征维度,降低计算时间复杂度。具体的,任意图的聚类算法都可用来作为所述池化操作。
S240、利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
本实施例的技术方案利用图卷积操作来提取关系网络图中图信号的特征,由于图卷积能够考虑关系网络图中整体结构的特征,因此特征提取更加全面和精确。利用提取到的组织特征和机器学习的方法进行训练得到离职风险预测模型,通过离职风险预测模型预测组织架构中员工的离职风险,无需人为干预,基于人工智能技术提供客观的分析预测结果,帮助管理者及早发现组织变革产生的问题并予以解决。
实施例三
图3是本发明实施例三提供的离职风险预测方法的流程图,本实施例是在上述实施例的基础上进一步进行优化。如图3所示,该方法包括:
S310、依据员工的级别信息和通信行为信息构建通信行为特征数据库,所述通信行为特征数据库中存储有不同时间切片的通信行为特征。
S320、基于所述不同时间切片的通信行为特征构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为。
S330、对根据所述不同时间切片的通信行为特征构建的关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征。
S340、利用所述不同时间切片的通信行为特征对应的组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
本实施例的技术方案与上述实施例不同的是,在本实施例中引入了时序信息。具体的,在获取员工的级别信息和通信行为信息之后,首先对这些通信行为信息进行切片,得到不同切片的通信行为信息。然后按照上述任一实施例所述的方法,依据不同切片的通信行为信息构建通信行为特征数据库,根据该通信行为特征数据库构建关系网络图,然后基于该关系网络图提取图信号特征并作为组织特征,利用该组织特征进行训练,得到离职风险预测模型。
而由于不同的时间点,组织架构中员工的工作强度是存在变化的,员工的工作状态也并非一成不变,因此,通过引入时序信息,对通信行为进行切片,从而提取不同切片的通信行为的特征进行学习,不仅可以学习到某一切片的通信行为的特征,还可以学习不同切片之间的通信行为的关系和区别,从而得到更佳的、更精确的学习效果,提高模型预测的准确性。
其中,切片的方法包括等距切片或等量切片。等距切片是指按照一定的频率进行切分,例如,将获取到的通信行为数据中,按照一个月的时间间隔进行切分,得到每个月的通信行为数据切片。等量切片是指按照通信次数进行切分,切分之后获得的不同切片中,各切片对应的通信次数都是相同的。实现时,可以根据实际情况,选择配置不同的切片方法。
本实施例的技术方案通过时序信息的引入,将通信行为数据进行切片,并对切片后的数据分别处理和学习,从而得到更佳的、更精确的学习效果,提高模型预测的准确性,更好地帮助管理者及早发现组织变革产生的问题并予以解决。
实施例四
图4是本发明实施例四提供的离职风险预测装置的结构示意图,本实施例可适用于预测组织架构中员工离职风险的情况。本发明实施例所提供的离职风险预测装置可执行本发明任意实施例所提供的离职风险预测方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置包括数据库构建模块410、关系网络图构建模块420、组织特征提取模块430和风险预测模块440,其中:
数据库构建模块410,用于依据员工的级别信息和通信行为信息构建通信行为特征数据库;
关系网络图构建模块420,用于基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
组织特征提取模块430,用于对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
风险预测模块440,用于利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
在上技术方案的基础上,进一步的,数据库构建模块410包括:
获取单元,用于获取组织架构信息、员工基本信息和员工之间的通信行为信息,其中,所述员工基本信息包括员工所属组织和员工级别;
筛选统计单元,用于根据所述组织架构信息、员工基本信息和员工之间的通信行为信息进行筛选统计,得到每个员工与其不同级别的员工之间和与其相同级别的员工之间发生通信行为的次数;
存储单元,用于将每个员工的级别和发生通信行为的对象和次数表示为特征向量,并存储到数据库中,得到通信行为特征数据库。
进一步的,所述关系网络图中的节点表示通信行为类型,所述通信行为类型包括任意两个不同级别的员工之间的通信和每一个级别中员工之间的通信,相应的,所述关系网络图中节点的值由该节点表示的通信行为类型发生的通信次数来表示;
所述关系网络图中的边表示不同通信行为类型同时发生的概率,相应的,所述关系网络图中边的权重由同时拥有该边对应的两个节点所表示的通信行为类型的员工数量来表示。
进一步的,组织特征提取模块430具体用于:
利用图卷积操作对所述关系网络图进行分析,得到图信号的特征,将该图信号的特征作为所述组织架构的组织特征,其中,所述图信号由所述关系网络图中各节点的值组成的向量表示。
进一步的,所述图卷积操作是通过对图信号进行傅里叶变换实现,表示为:
其中,cG表示图信号,UT表示拉普拉斯矩阵的特征向量矩阵的转置。
进一步的,所述数据库构建模块还用于依据不同时间切片的通信行为特征构建通信行为特征数据库;
所述关系网络图构建模块还用于基于所述不同时间切片的通信行为特征构建关系网络图;
所述组织特征提取模块还用于根据所述不同时间切片的通信行为特征构建的关系网络图提取组织特征;
相应的,所述离职预测模块还用于利用不同时间切片的通信行为特征对应的组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
本发明实施例利用员工的级别信息和通信行为信息构建关系网络图,并通过图信号的特征提取,得到组织架构的组织特征,利用该组织特征和机器学习的方法进行训练得到离职风险预测模型,通过离职风险预测模型预测组织架构中员工的离职风险,无需人为干预,基于人工智能技术提供客观的分析预测结果,帮助管理者及早发现组织变革产生的问题并予以解决。
实施例五
图5是本发明实施例五提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备512的框图。图5显示的计算机设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备512以通用终端的形式表现。计算机设备512的组件可以包括但不限于:一个或者多个处理器516,存储装置528,连接不同***组件(包括存储装置528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及***组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备512典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置528可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory,RAM)530和/或高速缓存存储器532。计算机设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储装置528中,这样的程序模块542包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该计算机设备512交互的设备通信,和/或与使得该计算机设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,计算机设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器520通过总线518与计算机设备512的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)***、磁带驱动器以及数据备份存储***等。
处理器516通过运行存储在存储装置528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的离职风险预测方法,该方法包括:
依据员工的级别信息和通信行为信息构建通信行为特征数据库;
基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的离职风险预测方法,该方法包括:
依据员工的级别信息和通信行为信息构建通信行为特征数据库;
基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM,或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (14)

1.一种离职风险预测方法,其特征在于,包括:
依据员工的级别信息和通信行为信息构建通信行为特征数据库;
基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
2.根据权利要求1所述的方法,其特征在于,所述依据员工的级别信息和通信行为信息构建通信行为特征数据库,包括:
获取组织架构信息、员工基本信息和员工之间的通信行为信息,其中,所述员工基本信息包括员工所属组织和员工级别;
根据所述组织架构信息、员工基本信息和员工之间的通信行为信息进行筛选统计,得到每个员工与其不同级别的员工之间和与其相同级别的员工之间发生通信行为的次数;
将每个员工的级别和发生通信行为的对象和次数表示为特征向量,并存储到数据库中,得到通信行为特征数据库。
3.根据权利要求1所述的方法,其特征在于,所述关系网络图中的节点表示通信行为类型,所述通信行为类型包括任意两个不同级别的员工之间的通信和每一个级别中员工之间的通信,相应的,所述关系网络图中节点的值由该节点表示的通信行为类型发生的通信次数来表示;
所述关系网络图中的边表示不同通信行为类型同时发生的概率,相应的,所述关系网络图中边的权重由同时拥有该边对应的两个节点所表示的通信行为类型的员工数量来表示。
4.根据权利要求1所述的方法,其特征在于,所述对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征,包括:
利用图卷积操作对所述关系网络图进行分析,得到图信号的特征,将该图信号的特征作为所述组织架构的组织特征,其中,所述图信号由所述关系网络图中各节点的值组成的向量表示。
5.根据权利要求4所述的方法,其特征在于,所述图卷积操作是通过对图信号进行傅里叶变换实现,表示为:
其中,cG表示图信号,UT表示拉普拉斯矩阵的特征向量矩阵的转置。
6.根据权利要求1-5任一所述的方法,其特征在于,
所述通信行为特征数据库中存储有不同时间切片的通信行为特征;所述关系网络图是基于所述不同时间切片的通信行为特征构建;所述组织特征是根据所述不同时间切片的通信行为特征构建的关系网络图提取的;
相应的,所述利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,包括:
利用所述不同时间切片的通信行为特征对应的组织特征和机器学习的方法训练得到离职风险预测模型。
7.一种离职风险预测装置,其特征在于,包括:
数据库构建模块,用于依据员工的级别信息和通信行为信息构建通信行为特征数据库;
关系网络图构建模块,用于基于所述通信行为特征数据库构建关系网络图,其中,所述关系网络图用于描述不同级别的员工之间和相同级别的员工之间的通信行为;
组织特征提取模块,用于对所述关系网络图中的图信号进行特征提取,得到所述组织架构的组织特征;
风险预测模块,用于利用所述组织特征和机器学习的方法进行训练得到离职风险预测模型,该离职风险预测模型用于进行离职风险预测。
8.根据权利要求7所述的装置,其特征在于,所述数据库构建模块包括:
获取单元,用于获取组织架构信息、员工基本信息和员工之间的通信行为信息,其中,所述员工基本信息包括员工所属组织和员工级别;
筛选统计单元,用于根据所述组织架构信息、员工基本信息和员工之间的通信行为信息进行筛选统计,得到每个员工与其不同级别的员工之间和与其相同级别的员工之间发生通信行为的次数;
存储单元,用于将每个员工的级别和发生通信行为的对象和次数表示为特征向量,并存储到数据库中,得到通信行为特征数据库。
9.根据权利要求7所述的装置,其特征在于,所述关系网络图中的节点表示通信行为类型,所述通信行为类型包括任意两个不同级别的员工之间的通信和每一个级别中员工之间的通信,相应的,所述关系网络图中节点的值由该节点表示的通信行为类型发生的通信次数来表示;
所述关系网络图中的边表示不同通信行为类型同时发生的概率,相应的,所述关系网络图中边的权重由同时拥有该边对应的两个节点所表示的通信行为类型的员工数量来表示。
10.根据权利要求7所述的装置,其特征在于,所述组织特征提取模块具体用于:
利用图卷积操作对所述关系网络图进行分析,得到图信号的特征,将该图信号的特征作为所述组织架构的组织特征,其中,所述图信号由所述关系网络图中各节点的值组成的向量表示。
11.根据权利要求10所述的装置,其特征在于,所述图卷积操作是通过对图信号进行傅里叶变换实现,表示为:
其中,cG表示图信号,UT表示拉普拉斯矩阵的特征向量矩阵的转置。
12.根据权利要求7-11任一所述的装置,其特征在于,
所述数据库构建模块还用于依据不同时间切片的通信行为特征构建通信行为特征数据库;
所述关系网络图构建模块还用于基于所述不同时间切片的通信行为特征构建关系网络图;
所述组织特征提取模块还用于根据所述不同时间切片的通信行为特征构建的关系网络图提取组织特征;
相应的,所述离职预测模块还用于利用不同时间切片的通信行为特征对应的组织特征和机器学习的方法进行训练得到离职风险预测模型。
13.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的离职风险预测方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的离职风险预测方法。
CN201810325419.2A 2018-04-12 2018-04-12 离职风险预测方法、装置、计算机设备和存储介质 Withdrawn CN110378543A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810325419.2A CN110378543A (zh) 2018-04-12 2018-04-12 离职风险预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810325419.2A CN110378543A (zh) 2018-04-12 2018-04-12 离职风险预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110378543A true CN110378543A (zh) 2019-10-25

Family

ID=68243525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810325419.2A Withdrawn CN110378543A (zh) 2018-04-12 2018-04-12 离职风险预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110378543A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340509A (zh) * 2020-05-22 2020-06-26 支付宝(杭州)信息技术有限公司 一种虚假交易识别方法、装置及电子设备
CN111369044A (zh) * 2020-02-27 2020-07-03 腾讯云计算(北京)有限责任公司 一种估计流失的方法、设备及计算机可读存储介质
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
WO2021089013A1 (zh) * 2019-11-06 2021-05-14 中国科学院深圳先进技术研究院 空间图卷积网络的训练方法、电子设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021089013A1 (zh) * 2019-11-06 2021-05-14 中国科学院深圳先进技术研究院 空间图卷积网络的训练方法、电子设备及存储介质
CN111369044A (zh) * 2020-02-27 2020-07-03 腾讯云计算(北京)有限责任公司 一种估计流失的方法、设备及计算机可读存储介质
CN111369044B (zh) * 2020-02-27 2023-06-06 腾讯云计算(北京)有限责任公司 一种估计流失的方法、设备及计算机可读存储介质
CN111340509A (zh) * 2020-05-22 2020-06-26 支付宝(杭州)信息技术有限公司 一种虚假交易识别方法、装置及电子设备
CN111340509B (zh) * 2020-05-22 2020-08-21 支付宝(杭州)信息技术有限公司 一种虚假交易识别方法、装置及电子设备
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
CN111709714B (zh) * 2020-06-17 2024-03-29 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置

Similar Documents

Publication Publication Date Title
US10963817B2 (en) Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data
WO2020029590A1 (zh) 基于联邦训练的样本预测方法、装置及存储介质
CN110555047B (zh) 数据处理方法和电子设备
CN107330731B (zh) 一种识别广告位点击异常的方法和装置
CN110378543A (zh) 离职风险预测方法、装置、计算机设备和存储介质
US20190272553A1 (en) Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks
US8862662B2 (en) Determination of latent interactions in social networks
CN110175168A (zh) 一种基于生成对抗网络的时间序列数据填补方法及***
Shafiei-Monfared et al. A novel approach for complexity measure analysis in design projects
US10402768B2 (en) Business problem networking system and tool
CN113807520A (zh) 基于图神经网络的知识图谱对齐模型的训练方法
CN112214775A (zh) 对图数据的注入式攻击方法、装置、介质及电子设备
CN105913235A (zh) 一种客户转账关系分析方法及***
US10685035B2 (en) Determining a collection of data visualizations
CN116089504A (zh) 一种关系型表格数据生成方法和***
Miller et al. Post-glacial expansion dynamics, not refugial isolation, shaped the genetic structure of a migratory bird, the yellow warbler
US20230087204A1 (en) Systems and methods to screen a predictive model for risks of the predictive model
CN107402984B (zh) 一种基于主题的分类方法及装置
CN117033997A (zh) 数据切分方法、装置、电子设备和介质
CN115409541A (zh) 基于数据血缘的卷烟品牌数据处理方法
CN114897607A (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN110223125B (zh) 节点位置核边收益算法下用户位置获取方法
Najarzadeh Testing equality of generalized variances of k multivariate normal populations
Porouhan Optimization of overdraft application process with fluxicon disco
CN111723247A (zh) 基于图的假设计算

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20191025

WW01 Invention patent application withdrawn after publication