CN115330142A - 联合能力模型的训练方法、能力需求匹配方法和装置 - Google Patents

联合能力模型的训练方法、能力需求匹配方法和装置 Download PDF

Info

Publication number
CN115330142A
CN115330142A CN202210878392.6A CN202210878392A CN115330142A CN 115330142 A CN115330142 A CN 115330142A CN 202210878392 A CN202210878392 A CN 202210878392A CN 115330142 A CN115330142 A CN 115330142A
Authority
CN
China
Prior art keywords
information
capability
obtaining
interview
resume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210878392.6A
Other languages
English (en)
Other versions
CN115330142B (zh
Inventor
李满伟
秦川
马海平
申大忠
祝恒书
张敬帅
姚开春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210878392.6A priority Critical patent/CN115330142B/zh
Publication of CN115330142A publication Critical patent/CN115330142A/zh
Application granted granted Critical
Publication of CN115330142B publication Critical patent/CN115330142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06398Performance of employee with respect to a job function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种联合能力模型的训练方法、能力需求匹配方法和装置,涉及人工智能技术领域,尤其涉及深度学习领域。具体实现方案为:采用多种能力预测模型对样本数据进行处理,得到多种能力信息;采用需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,该需求信息包括目标场景需要满足的能力信息;基于需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数。本公开利用多种样本数据对需求匹配模型和多种能力预测模型进行训练,训练后得到的联合能力模型能够满足更全面、更多维度的能力预测和需求匹配,适用于更丰富的应用场景。

Description

联合能力模型的训练方法、能力需求匹配方法和装置
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习领域。
背景技术
能力评估可以通过评估候选者技能与工作要求的一致性来选择最合适的候选者,是人才招聘中的一项关键任务。传统的能力评估涉及多个过程,采用不同形式的评估方法,通常会导致评估结论是分散的、嘈杂的且不可靠的。目前可以采用专家决策或自然语言处理技术等进行决策。
发明内容
本公开提供了一种联合能力模型的训练方法、能力需求匹配方法和装置。
根据本公开的一方面,提供了一种联合能力模型的训练方法,该联合能力模型包括多种能力预测模型和需求匹配模型,该方法包括:
采用该多种能力预测模型对样本数据进行处理,得到多种能力信息;
采用该需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,该需求信息包括目标场景需要满足的能力信息;
基于该需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数。
根据本公开的另一方面,提供了一种能力需求匹配方法,包括:
采用多种能力预测模型对候选者的多种待处理数据进行处理,得到该候选者的多种能力信息;
采用需求匹配模型对该多种能力信息和需求信息进行处理,得到该候选者的需求匹配结果,该需求信息包括目标场景需要满足的能力信息。
根据本公开的另一方面,提供了联合能力模型的训练装置,该联合能力模型包括多种能力预测模型和需求匹配模型,该装置包括:
能力预测模块,用于采用该多种能力预测模型对样本数据进行处理,得到多种能力信息;
需求匹配模块,用于采用该需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,该需求信息包括目标场景需要满足的能力信息;
训练模块,用于基于该需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数。
根据本公开的另一方面,提供了能力需求匹配装置,包括:
能力预测模块,用于采用多种能力预测模型对候选者的多种待处理数据进行处理,得到该候选者的多种能力信息;
需求匹配模块,用于采用需求匹配模型对该多种能力信息和需求信息进行处理,得到该候选者的需求匹配结果,该需求信息包括目标场景需要满足的能力信息。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开中任一实施例的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开中任一实施例的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开中任一实施例的方法。
根据本公开实施例,利用多种样本数据对需求匹配模型和多种能力预测模型进行训练,训练后得到的联合能力模型能够满足更全面、更多维度的能力预测和需求匹配,适用于更丰富的应用场景。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例的联合能力模型的训练方法的流程示意图;
图2是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图3是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图4是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图5是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图6是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图7是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图8是根据本公开另一实施例的联合能力模型的训练方法的流程示意图;
图9是根据本公开一实施例的能力需求匹配方法的流程示意图;
图10是根据本公开一实施例的能力需求匹配方法的流程示意图;
图11是根据本公开一实施例的能力需求匹配方法的流程示意图;
图12是根据本公开一实施例的能力需求匹配方法的流程示意图;
图13是根据本公开一实施例的能力需求匹配方法的流程示意图;
图14是根据本公开一实施例的能力需求匹配方法的流程示意图;
图15是根据本公开一实施例的联合能力模型的训练装置的结构示意图;
图16是根据本公开另一实施例的联合能力模型的训练装置的结构示意图;
图17是根据本公开一实施例的能力需求匹配装置的结构示意图;
图18是根据本公开另一实施例的能力需求匹配装置的结构示意图;
图19是本公开的人才招聘中的联合能力诊断方法框架示意图;
图20是本公开的笔试建模的框架图;
图21是本公开的简历建模的框架图;
图22是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开一实施例的联合能力模型的训练方法的流程示意图。该联合能力模型可以包括多种能力预测模型和需求匹配模型,该训练方法可以包括:
S101、采用多种能力预测模型对样本数据进行处理,得到多种能力信息;
S102、采用需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,该需求信息包括目标场景需要满足的能力信息;
S103、基于需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数。
在本公开实施例中,联合能力模型可以包括多种能力预测模型和需求匹配模型。根据不同的应用场景,可以构建不同的能力预测模型。例如,在求职场景,多种能力预测模型可以包括笔试能力预测模型、简历能力预测模型和面试能力预测模型等。再如,在升学、咨询等场景,多种能力预测模型可以包括笔试能力预测模型和面试能力预测模型等。
在本公开实施例中,需求匹配模型可以将多种能力信息与具体需求进行匹配,得到需求匹配结果。例如,需求匹配结果可以包括入职概率、入学概率、录取概率等。再如,需求匹配结果也可以包括与某个具体岗位、学校是否匹配的结果。
在本公开实施例中,在训练过程中,可以采用多种能力预测模型对多种样本数据分别进行对应的处理,得到多种能力信息。多种样本数据可以包括一批次的多个样本数据,具体可以按照能力预测模型的类型进行分类,例如,一批次的3A个样本数据包括A个样本笔试数据、A个样本简历数据和A个样本面试数据。A为正整数。当然,样本笔试数据、样本简历数据和样本面试数据的数量也可以不同。
在本公开实施例中,需求信息包括目标场景需要满足的能力信息。不同的目标场景的需求信息可能不同。例如,应聘场景的需求信息包括某个岗位具体需要的岗位相关的技能,也可以称为该岗位的技能需求信息,例如:熟悉的计算机语言、专业技术等。再如,入学场景的需求信息包括某个学校具体需要的学***、学科分数、竞赛奖励等。然后,采用需求匹配模型将各个能力预测模型预测的能力信息与具体的需求信息例如岗位的技能需求信息进行匹配,得到需求匹配结果。然后基于需求匹配结果,对需求匹配模型和各能力预测模型进行训练,以更新需求匹配模型和各能力预测模型的参数,直到整体损失函数收敛,停止训练。利用训练得到的联合能力模型中的多种能力预测模型和需求匹配模型,可以对多种数据源的候选者的能力相关的数据进行需求匹配预测。
在本公开实施例中,利用多种样本数据对需求匹配模型和多种能力预测模型进行训练,训练后得到的联合能力模型能够满足更全面、更多维度的能力预测和需求匹配,适用于更丰富的应用场景。进一步地,可以提高一些应用场景处理效率高,例如提高求职场景中的招聘效率。进一步地,还可以减少预测结果的主观性因素,具有较强的可扩展性。
图2是根据本公开另一实施例的联合能力模型的训练方法的流程示意图。该实施例的方法包括上述训练方法实施例的一个或多个特征。在一种可能的实施方式中,采用多种能力预测模型对样本数据进行处理,得到多种能力信息,包括以下至少两个步骤:
S201、采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息;
S202、采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息;
S203、采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息。
在本公开实施例中,可以从若干候选者的笔试数据中选取并生成样本笔试数据。例如,候选者的笔试数据可以包括根据候选者的入职考试、入学考试等试卷生成的文本。笔试数据中可以包括笔试题目和候选者对每个题目的答题结果等。每个笔试题目可以具有对应的编号,候选者对每个题目的答题结果可以通过具体数值表示。例如0表示正确,1表示错误。再如,10表示100分、9表示90分,8表示80分等。在本公开实施例中,题目又可以称为习题、练习题或问题等。
在本公开实施例中,可以从若干候选者的面试数据中选取并生成样本面试笔试数据。候选者的面试数据可以包括面试官对候选者在面试过程中的各种技能的评估文本,还可以包括从面试的音视频数据中提取的候选者的技能相关的文本等。例如,候选者的技能可以包括当不限于英语等级、计算机等级、计算机软件使用技能、毕业院校专业相关技能等。
在本公开实施例中,可以从若干候选者的简历数据中选取并生成样本简历数据。候选者的简历数据中可以包括候选者的是否具有某种技能等信息。
通过笔试能力预测模型、面试能力预测模型和简历能力预测模型中的至少两种,能够预测得到候选者的至少两种能力信息,进而有利于基于候选者的综合能力采用联合训练的方法更新联合能力模型,从而实现更全面的能力预测和需求匹配。
在一种可能的实施方式中,如图3所示,采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息,包括:
S301、从该样本笔试数据中提取候选者特征;
S302、基于该候选者特征得到候选者的笔试能力信息。
在本公开实施例中,笔试数据中的候选者特征可以包括候选者关于笔试的宏观表征,可以采用向量等形式来表示候选者特征,通过笔试数据中的候选者特征能够准确的得到候选者在笔试中所体现的具体能力。例如,从样本笔试数据中提取的候选者特征可以是候选者ui的独热(one-hot)向量
Figure BDA0003763384020000061
候选者的笔试能力信息可以是候选者关于笔试的宏观表征
Figure BDA0003763384020000062
可以是一个d维向量。
Figure BDA0003763384020000063
其中WU可以是一个嵌入矩阵,WU可以具有初始值。在后续训练过程中可以对WU进行学习和更新,进而更新笔试能力信息。训练完成后,利用笔试能力预测模型中训练后的WU与某个候选者的真实笔试数据中的候选者特征,能够准确预测该候选者的笔试能力信息。
在一种可能的实施方式中,该笔试能力预测模型的损失函数是基于该笔试能力预测模型预测的答题正确的概率和实际的答题结果构建的;其中,该答题正确的概率是该笔试能力预测模型基于该样本笔试数据得到的候选者与题目的交互信息预测得到的。利用该笔试能力预测模型的损失函数可以对该笔试能力预测模型的参数进行更新,得到更加准确的笔试能力预测模型。
例如,笔试能力预测模型的损失函数为lossE
Figure BDA0003763384020000064
其中,
Figure BDA0003763384020000065
为候选者ui作答题目ej的真实情况,
Figure BDA0003763384020000066
为模型预测候选者ui作答题目ej的情况。基于笔试数据最小化该损失函数可以学习每个候选者的能力
Figure BDA0003763384020000071
U表示候选者集合。
Figure BDA0003763384020000072
表示题目集合。
在一种可能的实施方式中,如图4所示,该候选者与题目的交互信息的获取步骤,包括:
S401、从该样本笔试数据中提取候选者特征和题目特征;
S402、基于该候选者特征得到笔试能力信息;
S403、基于该笔试能力信息和整体技能表征信息得到笔试技能表征信息;
S404、基于该题目特征得到题目难度信息和题目区分度信息;
S405、基于笔试技能表征信息、该题目难度信息、该题目区分度信息和题目关联技能信息,得到该候选者与题目的交互信息。
在一个示例中,假设系存在N位候选者、M道习题、K个技能,候选者例如编号ui∈R1 ×N,习题编号ej∈R1×M。其中,R1×N表示1×N的向量。R1×M表示1×M的向量,其他类似的表述具有类似的含义。
从样本笔试数据中提取的候选者特征可以包括候选者ui的独热(one-hot)向量
Figure BDA0003763384020000073
题目特征可以包括题目ej的one-hot向量
Figure BDA0003763384020000074
基于候选者特征得到的笔试能力信息可以为候选者关于笔试的宏观表征
Figure BDA0003763384020000075
整体技能表征信息可以为技能表征矩阵hS∈RK×d。基于笔试能力信息和整体技能表征信息得到的笔试技能表征信息可以为候选者关于笔试的在特定技能上的表征向量
Figure BDA0003763384020000076
sigmoid表示一种激活函数。上标T表示转置。
基于题目特征得到的题目难度信息可以为题目难度参数
Figure BDA0003763384020000077
Figure BDA0003763384020000078
基于题目特征得到的题目区分度信息可以为题目区分度参数
Figure BDA0003763384020000079
例如,题目难度参数可以是一个向量,题目的区分度参数可以是一个标量。Wdiff、Wdisc可以是可学习的嵌入矩阵。
题目关联技能信息可以为题目关联技能向量
Figure BDA00037633840200000710
表示题目考察的技能情况。例如,若题目ej考察技能s,则第s个位置为1,否则为0。基于笔试技能表征信息、题目难度信息、题目区分度信息和题目关联技能信息,得到候选者与题目的交互信息可以参见以下公式:
Figure BDA00037633840200000711
其中,x表示交互信息;
Figure BDA00037633840200000712
为候选者关于笔试的在特定技能上的表征向量、即笔试技能表征信息;
Figure BDA0003763384020000081
为题目难度参数、即题目难度信息;
Figure BDA0003763384020000082
为题目区分度参数、即题目区分度信息;
Figure BDA0003763384020000083
表示题目关联技能向量、即题目关联技能信息。符号
Figure BDA0003763384020000084
表示对位相乘,即
Figure BDA0003763384020000085
Figure BDA0003763384020000086
对位相乘。
在本公开实施例中,笔试能力预测模型可以包括候选者与题目交互的神经网络全连接层(Fully Connected Layers,FCL)。该神经网络FCL的输入信息可以包括候选者与题目的交互信息x。该神经网络FCL的输出信息可以包括预测答题正确的概率
Figure BDA0003763384020000087
该神经网络中的也可以基于候选者特征和可学习的嵌入矩阵得到候选者的笔试能力信息。笔试能力信息可以为笔试能力向量。
候选者与题目的交互信息可以基于教育心理学的项目反应理论公式得到,从而能够更加科学合理地确定候选者与笔试数据中的各个题目的交互情况,进而得到更加合适的损失函数。
在一种可能的实施方式中,如图5所示,采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息,包括:
S501、从该样本面试数据中提取初始的面试表征信息;
S502、基于该面试表征信息,得到第一均值和第一方差;
S503、基于该第一均值和该第一方差得到符合高斯分布的第一表征信息,从该第一表征信息中采样得到第一分布潜在变量;
S504、基于第一分布潜在变量得到第一主题分布信息;
S505、基于第一主题表征信息和整体技能表征信息得到第一主题集合;
S506、基于该第一主题分布信息与该第一主题集合得到预测的面试表征信息;
S507、基于该第一主题分布信息与该第一主题表征信息,得到面试能力信息。
在一种示例中,初始的面试表征信息可以为面试能力预测模型的输入向量
Figure BDA0003763384020000088
该输入向量包括从面试文本中提取的技能。例如,若面试文本中存在技能s,则s-th(第s个位置)为1,否则为0。
将向量
Figure BDA0003763384020000089
分别过两个神经网络全连接层(或称为全连接神经网络)得到第一均值μA和第一方差σA。接着,从符合高斯分布N(μA,(σA)2)的特征中采样得到第一分布潜在变量例如高斯随机向量
Figure BDA00037633840200000810
然后过softmax层得到第一主题分布信息例如主题分布向量
Figure BDA00037633840200000811
将第一主题表征信息例如主题表征矩阵tA和整体技能表征信息例如技能表征矩阵hS叉乘,并过softmax层得到第一主题集合βA(该集合可以为一个矩阵)。其中,βA可以包括主题在技能词的分布
Figure BDA0003763384020000091
表示每个主题k在对应技能上的熟练程度,
Figure BDA0003763384020000092
Figure BDA0003763384020000093
最后将第一主题分布信息
Figure BDA0003763384020000094
与第一主题集合βA相乘得到预测值、即预测的面试表征信息例如
Figure BDA0003763384020000095
预测的面试表征信息和初始的面试表征信息中的具体取值一般是不同的。此外,如果需要继续训练,本次预测的面试表征信息可以作为下次的初始的面试表征信息。面试能力信息
Figure BDA0003763384020000096
可以为一个向量。此外,tA可以包括
Figure BDA0003763384020000097
表示主题k的特定向量。
上述的第一主题分布信息可以对应每个主题的概率,表示在每个主题下(技能组)的掌握情况。
上述的第一主题表征信息可以为一个矩阵,该矩阵表示在***中关于面试的技能存在多个主题,其中每个主题表示一组较为接近的技能词。每个主题可以具有一个表征向量,即主题特定向量。
通过样本面试数据得到面试相关的初始的面试表征信息、预测的面试表征信息、主题分布、主题集合等,有利于进行后续的训练,并且能够得到更准确的面试能力信息。
在一种可能的实施方式中,该面试能力预测模型的损失函数是基于该第一主题分布信息、该第一分布潜在变量、该预测的面试表征信息和该第一主题集合构建的。利用该面试能力预测模型的损失函数可以对该面试能力预测模型的参数进行更新,得到更加准确的面试能力预测模型。
例如,面试能力预测模型的损失函数的公式的示例如下:
Figure BDA0003763384020000098
其中,
Figure BDA0003763384020000099
是面试ai的主题分布,
Figure BDA00037633840200000910
是一个分布潜在变量,
Figure BDA00037633840200000911
是面试ai的表征,βA是面试的主题集合。其中“|”表示先验概率问题;“||”表示并列。
Figure BDA00037633840200000912
表示求先验分布
Figure BDA00037633840200000913
和后验分布
Figure BDA00037633840200000914
的距离。
在一种可能的实施方式中,如图6所示,采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息,包括:
S601、从该样本简历数据中提取初始的简历表征信息;
S602、基于该简历表征信息,得到第二均值和第二方差;
S603、基于该第二均值和该第二方差得到符合高斯分布的第二表征信息,从该第二表征信息中采样得到第二分布潜在变量;
S604、基于该第二分布潜在变量得到第二主题分布信息;
S605、基于第二主题表征信息和整体技能表征信息得到第二主题集合;
S606、基于该第二主题分布信息与该第二主题集合得到预测的简历表征信息;
S607、基于该第二主题分布信息与该第二主题表征信息,得到简历能力信息。
在一种示例中,简历表征信息可以为简历能力预测模型的输入向量
Figure BDA0003763384020000101
该输入向量包括从简历文本中提取的技能。例如,若简历文本中存在技能s,则第s个位置为1,否则为0。
将向量
Figure BDA0003763384020000102
分别过两个神经网络全连接层(或称为全连接神经网络)得到第二均值μR和第二方差σR。接着,从符合高斯分布N(μR,(σR)2)的特征中采样得到第二分布潜在变量例如高斯随机向量
Figure BDA0003763384020000103
然后过softmax层得到第二主题分布信息例如主题分布向量
Figure BDA0003763384020000104
将第二主题表征信息例如主题表征矩阵tR和整体技能表征信息例如技能表征矩阵hS叉乘,并过softmax层得到第二主题集合βR(该集合可以为一个矩阵)。其中,βR可以包括主题在技能词的分布(向量)
Figure BDA0003763384020000105
表示每个主题k在对应技能上的熟练程度,
Figure BDA0003763384020000106
Figure BDA0003763384020000107
最后将第二主题分布信息
Figure BDA0003763384020000108
与第二主题集合βR相乘得到预测值、即预测的简历表征信息
Figure BDA0003763384020000109
此外,简历能力信息
Figure BDA00037633840200001010
可以为一个向量。此外,tR可以包括
Figure BDA00037633840200001011
表示主题k的特定向量。
上述的第二主题分布信息可以对应每个主题的概率,表示在每个主题下(技能组)的掌握情况。
上述的第二主题表征信息可以为一个矩阵,该矩阵表示在***中关于简历的技能存在多个主题,其中每个主题表示一组较为接近的技能词。每个主题可以具有一个表征向量,即主题特定向量。
通过样本简历数据得到简历相关的主题分布、主题集合等,基于对初始的简历表征信息预测得到预测的简历表征信息,有利于进行后续的训练,并且能够得到更准确的简历能力信息。
在一种可能的实施方式中,该简历能力预测模型的损失函数是基于该第二主题分布信息、该第二分布潜在变量、该预测的简历表征信息以及该第二主题集合构建的。利用该简历能力预测模型的损失函数可以对该简历能力预测模型的参数进行更新,得到更加准确的简历能力预测模型。
例如,简历能力预测模型的损失函数的公式的示例如下:
Figure BDA0003763384020000111
其中,
Figure BDA0003763384020000112
是简历ri的主题分布,
Figure BDA0003763384020000113
是一个分布潜在变量,
Figure BDA0003763384020000114
是简历ri的表征,βR是简历的主题集合。其中“|”表示先验概率问题;“||”表示并列。
Figure BDA0003763384020000115
表示求先验分布
Figure BDA0003763384020000116
和后验分布
Figure BDA0003763384020000117
的距离。
在一种可能的实施方式中,如图7所示,采用需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,包括:
S701、基于该多种能力信息和注意力权重得到整体能力信息;
S702、基于该整体能力信息和技能表征信息得到特定技能信息;
S703、基于该特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
例如,笔试能力信息为
Figure BDA0003763384020000118
简历能力信息为
Figure BDA0003763384020000119
面试能力信息为
Figure BDA00037633840200001110
采用注意力机制得到候选者的整体宏观能力即整体能力信息为hi∈R1×d,其中,
Figure BDA00037633840200001111
和hi可以为向量。
Figure BDA00037633840200001112
其中,aE、aR、aA为注意力权重,这些权重在训练过程中可以更新。
通过需求匹配模型能够识别候选者与岗位之间的匹配程度,能够基于候选者的整体能力信息,以及岗位的具体的技能需求信息,为候选者推荐合适的岗位,或者为岗位推荐合适的候选者。
在一种可能的实施方式中,该需求匹配模型的损失函数是基于预测的需求匹配结果和真实的需求匹配结果构建的。利用该需求匹配模型的损失函数可以对该需求匹配模型的参数进行更新,得到更加准确的需求匹配模型。
例如,在得到候选者的宏观能力后,与技能表征矩阵hS叉乘得到候选者例如求职者在特定技能上的掌握情况αi∈R1×K,αi可以为一个向量。
αi=sigmoid(hi×(hS)T)
岗位的技能需求γp∈R1×K:表示岗位pp对特定技能的需求情况,γp可以为一个向量,其公式示例如下:
Figure BDA00037633840200001113
其中,
Figure BDA00037633840200001114
是岗位编号的one-hot向量,WJ是可学习的训练矩阵。
最后,将候选者在特定技能的掌握情况向量αi与岗位的技能需求向量γp对位相乘,预测的申请成功的概率:
Figure BDA0003763384020000121
其中,αi,s表示技能s(第s个技能)的掌握情况向量,γp,s表示岗位pp的技能s的需求向量。
根据上述示例,一种需求匹配模型的损失函数的示例如下:
Figure BDA0003763384020000122
其中,yi可以表示候选者ui真实是否申请成功的标签,
Figure BDA0003763384020000123
可以表示模型预测候选者ui申请成功的概率。
在一种可能的实施方式中,如图8所示,基于需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数,包括:
S801、基于该需求匹配模型的损失函数和该多种能力预测模型的损失函数,得到整体损失函数;
S802、在基于该整体损失函数确定需要更新的情况下,利用该需求匹配模型的损失函数更新该需求匹配模型,并且利用该多种能力预测模型的损失函数分别更新对应的能力预测模型。
例如,整体损失函数的示例如下:
loss=α*lossE+β*lossR+γ*lossA+η*lossD
其中,α、β、γ和η是上述各个能力预测模型和需求匹配模型的损失函数对应的权重,可以是经验值。在实际应用中可以根据各个模型的收敛速度等调整α、β、γ和η的具体取值。
在本公开实施例中,在整体损失函数的值不小于设定阈值的情况下,可以更新需求匹配模型和各能力预测模型的参数。在整体损失函数的值小于设定阈值的情况下,整体损失函数收敛,可以停止更新整体的模型。通过整体的整体损失函数和各个模型的损失函数可以对联合能力模型包括的多个模型进行联合训练,提高训练效率。
在一种可能的实施方式中,利用该需求匹配模型的损失函数更新该需求匹配模型,包括:
基于该需求匹配模型的损失函数,更新该需求匹配模型中的注意力权重、整体技能表征信息和岗位技能需求信息中的至少一项。更新该需求匹配模型的参数,能够使得需求匹配模型得到更加合适的候选者和岗位的匹配结果。
在本公开实施例中,基于上述示例,需求匹配模型中需要更新的参数可以包括以下一项或者多项:注意力权重例如aE、aR、aA,整体技能表征信息例如hS,以及岗位技能需求信息例如γj的嵌入矩阵WJ。如果需求匹配模型的损失函数不小于设定阈值的情况下,可以更新需求匹配模型中的注意力权重、整体技能表征信息和岗位技能需求信息中的至少一项。在整体损失函数的值小于设定阈值的情况下,需求匹配模型的损失函数,可以停止更新需求匹配模型。
在一种可能的实施方式中,利用该多种能力预测模型的损失函数分别更新对应的能力预测模型,包括以下至少两个步骤:
基于笔试能力预测模型的损失函数,更新该笔试能力预测模型的笔试能力信息、题目难度信息、题目区分度信息和整体技能表征信息中的至少一项;
基于面试能力预测模型的损失函数,更新该面试能力预测模型的全连接层参数、第一主题表征信息和整体技能表征信息中的至少一项;
基于简历能力预测模型的损失函数,更新该简历能力预测模型的全连接层参数、第二主题表征信息和整体技能表征信息中的至少一项。
例如,如果联合能力模型包括笔试能力预测模型和面试能力预测模型,则根据笔试能力预测模型的损失函数,更新笔试能力预测模型的参数,根据面试能力预测模型的损失函数,更新面试能力预测模型的参数。再如,如果联合能力模型包括笔试能力预测模型和简历能力预测模型,则根据笔试能力预测模型的损失函数,更新笔试能力预测模型的参数,根据简历能力预测模型的损失函数,更新简历能力预测模型的参数。
在本公开实施例中,在多个模型的更新中,都需要更新整体技能表征信息,因此可以按照一定顺序更新整体技能表征信息。例如按照简历能力预测模型、笔试能力预测模型、面试能力预测模型的顺序更新整体技能表征信息。再如,按照笔试能力预测模型、简历能力预测模型、面试能力预测模型的顺序更新整体技能表征信息。上一个模型更新后的整体技能表征信息,可以作为下一个模型的更新基础。
通过更新各个能力预测模型的参数,能够满足更全面、更多维度的能力预测。
图9是根据本公开一实施例的能力需求匹配方法的流程示意图。该匹配方法可以包括:
S901、采用多种能力预测模型对候选者的多种待处理数据进行处理,得到该候选者的多种能力信息;
S902、采用需求匹配模型对该多种能力信息和需求信息进行处理,得到该候选者的需求匹配结果,该需求信息包括目标场景需要满足的能力信息。
在本实施例中的能力预测模型和需求匹配模型,可以为采用上述实施例中任意一种训练方法训练得到的联合能力模型中的能力预测模型和需求匹配模型。多种待处理数据可以包括例如候选者的真实笔试数据、真实面试数据和真实简历数据的一种或多种。例如,将某个候选者的真实笔试数据、真实面试数据和真实简历数据输入联合能力模型,联合能力模型的多种能力预测模型分别对候选者的真实笔试数据、真实面试数据和真实简历数据进行处理,得到该候选者的笔试能力信息、面试能力信息和简历能力信息。
在本公开实施例中,利用训练后得到的联合能力模型能够满足更全面、更多维度的能力预测和需求匹配,适用于更丰富的应用场景。
在一种可能的实施方式中,如图10所示,采用多种能力预测模型对候选者的多种待处理数据进行处理,得到该候选者的多种能力信息,包括以下至少两个步骤:
S1001、采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息;
S1002、采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息;
S1003、采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息。
在本公开实施例中,待处理笔试数据可以是候选者的真实笔试数据例如学校考试卷、入职测试卷等笔试答题记录。待处理面试数据可以是候选者的真实面试数据例如面试官对某个候选者在面试过程中的各种技能的评估文本,从面试的音视频数据中提取的某个候选者的技能相关的文本等。待处理简历数据可以是候选者的真实简历数据例如某个候选者的简历电子文本。
通过笔试能力预测模型、面试能力预测模型和简历能力预测模型中的至少两种,能够预测得到候选者的至少多种能力信息,进而基于候选者的多种能力信息实现更全面、更准确需求匹配。
在一种可能的实施方式中,如图11所示,采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息,包括:
S1101、从该待处理笔试数据中提取候选者特征;
S1102、基于该候选者特征得到候选者的笔试能力信息。
在本公开实施例中,待处理笔试数据即真实笔试数据中的候选者特征可以包括候选者关于笔试的宏观表征,通过笔试数据中的候选者特征能够准确的得到候选者在笔试中所体现的具体能力。例如,从待处理笔试数据即真实中提取的候选者特征可以是候选者u1的独热(one-hot)向量
Figure BDA0003763384020000151
候选者的笔试能力信息可以是候选者关于笔试的宏观表征
Figure BDA0003763384020000152
可以是一个d维向量。
Figure BDA0003763384020000153
其中WU可以是一个嵌入矩阵,WU可以具有初始值。在后续训练过程中可以对WU进行学习和更新,进而更新笔试能力信息。训练完成后,利用笔试能力预测模型中训练后的WU与某个候选者的真实笔试数据的独热编码可以预测得到该候选者的笔试能力信息。
此外,可以基于真实笔试数据对已训练的笔试能力预测模型进行动态更新,具体过程可以参见利用训练笔试数据更新的过程。笔试能力预测模型的算损失函数的构建方式也可以参见上述实施例的训练方法中的相关描述。
在一种可能的实施方式中,如图12所示,采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息,包括:
S1201、从该待处理面试数据中提取初始的面试表征信息;
S1202、基于该面试表征信息,得到第一均值和第一方差;
S1203、基于该第一均值和该第一方差得到符合高斯分布的第一表征信息,从该第一表征信息中采样得到第一分布潜在变量;
S1204、基于第一分布潜在变量得到第一主题分布信息;
S1205、基于第一主题表征信息和整体技能表征信息得到第一主题集合;
S1206、基于该第一主题分布信息与该第一主题集合得到预测的面试表征信息;
S1207、基于该第一主题分布信息与该第一主题表征信息,得到面试能力信息。
参见图5的示例,从待处理面试数据即真实面试数据中提取候选者u1的初始的面试表征信息
Figure BDA0003763384020000154
作为面试能力预测模型的输入向量。向量
Figure BDA0003763384020000155
分别过两个神经网络全连接层(或称为全连接神经网络)得到第一均值μA和第一方差σA。接着,从符合高斯分布N(μA,(σA)2)的特征中采样得到第一分布潜在变量例如高斯随机向量
Figure BDA0003763384020000156
然后过softmax层得到第一主题分布信息例如主题分布向量
Figure BDA0003763384020000157
将第一主题表征信息例如主题表征矩阵tA和整体技能表征信息例如技能表征矩阵hS叉乘,并过softmax层得到第一主题集合βA。最后将第一主题分布信息
Figure BDA0003763384020000161
与第一主题集合βA相乘得到预测值、即预测的面试表征信息
Figure BDA0003763384020000162
此外,面试能力信息
Figure BDA0003763384020000163
通过候选者的真实面试数据可以得到面试相关的初始的面试表征信息、预测的面试表征信息、主题分布、主题集合等,能够得到候选者的更准确的面试能力信息。
此外,可以基于真实面试数据对已训练的笔试能力预测模型进行动态更新,具体过程可以参见利用训练面试数据更新的过程。面试能力预测模型的算损失函数的构建方式也可以参见上述实施例的训练方法中的相关描述。
在一种可能的实施方式中,如图13所示,采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息,包括:
S1301、从该待处理简历数据中提取初始的简历表征信息;
S1302、基于该简历表征信息,得到第二均值和第二方差;
S1303、基于该第二均值和该第二方差得到符合高斯分布的第二表征信息,从该第二表征信息中采样得到第二分布潜在变量;
S1304、基于该第二分布潜在变量得到第二主题分布信息;
S1305、基于第二主题表征信息和整体技能表征信息得到第二主题集合;
S1306、基于该第二主题分布信息与该第二主题集合得到预测的简历表征信息;
S1307、基于该第二主题分布信息与该第二主题表征信息,得到简历能力信息。
参见图6的示例,从待处理简历数据即真实简历数据中提取候选者u1的面试表征信息
Figure BDA0003763384020000164
作为简历能力预测模型的输入向量。向量
Figure BDA0003763384020000165
分别过两个神经网络全连接层(或称为全连接神经网络)得到第二均值μR和第二方差σR。接着,从符合高斯分布N(μR,(σR)2)的特征中采样得到第二分布潜在变量例如高斯随机向量
Figure BDA0003763384020000166
然后过softmax层得到第二主题分布信息例如主题分布向量
Figure BDA0003763384020000167
将第二主题表征信息例如主题表征矩阵tR和整体技能表征信息例如技能表征矩阵hS叉乘,并过softmax层得到第二主题集合βR。最后将第二主题分布信息
Figure BDA0003763384020000168
与第二主题集合βR相乘得到预测值、即预测的简历表征信息
Figure BDA0003763384020000169
此外,面试能力信息
Figure BDA00037633840200001610
通过候选者的真实简历数据得到简历相关的初始的简历表征信息、预测的简历表征信息、主题分布、主题集合等,能够得到候选者的更准确的简历能力信息。
此外,可以基于真实简历数据对已训练的简历能力预测模型进行动态更新,具体过程可以参见利用训练简历数据更新的过程。简历能力预测模型的算损失函数的构建方式也可以参见上述实施例的训练方法中的相关描述。
在一种可能的实施方式中,如图14所示,采用需求匹配模型对该多种能力信息和需求信息进行处理,得到该候选者的需求匹配结果,包括:
S1401、基于该多种能力信息和注意力权重得到整体能力信息;
S1402、基于该整体能力信息和技能表征信息得到特定技能信息;
S1403、基于该特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
例如,基于候选者u1的笔试能力信息为
Figure BDA0003763384020000171
简历能力信息为
Figure BDA0003763384020000172
面试能力信息为
Figure BDA0003763384020000173
采用注意力机制得到候选者的整体宏观能力即整体能力信息为h1∈R1×d
Figure BDA0003763384020000174
其中,aE、aR、aA为注意力权重,这些权重可以是训练后的权重。
在得到候选者的宏观能力h1后,将h1与技能表征矩阵hS叉乘得到候选者例如求职者在特定技能上的掌握情况α1∈R1×K
α1=sigmoid(h1×(hS)T)
岗位p1的技能需求γ1∈R1×K的公式示例如下:
Figure BDA0003763384020000175
其中,
Figure BDA0003763384020000176
是岗位p1的one-hot向量,WJ是训练后的矩阵。
最后,将候选者u1在特定技能的掌握情况向量α1与岗位p1的技能需求向量γ1对位相乘,预测的申请成功的概率:
Figure BDA0003763384020000177
其中,α1,s表示候选者u1的技能s的掌握情况向量,γ1,s表示岗位p1的技能s的需求向量γ1
通过需求匹配模型能够识别候选者与岗位之间的匹配程度,能够基于候选者的整体能力信息,以及岗位的具体的技能需求信息,为候选者推荐合适的岗位,或者为岗位推荐合适的候选者。
图15是根据本公开一实施例的联合能力模型的训练装置的结构示意图,该联合能力模型包括多种能力预测模型和需求匹配模型,该装置可以包括:
能力预测模块1501,用于采用多种能力预测模型对样本数据进行处理,得到多种能力信息;
需求匹配模块1502,用于采用需求匹配模型对该多种能力信息和需求信息进行处理,得到需求匹配结果,该需求信息包括目标场景需要满足的能力信息;
训练模块1503,用于基于需求匹配结果对该需求匹配模型和该多种能力预测模型进行训练,以更新该需求匹配模型和该多种能力预测模型的参数。
在一种可能的实施方式中,如图16所示,该能力预测模块1501包括以下至少两个:
笔试能力预测子模块15011,用于采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息;
面试能力预测子模块15012,用于采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息;
简历能力预测子模块15013,用于采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息。
在一种可能的实施方式中,该笔试能力预测子模块15011还用于从该样本笔试数据中提取候选者特征;基于该候选者特征得到候选者的笔试能力信息。
在一种可能的实施方式中,该笔试能力预测模型的损失函数是基于该笔试能力预测模型预测的答题正确的概率和实际的答题结果构建的;其中,该答题正确的概率是该笔试能力预测模型基于该样本笔试数据得到的候选者与题目的交互信息预测得到的。
在一种可能的实施方式中,该笔试能力预测子模块15011还用于获取该候选者与题目的交互信息的步骤,包括:
从该样本笔试数据中提取候选者特征和题目特征;
基于该候选者特征得到笔试能力信息;
基于该笔试能力信息和整体技能表征信息得到笔试技能表征信息;
基于该题目特征得到题目难度信息和题目区分度信息;
基于笔试技能表征信息、该题目难度信息、该题目区分度信息和题目关联技能信息,得到该候选者与题目的交互信息。
在一种可能的实施方式中,该面试能力预测子模块15012用于:
从该样本面试数据中提取初始的面试表征信息;
基于该面试表征信息,得到第一均值和第一方差;
基于该第一均值和该第一方差得到符合高斯分布的第一表征信息,从该第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于该第一主题分布信息与该第一主题集合得到预测的面试表征信息;
基于该第一主题分布信息与该第一主题表征信息,得到面试能力信息。
在一种可能的实施方式中,该面试能力预测模型的损失函数是基于该第一主题分布信息、该第一分布潜在变量、该预测的面试表征信息和该第一主题集合构建的。
在一种可能的实施方式中,该简历能力预测子模块15013还用于:
从该样本简历数据中提取初始的简历表征信息;
基于该简历表征信息,得到第二均值和第二方差;
基于该第二均值和该第二方差得到符合高斯分布的第二表征信息,从该第二表征信息中采样得到第二分布潜在变量;
基于该第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于该第二主题分布信息与该第二主题集合得到预测的简历表征信息;
基于该第二主题分布信息与该第二主题表征信息,得到简历能力信息。
在一种可能的实施方式中,该简历能力预测模型的损失函数是基于该第二主题分布信息、该第二分布潜在变量、该预测的简历表征信息以及该第二主题集合构建的。
在一种可能的实施方式中,如图16所示,该需求匹配模块1502包括:
整体能力子模块15021,用于基于该多种能力信息和注意力权重得到整体能力信息;
特定技能子模块15022,用于基于该整体能力信息和技能表征信息得到特定技能信息;
需求匹配子模块15023,用于基于该特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
在一种可能的实施方式中,该需求匹配模型的损失函数是基于预测的需求匹配结果和真实的需求匹配结果构建的。
在一种可能的实施方式中,该训练模块1503包括:
整体损失子模块15031,用于基于该需求匹配模型的损失函数和该多种能力预测模型的损失函数,得到整体损失函数;
更新子模块15032,用于在基于该整体损失函数确定需要更新的情况下,利用该需求匹配模型的损失函数更新该需求匹配模型,并且利用该多种能力预测模型的损失函数分别更新对应的能力预测模型。
在一种可能的实施方式中,该更新子模块15032用于利用该需求匹配模型的损失函数更新该需求匹配模型,包括:基于该需求匹配模型的损失函数,更新该需求匹配模型中的注意力权重、整体技能信息和岗位技能需求信息中的至少一项。
在一种可能的实施方式中,该更新子模块15032还用于利用该多种能力预测模型的损失函数分别更新对应的能力预测模型,包括以下至少两个:
基于笔试能力预测模型的损失函数,更新该笔试能力预测模型的笔试能力信息、题目难度信息、题目区分度信息和整体技能表征信息中的至少一项;
基于面试能力预测模型的损失函数,更新该面试能力预测模型的全连接层参数、第一主题表征信息和整体技能表征信息中的至少一项;
基于简历能力预测模型的损失函数,更新该简历能力预测模型的全连接层参数、第二主题表征信息和整体技能表征信息中的至少一项。
图17是根据本公开一实施例的能力需求匹配装置的结构示意图,该装置可以包括:
能力预测模块1701,用于采用多种能力预测模型对候选者的多种待处理数据进行处理,得到该候选者的多种能力信息;
需求匹配模块1702,用于采用需求匹配模型对该多种能力信息和需求信息进行处理,得到该候选者的需求匹配结果,该需求信息包括目标场景需要满足的能力信息。
在一种可能的实施方式中,如图18所示,该能力预测模块1701,包括以下至少两个:
笔试能力预测子模块17011,用于采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息;
面试能力预测子模块17012,用于采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息;
简历能力预测子模块17013,用于采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息。
在一种可能的实施方式中,该笔试能力预测子模块17011还用于从该待处理笔试数据中提取候选者特征;基于该候选者特征得到候选者的笔试能力信息。
在一种可能的实施方式中,该面试能力预测子模块17012还用于:
从该待处理面试数据中提取初始的面试表征信息;
基于该面试表征信息,得到第一均值和第一方差;
基于该第一均值和该第一方差得到符合高斯分布的第一表征信息,从该第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于该第一主题分布信息与该第一主题集合得到预测的面试表征信息;
基于该第一主题分布信息与该第一主题表征信息,得到面试能力信息。
在一种可能的实施方式中,该简历能力预测子模块17013用于:
从该待处理简历数据中提取初始的简历表征信息;
基于该简历表征信息,得到第二均值和第二方差;
基于该第二均值和该第二方差得到符合高斯分布的第二表征信息,从该第二表征信息中采样得到第二分布潜在变量;
基于该第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于该第二主题分布信息与该第二主题集合得到预测的简历表征信息;
基于该第二主题分布信息与该第二主题表征信息,得到简历能力信息。
在一种可能的实施方式中,该需求匹配模块1702包括:
整体能力子模块17021,用于基于该多种能力信息和注意力权重得到整体能力信息;
特定技能子模块17022,用于基于该整体能力信息和技能表征信息得到特定技能信息;
需求匹配子模块17023,用于基于该特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
本公开实施例的装置的各模块、子模块的具体功能和示例的描述,可以参见上述方法实施例中对应步骤的相关描述,在此不再赘述。
在相关技术中,专家决策包括:专家(人事部门等)基于以往经验,对候选者的笔试成绩、简历中的掌握技能以及项目经验、面试评估报告等因素进行综合的决策。但是,专家决策对人工经验依赖性强,存在决策效率低、缺乏可解释性、综合决策具有较强的主观性等问题。而且,由于不同的专家以往的经验不同,可能导致具有不同的决策偏好,扩展性不足。
在相关技术中,基于匹配的算法使用基于自然语言处理技术对候选者的简历信息和岗位的技能需求进行简单匹配,并基于匹配情况进行决策。该方案可以辅助专家进行决策,但只是将候选者的简历和岗位信息进行匹配,并未全面考虑候选者的多源评估数据(笔试、面试评估),缺乏一定的可解释性。
本公开实施例的联合能力模型的训练方法可以用于人才招聘中的联合能力诊断过程中,通过联合建模多源异构评估结果来提高人才招聘中的能力评估表现。
应用场景包括但不限于:整合候选者的多源评估结果,得到候选者的综合评估,并针对不同岗位的技能需求选择最合适的候选者,实现岗位与人才的最佳匹配,提高人才招聘的效率,减少岗位间竞争导致的人才流失。
在人才招聘中的联合能力诊断过程中,可以分别基于候选者的简历数据、笔试数据和面试数据建模候选者的能力。例如,基于简历的能力、基于笔试的能力和基于面试的能力等。并采用注意力机制智能整合候选者的多源异构评估结果得到候选者的综合能力评估。通过预测候选者的综合能力和岗位的技能需求(或称为岗位的能力要求)的匹配程度,还原历史招聘记录中的专家决策过程。并且,可以结合预测结果和真实结果例如实际的入职结果,在迭代中实现各个模型的相关参数的训练学习。参见图19,人才招聘中的联合能力诊断过程具体可以包含以下环节。
下面参考表1中本公开实施例中的主要数学符号和说明,详细描述各个环节的具体步骤。
表1:数学符号和说明
Figure BDA0003763384020000221
Figure BDA0003763384020000231
(一)多源候选者能力建模:
1、基于笔试数据的候选者能力建模
假设***中存在N位候选者例如求职者、M道习题(也可以称为题目、练习题等)、K个技能。
其中,候选者编号ui∈R1×N,习题编号ej∈R1×M,技能表征矩阵hS∈RK×d,WU、Wdiff、Wdisc分别是可学习的嵌入矩阵。候选者ui、习题ej的one-hot向量分别为
Figure BDA0003763384020000232
Figure BDA0003763384020000233
候选者关于笔试的宏观表征(向量)
Figure BDA0003763384020000234
R1×d的上标d表示宏观能力维度。
候选者关于笔试的在特定技能上的表征(向量)
Figure BDA0003763384020000235
Figure BDA0003763384020000236
R1×K的上标K表示技能的维度。
习题的难度参数(向量)
Figure BDA0003763384020000237
习题的区分度参数
Figure BDA0003763384020000238
习题关联技能向量
Figure BDA0003763384020000239
表示习题考察的技能情况。例如,若习题ej考察技能s,则
Figure BDA00037633840200002310
的第s个元素位置为1,否则为0。
基于教育心理学的项目反应理论公式:
Figure BDA0003763384020000241
其中,符号
Figure BDA0003763384020000242
表示对位相乘。
参见图20,为笔试能力预测模型中的候选者(例如学生、求职者等)与习题之间的交互的神经网络FCL,将x作为FCL的输入,输出为
Figure BDA0003763384020000243
即预测作答正确的概率。
基于候选者的笔试作答数据,建模候选者的能力参数和习题的参数表征,然后遵循心理学的项目反应理论思想构建候选者与习题的交互公式后,可以采用具有较强拟合能力的神经网络自动学习候选者与习题之间的交互作用,输出候选者正确作答习题的概率。并且,将正确作答习题的概率与真实作答结果比较计算损失函数,更新笔试能力预测模型的参数。基于笔试的候选者能力建模的损失函数lossE
Figure BDA0003763384020000244
其中,
Figure BDA0003763384020000245
为候选者ui作答习题ej的真实情况,
Figure BDA0003763384020000246
为模型预测候选者ui作答习题ej的情况。基于笔试记录最小化该损失函数来学习每个候选者的能力
Figure BDA0003763384020000247
2、基于简历数据/面试数据的候选者能力建模:
参见图21,简历能力预测模型的输入为简历ri的表征(向量)
Figure BDA0003763384020000248
Figure BDA0003763384020000249
包括从简历文本中提取的技能。例如若简历文本中存在技能s,则
Figure BDA00037633840200002410
的第s个元素位置为1,否则为0。
Figure BDA00037633840200002411
分别过两个全连接神经网络得到均值μR和方差σR,然后从符合高斯分布N(μR,(σR)2)的表征中采样得到分布潜在变量例如高斯随机向量
Figure BDA00037633840200002412
然后过softmax得到主题分布(向量)
Figure BDA00037633840200002413
将主题表征(矩阵)tR和技能表征(矩阵)hS叉乘并过softmax得到主题集合(矩阵)βR,最后将
Figure BDA00037633840200002414
与βR相乘得到预测值。
主题分布(向量)
Figure BDA00037633840200002415
对应每个主题的概率,表示在每个主题下(技能组)的掌握情况。
主题表征(矩阵)
Figure BDA00037633840200002416
假设在***中关于简历的技能存在KR个主题,其中每个主题表示一组较为接近的技能词,比如卷积、机器学习等。每个主题都有一个表征向量,即主题特定向量。
Figure BDA00037633840200002417
表示主题k的特定向量。
主题在技能词的分布
Figure BDA00037633840200002418
表示每个主题k在对应技能上的熟练程度,
Figure BDA00037633840200002419
hS表示技能表征矩阵。
最终,将简历的主题分布(向量)
Figure BDA0003763384020000251
与主题表征(矩阵)tR相乘,可以得到候选者例如求职者在简历上的宏观能力(向量):
Figure BDA0003763384020000252
基于与简历建模类似的原理进行面试建模,面试评估的主题分布(向量)
Figure BDA0003763384020000253
与主题表征(矩阵)tA相乘,可以得到候选者在面试评估上的宏观能力(向量):
Figure BDA0003763384020000254
基于简历/面试数据的候选者能力建模后,可以基于候选者的简历/面试数据,从候选者的简历/面试中了解他们的能力。由于主题模型以具有高可解释性的有效表示来解释隐藏的决策逻辑而闻名,这里可以基于主题模型挖掘简历中体现的潜在能力表征。基于简历的候选者能力建模的损失函数可以为:
Figure BDA0003763384020000255
其中,
Figure BDA0003763384020000256
是简历ri的主题分布,
Figure BDA0003763384020000257
是一个分布潜在变量,
Figure BDA0003763384020000258
是简历ri的表征,βR是简历的主题集合。
基于面试的候选者能力建模的损失函数可以为:
Figure BDA0003763384020000259
其中,
Figure BDA00037633840200002510
是面试ai的主题分布,
Figure BDA00037633840200002511
是一个分布潜在变量,
Figure BDA00037633840200002512
是面试ai的表征,βA是面试的主题集合。其中“|”表示先验概率问题;“||”表示并列。
Figure BDA00037633840200002513
表示求先验分布
Figure BDA00037633840200002514
和后验分布
Figure BDA00037633840200002515
的距离。
以下为简历的损失函数的具体公式推理过程的示例,面试也是类似的不再赘述:
(1)损失函数:
Figure BDA00037633840200002516
(2)生成过程:可以为每个简历使用以上模型定义一个生成模型,
Figure BDA00037633840200002517
Figure BDA00037633840200002518
上式中的下标s表示技能的计数值;K表示知识点的个数,相当于上述的技能维度K。
其中,假设
Figure BDA0003763384020000261
是从一个高斯随机向量
Figure BDA0003763384020000262
中得到,
Figure BDA0003763384020000263
Figure BDA0003763384020000264
(3)推理过程:使用变分推理算法来推断简历的主题分布概率
Figure BDA0003763384020000265
基本的思想是优化参数
Figure BDA0003763384020000266
因此使用KL分布来接近真实后验分布。在这里,可以将变分分布定义为高斯分布,
Figure BDA0003763384020000267
其中,
Figure BDA0003763384020000268
f1,f2是全连接神经网络层的参数。
简历Ri的嵌入
Figure BDA0003763384020000269
fr是神经网络的参数,参见图21。
最后,可以对
Figure BDA00037633840200002610
的后验分布进行近似,并通过最小化下限证据推断出每个候选者ui
Figure BDA00037633840200002611
的损失函数公式如下,
Figure BDA00037633840200002612
(二)多源候选者能力整合:基于(一)中得到的关于候选者的多源能力,采用注意力机制分别学习对候选者不同能力的侧重,并使用线性叠加函数将多源候选者能力整合得到候选者的综合能力。
(三)岗位技能需求建模:基于岗位的信息数据,提取出岗位对特定技能的需求情况。
(四)候选者-岗位匹配:
候选者例如求职者与岗位匹配的建模过程示例如下:
分别在笔试、简历、面试数据中建模候选者的能力
Figure BDA00037633840200002613
然后采用注意力机制得到候选者的整体宏观能力(向量)hi∈R1×d,即
Figure BDA00037633840200002614
其中,aE、aR、aA为注意力权重。
在得到候选者的宏观能力后,与技能表征矩阵hS叉乘得到候选者在特定技能上的掌握情况向量αi∈R1×K
αi=sigmoid(hi×(hS)T)
岗位的技能需求向量γp∈R1×K:表示岗位pp对特定技能的需求情况(向量),公式如下,
Figure BDA0003763384020000271
其中,
Figure BDA0003763384020000272
是岗位pp的one-hot向量,WJ是可学习的训练矩阵。
最后,将求职者在特定技能的掌握情况αi与岗位的技能需求向量γp对位相乘,预测入职概率,
Figure BDA0003763384020000273
其中,αi,s表示技能s(第s个技能)的掌握情况向量,γp,s表示岗位的技能s的需求向量。
将(二)中得到的候选者综合能力和(三)中得到的岗位技能需求进行匹配,判断候选者的能力是否适合该岗位,并基于匹配结果,对候选者是否成功申请该岗位进行预测。候选者-岗位匹配建模的损失函数:
Figure BDA0003763384020000274
其中,yi是候选者ui真实是否申请成功的标签,
Figure BDA0003763384020000275
是模型预测候选者ui申请成功的概率。
(五)损失函数计算:将(四)中获得预测结果与实际招聘情况进行比较,找出所有预测错误的情况,计算损失函数。例如,整体损失函数的示例:
loss=α*lossE+β*lossR+γ*lossA+η*lossD
(六)参数更新:利用(五)中的损失函数,更新整个模型的参数。联合训练:如果(五)的损失函数的计算结果表示需要更新参数,根据每个模型对应的损失函数分别调整各个模型的参数。如果(五)的损失函数的计算结果表示需要收敛,所有模型停止调参。
本公开实施例的方案诊断出候选者的综合能力后,可以有以下的具体应用。
(1)候选者能力刻画:
可通过映射操作得到候选者在特定技能上的掌握情况,获知候选者的薄弱/熟练技能点。
在得到新技能表征后,也可通过候选者综合能力的潜在表征映射到该技能,得到候选者在新技能上的掌握情况。
通过线性叠加函数得到候选者对相关技能集合的整体掌握情况。
(2)人才检索服务:
框架可将候选者按照对某技能组合的掌握情况排序,然后根据岗位对技能的需求,为特定岗位推荐最优的K个候选者,可有效避免因同一岗位内竞争导致的人才流失,以确保岗位招聘的是最合适的候选者。
本公开实施例的方案应用于人才招聘场景具有以下特点的至少之一:
全面性。基于本公开实施例的方案的框架可以提供人才招聘中的联合能力诊断方法,与传统的基于匹配方法相比,考虑候选者的数据更全面,从不同维度建模候选者能力来提高人才招聘中的能力评估表现。
高效性。基于本公开实施例的方案的框架,可以直接进行决策、也可以辅助专家决策,与传统的人工决策方法相比,可大幅度的提升招聘效率。
可解释性。基于本公开实施例的方案的框架,可以刻画出候选者在特定技能上的掌握情况,以及岗位在特定技能上的需求情况,不存在黑箱,具有良好的可解释性。
客观性。基于本公开实施例的方案的框架,基于候选者的多源数据建模候选者的综合能力,与传统的人力专家人工整合多源评估结果相比,减少了主观性因素。
可扩展性。针对不同的场景,不同的候选者数据,基于本公开实施例的方案的框架均可以适用,具有较强的可扩展性。
平衡性。基于本公开实施例的方案的框架可针对特定技能组合,对候选者进行排序,以保证岗位招聘的人才是最合适的,并且可以有效避免同一岗位的竞争导致的人才流失。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图22示出了可以用来实施本公开的实施例的示例电子设备2200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图22所示,设备2200包括计算单元2201,其可以根据存储在只读存储器(ROM)2202中的计算机程序或者从存储单元2208加载到随机访问存储器(RAM)2203中的计算机程序,来执行各种适当的动作和处理。在RAM 2203中,还可存储设备2200操作所需的各种程序和数据。计算单元2201、ROM 2202以及RAM 2203通过总线2204彼此相连。输入/输出(I/O)接口2205也连接至总线2204。
设备2200中的多个部件连接至I/O接口2205,包括:输入单元2206,例如键盘、鼠标等;输出单元2207,例如各种类型的显示器、扬声器等;存储单元2208,例如磁盘、光盘等;以及通信单元2209,例如网卡、调制解调器、无线通信收发机等。通信单元2209允许设备2200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元2201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元2201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元2201执行上文所描述的各个方法和处理,例如联合能力模型的训练方法或能力需求匹配方法。例如,在一些实施例中,联合能力模型的训练方法或能力需求匹配方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元2208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 2202和/或通信单元2209而被载入和/或安装到设备2200上。当计算机程序加载到RAM2203并由计算单元2201执行时,可以执行上文描述的联合能力模型的训练方法或能力需求匹配方法的一个或多个步骤。备选地,在其他实施例中,计算单元2201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行联合能力模型的训练方法或能力需求匹配方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (43)

1.一种联合能力模型的训练方法,所述联合能力模型包括多种能力预测模型和需求匹配模型,所述方法包括:
采用所述多种能力预测模型对样本数据进行处理,得到多种能力信息;
采用所述需求匹配模型对所述多种能力信息和需求信息进行处理,得到需求匹配结果,所述需求信息包括目标场景需要满足的能力信息;
基于所述需求匹配结果对所述需求匹配模型和所述多种能力预测模型进行训练,以更新所述需求匹配模型和所述多种能力预测模型的参数。
2.根据权利要求1所述的方法,其中,采用所述多种能力预测模型对样本数据进行处理,得到多种能力信息,包括以下至少两个步骤:
采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息;
采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息;
采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息。
3.根据权利要求2所述的方法,其中,采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息,包括:
从所述样本笔试数据中提取候选者特征;
基于所述候选者特征得到候选者的笔试能力信息。
4.根据权利要求3所述的方法,其中,所述笔试能力预测模型的损失函数是基于所述笔试能力预测模型预测的答题正确的概率和实际的答题结果构建的;其中,所述答题正确的概率是所述笔试能力预测模型基于所述样本笔试数据得到的候选者与题目的交互信息预测得到的。
5.根据权利要求4所述的方法,其中,所述候选者与题目的交互信息的获取步骤,包括:
从所述样本笔试数据中提取候选者特征和题目特征;
基于所述候选者特征得到笔试能力信息;
基于所述笔试能力信息和整体技能表征信息得到笔试技能表征信息;
基于所述题目特征得到题目难度信息和题目区分度信息;
基于笔试技能表征信息、所述题目难度信息、所述题目区分度信息和题目关联技能信息,得到所述候选者与题目的交互信息。
6.根据权利要求2至5中任一项所述的方法,采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息,包括:
从所述样本面试数据中提取的面试表征信息;
基于所述面试表征信息,得到第一均值和第一方差;
基于所述第一均值和所述第一方差得到符合高斯分布的第一表征信息,从所述第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于所述第一主题分布信息与所述第一主题集合得到预测的面试表征信息;
基于所述第一主题分布信息与所述第一主题表征信息,得到面试能力信息。
7.根据权利要求6所述的方法,其中,所述面试能力预测模型的损失函数是基于所述第一主题分布信息、所述第一分布潜在变量、所述预测的面试表征信息和所述第一主题集合构建的。
8.根据权利要求2至7中任一项所述的方法,采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息,包括:
从所述样本简历数据中提取的简历表征信息;
基于所述简历表征信息,得到第二均值和第二方差;
基于所述第二均值和所述第二方差得到符合高斯分布的第二表征信息,从所述第二表征信息中采样得到第二分布潜在变量;
基于所述第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于所述第二主题分布信息与所述第二主题集合得到预测的简历表征信息;
基于所述第二主题分布信息与所述第二主题表征信息,得到简历能力信息。
9.根据权利要求8所述的方法,其中,所述简历能力预测模型的损失函数是基于所述第二主题分布信息、所述第二分布潜在变量、所述预测的简历表征信息以及所述第二主题集合构建的。
10.根据权利要求1至9中任一项所述的方法,其中,采用所述需求匹配模型对所述多种能力信息和需求信息进行处理,得到需求匹配结果,包括:
基于所述多种能力信息和注意力权重得到整体能力信息;
基于所述整体能力信息和技能表征信息得到特定技能信息;
基于所述特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
11.根据权利要求10所述的方法,其中,所述需求匹配模型的损失函数是基于预测的需求匹配结果和真实的需求匹配结果构建的。
12.根据权利要求1至11中任一项所述的方法,其中,基于所述需求匹配结果对所述需求匹配模型和所述多种能力预测模型进行训练,以更新所述需求匹配模型和所述多种能力预测模型的参数,包括:
基于所述需求匹配模型的损失函数和所述多种能力预测模型的损失函数,得到整体损失函数;
在基于所述整体损失函数确定需要更新的情况下,利用所述需求匹配模型的损失函数更新所述需求匹配模型,并且利用所述多种能力预测模型的损失函数分别更新对应的能力预测模型。
13.根据权利要求12所述的方法,其中,利用所述需求匹配模型的损失函数更新所述需求匹配模型,包括:
基于所述需求匹配模型的损失函数,更新所述需求匹配模型中的注意力权重、整体技能表征信息和岗位技能需求信息中的至少一项。
14.根据权利要求12或13所述的方法,其中,利用所述多种能力预测模型的损失函数分别更新对应的能力预测模型,包括以下至少两个步骤:
基于笔试能力预测模型的损失函数,更新所述笔试能力预测模型的笔试能力信息、题目难度信息、题目区分度信息和整体技能表征信息中的至少一项;
基于面试能力预测模型的损失函数,更新所述面试能力预测模型的全连接层参数、第一主题表征信息和整体技能表征信息中的至少一项;
基于简历能力预测模型的损失函数,更新所述简历能力预测模型的全连接层参数、第二主题表征信息和整体技能表征信息中的至少一项。
15.一种能力需求匹配方法,包括:
采用多种能力预测模型对候选者的多种待处理数据进行处理,得到所述候选者的多种能力信息;
采用需求匹配模型对所述多种能力信息和需求信息进行处理,得到所述候选者的需求匹配结果,所述需求信息包括目标场景需要满足的能力信息。
16.根据权利要求15所述的方法,其中,采用多种能力预测模型对候选者的多种待处理数据进行处理,得到所述候选者的多种能力信息,包括以下至少两个步骤:
采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息;
采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息;
采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息。
17.根据权利要求16所述的方法,其中,采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息,包括:
从所述待处理笔试数据中提取候选者特征;
基于所述候选者特征得到候选者的笔试能力信息。
18.根据权利要求16或17所述的方法,采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息,包括:
从所述待处理面试数据中提取的面试表征信息;
基于所述面试表征信息,得到第一均值和第一方差;
基于所述第一均值和所述第一方差得到符合高斯分布的第一表征信息,从所述第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于所述第一主题分布信息与所述第一主题集合得到预测的面试表征信息;
基于所述第一主题分布信息与所述第一主题表征信息,得到面试能力信息。
19.根据权利要求16至18中任一项所述的方法,采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息,包括:
从所述待处理简历数据中提取的简历表征信息;
基于所述简历表征信息,得到第二均值和第二方差;
基于所述第二均值和所述第二方差得到符合高斯分布的第二表征信息,从所述第二表征信息中采样得到第二分布潜在变量;
基于所述第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于所述第二主题分布信息与所述第二主题集合得到预测的简历表征信息;
基于所述第二主题分布信息与所述第二主题表征信息,得到简历能力信息。
20.根据权利要求15至19中任一项所述的方法,其中,采用需求匹配模型对所述多种能力信息和需求信息进行处理,得到所述候选者的需求匹配结果,包括:
基于所述多种能力信息和注意力权重得到整体能力信息;
基于所述整体能力信息和技能表征信息得到特定技能信息;
基于所述特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
21.一种联合能力模型的训练装置,所述联合能力模型包括多种能力预测模型和需求匹配模型,所述装置包括:
能力预测模块,用于采用所述多种能力预测模型对样本数据进行处理,得到多种能力信息;
需求匹配模块,用于采用所述需求匹配模型对所述多种能力信息和需求信息进行处理,得到需求匹配结果,所述需求信息包括目标场景需要满足的能力信息;
训练模块,用于基于所述需求匹配结果对所述需求匹配模型和所述多种能力预测模型进行训练,以更新所述需求匹配模型和所述多种能力预测模型的参数。
22.根据权利要求21所述的装置,其中,所述能力预测模块包括以下至少两个:
笔试能力预测子模块,用于采用笔试能力预测模型对样本笔试数据进行处理,得到笔试能力信息;
面试能力预测子模块,用于采用面试能力预测模型对样本面试数据进行处理,得到面试能力信息;
简历能力预测子模块,用于采用简历能力预测模型对样本简历数据进行处理,得到简历能力信息。
23.根据权利要求22所述的装置,其中,所述笔试能力预测子模块用于从所述样本笔试数据中提取候选者特征;基于所述候选者特征得到候选者的笔试能力信息。
24.根据权利要求23所述的装置,其中,所述笔试能力预测模型的损失函数是基于所述笔试能力预测模型预测的答题正确的概率和实际的答题结果构建的;其中,所述答题正确的概率是所述笔试能力预测模型基于所述样本笔试数据得到的候选者与题目的交互信息预测得到的。
25.根据权利要求24所述的装置,其中,所述笔试能力预测子模块用于获取所述候选者与题目的交互信息的步骤,包括:
从所述样本笔试数据中提取候选者特征和题目特征;
基于所述候选者特征得到笔试能力信息;
基于所述笔试能力信息和整体技能表征信息得到笔试技能表征信息;
基于所述题目特征得到题目难度信息和题目区分度信息;
基于笔试技能表征信息、所述题目难度信息、所述题目区分度信息和题目关联技能信息,得到所述候选者与题目的交互信息。
26.根据权利要求22至25中任一项所述的装置,所述面试能力预测子模块用于:
从所述样本面试数据中提取的面试表征信息;
基于所述面试表征信息,得到第一均值和第一方差;
基于所述第一均值和所述第一方差得到符合高斯分布的第一表征信息,从所述第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于所述第一主题分布信息与所述第一主题集合得到预测的面试表征信息;
基于所述第一主题分布信息与所述第一主题表征信息,得到面试能力信息。
27.根据权利要求26所述的装置,其中,所述面试能力预测模型的损失函数是基于所述第一主题分布信息、所述第一分布潜在变量、所述预测的面试表征信息和所述第一主题集合构建的。
28.根据权利要求22至27中任一项所述的装置,所述简历能力预测子模块用于:
从所述样本简历数据中提取的简历表征信息;
基于所述简历表征信息,得到第二均值和第二方差;
基于所述第二均值和所述第二方差得到符合高斯分布的第二表征信息,从所述第二表征信息中采样得到第二分布潜在变量;
基于所述第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于所述第二主题分布信息与所述第二主题集合得到预测的简历表征信息;
基于所述第二主题分布信息与所述第二主题表征信息,得到简历能力信息。
29.根据权利要求28所述的装置,其中,所述简历能力预测模型的损失函数是基于所述第二主题分布信息、所述第二分布潜在变量、所述预测的简历表征信息以及所述第二主题集合构建的。
30.根据权利要求21至29中任一项所述的装置,其中,所述需求匹配模块包括:
整体能力子模块,用于基于所述多种能力信息和注意力权重得到整体能力信息;
特定技能子模块,用于基于所述整体能力信息和技能表征信息得到特定技能信息;
需求匹配子模块,用于基于所述特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
31.根据权利要求30所述的装置,其中,所述需求匹配模型的损失函数是基于预测的需求匹配结果和真实的需求匹配结果构建的。
32.根据权利要求21至31中任一项所述的装置,其中,所述训练模块包括:
整体损失子模块,用于基于所述需求匹配模型的损失函数和所述多种能力预测模型的损失函数,得到整体损失函数;
更新子模块,用于在基于所述整体损失函数确定需要更新的情况下,利用所述需求匹配模型的损失函数更新所述需求匹配模型,并且利用所述多种能力预测模型的损失函数分别更新对应的能力预测模型。
33.根据权利要求32所述的装置,其中,所述更新子模块用于利用所述需求匹配模型的损失函数更新所述需求匹配模型,包括:基于所述需求匹配模型的损失函数,更新所述需求匹配模型中的注意力权重、整体技能信息和岗位技能需求信息中的至少一项。
34.根据权利要求32或33所述的装置,其中,所述更新子模块用于利用所述多种能力预测模型的损失函数分别更新对应的能力预测模型,包括以下至少两个步骤:
基于笔试能力预测模型的损失函数,更新所述笔试能力预测模型的笔试能力信息、题目难度信息、题目区分度信息和整体技能表征信息中的至少一项;
基于面试能力预测模型的损失函数,更新所述面试能力预测模型的全连接层参数、第一主题表征信息和整体技能表征信息中的至少一项;
基于简历能力预测模型的损失函数,更新所述简历能力预测模型的全连接层参数、第二主题表征信息和整体技能表征信息中的至少一项。
35.一种能力需求匹配装置,包括:
能力预测模块,用于采用多种能力预测模型对候选者的多种待处理数据进行处理,得到所述候选者的多种能力信息;
需求匹配模块,用于采用需求匹配模型对所述多种能力信息和需求信息进行处理,得到所述候选者的需求匹配结果,所述需求信息包括目标场景需要满足的能力信息。
36.根据权利要求35所述的装置,其中,所述能力预测模块包括以下至少两个:
笔试能力预测子模块,用于采用笔试能力预测模型对待处理笔试数据进行处理,得到笔试能力信息;
面试能力预测子模块,用于采用面试能力预测模型对待处理面试数据进行处理,得到面试能力信息;
简历能力预测子模块,用于采用简历能力预测模型对待处理简历数据进行处理,得到简历能力信息。
37.根据权利要求36所述的装置,其中,所述笔试能力预测子模块用于从所述待处理笔试数据中提取候选者特征;基于所述候选者特征得到候选者的笔试能力信息。
38.根据权利要求36或37所述的装置,所述面试能力预测子模块用于:
从所述待处理面试数据中提取的面试表征信息;
基于所述面试表征信息,得到第一均值和第一方差;
基于所述第一均值和所述第一方差得到符合高斯分布的第一表征信息,从所述第一表征信息中采样得到第一分布潜在变量;
基于第一分布潜在变量得到第一主题分布信息;
基于第一主题表征信息和整体技能表征信息得到第一主题集合;
基于所述第一主题分布信息与所述第一主题集合得到预测的面试表征信息;
基于所述第一主题分布信息与所述第一主题表征信息,得到面试能力信息。
39.根据权利要求36至38中任一项所述的装置,所述简历能力预测子模块用于:
从所述待处理简历数据中提取的简历表征信息;
基于所述简历表征信息,得到第二均值和第二方差;
基于所述第二均值和所述第二方差得到符合高斯分布的第二表征信息,从所述第二表征信息中采样得到第二分布潜在变量;
基于所述第二分布潜在变量得到第二主题分布信息;
基于第二主题表征信息和整体技能表征信息得到第二主题集合;
基于所述第二主题分布信息与所述第二主题集合得到预测的简历表征信息;
基于所述第二主题分布信息与所述第二主题表征信息,得到简历能力信息。
40.根据权利要求35至39中任一项所述的装置,其中,所述需求匹配模块包括:
整体能力子模块,用于基于所述多种能力信息和注意力权重得到整体能力信息;
特定技能子模块,用于基于所述整体能力信息和技能表征信息得到特定技能信息;
需求匹配子模块,用于基于所述特定技能信息和岗位技能需求信息得到预测的需求匹配结果。
41.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-20中任一项所述的方法。
42.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-20中任一项所述的方法。
43.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-20中任一项所述的方法。
CN202210878392.6A 2022-07-25 2022-07-25 联合能力模型的训练方法、能力需求匹配方法和装置 Active CN115330142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210878392.6A CN115330142B (zh) 2022-07-25 2022-07-25 联合能力模型的训练方法、能力需求匹配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210878392.6A CN115330142B (zh) 2022-07-25 2022-07-25 联合能力模型的训练方法、能力需求匹配方法和装置

Publications (2)

Publication Number Publication Date
CN115330142A true CN115330142A (zh) 2022-11-11
CN115330142B CN115330142B (zh) 2023-06-02

Family

ID=83919194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210878392.6A Active CN115330142B (zh) 2022-07-25 2022-07-25 联合能力模型的训练方法、能力需求匹配方法和装置

Country Status (1)

Country Link
CN (1) CN115330142B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115758178A (zh) * 2022-11-23 2023-03-07 北京百度网讯科技有限公司 数据处理方法、数据处理模型训练方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180104789A (ko) * 2017-03-13 2018-09-27 서울대학교산학협력단 글로벌 건설인적자원 정보인프라 제공방법
CN114202309A (zh) * 2021-12-10 2022-03-18 北京百度网讯科技有限公司 用户与企业的匹配参数的确定方法、电子设备及程序产品
CN114418023A (zh) * 2022-01-25 2022-04-29 知乎创意(广州)数字科技有限公司 一种岗位匹配方法、***、设备及存储介质
CN114519503A (zh) * 2022-01-13 2022-05-20 河南工业大学 一种基于b/s下提供就业能力培养途径的方法及***
CN114548940A (zh) * 2022-02-25 2022-05-27 宜宾职业技术学院 基于互联网的人力资源教师管理信息化平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180104789A (ko) * 2017-03-13 2018-09-27 서울대학교산학협력단 글로벌 건설인적자원 정보인프라 제공방법
CN114202309A (zh) * 2021-12-10 2022-03-18 北京百度网讯科技有限公司 用户与企业的匹配参数的确定方法、电子设备及程序产品
CN114519503A (zh) * 2022-01-13 2022-05-20 河南工业大学 一种基于b/s下提供就业能力培养途径的方法及***
CN114418023A (zh) * 2022-01-25 2022-04-29 知乎创意(广州)数字科技有限公司 一种岗位匹配方法、***、设备及存储介质
CN114548940A (zh) * 2022-02-25 2022-05-27 宜宾职业技术学院 基于互联网的人力资源教师管理信息化平台

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115758178A (zh) * 2022-11-23 2023-03-07 北京百度网讯科技有限公司 数据处理方法、数据处理模型训练方法、装置及设备
CN115758178B (zh) * 2022-11-23 2024-02-06 北京百度网讯科技有限公司 数据处理方法、数据处理模型训练方法、装置及设备

Also Published As

Publication number Publication date
CN115330142B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN110188331B (zh) 模型训练方法、对话***评价方法、装置、设备及存储介质
Ribeiro et al. Anchors: High-precision model-agnostic explanations
CN111078836B (zh) 基于外部知识增强的机器阅读理解方法、***、装置
CN111191791A (zh) 机器学习模型的应用方法、训练方法、装置、设备及介质
CN111444709A (zh) 文本分类方法、装置、存储介质及设备
CN111783474A (zh) 一种评论文本观点信息处理方法、装置及存储介质
CN112632351B (zh) 分类模型的训练方法、分类方法、装置及设备
CN110322959B (zh) 一种基于知识的深度医疗问题路由方法及***
CN111428448A (zh) 文本生成方法、装置、计算机设备及可读存储介质
Aydın et al. Turkish sentiment analysis for open and distance education systems
CN116385937A (zh) 一种基于多粒度的跨模态交互框架解决视频问答的方法及***
CN112819024A (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
Durga et al. Deep-Sentiment: An Effective Deep Sentiment Analysis Using a Decision-Based Recurrent Neural Network (D-RNN)
Oreshin et al. Implementing a Machine Learning Approach to Predicting Students’ Academic Outcomes
CN115330142B (zh) 联合能力模型的训练方法、能力需求匹配方法和装置
CN113283488A (zh) 一种基于学习行为的认知诊断方法及***
CN117648915A (zh) 一种基于知识图谱的问答题评分方法及***
Chaudhary et al. Student future prediction using machine learning
CN116541507A (zh) 一种基于动态语义图神经网络的视觉问答方法及***
KR20210152980A (ko) 인공 지능 학습 기반의 학습 컨텐츠 추천 시스템 및 그것의 동작 방법
Singh et al. Analysis of Student Sentiment Level Using Perceptual Neural Boltzmann Machine Learning Approach for E-learning Applications
Alghalibi et al. Deep Tweets Analyzer Model for Twitter Mood Visualization and Prediction Based Deep Learning Approach
Ezenkwu et al. Automated Career Guidance Expert System Using Case-Based Reasoning
Meng et al. Nonlinear network speech recognition structure in a deep learning algorithm
US12028180B1 (en) Apparatus and method for monitoring multiparty stream communications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant