CN110263148A - 智能简历筛选方法及装置 - Google Patents
智能简历筛选方法及装置 Download PDFInfo
- Publication number
- CN110263148A CN110263148A CN201910565804.9A CN201910565804A CN110263148A CN 110263148 A CN110263148 A CN 110263148A CN 201910565804 A CN201910565804 A CN 201910565804A CN 110263148 A CN110263148 A CN 110263148A
- Authority
- CN
- China
- Prior art keywords
- resume
- ability
- label
- text
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种智能简历筛选方法及装置,智能简历筛选装置包括从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;根据所述能力标签树从获取的简历文本中提取能力标签;根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。本申请可基于需求能力标签库与简历自然文本进行自然语言分析,勾画简历的能力画像,实现简历的智能评价。一方面,最大程度上减少了人才筛选的人力投入,另一方面,利用银行现有的软硬件资源,进一步推动人工智能辅助生产决策。
Description
技术领域
本申请涉及人工智能技术,特别涉及信息筛选技术,具体涉及一种智能简历筛选方法及装置。
背景技术
各企事业在招聘的过程中,需要耗费人力去审阅大量的岗位申请简历,同时要求审阅者具备很高的岗位认知能力。现有的简历筛选多依靠相应岗位招聘专员,肉眼查阅简历,在大段文本介绍中寻找与岗位契合的能力,从而达到评判一份简历优劣的目的。人工审阅简历的过程评判依据比较主观,不同审阅者会存在认知差异,应聘者不能通过简历描述得到客观的优劣比较。另外,现有简历筛选处理过程数据复用率低,无法满足多次差异检索条件的快速查阅。
发明内容
针对现有技术中的问题,本申请提供一种智能简历筛选方法及装置,能够在简历筛选时快速提取所有应聘者简历的能力标签以及能力强度,从而实现简历快速评价,为人才筛选提供决策依据。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种智能简历筛选方法,包括:
从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
根据所述能力标签树从获取的简历文本中提取能力标签;
根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
进一步地,所述的智能简历筛选方法,还包括:创建所述能力标签库。
进一步地,所述创建所述能力标签库,包括:
获取各岗位对应的能力需求信息;
将能力需求信息进行领域分类,并将各领域划分为多个子类;
将各子类对应的不同能力赋予对应不同的能力标签;
确定岗位对应每个能力标签的权值。
进一步地,所述智能简历筛选方法,所述创建所述能力标签库还包括:
基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;
将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量。
进一步地,所述从获取的简历文本中提取能力标签,包括:
对所述简历文本的句子进行分词处理,得到简历分词文本;
对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;
计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;
根据预设的相似度阈值提取简历文本中能力标签。
进一步地,所述根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选,包括:
对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
将所述各子类的评分求和,得到所述简历的总评分;
根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,所述根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选,包括:
将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
将所述各子类的评分求和,得到所述简历的总评分;
根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,所述的智能简历筛选方法,还包括:
将简历文本拆分为句子列表;
对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;
对所述词语列表进行词性分析;
对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;
在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;
从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;
将所述修饰短语转化为数值强度,得到能力强度。
第二方面,本申请提供一种智能简历筛选装置,包括:
标签树生成单元,用于从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
标签提取单元,用于根据所述能力标签树从获取的简历文本中提取能力标签;
简历筛选单元,用于根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
进一步地,所述的智能简历筛选装置,还包括:标签库创建单元,用于创建所述能力标签库。
进一步地,所述标签库创建单元包括:
信息获取模块,用于获取各岗位对应的能力需求信息;
信息分类模块,用于将能力需求信息进行领域分类,并将各领域划分为多个子类;
标签确定模块,用于将各子类对应的不同能力赋予对应不同的能力标签;
权值确定模块,用于确定岗位对应每个能力标签的权值。
进一步地,所述的标签库创建单元,还包括:
匹配规则设定模块,用于基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;
第一文本向量化模块,用于将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量。
进一步地,所述标签提取单元,包括:
第一文本分词模块,用于对所述简历文本的句子进行分词处理,得到简历分词文本;
第二文本向量化模块,用于对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;
相似度评估模块,用于计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;
标签筛选模块,用于根据预设的相似度阈值提取简历文本中能力标签。
进一步地,所述简历筛选单元,包括:
第一子类标签评分模块,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
第一总评分模块,用于将所述各子类的评分求和,得到所述简历的总评分;
第一简历筛选模块,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,所述简历筛选单元,包括:
标签加权模块,用于将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
第二子类标签评分模块,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
第二总评分模块,用于将所述各子类的评分求和,得到所述简历的总评分;
第二简历筛选模块,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,所述的智能简历筛选装置,还包括:
文本拆分模块,用于将简历文本拆分为句子列表;
第二文本分词模块,用于对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;
词性标注模块,用于对所述词语列表进行词性分析;
句法分析模块,用于对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;
匹配词定位单元,用于在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;
修饰短语提取单元,用于从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;
修饰短语量化单元,用于将所述修饰短语转化为数值强度,得到能力强度。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的智能简历筛选方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的智能简历筛选方法的步骤。
由上述技术方案可知,本申请提供一种智能简历筛选方法及装置,智能简历筛选方法包括:从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;根据所述能力标签树从获取的简历文本中提取能力标签;根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选,可以快速提取所有应聘者简历的能力标签以及能力强度,从而实现简历快速评价,为人才筛选提供决策依据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的智能简历筛选方法流程图;
图2为本申请实施例的创建所述能力标签库的流程图;
图3为本申请实施例的从获取的简历文本中提取能力标签的流程图;
图4为本申请实施例的根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选的流程图;
图5为本申请实施例的根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选的流程图;
图6为本申请实施例的智能简历筛选方法的附加步骤流程图;
图7为本申请实施例的智能简历筛选装置的结构示意图;
图8为本申请实施例的标签库创建单元704的结构示意图;
图9为本申请实施例的标签库创建单元704的附加结构示意图;
图10为本申请实施例的标签提取单元702的结构示意图;
图11为本申请实施例的简历筛选单元703的结构示意图;
图12为本申请实施例的简历筛选单元703的结构示意图;
图13为本申请实施例的智能简历筛选装置的附加结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有的人工审阅简历的过程评判依据比较主观,不同审阅者会存在认知差异,应聘者不能通过简历描述得到客观的优劣比较,以及现有简历筛选处理过程数据复用率低,无法满足多次差异检索条件的快速查阅的问题,本申请提供一种智能简历筛选方法及装置,根据简历文本中提取的能力标签与目标岗位所需的能力标签的匹配度进行简历筛选。
图1为本申请实施例的智能简历筛选方法流程图,如图1所示,该智能简历筛选方法包括:
S101:从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
每一目标岗位中一般包括多个能力标签,例如编程能力标签、社交能力标签等,这些能力标签组成了该目标岗位的能力标签树。
S102:根据所述能力标签树从获取的简历文本中提取能力标签;
为了筛选到较为匹配的简历,需要从获取的简历文本中提取能力标签,该能力标签属于目标岗位的能力标签树。
S103:根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
由图1所示的流程可知,本申请首先从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树;然后根据所述能力标签树从获取的简历文本中提取能力标签;最后根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。通过该方法,可以快速提取所有应聘者简历的能力标签以及能力强度,从而实现简历快速评价,为人才筛选提供决策依据。
一实施例中,智能简历筛选方法还包括:创建所述能力标签库的步骤。
具体实施时,如图2所示,创建所述能力标签库步骤包括:
S201:获取各岗位对应的能力需求信息,例如教育学历、竞赛、项目经验、技术能力点等多方面需求;
S202:将能力需求信息进行领域分类,例如划分为学术、实践、技能、才艺、性格、荣誉等领域;并将各领域划分为多个子类,例如技能中的子类包括计算机水平、外语水平等。
S203:将各子类对应的不同能力赋予对应不同的能力标签;
S204:根据各岗位能力需求强弱确定岗位对应每个能力标签的权值。
例如,对于翻译岗位,外语能力属于需求较强的能力,对应的能力标签的权值一般较高。
一实施例中,智能简历筛选方法还包括:
基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;例如,对于编程能力标签,C++、Java等编程语言可作为该能力标签的匹配规则。
将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量;文本向量化常用方法有onehot、bow、tf-idf、word2vec、doc2vec、哈希向量化等;优选地,可以采用bow的编码方式将文本规范化单元输出的有序词语列表转换为文本向量。
一实施例中,智能简历筛选方法还包括:从获取的简历文本中提取能力标签的步骤。
具体实施时,如图3所示,从获取的简历文本中提取能力标签步骤包括:
S301:对所述简历文本的句子进行分词处理,得到简历分词文本;具体地,根据业务知识构建领域内专有名词库,作为自定义词库对每个字段的句子分词,从而获得一个有序词语列表;同样,可以根据业务知识构建停用词库,过滤词语列表中任务无关的词语,最终得到简历分词文本。
S302:对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;具体实施时,需要通过与所述匹配规则的分词文本相同的编码方式进行文本向量化。
S303:计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;常用方法包括计算两段文本的文本向量之间的余弦值,根据余弦值的大小判断相似度,相似度与向量之间的余弦值相对应,余弦值数值越大代表相似度越大。优选地,可以采用docsim方法计算两段文本的文本向量之间的余弦值。
S304:根据预设的相似度阈值提取简历文本中能力标签。具体地,可以针对与相关能力标签的相似度高于某一阈值的简历文本,判断其在全量简历范围内同一能力标签的相似度排名,将排名前30%的简历文本打上该能力标签。
另外,针对经过上述步骤后仍然没有打上能力标签的简历,还可以逐个判断当前简历文本的能力标签相似度,若最佳能力标签的相似度排名在前60%,则为其打上该能力标签,实现二次选取。
一实施例中,如图4所示,根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选的步骤包括:
S401:对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
S402:将所述各子类的评分求和,得到所述简历的总评分;
针对上述总评分,可以将所有简历的总评分按最低分和最高分归一化到0到100的分数范围空间中,所有简历的分数变成100以内的常规分数,本申请不限于此。
S403:根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
具体地,将总评分低于评分阈值的简历过滤掉,筛选出合适的简历。
一实施例中,如图5所示,根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选的步骤包括:
S501:将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
S502:对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
S503:将所述各子类的评分求和,得到所述简历的总评分;
针对上述总评分,可以将所有简历的总评分按最低分和最高分归一化到0到100的分数范围空间中,所有简历的分数变成100以内的常规分数,本申请不限于此。
S504:根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
一实施例中,如图6所示,智能简历筛选方法的步骤还包括:
S601:将简历文本拆分为句子列表;具体地,可以将每一份简历的各个字段按照分句标点如句号、感叹号、问号等,拆分成句子列表;
S602:对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;通过载入的停用词词典,过滤掉不关注的停用词,例如“的”、“是”等;过滤掉不关注的特殊词性的词语,例如“我们”等;
S603:对所述词语列表进行词性分析;
具体地,可以根据句子的上下文信息给句子中的每个词标上一个最为合适的词性;优选地,可以通过隐马尔科夫模型实现词性标注,该方法可以通过兼类词性的概率分布对词性兼类进行一定的消歧;
S604:对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;
具体地,根据目标不同可分为确定句子的句法结构的句法结构分析方法和确定句子之间依存关系的依存关系分析方法,优选采用依存句法分析方法;目前,依存句法分析方法相对句法结构分析方法,训练标注简单、灵活且准确率高。
S605:在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;词序坐标即为能力标签在文本中的位置。
S606:从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;
具体地,通过所述词序坐标列表,重复地从坐标点出发,进行左右遍历;遍历过程中,每向对应方向推进一个词,获取该词的词性、句法分析结果,通过组合规则判断这个词是否属于能力目标词的修饰成分。若某方向搜索到非修饰成分词提前退出当次遍历。将某个方向上的位置最接近的连续修饰成分融合成同一个修饰短语。
S607:将所述修饰短语转化为数值强度,得到能力强度;
具体地,把修饰短语按照预分类的方式转化成0到5的数值强度,若无法识别为预训练的类别,则识别为强度2;按照相同能力标签进行归并,得到能力标签对应的能力强度。
基于同一发明构思,本申请实施例还提供了一种智能简历筛选装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于智能简历筛选装置解决问题的原理与智能简历筛选方法相似,因此智能简历筛选装置的实施可以参见基于智能简历筛选方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的***较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
如图7所示,本申请提供一种智能简历筛选装置的实施例,包括:
标签树生成单元701,用于从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
标签提取单元702,用于根据所述能力标签树从获取的简历文本中提取能力标签;
简历筛选单元703,用于根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
进一步地,所述的智能简历筛选装置,还包括:标签库创建单元704,用于创建所述能力标签库。
进一步地,如图8所示,所述标签库创建单元704包括:
信息获取模块7041,用于获取各岗位对应的能力需求信息;
信息分类模块7042,用于将能力需求信息进行领域分类,并将各领域划分为多个子类;
标签确定模块7043,用于将各子类对应的不同能力赋予对应不同的能力标签;
权值确定模块7044,用于确定岗位对应每个能力标签的权值。
进一步地,如图9所示,所述标签库创建单元704,还包括:
匹配规则设定模块7045,用于基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;
第一文本向量化模块7046,用于将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量。
进一步地,如图10所示,所述标签提取单元702,包括:
第一文本分词模块7021,用于对所述简历文本的句子进行分词处理,规范化原始文本的格式;具体的,根据业务知识构建领域内专有名词库,作为自定义词库对每个字段的句子分词,从而获得一个有序词语列表;同样根据业务知识构建停用词库,过滤词语列表中任务无关的词语,最终得到简历分词文本;
第二文本向量化模块7022,用于对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;文本向量化常用方法有onehot、bow、tf-idf、word2vec、doc2vec、哈希向量化等;优选采用bow的编码方式将文本规范化单元输出的有序词语列表转换为文本向量。
相似度评估模块7023,用于计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;常用方法为计算两段文本的文本向量之间的余弦值,数值越大代表相似度越大,优选采用docsim方法。
标签筛选模块7024,用于根据预设的相似度阈值提取简历文本中能力标签。具体的,自动标签单元针对与相关能力标签的相似度高于某一阈值的简历文本,判断其在全量简历范围内同一能力标签的相似度排名,将排名前30%的简历文本打上该能力标签;针对经过上述步骤后仍然没有打上能力标签的简历,逐个判断当前简历文本的能力标签相似度,若最佳能力标签的相似度排名在前60%,则为其打上该能力标签。
进一步地,如图11所示,所述简历筛选单元703,包括:
第一子类标签评分模块7031,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;优选的,计算各子类评分的比例,得到各子类的评分占比。
第一总评分模块7032,用于将所述各子类的评分求和,得到所述简历的总评分;优选的,将所有简历的初评分按最低分和最高分归一化到0到100的分数范围空间中,所有简历的分数变成100以内的常规分数。
第一简历筛选模块7033,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,如图12所示,所述简历筛选单元703,包括:
标签加权模块7034,用于将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
第二子类标签评分模块7035,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;优选的,计算各子类评分的比例,得到各子类的评分占比。
第二总评分模块7036,用于将所述各子类的评分求和,得到所述简历的总评分;优选的,将所有简历的初评分按最低分和最高分归一化到0到100的分数范围空间中,所有简历的分数变成100以内的常规分数。
第二简历筛选模块7037,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
进一步地,如图13所示,所述的智能简历筛选装置还包括:
文本拆分单元705,用于将简历文本拆分为句子列表;
第二文本分词单元706,用于对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;
词性标注单元707,用于对所述词语列表进行词性分析;根据句子的上下文信息给句子中的每个词标上一个最为合适的词性;常用的词性标注方法是通过隐马尔科夫模型实现的,这种方法可以通过兼类词性的概率分布对词性兼类进行一定的消歧。
句法分析单元708,用于对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;根据目标不同可被分为确定句子的句法结构的句法结构分析和确定句子之间依存关系的依存关系分析;目前,传统由语法集组成的句法结构分析研究已逐渐被训练标注简单且灵活高准确率的依存关系分析研究所取代;优选采用依存句法分析。
匹配词定位单元709,用于在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;
修饰短语提取单元710,用于从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;具体的,通过匹配词定位单元755中获得的词序坐标列表,重复地从坐标点出发,进行左右遍历;遍历中,每向对应方向推进一个词,获取该词的词性、句法分析结果,通过组合规则判断这个词是否属于能力目标词的修饰成分,某方向搜索到非修饰成分词提前退出当次遍历;将某个方向上的最近的连续修饰成分融合成同一个修饰短语。
修饰短语量化单元711,用于将所述修饰短语转化为数值强度,得到能力强度。具体的,把修饰短语按照预分类的方式转化成0到5的数值强度,若无法识别为预训练的类别,则识别为强度2;按照相同能力标签进行归并,得到能力标签对应的能力强度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (18)
1.一种智能简历筛选方法,其特征在于,包括:
从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
根据所述能力标签树从获取的简历文本中提取能力标签;
根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
2.根据权利要求1所述的智能简历筛选方法,其特征在于,还包括:创建所述能力标签库。
3.根据权利要求2所述的智能简历筛选方法,其特征在于,所述创建所述能力标签库包括:
获取各岗位对应的能力需求信息;
将能力需求信息进行领域分类,并将各领域划分为多个子类;
将各子类对应的不同能力赋予对应不同的能力标签;
确定岗位对应每个能力标签的权值。
4.根据权利要求3所述的智能简历筛选方法,其特征在于,所述创建所述能力标签库还包括:
基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;
将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量。
5.根据权利要求4所述的智能简历筛选方法,其特征在于,所述从获取的简历文本中提取能力标签,包括:
对所述简历文本的句子进行分词处理,得到简历分词文本;
对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;
计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;
根据预设的相似度阈值提取简历文本中能力标签。
6.根据权利要求3所述的智能简历筛选方法,其特征在于,所述根据所述简历文本中提取的能力标签与所述目标岗位的能力标签进行简历筛选,包括:
对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
将所述各子类的评分求和,得到所述简历的总评分;
根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
7.根据权利要求4所述的智能简历筛选方法,其特征在于,所述根据所述简历文本中提取的能力标签与所述目标岗位的能力标签进行简历筛选,包括:
将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
将所述各子类的评分求和,得到所述简历的总评分;
根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
8.根据权利要求7所述的智能简历筛选方法,其特征在于,还包括:
将简历文本拆分为句子列表;
对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;
对所述词语列表进行词性分析;
对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;
在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;
从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;
将所述修饰短语转化为数值强度,得到能力强度。
9.一种智能简历筛选装置,其特征在于,包括:
标签树生成单元,用于从预先创建的能力标签库中过滤目标岗位对应的能力标签,生成能力标签树,其中,所述能力标签库为各岗位对应的各种能力需求所对应的能力标签的集合;
标签提取单元,用于根据所述能力标签树从获取的简历文本中提取能力标签;
简历筛选单元,用于根据所述简历文本中提取的能力标签与所述目标岗位的能力标签树进行简历筛选。
10.根据权利要求9所述的智能简历筛选装置,其特征在于,还包括:标签库创建单元,用于创建所述能力标签库。
11.根据权利要求10所述的智能简历筛选装置,其特征在于,所述标签库创建单元包括:
信息获取模块,用于获取各岗位对应的能力需求信息;
信息分类模块,用于将能力需求信息进行领域分类,并将各领域划分为多个子类;
标签确定模块,用于将各子类对应的不同能力赋予对应不同的能力标签;
权值确定模块,用于确定岗位对应每个能力标签的权值。
12.根据权利要求11所述的智能简历筛选装置,其特征在于,所述标签库创建单元还包括:
匹配规则设定模块,用于基于赋予的能力标签的含义及范畴,根据历史简历的描述方式确定该能力标签的匹配规则;
第一文本向量化模块,用于将所述匹配规则的分词文本通过编码方式进行文本向量化,得到能力标签向量。
13.根据权利要求12所述的智能简历筛选装置,其特征在于,所述标签提取单元,包括:
第一文本分词模块,用于对所述简历文本的句子进行分词处理,得到简历分词文本;
第二文本向量化模块,用于对所述简历分词文本通过编码方式进行文本向量化,得到文本向量;
相似度评估模块,用于计算所述目标岗位的能力标签树对应的所述能力标签向量与文本向量的相似度;
标签筛选模块,用于根据预设的相似度阈值提取简历文本中能力标签。
14.根据权利要求11所述的智能简历筛选装置,其特征在于,所述简历筛选单元,包括:
第一子类标签评分模块,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
第一总评分模块,用于将所述各子类的评分求和,得到所述简历的总评分;
第一简历筛选模块,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
15.根据权利要求12所述的智能简历筛选装置,其特征在于,所述简历筛选单元,包括:
标签加权模块,用于将所述简历文本中提取的能力标签根据所述岗位对应的权值及能力标签对应的能力强度进行加权,得到能力标签加权值,其中所述能力强度为能力标签对应的能力水平;
第二子类标签评分模块,用于对所述简历中的各个子类的对应的各能力标签加权值分别求和,得到各子类的评分;
第二总评分模块,用于将所述各子类的评分求和,得到所述简历的总评分;
第二简历筛选模块,用于根据预设的评分阈值及所述简历的总评分进行简历筛选,所述评分阈值根据所述目标岗位的能力标签树确定。
16.根据权利要求15所述的智能简历筛选装置,其特征在于,还包括:
文本拆分单元,用于将简历文本拆分为句子列表;
第二文本分词单元,用于对所述句子列表中的各个句子进行分词处理,得到每个句子的词语列表;
词性标注单元,用于对所述词语列表进行词性分析;
句法分析单元,用于对所述词语列表进行句法分析,得到同句中不同词之间的语义关系;
匹配词定位单元,用于在所述简历文本中搜索提取的所述能力标签的匹配词,并获取所述匹配词出现的词序坐标;
修饰短语提取单元,用于从所述词序坐标出发,进行左右遍历,根据所述词性、语义关系找到所述匹配词的修饰短语;
修饰短语量化单元,用于将所述修饰短语转化为数值强度,得到能力强度。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述的智能简历筛选方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的智能简历筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910565804.9A CN110263148A (zh) | 2019-06-27 | 2019-06-27 | 智能简历筛选方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910565804.9A CN110263148A (zh) | 2019-06-27 | 2019-06-27 | 智能简历筛选方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110263148A true CN110263148A (zh) | 2019-09-20 |
Family
ID=67922066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910565804.9A Pending CN110263148A (zh) | 2019-06-27 | 2019-06-27 | 智能简历筛选方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263148A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507685A (zh) * | 2020-04-14 | 2020-08-07 | 上海学为信息科技有限公司 | 一种基于用户行为调整匹配条件和促进人岗匹配的方法 |
CN111680895A (zh) * | 2020-05-26 | 2020-09-18 | 中国平安财产保险股份有限公司 | 数据自动标注方法、装置、计算机设备及存储介质 |
WO2021169111A1 (zh) * | 2020-02-28 | 2021-09-02 | 平安国际智慧城市科技股份有限公司 | 简历筛选方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130254129A1 (en) * | 2007-10-05 | 2013-09-26 | Martin Perlmutter | Technological solution to interview inefficiency |
CN103544312A (zh) * | 2013-11-04 | 2014-01-29 | 成都数之联科技有限公司 | 一种基于社交网络的招聘信息匹配方法 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及*** |
CN109165295A (zh) * | 2018-09-27 | 2019-01-08 | 天涯社区网络科技股份有限公司 | 一种智能简历评估方法 |
CN109213999A (zh) * | 2018-08-20 | 2019-01-15 | 成都佳发安泰教育科技股份有限公司 | 一种主观题评分方法 |
CN109582704A (zh) * | 2018-10-17 | 2019-04-05 | 龙马智芯(珠海横琴)科技有限公司 | 招聘信息和求职简历匹配的方法 |
-
2019
- 2019-06-27 CN CN201910565804.9A patent/CN110263148A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130254129A1 (en) * | 2007-10-05 | 2013-09-26 | Martin Perlmutter | Technological solution to interview inefficiency |
CN103544312A (zh) * | 2013-11-04 | 2014-01-29 | 成都数之联科技有限公司 | 一种基于社交网络的招聘信息匹配方法 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及*** |
CN109213999A (zh) * | 2018-08-20 | 2019-01-15 | 成都佳发安泰教育科技股份有限公司 | 一种主观题评分方法 |
CN109165295A (zh) * | 2018-09-27 | 2019-01-08 | 天涯社区网络科技股份有限公司 | 一种智能简历评估方法 |
CN109582704A (zh) * | 2018-10-17 | 2019-04-05 | 龙马智芯(珠海横琴)科技有限公司 | 招聘信息和求职简历匹配的方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169111A1 (zh) * | 2020-02-28 | 2021-09-02 | 平安国际智慧城市科技股份有限公司 | 简历筛选方法、装置、计算机设备和存储介质 |
CN111507685A (zh) * | 2020-04-14 | 2020-08-07 | 上海学为信息科技有限公司 | 一种基于用户行为调整匹配条件和促进人岗匹配的方法 |
CN111680895A (zh) * | 2020-05-26 | 2020-09-18 | 中国平安财产保险股份有限公司 | 数据自动标注方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meredith | Computational music analysis | |
Jamal et al. | Poetry classification using support vector machines | |
Valakunde et al. | Multi-aspect and multi-class based document sentiment analysis of educational data catering accreditation process | |
Nejat et al. | Exploring joint neural model for sentence level discourse parsing and sentiment analysis | |
CN110263148A (zh) | 智能简历筛选方法及装置 | |
CN110175246A (zh) | 一种从视频字幕中提取概念词的方法 | |
CN115357719B (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
Stemle et al. | Using language learner data for metaphor detection | |
Smitha et al. | Meme classification using textual and visual features | |
Jishan et al. | Natural language description of images using hybrid recurrent neural network | |
CN114912425A (zh) | 演示文稿生成方法及装置 | |
CN112905796B (zh) | 基于再注意力机制的文本情绪分类方法及*** | |
CN113886580A (zh) | 一种情感评分方法、装置及电子设备 | |
Balouchzahi et al. | LA-SACo: A study of learning approaches for sentiments analysis inCode-mixing texts | |
CN111897955B (zh) | 基于编解码的评语生成方法、装置、设备和存储介质 | |
Rintyarna et al. | Automatic ranking system of university based on technology readiness level using LDA-Adaboost. MH | |
Pathuri et al. | Feature based sentimental analysis for prediction of mobile reviews using hybrid bag-boost algorithm | |
JP5032600B2 (ja) | 文書可読性評価プログラムおよび文書可読性評価装置 | |
Huang et al. | Automatic Classroom Question Classification Based on Bloom's Taxonomy | |
Bekmanova et al. | Sentiment analysis model based on the word structural representation | |
Borlinghaus et al. | Comparing apples and oranges: Human and computer clustered affinity diagrams under the microscope | |
Martin et al. | Semantic unsupervised learning for word sense disambiguation | |
JP5506482B2 (ja) | 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム | |
LU504829B1 (en) | Text classification method, computer readable storage medium and system | |
Suriyasat et al. | A Comparison of Machine Learning and Neural Network Algorithms for an Automated Thai Essay Scoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190920 |