CN110866393A - 基于领域知识库的简历信息抽取方法及*** - Google Patents
基于领域知识库的简历信息抽取方法及*** Download PDFInfo
- Publication number
- CN110866393A CN110866393A CN201911134165.7A CN201911134165A CN110866393A CN 110866393 A CN110866393 A CN 110866393A CN 201911134165 A CN201911134165 A CN 201911134165A CN 110866393 A CN110866393 A CN 110866393A
- Authority
- CN
- China
- Prior art keywords
- information
- extracted
- type
- resume
- knowledge base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于领域知识库的简历信息抽取方法,包括:建立知识库;建立栏目标题集合;为第一类待抽取信息和第二类待抽取信息分别建立抽取规则;采集样本简历,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;获取目标简历,将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的误差小于设定阈值,则舍弃。本发明还公开了基于领域知识库的简历信息抽取装置。本发明针对简历自身特点,能够快速抽取信息,并能够对信息进行初步筛选,舍弃异常信息。
Description
技术领域
本发明涉及招聘领域。更具体地说,本发明涉及一种基于领域知识库的简历信息抽取方法及***。
背景技术
简历是求职者的书面介绍,通过人工的方式搜索、阅读、记录海量的简历,需要耗费巨大的工作量。现有技术中也出现了一些使用信息抽取技术自动抽取文档信息的技术方案,但是简历不同于一般文档,现有技术不能简单适用,而且现有技术无法对异常简历进行初步筛选。因此,亟需设计一种能够一定程度克服上述缺陷的抽取方法及***。
发明内容
本发明的一个目的是提供一种基于领域知识库的简历信息抽取方法及***,其针对简历自身特点,能够快速抽取信息,并能够对信息进行初步筛选,舍弃异常信息。
为了实现根据本发明的这些目的和其它优点,提供了基于领域知识库的简历信息抽取方法,包括:
建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差小于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
优选的是,所述的基于领域知识库的简历信息抽取方法,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词。
优选的是,所述的基于领域知识库的简历信息抽取方法,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价。
优选的是,所述的基于领域知识库的简历信息抽取方法,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。
优选的是,所述的基于领域知识库的简历信息抽取方法,第一类待抽取信息和第二类待抽取信息的关键词分别转化为词向量,分别作为神经网络的输入和输出。
本发明还提供了基于领域知识库的简历信息抽取***,包括:
知识库构建模块,其用于建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
栏目标题集合构建模块,其用于建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
抽取规则构建模块,其用于为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
神经网络预测模型构建模块,其采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
抽取模块,其获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差大于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
优选的是,所述的基于领域知识库的简历信息抽取***,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。
本发明至少包括以下有益效果:
本发明首先建立知识库,然后根据简历的特点,按照栏目标题将简历分为多个文本内容,将多个文本内容与待抽取信息对应,然后采用预设的抽取规则抽取待抽取信息。本发明还通过训练得到神经网络预测模型,通过比较预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差,确定简历是否异常,若异常,则舍弃。可见,本发明能够高效地抽取有效信息,并能够初步筛选简历,提升招聘者体验。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
在一种技术方案中,如图1所示,基于领域知识库的简历信息抽取方法,包括:
建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差大于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
上述技术方案中,知识库是简历信息抽取过程中必要的词库,用于使得信息抽取准确度更高,知识库至少包括企业名称、姓氏、专业名称、学校名称、专业术语、技能名称、奖励名称等。知识库可以直接使用现有词库,或者通过采集百度百科等网络资源建立。
一般简历包括多个栏目,每个栏目包括一种类型的文本信息,比如常见的栏目包括基本信息、教育背景、工作经历等。为了更加准确地抽取信息,需要在各栏目内分别抽取所需的信息。建立栏目标题集合,即尽可能多的列举简历采用的栏目标题。
正常简历的各部分内容有一定的关联性,比如教育、项目类信息与工作经历类信息具有较大的关联性,若关联性小,则成为异常简历的可能性大。第一类待抽取信息即是教育、项目类信息,第二类待抽取信息即是工作经历类信息。抽取规则即按照信息的表述形式抽取关键词,比如教育背景和工作经历一般是时间、机构、内容的组合,按照这个组合抽取关键词,能够提高抽取效率和准确率。具体抽取时,先分词,然后根据知识库进行抽取。对于样本简历,将第一类待抽取信息的关键词作为输入,将第二类待抽取信息的关键词作为输出,训练得到神经网络预测模型。
对于正常简历,以相同的抽取规则抽取关键词组合,然后输入神经网络预测模型,得到预测的第二类待抽取信息的关键词组合,并与实际的第二类待抽取信息的关键词组合比较,若误差大于设定阈值,则表明关联性差,为异常简历,将该条抽取的信息舍弃。比如某个关键词预测的概率小于10%,而该关键词实际存在,即可舍弃该条信息。
可见,本技术方案能够根据知识库高效、准确地抽取有效信息,并能够初步筛选简历,避免招聘者陷入海量的简历,提升了用户体验。
在另一种技术方案中,所述的基于领域知识库的简历信息抽取方法,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词。这里提供了优选的简历信息属性,能够全面辅助各类信息的提取。
在另一种技术方案中,所述的基于领域知识库的简历信息抽取方法,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价。这里提供了优选的栏目标题,基本能够覆盖大多数网络简历。
在另一种技术方案中,所述的基于领域知识库的简历信息抽取方法,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。这里提供了第一类待抽取信息和第二类待抽取信息的优选类型,个人经历类信息是指工作前的信息,如教育背景、项目经历、参赛经历等,与工作经历具有较大关联性。
在另一种技术方案中,所述的基于领域知识库的简历信息抽取方法,第一类待抽取信息和第二类待抽取信息的关键词分别转化为词向量,分别作为神经网络的输入和输出。将关键词转化为词向量为现有技术,一般首先获取由预设简历关键词和所述预设简历关键词对应的词向量组成的样本集合,输入到预设神经网络模型,训练得到词向量推断神经网络模型,根据词向量推断神经网络模型即可得到各关键词的词向量。
本发明还提供了基于领域知识库的简历信息抽取***,包括:
知识库构建模块,其用于建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
栏目标题集合构建模块,其用于建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
抽取规则构建模块,其用于为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
神经网络预测模型构建模块,其采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
抽取模块,其获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差小于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
本技术方案基于与基于领域知识库的简历信息抽取方法相同的发明构思,理解本技术方案可参见抽取方法部分的描述。本技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在另一种技术方案中,所述的基于领域知识库的简历信息抽取***,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。理解本技术方案请参见抽取方法部分的描述。
这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明基于领域知识库的简历信息抽取方法及***的应用、修改和变化对本领域的技术人员来说是显而易见的。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (7)
1.基于领域知识库的简历信息抽取方法,其特征在于,包括:
建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差小于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
2.如权利要求1所述的基于领域知识库的简历信息抽取方法,其特征在于,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词。
3.如权利要求1所述的基于领域知识库的简历信息抽取方法,其特征在于,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价。
4.如权利要求1所述的基于领域知识库的简历信息抽取方法,其特征在于,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。
5.如权利要求1所述的基于领域知识库的简历信息抽取方法,其特征在于,第一类待抽取信息和第二类待抽取信息的关键词分别转化为词向量,分别作为神经网络的输入和输出。
6.基于领域知识库的简历信息抽取***,其特征在于,包括:
知识库构建模块,其用于建立知识库,所述知识库中包括多个简历信息属性以及分别与多个简历信息属性对应的多个词语集合;
栏目标题集合构建模块,其用于建立栏目标题集合,所述栏目标题为简历中各类型文本信息的标题;
抽取规则构建模块,其用于为第一类待抽取信息和第二类待抽取信息分别建立抽取规则,所述抽取规则包括与第一类待抽取信息或第二类待抽取信息所对应的栏目标题以及与第一类待抽取信息或第二类待抽取信息对应的关键词组合;
神经网络预测模型构建模块,其采集样本简历,根据栏目标题集合,识别样本简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,以第一类待抽取信息的关键词组合为神经网络的输入,以第二类待抽取信息的关键词组合为神经网络的输出,训练得到神经网络预测模型;
抽取模块,其获取目标简历,根据栏目标题集合,识别目标简历的栏目标题以及与栏目标题对应的文本内容,根据抽取规则从文本内容中抽取第一类待抽取信息和第二类待抽取信息的关键词组合,并将第一类待抽取信息的关键词组合输入神经网络预测模型,获得预测的第二类待抽取信息的关键词组合,若预测的第二类待抽取信息的关键词组合与实际的第二类待抽取信息的关键词组合的误差大于设定阈值,则舍弃抽取到的第一类待抽取信息和第二类待抽取信息。
7.如权利要求6所述的基于领域知识库的简历信息抽取***,其特征在于,所述简历信息属性包括姓名、专业名、籍贯、学校名、公司名、专有名词,所述栏目标题包括个人信息、教育背景、项目经历、工作经历、专业技能、获奖经历、自我评价,第一类待抽取信息为个人经历类信息,第二类待抽取信息为工作经历类信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911134165.7A CN110866393B (zh) | 2019-11-19 | 2019-11-19 | 基于领域知识库的简历信息抽取方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911134165.7A CN110866393B (zh) | 2019-11-19 | 2019-11-19 | 基于领域知识库的简历信息抽取方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110866393A true CN110866393A (zh) | 2020-03-06 |
CN110866393B CN110866393B (zh) | 2023-06-23 |
Family
ID=69655585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911134165.7A Active CN110866393B (zh) | 2019-11-19 | 2019-11-19 | 基于领域知识库的简历信息抽取方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866393B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990887A (zh) * | 2021-05-07 | 2021-06-18 | 北京车智赢科技有限公司 | 一种简历和岗位匹配的方法及计算设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291715A (zh) * | 2016-03-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 简历评估方法和装置 |
CN107798435A (zh) * | 2017-11-09 | 2018-03-13 | 贵州电网有限责任公司 | 一种基于文本信息抽取的电力物资需求预测方法 |
CN107943911A (zh) * | 2017-11-20 | 2018-04-20 | 北京大学深圳研究院 | 数据抽取方法、装置、计算机设备及可读存储介质 |
CN107993019A (zh) * | 2017-12-12 | 2018-05-04 | 北京字节跳动网络技术有限公司 | 一种简历评估方法及装置 |
CN108304364A (zh) * | 2017-02-23 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置 |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
US20190102704A1 (en) * | 2017-10-02 | 2019-04-04 | Wei Liu | Machine learning systems for ranking job candidate resumes |
CN109635288A (zh) * | 2018-11-29 | 2019-04-16 | 东莞理工学院 | 一种基于深度神经网络的简历抽取方法 |
CN109753909A (zh) * | 2018-12-27 | 2019-05-14 | 广东人啊人网络技术开发有限公司 | 一种基于内容分块和BiLSTM模型的简历解析方法 |
CN109766438A (zh) * | 2018-12-12 | 2019-05-17 | 平安科技(深圳)有限公司 | 简历信息提取方法、装置、计算机设备和存储介质 |
CN110110330A (zh) * | 2019-04-30 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 基于文本的关键词提取方法和计算机设备 |
CN110119765A (zh) * | 2019-04-18 | 2019-08-13 | 浙江工业大学 | 一种基于Seq2seq框架的关键词提取方法 |
US20190294965A1 (en) * | 2018-03-23 | 2019-09-26 | Vettd, Inc. | Systems and methods using artificial intelligence to analyze natural language sources based on personally-developed intelligent agent models |
CN110321432A (zh) * | 2019-06-24 | 2019-10-11 | 拓尔思信息技术股份有限公司 | 文本事件信息提取方法、电子装置和非易失性存储介质 |
-
2019
- 2019-11-19 CN CN201911134165.7A patent/CN110866393B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291715A (zh) * | 2016-03-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 简历评估方法和装置 |
CN108304364A (zh) * | 2017-02-23 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置 |
US20190102704A1 (en) * | 2017-10-02 | 2019-04-04 | Wei Liu | Machine learning systems for ranking job candidate resumes |
CN107798435A (zh) * | 2017-11-09 | 2018-03-13 | 贵州电网有限责任公司 | 一种基于文本信息抽取的电力物资需求预测方法 |
CN107943911A (zh) * | 2017-11-20 | 2018-04-20 | 北京大学深圳研究院 | 数据抽取方法、装置、计算机设备及可读存储介质 |
CN107993019A (zh) * | 2017-12-12 | 2018-05-04 | 北京字节跳动网络技术有限公司 | 一种简历评估方法及装置 |
US20190294965A1 (en) * | 2018-03-23 | 2019-09-26 | Vettd, Inc. | Systems and methods using artificial intelligence to analyze natural language sources based on personally-developed intelligent agent models |
CN108874928A (zh) * | 2018-05-31 | 2018-11-23 | 平安科技(深圳)有限公司 | 简历数据信息解析处理方法、装置、设备及存储介质 |
CN109635288A (zh) * | 2018-11-29 | 2019-04-16 | 东莞理工学院 | 一种基于深度神经网络的简历抽取方法 |
CN109766438A (zh) * | 2018-12-12 | 2019-05-17 | 平安科技(深圳)有限公司 | 简历信息提取方法、装置、计算机设备和存储介质 |
CN109753909A (zh) * | 2018-12-27 | 2019-05-14 | 广东人啊人网络技术开发有限公司 | 一种基于内容分块和BiLSTM模型的简历解析方法 |
CN110119765A (zh) * | 2019-04-18 | 2019-08-13 | 浙江工业大学 | 一种基于Seq2seq框架的关键词提取方法 |
CN110110330A (zh) * | 2019-04-30 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 基于文本的关键词提取方法和计算机设备 |
CN110321432A (zh) * | 2019-06-24 | 2019-10-11 | 拓尔思信息技术股份有限公司 | 文本事件信息提取方法、电子装置和非易失性存储介质 |
Non-Patent Citations (9)
Title |
---|
C H AYISHATHAHIRA等: "Combination of Neural Networks and Conditional Random Fields for Efficient Resume Parsing", 《2018 INTERNATIONAL CET CONFERENCE ON CONTROL,COMMUNICATION,AND COMPUTING(IC4)》 * |
伍薇;: "基于CNN卷积神经网络的企业电子档案分类法研究", no. 05 * |
张波: "一种基于BP神经网络的企业简历筛选方案研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 02 * |
沈刚: "基于互联网招聘的简历评价筛选研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 01 * |
谷楠楠;冯筠;孙霞;赵妍;张蕾;: "中文简历自动解析及推荐算法", no. 18 * |
郭洁: "面向IT行业个性化简历推荐算法研究", no. 01 * |
陈毅;符磊;代云霞;张剑;: "基于特征融合的中文简历解析方法研究", no. 10 * |
陈毅;符磊;张剑;黄石磊;: "基于字序列的非结构化简历信息解析方法", 计算机工程与设计, no. 06 * |
黄胜;李伟;张剑;: "基于深度学习的简历信息实体抽取方法", no. 12 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990887A (zh) * | 2021-05-07 | 2021-06-18 | 北京车智赢科技有限公司 | 一种简历和岗位匹配的方法及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110866393B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lippi et al. | Context-independent claim detection for argument mining | |
US9594747B2 (en) | Generation of a semantic model from textual listings | |
CN111222305B (zh) | 一种信息结构化方法和装置 | |
Massey et al. | Automated text mining for requirements analysis of policy documents | |
Sebastiani | Classification of text, automatic | |
US9754207B2 (en) | Corpus quality analysis | |
US8082264B2 (en) | Automated scheme for identifying user intent in real-time | |
KR20190062391A (ko) | 전자 기록의 문맥 리트리벌을 위한 시스템 및 방법 | |
US20160055234A1 (en) | Retrieving Text from a Corpus of Documents in an Information Handling System | |
Furlan et al. | Semantic similarity of short texts in languages with a deficient natural language processing support | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
US9411878B2 (en) | NLP duration and duration range comparison methodology using similarity weighting | |
US9697099B2 (en) | Real-time or frequent ingestion by running pipeline in order of effectiveness | |
US8825620B1 (en) | Behavioral word segmentation for use in processing search queries | |
US10430713B2 (en) | Predicting and enhancing document ingestion time | |
US20180204106A1 (en) | System and method for personalized deep text analysis | |
Zainol et al. | Text analytics of unstructured textual data: a study on military peacekeeping document using R text mining package | |
Sitara et al. | SSN MLRG at VQA-MED 2021: An Approach for VQA to Solve Abnormality Related Queries using Improved Datasets. | |
Vanezi et al. | Complicy: Evaluating the gdpr alignment of privacy policies-a study on web platforms | |
US10783140B2 (en) | System and method for augmenting answers from a QA system with additional temporal and geographic information | |
CN110866393B (zh) | 基于领域知识库的简历信息抽取方法及*** | |
KR102256007B1 (ko) | 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법 | |
JP2004192546A (ja) | 情報検索方法、装置、プログラム、および記録媒体 | |
AU2022204712B2 (en) | Extracting content from freeform text samples into custom fields in a software application | |
Chen et al. | A query substitution-search result refinement approach for long query web searches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |