CN109885647B - 用户履历验证方法、装置、电子设备及存储介质 - Google Patents

用户履历验证方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109885647B
CN109885647B CN201811628088.6A CN201811628088A CN109885647B CN 109885647 B CN109885647 B CN 109885647B CN 201811628088 A CN201811628088 A CN 201811628088A CN 109885647 B CN109885647 B CN 109885647B
Authority
CN
China
Prior art keywords
information
target user
skill
combination
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811628088.6A
Other languages
English (en)
Other versions
CN109885647A (zh
Inventor
邹铁山
孙积慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kaola Credit Service Co ltd
Original Assignee
Kaola Credit Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kaola Credit Service Co ltd filed Critical Kaola Credit Service Co ltd
Priority to CN201811628088.6A priority Critical patent/CN109885647B/zh
Publication of CN109885647A publication Critical patent/CN109885647A/zh
Application granted granted Critical
Publication of CN109885647B publication Critical patent/CN109885647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种用户履历验证方法、装置、电子设备及存储介质。其中,该方法包括:获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;根据所述相关信息获取所述目标用户的科研公开数据;根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。

Description

用户履历验证方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机领域,具体涉及一种用户履历验证方法、装置、电子设备及存储介质。
背景技术
在人力资源领域,背景调查是一个重要的环节,一般通过人工的方式对候选人进行职业背景情况进行调查,例如职业资格、学历和/或学术背景、技能经验等信息。然而,传统的方法不仅耗时耗力,浪费大量的资源,并且有可能存在信息获取不准确而导致调查结果不准确的情况。随着互联网和大数据的兴起,尤其是近期人工智能技术的突破,使得基于互联网的职业背景调查成为可能。通过大数据和人工智能技术,职业背景调查平台可以从不同的渠道获取关于个人的***息,通过整合处理这些***息并在目标用户授权的情况下,职业背景调查平台可以自动快速给出一个候选人的职业背景信息。在一些情况下,候选人最重要的特征是其专业性,例如大学研究员、企业研发工程师等。此时,除了一般性的信息,对候选人的专业技能调查变得尤为重要。
然而,发明人在实现本公开实施例相关技术方案的过程中发现,相关技术中至少存在以下问题:由于专业技能牵扯具体的领域知识,使得非本领域人员进行调查时变得异常困难。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种用户履历验证方法、装置、电子设备及计算机可读存储介质,以解决由于专业技能牵扯具体的领域知识,使得非本领域人员进行调查时变得异常困难的问题。
本公开实施例的第一方面提供了一种用户履历验证方法,包括:
获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;
根据所述相关信息获取所述目标用户的科研公开数据;
根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。
在一些实施例中,根据所述科研公开数据以及所述相关信息验证所述目标用户的履历,包括:
解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息;
根据所述第一关联组合和第二关联组合验证所述目标用户的履历。
在一些实施例中,根据所述第一关联组合和第二关联组合验证所述目标用户的履历,至少包括:
根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
在一些实施例中,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历,包括:
根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
在一些实施例中,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
在一些实施例中,所述科研公开数据包括专利文献数据;和/或,
所述履历信息还包括所述目标用户申请过的专利文献标识。
在一些实施例中,解析所述科研公开数据,包括:
解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
本公开实施例的第二方面提供了一种用户履历验证装置,包括:
第一获取模块,用于获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;
第二获取模块,用于根据所述相关信息获取所述目标用户的科研公开数据;
验证模块,用于根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。
在一些实施例中,所述验证模块包括:
第一确定子模块,用于解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息;
第一验证子模块,用于根据所述第一关联组合和第二关联组合验证所述目标用户的履历。
在一些实施例中,所述第一验证子模块包括:
匹配子模块,用于根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
第二验证子模块,用于针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
在一些实施例中,所述第二验证子模块包括:
第二确定子模块,用于根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
第三确定子模块,用于在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
在一些实施例中,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
在一些实施例中,所述科研公开数据包括专利文献数据;和/或,
所述履历信息还包括所述目标用户申请过的专利文献标识。
在一些实施例中,所述第一确定子模块,包括:
解析子模块,用于解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
本公开实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例,通过获取目标用户的相关信息,其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;再通过所述相关信息获取所述目标用户的科研公开数据,最后根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。通过本公开实施例的上述技术方案可以自动地获取目标用户的科研公开数据并且能够验证目标用户是否真的具备其所声称的技能信息,进行验证的人员无需具备相关的专业知识,就能快速而准确的验证目标对象的履历信息的真实性。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的用户履历验证方法的流程示意图;
图2是根据图1所示实施例的步骤S102的流程示意图;
图3是根据图2所示实施例的步骤S202的流程示意图;
图4是根据本公开的一实施例所示通过机器学习生成的技能-时间片段的示意图;
图5根据本公开的一实施例示出不同时间片段内的验证结果的示意图;
图6是根据图3所示实施例的步骤S302的流程示意图;
图7是根据本公开的一些实施例所示的用户履历验证装置示意图。
图8是适于用来实现根据本公开实施方式的用户履历验证方法的电子设备的结构示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“***”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
图1是根据本公开的一些实施例所示的用户履历验证方法示意图,如图1所示,所述用户履历验证方法包括以下步骤:
S101,获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息。
具体地,本公开实施例提出的用户履历验证方法可以实现在一个背景调查平台上,该背景调查平台可以为运行于服务器之上用于提供履历背景的调查和验证的软件***。例如,调查人员通过终端设备,例如PC、智能手机通过网络向背景调查平台发起调查请求,背景调查平台在获得被调查人也即目标用户的授权信息之后,向调查人发送相关的背景调查信息。
人力资源调查人员通过终端设备,例如PC、智能手机等,通过网络向背景调查平台发起调查请求,背景调查平台在获得目标用户的授权信息之后,向调查人员发送目标用户的相关信息。目标用户的相关信息可以是目标用户提供的,也可以是通过网络中其他方式获取的。目标用户可以是任意用户,例如求职人员。目标用户的相关信息可以包括但不限于目标用户的简历。相关信息至少包括身份信息以及履历信息,身份信息可以包括但不限于目标用户的姓名、年龄、身份证、手机号等联系方式;履历信息包括但不限于目标用户在以往时间区间内的学习经历、职业经历等。第一时间区间可以以年、月等为维度,第一机构可以是目标用户在学习技能过程中涉及的学校、从业过程中任职公司、单位、部门等。第一技能信息包括但不限于目标用户在学业过程中所学的主修专业、辅修专业、自学专业等,还包括从业过程中从事的行业、工作性质、涉及到的专业知识等。
在目标用户的相关信息为目标用户的简历时,该简历数据可以是一种结构化的信息,也可以是一般的文本信息,下面以举例的方式阐述,从工作经验及教育背景中可以获取第一关联组合。
例如,背景调查平台获取的一份简历信息如下:
姓名:张三
工作经历
2011-2013:百度,软件工程师
工作期间,主要负责在线地图的数据库开发与维护工作。
2013-2015:阿里巴巴,人工智能架构师
工作期间,参与阿里巴巴人工智能***的分布式存储***的设计与开发。
教育背景:
2008-2011:北京大学,计算机硕士
研究生期间,参与了智能语义分析的算法开发,使用了深度神经网络、霍夫曼树等方法。
通过解析上述例子中的工作经验及教育背景,背景调查平台可以获取三个第一关联组合,分别为:(1)2008-2011,北京大学:语义分析、深度神经网络、霍夫曼树;(2)2011-2013,百度:在线地图、数据库开发;(3)2013-2015,阿里巴巴:分布式存储,人工智能。
S102,根据所述相关信息获取所述目标用户的科研公开数据。
具体地,目标用户在以往的工作中会产生科研公开数据,科研公开数据包括但不限于发表的文章、论文、专利文献、科技新闻或互联网(论坛、blog、SNS、问答***等)等。根据目标用户的相关信息,例如姓名和/或身份证号等,获取目标用户的科研公开数据,这些科研公开数据中包括专业知识和时间节点信息。例如,科研公开数据为目标用户发表的期刊文章,专业知识为该期刊文章涉及的专业知识,时间节点信息包括该期刊文章的发表时间。再例如,科研公开数据为专利文献,专业知识为该专利文献的发明点所涉及的技术知识,时间节点信息包括专利文献的申请时间等。
在一些实施例中,背景调查平台至少包括一个专利信息数据库,该专利信息数据库可以为本地存储的数据库或能够通过远程访问的数据库,通过访问背景调查平台上的专利信息数据库可以获取目标用户的科研公开数据,即专利文献数据。还可以通过访问现有的国内外的专利数据库获取专利文献数据,例如中国国家知识产权局检索平台、PCT国际专利检索网站等提供的专利数据库。
在另一些实施例中,背景调查平台可以通过访问万方数据库及中国知网等获取目标用户的论文数据,通过访问百度、Google等搜索引擎获取目标用户的科技新闻或互联网(论坛、blog、SNS、问答***等)等公开的数据。
S103,根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。
具体地,履历信息的验证包括但不限于验证目标用户在一个时间区间和任职单位从事的工作的真实性。例如,验证目标用户在同一个时间区间内的任职单位与科研公开数据中涉及的机构是否一致,若一致,则可以确定目标用户的该条履历信息真实;或者可以验证目标用户在一个时间区间内的工作技能与科研公开数据中涉及的专业知识是否相似,若两者完全属于不同的技术领域或者相似度较低,则可以确定目标用户的该条履历信息不真实;又或者可以验证目标用户在一个时间区间内的任职单位、工作技能是否与科研公开数据涉及的机构、专业知识都一致,若都一致,则可以目标用户的该条履历信息真实。
本公开实施例,通过获取目标用户的相关信息,其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;再通过所述相关信息获取所述目标用户的科研公开数据,最后根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。通过本公开实施例的上述技术方案可以自动地获取目标用户的科研公开数据并且能够验证目标用户是否真的具备其所声称的技能信息,进行验证的人员无需具备相关的专业知识,就能快速而准确的验证目标对象的履历信息的真实性。
在一些可选的实施例中,如图2所示,步骤S103即根据所述科研公开数据以及所述相关信息验证所述目标用户的履历,包括:
S201,解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息;
S202,根据所述第一关联组合和第二关联组合验证所述目标用户的履历。
在一些实施例中,科研公开数据为目标用户发表的期刊文章、论文、专利文献等结构化数据时,可以通过正则匹配等方式从结构化数据中解析出第二关联组合。例如,专利文献的结构化信息包括申请人、申请日、摘要、权利要求书及说明书等,期刊文章、论文的结构化信息包括题名、作者、摘要、关键词、通讯单位及参考文献等;其中,第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息。第二关联组合中的每一项与第一关联组合中的每一项相对应。第二机构可以为科研公开数据涉及的科研机构,例如论文和/或文章发表时目标用户所在的学校、任职单位等,专利文献的申请人机构。第二时间区间包括但不限于文章、论文等的发表时间涉及的时间区间,专利文献的申请日涉及的时间区间。
在另一些实施例中,科研公开数据为科技新闻或互联网(论坛、blog、SNS、问答***等)等非结构化数据类型时,可以先获取关键信息,再对该关键信息作结构化处理,最后解析并确定科技新闻或互联网(论坛、blog、SNS、问答***等)等数据涉及的至少一个第二关联组合。
下面将以专利文献数据为例来具体说明解析并确定专利文献的至少一个第二关联组合的其中一种实现方式,假设通过姓名张三访问专利数据库,得到张三的专利文献数据:
CN2011xxx,北京大学:一种语音识别方法
CN2012xxx,百度:一种自动地图数据更新方法
CN2013xxx,百度:一种快速获得地理信息数据的方法
CN2015xxx,阿里巴巴:一种神经网络训练方法
此处,虽然专利文献数据一般拥有结构化的用于描述技术方向的数据,例如IPC、CPC分类号,然而这些分类号一般较为宽泛,无法得到较为精准的技能信息。因此使用结构化技术分类字段的方法将无法与履历完成精准匹配。在一些实施例中,可以使用预先训练好的人工智能模型例如神经网络模型对专利文献的标题、摘要、权利要求和说明书等进行解析,用于提取专利的技术特征词。该神经网络模块可以通过标注的训练数据来完成训练,以抽取较为精准的技术特征词。例如,经过解析后可以得到该专利文献在申请日这一时间点上的技能信息,即该专利文献数据的第二关联组合可以表示为:
2011,北京大学:语音识别、word2vector、NLP、波形检测、数据库
2012,百度:地图数据,GIS,数据获取、数据更新、分布式
2013,百度:人机交互,GIS,地理信息***、误差校准
2015,阿里巴巴:神经网络、CNN、RNN、训练、收敛、并行计算
进一步地,在一些实施例中,将上述专利文献数据提取的第二关联组合与履历解析的第一关联组合进行交叉验证,可以得到履历的验证信息。
在一些可选的实施例中,如图3所示,步骤S202即根据所述第一关联组合和第二关联组合验证所述目标用户的履历,包括:
S301,根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
S302,针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
在本实施例中,根据第一机构和第二机构是否一致、第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合。假设第一机构和第二机构一致,下面将以专利文献数据类型为例来具体说明,在第一时间区间内匹配第一关联组合和第二关联组合,由于第二关联组合中的第二时间区间,即专利申请时间为具体的日期,因此需要对时间点进行一个滤波,得到一个时间区间,该滤波可以将研发的连续性考虑进去,可以将一个一般性的研发时间周期与上述时间点进行卷积,得到多个技术特征的时间周期。例如,产生一个专利技术意味着至少包含一年的研发周期,因此数据点与一年的周期进行卷积,能够得到不同的技能周期:
计算机:2011-2015
语义分析:2011-2012
语音识别:2011-2012
GIS:2012-2013
神经网络:2015-2016
由于滤波的方式等同于将一个时间点直接扩张成一个时间段,而目标用户的研发经历的连贯性存在内在技术的关联度。例如,一个目标用户的研究课题在十年内从3G移动通信自然演进到4G移动通信是一个正常的过程,而相反由一个生物学研究切换成人工智能研究则意味着出现一次较大的职业变动。因此,也可以使用机器学习的方法基于专利文献数据生成第二关联信息中的技能-时间片段。例如,首先获得大量的申请人标识,并通过以上方法得到具体时间点的技能特征词,进一步由人工的方式标注时间片段,可选的可以为时间片段进行技能标注,例如由人工对该段技能的技术领域进行标注。在得到大量的训练数据后,训练一个机器学习模型,得到一个技能-时间片段分割和分类模型。进而,在得到一个目标用户的专利数据后,输入该模型,模型将自动给出技能-时间片段的划分和标注。
图4是根据本公开的一实施例所示通过机器学习生成的技能-时间片段的示意图,如图4所示,技能-时间片段1中,技能从数据库技术演进至分布式存储技术,两者由于均为数据库技术的演进,因此模型将两者合成为一个片段。进一步,技能从数据库演进至人工智能领域。在技能-时间片段2中,技能从3G相关的技术,例如CDMA、UMTS自然演进至4G相关的技术,例如OFDM,由于模型已经吸收了训练数据中的特征,因此将判断两段技能为无线通信技能。进一步,技能发生了较大的转变,转为基因测序以及基因编辑领域,因此技能片段出现了明显的转折,变为生物技术。
在本实施例中,***首先根据第一机构和第二机构是否一致、第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合,若第一关联组合相关联的第一时间区间、第一机构分别与第二关联组合相关联的第二时间区间、第二机构一致,即第一关联组合和第二关联组合相匹配时,再进一步根据第一技能信息和第二技能信息的相似度验证所述目标用户的履历。一种较为简单的验证结果为按照履历的时间片段,给出不同时间片段内的验证结果。图5根据本公开的一实施例示出不同时间片段内的验证结果的示意图,如图5所示,其中时间片段是按照履历信息切分的历史信息。
在一些实施例中,履历解析的第一关联组合包含科研公开数据解析的第一关联组合,此时可以确定履历是真实的,例如:
履历数据:
2008-2011:语义分析
科研公开数据解析:
2010-2011:语义分析
在另一些实施例中,履历解析的第一关联组合中的第一技能信息,与科研公开数据解析的第一关联组合中的第二技能信息不完全相同,例如:
履历:
2011-2013:在线地图
科研公开数据:
2012-2013:GIS
此时,在线地图和GIS是不能完全匹配的技能特征,将计算两个词之间的词距信息,以得到第一技能信息和第二技能信息的相似度,再根据第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
在一些可选的实施例中,如图6所示,步骤S302即根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历,包括:
S601,根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
S602,在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
在本实施例中,下面将以专利文献数据类型为例来具体说明根据预先训练好的人工智能模型确定第一技能信息和第二技能信息之间相似度的其中一种实现方式。由于专利文献中技能特征词一般均为非日常用词,并且日常用词也无法反应专业领域的划分,因此技能特征词的词向量是由大量领域内的专利计算得到的。具体的,将相关领域的专利文献,例如将计算机领域的大量专利文献输入至预先训练好的人工智能模型,例如神经网络模型,并抽取专利文献的技能词,并计算技能词的词向量表示。此时,通过计算两个技能词“在线地图”和“GIS”之间的词向量,可以得到第一技能信息和第二技能信息之间的相似度,也就是一个匹配度取值。此时,尽管两个技能词之间并不完全关联,但是通过专利文献中存在的大量技术性描述文本,隶属于相同领域的技能词之间将得到较高的词距,也意味着较高概率下履历信息得到了专利文献的验证,例如“GIS”和“在线地图”之间将具有较高的相似度,而“GIS”和“农药”之间相似度则较低。在相似度大于或等于预设阈值时,确定目标用户的履历中当前第一关联组合信息是真实的。
在获得所有的第一技能信息和第二技能信息之间的相似度之后,***可以对整个履历进行综合验证。当履历解析出的多个第一关联组合均能得到专利解析数据的验证时,可以得到整个履历信息的验证得分。
在一种情况下,专利数据解析出的第二技能信息为空,由于研发工作并不必须一定能产生专利申请,此时则认为该段履历信息无法验证。
在一些可选的实施例中,根据第一关联组合和第二关联组合验证目标用户的履历时,当第一关联组合和第二关联组合匹配度较低,或者第一技能信息和第二技能信息之间的相似度较低时,可以生成报警信息。例如:
履历:
2011-2013:在线地图,百度
科研公开数据:
2011-2012:无人机,深圳大疆科技
第一关联组合中的第一机构为“百度”,第二关联组合中的第二机构为“深圳大疆科技”,两者不一致,可以认定第一关联组合和第二关联组合匹配度较低;同时,第一关联组合中的第一技能信息为“在线地图”,第二关联组合中的第二技能信息为“无人机”,即第一技能信息和第二技能信息之间的相似度较低,因此将生成一个警报信息。
再例如:
履历:
2011-2013:在线地图,百度
科研公开数据:
2011-2012:即时通信,百度
此时,尽管在时间片段和机构信息方面科研公开数据能够验证履历信息,然而在线地图与即时通信技能相关度较低,此时***也将产生一个警报信息。
在一些可选的实施例中,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
在本实施例中,在解析专利文献数据时,至少可以通过解析该专利文献数据所涉及的技术领域、技术问题和/或技术手段来确定目标用户的第二技能信息。
在一些可选的实施例中,所述科研公开数据包括专利文献数据;和/或,所述履历信息还包括所述目标用户申请过的专利文献标识。
该可选的实现方式中,目标用户的履历信息中还可以包括目标用户申请过的专利文献标识,例如专利申请号、公开号和/或公开日等。在对目标用户的履历信息进行验证时,还可以通过该专利文献标识从专利数据库中提取对应的专利文献,并获取该专利文献的申请信息即申请人、发明人、申请日等,并与履历信息中目标用户的姓名等进行匹配验证。
在一些可选的实施例中,解析所述科研公开数据,包括:解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
该可选的实现方式中,可以通过解析专利文献数据中标题、摘要、权利要求书、说明书等内容获取专利文献数据所涉及的专业知识,进而确定目标用户的第二技能信息,以用于验证目标用户的履历信息。
以上是本公开提供的用户履历验证方法的具体实施方式。
图7是根据本公开的一些实施例所示的用户履历验证装置示意图。如图7所示,用户履历验证装置700包括第一获取模块701、第二获取模块702和验证模块703,其中:
第一获取模块701,用于获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;
第二获取模块702,用于根据所述相关信息获取所述目标用户的科研公开数据;
验证模块703,用于根据所述科研公开数据以及所述相关信息验证所述目标用户的履历。
在一些可选的实施例中,所述验证模块703包括:
第一确定子模块,用于解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息;
第一验证子模块,用于根据所述第一关联组合和第二关联组合验证所述目标用户的履历。
在一些可选的实施例中,所述第一验证子模块包括:
匹配子模块,用于根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
第二验证子模块,用于针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
在一些可选的实施例中,所述第二验证子模块包括:
第二确定子模块,用于根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
第三确定子模块,用于在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
在一些可选的实施例中,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
在一些可选的实施例中,所述科研公开数据包括专利文献数据;和/或,
所述履历信息还包括所述目标用户申请过的专利文献标识。
在一些可选的实施例中,所述第一确定子模块,包括:
解析子模块,用于解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
上述实施例中提出的用户履历验证装置与上述用户履历验证方法对应一致,具体细节可参见上述对用户履历验证方法的描述,在此不再赘述。
图8是适于用来实现根据本公开实施方式的用户履历验证方法的电子设备的结构示意图。
如图8所示,电子设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行上述图1所示的实施方式中的各种处理。在RAM808中,还存储有电子设备800操作所需的各种程序和数据。CPU801、ROM802以及RAM808通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本公开的实施方式,上文参考图1描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行图1的方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。
附图中的流程图和框图,图示了按照本公开各种实施方式的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
综上所述,本公开提出了一种用户履历验证方法、装置、电子设备及其计算机可读存储介质。本公开实施例通过上述技术方案可以自动地获取目标用户的科研公开数据并且能够验证目标用户是否真的具备其所声称的技能信息,进行验证的人员无需具备相关的专业知识,就能快速而准确的验证目标对象的履历信息的真实性。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (16)

1.一种用户履历验证方法,其特征在于,包括:
获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;
根据所述相关信息获取所述目标用户的科研公开数据;
解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;其中,通过对时间点进行滤波得到第二时间区间,所述滤波包括研发的连续性因素,所述研发的连续性存在内在技术的关联度;使用机器学习的方法基于专利文献数据生成第二关联信息中的技能-时间片段;
根据所述第一关联组合和第二关联组合验证所述目标用户的履历;其中,按照履历的时间片段,给出不同时间片段内的验证结果。
2.根据权利要求1所述的用户履历验证方法,其特征在于,所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息。
3.根据权利要求2所述的用户履历验证方法,其特征在于,根据所述第一关联组合和第二关联组合验证所述目标用户的履历,至少包括:
根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
4.根据权利要求3所述的用户履历验证方法,其特征在于,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历,包括:
根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
5.根据权利要求3或4所述的用户履历验证方法,其特征在于,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
6.根据权利要求3或4所述的用户履历验证方法,其特征在于,所述科研公开数据包括专利文献数据;和/或,
所述履历信息还包括所述目标用户申请过的专利文献标识。
7.根据权利要求6所述的用户履历验证方法,其特征在于,解析所述科研公开数据,包括:
解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
8.一种用户履历验证的装置,其特征在于,包括:
第一获取模块,用于获取目标用户的相关信息;其中,所述相关信息至少包括身份信息以及履历信息;所述履历信息包括所述目标用户的至少一个第一关联组合,所述第一关联组合包括相关联的第一时间区间、第一机构和第一技能信息;
第二获取模块,用于根据所述相关信息获取所述目标用户的科研公开数据;
第一确定子模块,用于解析所述科研公开数据,并确定所述科研公开数据涉及的至少一个第二关联组合;其中,通过对时间点进行滤波得到第二时间区间,所述滤波包括研发的连续性因素,所述研发的连续性存在内在技术的关联度;使用机器学习的方法基于专利文献数据生成第二关联信息中的技能-时间片段;
第一验证子模块,用于根据所述第一关联组合和第二关联组合验证所述目标用户的履历;其中,按照履历的时间片段,给出不同时间片段内的验证结果。
9.根据权利要求8所述的用户履历验证装置,其特征在于,所述第二关联组合包括相关联的第二机构、第二时间区间和第二技能信息。
10.根据权利要求9所述的用户履历验证装置,所述第一验证子模块包括:
匹配子模块,用于根据所述第一机构和第二机构是否一致、所述第二时间区间是否在所述第一时间区间内匹配第一关联组合和第二关联组合;
第二验证子模块,用于针对相匹配的所述第一关联组合和第二关联组合,根据所述第一技能信息和第二技能信息的相似度验证所述目标用户的履历。
11.根据权利要求10所述的用户履历验证装置,所述第二验证子模块包括:
第二确定子模块,用于根据预先训练好的人工智能模型确定所述第一技能信息和第二技能信息之间的相似度;
第三确定子模块,用于在所述相似度大于或等于预设阈值时,确定所述目标用户的履历真实。
12.根据权利要求10或11所述的用户履历验证装置,其特征在于,所述第二技能信息至少包括:技术领域、技术问题和/或技术手段。
13.根据权利要求10或11所述的用户履历验证装置,其特征在于,所述科研公开数据包括专利文献数据;和/或,
所述履历信息还包括所述目标用户申请过的专利文献标识。
14.根据权利要求13所述的用户履历验证装置,其特征在于,所述第一确定子模块,包括:
解析子模块,用于解析所述专利文献数据中的标题、摘要、权利要求书和说明书中的至少一个。
15.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如权利要求1-7任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如权利要求1-7任一项所述的方法。
CN201811628088.6A 2018-12-28 2018-12-28 用户履历验证方法、装置、电子设备及存储介质 Active CN109885647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811628088.6A CN109885647B (zh) 2018-12-28 2018-12-28 用户履历验证方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811628088.6A CN109885647B (zh) 2018-12-28 2018-12-28 用户履历验证方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109885647A CN109885647A (zh) 2019-06-14
CN109885647B true CN109885647B (zh) 2021-07-09

Family

ID=66925378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811628088.6A Active CN109885647B (zh) 2018-12-28 2018-12-28 用户履历验证方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN109885647B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569418A (zh) * 2019-07-24 2019-12-13 阿里巴巴集团控股有限公司 学历信息验证方法以及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426435A (zh) * 2015-11-04 2016-03-23 深圳市前海七号网络科技有限公司 专业人才数据处理方法及服务器
CN108520334A (zh) * 2018-03-15 2018-09-11 考拉征信服务有限公司 一种职业征信方法和装置
CN108595491A (zh) * 2018-03-15 2018-09-28 考拉征信服务有限公司 一种基于履历拆分的背调方法、***及其计算机存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7865451B2 (en) * 2006-12-11 2011-01-04 Yahoo! Inc. Systems and methods for verifying jobseeker data
CN106790061A (zh) * 2016-12-20 2017-05-31 财付通支付科技有限公司 用户信息验证方法和装置
CN108985707B (zh) * 2018-06-11 2021-08-10 安徽引航科技有限公司 一种快速判断简历内容真实性的方法
CN108932607A (zh) * 2018-06-19 2018-12-04 秦德玉 一种基于云端的验证履历真实性的***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426435A (zh) * 2015-11-04 2016-03-23 深圳市前海七号网络科技有限公司 专业人才数据处理方法及服务器
CN108520334A (zh) * 2018-03-15 2018-09-11 考拉征信服务有限公司 一种职业征信方法和装置
CN108595491A (zh) * 2018-03-15 2018-09-28 考拉征信服务有限公司 一种基于履历拆分的背调方法、***及其计算机存储介质

Also Published As

Publication number Publication date
CN109885647A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN112632385B (zh) 课程推荐方法、装置、计算机设备及介质
CN109325165B (zh) 网络舆情分析方法、装置及存储介质
CN109815487B (zh) 文本质检方法、电子装置、计算机设备及存储介质
US20180232528A1 (en) Sensitive Data Classification
US20190188326A1 (en) Domain specific natural language understanding of customer intent in self-help
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN115002200B (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
US10614377B2 (en) Method and system for using existing models in connection with new model development
CN111984792A (zh) 网站分类方法、装置、计算机设备及存储介质
CN113239173A (zh) 问答数据的处理方法、装置、存储介质与电子设备
CN117114514A (zh) 一种基于大数据的人才信息分析管理方法、***及装置
CN111723180A (zh) 一种面试方法和装置
CN114398466A (zh) 基于语义识别的投诉分析方法、装置、计算机设备及介质
CN114186040A (zh) 一种智能机器人客服的运作方法
CN113761375A (zh) 基于神经网络的消息推荐方法、装置、设备及存储介质
CN109885647B (zh) 用户履历验证方法、装置、电子设备及存储介质
Tao et al. A traffic accident morphology diagnostic model based on a rough set decision tree
CN112256884A (zh) 一种基于知识图谱的数据资产库访问方法和装置
CN115718807A (zh) 人员关系分析方法、装置、设备及存储介质
CN109857793A (zh) 技术背景数据的处理方法、装置、电子设备及存储介质
CN111897884B (zh) 数据关系信息显示方法、终端设备
CN114741483A (zh) 数据识别的方法和装置
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN111615178B (zh) 识别无线网络类型及模型训练的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant