CN110569400A - 一种人事信息基于cnn和lstm建模的信息抽取方法 - Google Patents
一种人事信息基于cnn和lstm建模的信息抽取方法 Download PDFInfo
- Publication number
- CN110569400A CN110569400A CN201910665726.XA CN201910665726A CN110569400A CN 110569400 A CN110569400 A CN 110569400A CN 201910665726 A CN201910665726 A CN 201910665726A CN 110569400 A CN110569400 A CN 110569400A
- Authority
- CN
- China
- Prior art keywords
- information
- personnel information
- neural network
- cnn
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种人事信息基于CNN和LSTM建模的信息抽取方法,包括以下步骤:S1:获取人员信息;S2:构建LSTM‑CNN神经网络***;S3:对人员信息进行分类,并选出多个关键词;S4:通过现有存储的人员信息与关键词,对神经网络***进行训练;S5:通过S4的训练,获取关键词与人员信息之间的相关性;S6:多次查询不同的关键词,从而使得***获得初次检索结果;S7:神经网络***对多次初次检索结果进行重新排序,以得到最终检索结果;S8:操作者对最终检索结果进行抽取以及调用。本发明中,提高了人事信息的调取速度,解决传统人事信息调取困难的问题。神经网络***通过关键词与人员信息之间的相关性,能够及时调取相关信息,展现出优越的搜索性能。
Description
技术领域
本发明涉及信息抽取领域,尤其涉及一种人事信息基于CNN和LSTM建模的信息抽取方法。
背景技术
目前,各地区各部门的工作已经基本实现电子化。对于人员管理、人员组织管理、人员费用管理、工作学习等内容,均可以通过电脑进行管理,人员信息化建设。同时,也有不少的组织部建立了自己的网站,通过网络组织政务工作、开展学习和帮助人员进步。
然而,现有各类人员信息管理***,均停留在使用电脑操作的阶段,由于当官人数很多,导致了调取、查询人员信息困难。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种人事信息基于CNN和 LSTM建模的信息抽取方法,大大提高了人事信息的调取速度,解决传统人事信息调取困难的问题。神经网络***通过关键词与人员信息之间的相关性,能够及时调取相关信息,展现出优越的搜索性能。
(二)技术方案
为解决上述问题,本发明提供了一种人事信息基于CNN和LSTM建模的信息抽取方法,包括以下步骤:
S1:获取人员信息;
S2:构建LSTM-CNN神经网络***;
S3:对人员信息进行分类,并选出多个关键词;
S4:通过现有存储的人员信息与关键词,对神经网络***进行训练;
S5:通过S4的训练,获取关键词与人员信息之间的相关性;
S6:多次查询不同的关键词,从而使得***获得初次检索结果;
S7:神经网络***对多次初次检索结果进行重新排序,以得到最终检索结果;
S8:操作者对最终检索结果进行抽取以及调用。
优选的,人员信息包括姓名、身份证信息、户籍、工作时间、工龄、职务、工作所在地。
优选的,S4中,将姓名、身份证和人员信息构建成三元组,作为输出矩阵输入神经网络***;其中,姓名和身份证信息同时作为关键词。
优选的,关键词为包括人员信息中含有的词条。
优选的,包括记录***;操作着调用信息后,记录***对调用的数据、数据调用、查看的时间,以及调用者进行详细的调用记录。
优选的,根据调用记录,对使用的关键词以及被查询的人事信息进行数量统计;统计数量多的关键词以及对应的人事信息进行优先调取。
优选的,神经网络***为串联的循环神经网络和卷积神经网络。
优选的,循环神经网络用于处理人员信息的时序特征;卷积神经网络用于处理人员信息的位置特征。
本发明的上述技术方案具有如下有益的技术效果:
本发明中,通过构建LSTM-CNN神经网络***对人事信息进行处理,大大提高了人事信息的调取速度,解决传统人事信息调取困难的问题。神经网络***通过关键词与人员信息之间的相关性,能够及时调取相关信息,展现出优越的搜索性能。
本发明中,LSTM算法和CNN算法结合使用,构建LSTM-CNN神经网络***。其中,LSTM算法能查询关键词在时序上的特征,通过门函数对关键词的状态特征进行计算,而CNN算法能够有效捕获人员信息的位置特征信息,从而提高搜索查询的速度,实现快速调取人事信息的过程。
附图说明
图1为本发明提出的人事信息基于CNN和LSTM建模的信息抽取方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
如图1所示,本发明提出的一种人事信息基于CNN和LSTM建模的信息抽取方法,包括以下步骤:
S1:获取人员信息;
S2:构建LSTM-CNN神经网络***;
S3:对人员信息进行分类,并选出多个关键词;
S4:通过现有存储的人员信息与关键词,对神经网络***进行训练;
S5:通过S4的训练,获取关键词与人员信息之间的相关性;
S6:多次查询不同的关键词,从而使得***获得初次检索结果;
S7:神经网络***对多次初次检索结果进行重新排序,以得到最终检索结果;
S8:操作者对最终检索结果进行抽取以及调用。
本发明中,通过构建LSTM-CNN神经网络***对人事信息进行处理,大大提高了人事信息的调取速度,解决传统人事信息调取困难的问题。神经网络***通过关键词与人员信息之间的相关性,能够及时调取相关信息,展现出优越的搜索性能;
本发明中,LSTM算法和CNN算法结合使用,构建LSTM-CNN神经网络***。其中,LSTM算法能查询关键词在时序上的特征,通过门函数对关键词的状态特征进行计算,而CNN算法能够有效捕获人员信息的位置特征信息,从而提高搜索查询的速度,实现快速调取人事信息的过程。
在一个可选的实施例中,人员信息包括姓名、身份证信息、户籍、工作时间、工龄、职务、工作所在地,能够全面的抽取人员信息,全面了解人员的基本情况,便于解决突发事件等。
在一个可选的实施例中,S4中,将姓名、身份证和人员信息构建成三元组,作为输出矩阵输入神经网络***;其中,姓名和身份证信息同时作为关键词;三元组提高***的算法速度,优化算法过程,实现***的高效率运行;姓名和身份证信息同时作为关键词,便于快速查找信息。
在一个可选的实施例中,关键词为包括人员信息中含有的词条,比如:姓名、身份证信息、户籍、工作时间、工龄、职务、工作所在地等,都能够作为关键词使用,从而扩大***的搜索范围,提高***的使用性能。
在一个可选的实施例中,包括记录***;操作着调用信息后,记录***对调用的数据、数据调用、查看的时间,以及调用者进行详细的调用记录
在一个可选的实施例中,根据调用记录,对使用的关键词以及被查询的人事信息进行数量统计;统计数量多的关键词以及对应的人事信息进行优先调取。
需要说明的是,记录***用于对调用信息过程进行记录,当调用出现问题是,能够通过该记录查找处调用记录,从而提高***的安全性。同时,统计数量多的关键词以及对应的人事信息进行优先调取,以提升对常用调取信息的排序,便于实现更加快捷的调取常用信息。
在一个可选的实施例中,神经网络***为串联的循环神经网络和卷积神经网络
在一个可选的实施例中,循环神经网络用于处理人员信息的时序特征;卷积神经网络用于处理人员信息的位置特征。
需要说明的是,LSTM-CNN神经网络***中,LSTM算法和CNN算法结合使用,构建LSTM-CNN神经网络***。其中,LSTM算法能查询关键词在时序上的特征,通过门函数对关键词的状态特征进行计算,而CNN算法能够有效捕获人员信息的位置特征信息,从而提高搜索查询的速度,实现快速调取人事信息的过程。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (8)
1.一种人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,包括以下步骤:
S1:获取人员信息;
S2:构建LSTM-CNN神经网络***;
S3:对人员信息进行分类,并选出多个关键词;
S4:通过现有存储的人员信息与关键词,对神经网络***进行训练;
S5:通过S4的训练,获取关键词与人员信息之间的相关性;
S6:多次查询不同的关键词,从而使得***获得初次检索结果;
S7:神经网络***对多次初次检索结果进行重新排序,以得到最终检索结果;
S8:操作者对最终检索结果进行抽取以及调用。
2.根据权利要求1所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,人员信息包括姓名、身份证信息、户籍、工作时间、工龄、职务、工作所在地。
3.根据权利要求1所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,S4中,将姓名、身份证和人员信息构建成三元组,作为输出矩阵输入神经网络***;其中,姓名和身份证信息同时作为关键词。
4.根据权利要求1所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,关键词为包括人员信息中含有的词条。
5.根据权利要求1所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,包括记录***;操作着调用信息后,记录***对调用的数据、数据调用、查看的时间,以及调用者进行详细的调用记录。
6.根据权利要求5所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,根据调用记录,对使用的关键词以及被查询的人事信息进行数量统计;统计数量多的关键词以及对应的人事信息进行优先调取。
7.根据权利要求1所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,神经网络***为串联的循环神经网络和卷积神经网络。
8.根据权利要求7所述的人事信息基于CNN和LSTM建模的信息抽取方法,其特征在于,循环神经网络用于处理人员信息的时序特征;卷积神经网络用于处理人员信息的位置特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910665726.XA CN110569400A (zh) | 2019-07-23 | 2019-07-23 | 一种人事信息基于cnn和lstm建模的信息抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910665726.XA CN110569400A (zh) | 2019-07-23 | 2019-07-23 | 一种人事信息基于cnn和lstm建模的信息抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569400A true CN110569400A (zh) | 2019-12-13 |
Family
ID=68773264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910665726.XA Pending CN110569400A (zh) | 2019-07-23 | 2019-07-23 | 一种人事信息基于cnn和lstm建模的信息抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569400A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202044A (zh) * | 2016-07-07 | 2016-12-07 | 武汉理工大学 | 一种基于深度神经网络的实体关系抽取方法 |
CN107832289A (zh) * | 2017-10-12 | 2018-03-23 | 北京知道未来信息技术有限公司 | 一种基于lstm‑cnn的命名实体识别方法 |
CN107977353A (zh) * | 2017-10-12 | 2018-05-01 | 北京知道未来信息技术有限公司 | 一种基于lstm-cnn的混合语料命名实体识别方法 |
CN108304478A (zh) * | 2017-12-28 | 2018-07-20 | 深圳市轱辘车联数据技术有限公司 | 一种数据处理方法以及服务器 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
-
2019
- 2019-07-23 CN CN201910665726.XA patent/CN110569400A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202044A (zh) * | 2016-07-07 | 2016-12-07 | 武汉理工大学 | 一种基于深度神经网络的实体关系抽取方法 |
CN107832289A (zh) * | 2017-10-12 | 2018-03-23 | 北京知道未来信息技术有限公司 | 一种基于lstm‑cnn的命名实体识别方法 |
CN107977353A (zh) * | 2017-10-12 | 2018-05-01 | 北京知道未来信息技术有限公司 | 一种基于lstm-cnn的混合语料命名实体识别方法 |
CN108304478A (zh) * | 2017-12-28 | 2018-07-20 | 深圳市轱辘车联数据技术有限公司 | 一种数据处理方法以及服务器 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230281994A1 (en) | Inmate tracking system in a controlled environment | |
CN109743624B (zh) | 视频切割方法、装置、计算机设备和存储介质 | |
CN109635146B (zh) | 一种基于图像特征的目标查询方法及*** | |
CN108509424B (zh) | 制度信息处理方法、装置、计算机设备和存储介质 | |
US11258895B2 (en) | Automated speech-to-text processing and analysis of call data apparatuses, methods and systems | |
CN105244031A (zh) | 说话人识别方法和装置 | |
EP2674884A1 (en) | Method, system and computer-readable recording medium for adding a new image and information on the new image to an image database | |
CN103235825A (zh) | 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法 | |
US20100174712A1 (en) | Expertise ranking using social distance | |
CN109299040B (zh) | 一种基于大数据的文件存储空间智能分配方法 | |
CN103699679A (zh) | 目标对象的信息检索方法及信息检索设备 | |
WO2020134684A1 (zh) | 信息检索方法、装置、设备和介质 | |
CN106326438A (zh) | 一种人员信息的关联方法 | |
CN110727756A (zh) | 时空轨迹数据的管理方法和装置 | |
WO2021101105A3 (ko) | 의료 전문 자료의 과목 분류 시스템 및 방법 | |
CN110543584A (zh) | 一种建立人脸索引的方法、装置、处理服务器及存储介质 | |
CN111427972B (zh) | 搜索业务数据的方法、装置、业务搜索***和存储介质 | |
CN110569400A (zh) | 一种人事信息基于cnn和lstm建模的信息抽取方法 | |
CN107590233A (zh) | 一种文件管理方法及装置 | |
CN111666263A (zh) | 一种数据湖环境下异构数据管理的实现方法 | |
CN110751310A (zh) | 一种获取多维人员关系和事件关联的方法及*** | |
CN107784588A (zh) | 保险用户信息合并方法和装置 | |
CN110019237B (zh) | 一种基于地图分析罪犯行踪的***及方法 | |
CN115630057A (zh) | 一种实现多源异构数据自动整合的方法 | |
CN115295164A (zh) | 医保数据的处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191213 |