CN110399455A - 一种基于cnn和lstm的深度学习数据挖掘方法 - Google Patents
一种基于cnn和lstm的深度学习数据挖掘方法 Download PDFInfo
- Publication number
- CN110399455A CN110399455A CN201910488085.5A CN201910488085A CN110399455A CN 110399455 A CN110399455 A CN 110399455A CN 201910488085 A CN201910488085 A CN 201910488085A CN 110399455 A CN110399455 A CN 110399455A
- Authority
- CN
- China
- Prior art keywords
- cnn
- lstm
- data
- method based
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:依次收集每个目标对象的特征向量,得到原始数据包;对数据预处理,建立字符信息库;构建CNN‑LSTM算法模型;对CNN‑LSTM算法模型进行训练,并测试;采用CNN‑LSTM算法模型进行数据挖掘;得到数据反馈,进行学习。本发明中,通过构建LSTM‑CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。
Description
技术领域
本发明涉及学习领域,尤其涉及一种基于CNN和LSTM的深度学习数据挖掘方法。
背景技术
目前,各地区各部门的工作已经基本实现电子化。由于实现电子化的时间不长,信息量过于庞大,使得信息挖掘的准确性低,速度慢,耽误了各单位和个人的学习。
为解决上述问题,本申请中提出一种基于CNN和LSTM的深度学习数据挖掘方法。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种基于CNN和LSTM的深度学习数据挖掘方法,本发明通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。
(二)技术方案
为解决上述问题,本发明提供了一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:
S1、依次收集每个目标对象的特征向量,得到原始数据包;
S2、对数据预处理,建立字符信息库;
S3、构建CNN-LSTM算法模型;
S4、对CNN-LSTM算法模型进行训练,并测试;
S5、采用CNN-LSTM算法模型进行数据挖掘;
S6、得到数据反馈,进行学习。
优选的,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。
优选的,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。
优选的,在S3中,CNN神经网络***和LSTM神经网络***为串联建模。
优选的,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。
优选的,在S4中,LSTM包含长短记忆层和至少一个全连接层。
优选的,在S5中进行数据挖掘时,首先输入关键词,CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。
优选的,还包括校正***;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。
优选的,还包括记录***;记录***对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。
本发明的上述技术方案具有如下有益的技术效果:
一、本发明中,通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。
二、本发明中,设置的校正***和记录***,提高了数据挖掘的准确性和便捷性,进一步完善方法***,促进学习效果。
附图说明
图1为本发明提出的一种基于CNN和LSTM的深度学习数据挖掘方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
如图所示,本发明提出的一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:
S1、依次收集每个目标对象的特征向量,得到原始数据包;
S2、对数据预处理,建立字符信息库;
S3、构建CNN-LSTM算法模型;
S4、对CNN-LSTM算法模型进行训练,并测试;
S5、采用CNN-LSTM算法模型进行数据挖掘;
S6、得到数据反馈,进行学习。
在一个可选的实施例中,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。
在一个可选的实施例中,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。
在一个可选的实施例中,在S3中,CNN神经网络***和LSTM神经网络***为串联建模。
在一个可选的实施例中,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。
在一个可选的实施例中,在S4中,LSTM包含长短记忆层和至少一个全连接层。
在一个可选的实施例中,在S5中进行数据挖掘时,首先输入关键词,CNN 对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。
在一个可选的实施例中,还包括校正***;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。
在一个可选的实施例中,还包括记录***;记录***对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。
本发明中,通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高;设置的校正***和记录***,提高了数据挖掘的准确性和便捷性,进一步完善方法***,促进学习效果。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (9)
1.一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,包括以下步骤:
S1、依次收集每个目标对象的特征向量,得到原始数据包;
S2、对数据预处理,建立字符信息库;
S3、构建CNN-LSTM算法模型;
S4、对CNN-LSTM算法模型进行训练,并测试;
S5、采用CNN-LSTM算法模型进行数据挖掘;
S6、得到数据反馈,进行学习。
2.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。
3.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。
4.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S3中,CNN神经网络***和LSTM神经网络***为串联建模。
5.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。
6.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S4中,LSTM包含长短记忆层和至少一个全连接层。
7.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S5中进行数据挖掘时,首先输入关键词,CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。
8.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,还包括校正***;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。
9.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,还包括记录***;记录***对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910488085.5A CN110399455A (zh) | 2019-06-05 | 2019-06-05 | 一种基于cnn和lstm的深度学习数据挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910488085.5A CN110399455A (zh) | 2019-06-05 | 2019-06-05 | 一种基于cnn和lstm的深度学习数据挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110399455A true CN110399455A (zh) | 2019-11-01 |
Family
ID=68323046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910488085.5A Pending CN110399455A (zh) | 2019-06-05 | 2019-06-05 | 一种基于cnn和lstm的深度学习数据挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399455A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177378A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 一种文本挖掘方法、装置及电子设备 |
CN111915218A (zh) * | 2020-08-14 | 2020-11-10 | 中国工商银行股份有限公司 | 基于lstm-cnn的财务造假识别方法及*** |
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220506A (zh) * | 2017-06-05 | 2017-09-29 | 东华大学 | 基于深度卷积神经网络的乳腺癌风险评估分析*** |
CN107832289A (zh) * | 2017-10-12 | 2018-03-23 | 北京知道未来信息技术有限公司 | 一种基于lstm‑cnn的命名实体识别方法 |
CN108009674A (zh) * | 2017-11-27 | 2018-05-08 | 上海师范大学 | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 |
CN109814523A (zh) * | 2018-12-04 | 2019-05-28 | 合肥工业大学 | 基于cnn-lstm深度学习方法及多属性时序数据的故障诊断方法 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
-
2019
- 2019-06-05 CN CN201910488085.5A patent/CN110399455A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220506A (zh) * | 2017-06-05 | 2017-09-29 | 东华大学 | 基于深度卷积神经网络的乳腺癌风险评估分析*** |
CN107832289A (zh) * | 2017-10-12 | 2018-03-23 | 北京知道未来信息技术有限公司 | 一种基于lstm‑cnn的命名实体识别方法 |
CN108009674A (zh) * | 2017-11-27 | 2018-05-08 | 上海师范大学 | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 |
CN109814523A (zh) * | 2018-12-04 | 2019-05-28 | 合肥工业大学 | 基于cnn-lstm深度学习方法及多属性时序数据的故障诊断方法 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177378A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 一种文本挖掘方法、装置及电子设备 |
CN111177378B (zh) * | 2019-12-20 | 2023-09-26 | 北京淇瑀信息科技有限公司 | 一种文本挖掘方法、装置及电子设备 |
CN111915218A (zh) * | 2020-08-14 | 2020-11-10 | 中国工商银行股份有限公司 | 基于lstm-cnn的财务造假识别方法及*** |
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
CN112052853B (zh) * | 2020-09-09 | 2024-02-02 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399455A (zh) | 一种基于cnn和lstm的深度学习数据挖掘方法 | |
CN105512289B (zh) | 基于深度学习和哈希的图像检索方法 | |
CN102184221B (zh) | 一种基于用户偏好的实时视频摘要生成方法 | |
CN105740773A (zh) | 基于深度学习和多尺度信息的行为识别方法 | |
CN104067314A (zh) | 人形图像分割方法 | |
CN108228832B (zh) | 一种基于距离矩阵的时间序列数据补全方法 | |
CN109165337B (zh) | 一种基于知识图谱构建招投标领域关联分析的方法及*** | |
CN107292259A (zh) | 基于AdaRank的深度特征和传统特征的集成方法 | |
CN106407208A (zh) | 一种城市管理本体知识库的构建方法及*** | |
CN106022363A (zh) | 一种适用于自然场景下的中文文字识别方法 | |
Donato | A dynamic view of Mexican migration to the United States | |
KR102593835B1 (ko) | 휴리스틱 가우스 클라우드 변환에 기반하는 얼굴인식 기술 | |
CN106294715A (zh) | 一种基于属性约简的关联规则挖掘方法及装置 | |
CN111080241A (zh) | 一种基于互联网平台的数据化人才管理分析*** | |
CN106021442A (zh) | 一种网络新闻概要提取方法 | |
CN109785400A (zh) | 一种剪影图像制作方法、装置、电子设备及存储介质 | |
CN105095857A (zh) | 基于关键点扰动技术的人脸数据增强方法 | |
CN104299241A (zh) | 基于 Hadoop 的遥感图像显著性目标检测方法及*** | |
CN108664993A (zh) | 一种密集权重连接的卷积神经网络图像分类方法 | |
CN107832753B (zh) | 一种基于四值权重与多重分类的人脸特征提取方法 | |
CN113935435A (zh) | 基于时空特征融合的多模态情感识别方法 | |
CN113268370A (zh) | 一种根因告警分析方法、***、设备及存储介质 | |
CN110378543A (zh) | 离职风险预测方法、装置、计算机设备和存储介质 | |
CN115620143A (zh) | 一种新古典主义建筑风格识别***、构建方法及识别方法 | |
CN103984723A (zh) | 一种针对增量数据对频繁项进行更新数据挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191101 |
|
RJ01 | Rejection of invention patent application after publication |