CN111125534A - 一种新颖的数据挖掘方法 - Google Patents
一种新颖的数据挖掘方法 Download PDFInfo
- Publication number
- CN111125534A CN111125534A CN201911370121.4A CN201911370121A CN111125534A CN 111125534 A CN111125534 A CN 111125534A CN 201911370121 A CN201911370121 A CN 201911370121A CN 111125534 A CN111125534 A CN 111125534A
- Authority
- CN
- China
- Prior art keywords
- module
- user editing
- filtering module
- filtering
- editing module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000001914 filtration Methods 0.000 claims abstract description 97
- 238000012216 screening Methods 0.000 claims abstract description 39
- 239000000523 sample Substances 0.000 claims abstract description 4
- 241000700605 Viruses Species 0.000 claims description 3
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种新颖的数据挖掘方法,通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储,还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
Description
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种新颖的数据挖掘方法。
背景技术
当今社会已经进入信息高速传播的时代,这为人们带来方便的同时,也出现了越来越多的问题,例如,如何对挖掘收集到的数据进行分类、筛选,目前网络上通过搜索引擎搜索出来的信息基本被广告、垃圾信息、蹭热点信息所充斥,给人们的信息收集带来了诸多误导。
发明内容
针对背景技术中指出的问题,本发明提出一种新颖的数据挖掘方法,其可以通过设置筛选规则来尽量过滤掉无关信息。
本发明的技术方案是这样实现的:
一种新颖的数据挖掘方法,通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储;
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储;
可编辑空模块供用户进行编辑形成新的过滤模块;
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中;
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
本发明还进一步设置为,所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
本发明还进一步设置为,所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。
采用了上述技术方案,本发明的有益效果为:
本发明所提供的新颖的数据挖掘方法,其通过设置筛查规则库来对收集的信息进行过滤处理,以得到用户想要的信息,且筛查规则库对用户进行开放,用户可向过滤模块中写入新的过滤数据特征,使得筛查规则库更加完善和强大。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明数据挖掘方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如下参考图1对本发明进行说明:
一种新颖的数据挖掘方法,通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储。
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储。
可编辑空模块供用户进行编辑形成新的过滤模块。
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中。
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
其中,所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
其中,所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。
采用了上述技术方案,本发明的有益效果为:
本发明所提供的新颖的数据挖掘方法,其通过设置筛查规则库来对收集的信息进行过滤处理,以得到用户想要的信息,且筛查规则库对用户进行开放,用户可向过滤模块中写入新的过滤数据特征,使得筛查规则库更加完善和强大。
以上所述的仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种新颖的数据挖掘方法,其特征在于:通过智能收集的方式进行数据挖掘,并对挖掘到的数据进行筛查和存储,设置筛查规则库,智能收集包括设置网络探针,自动发现收集信息,筛查按照筛查规则库制定的规则来对收集的信息进行过滤筛查,存储对过滤筛查后的信息进行存储;
所述的筛查规则库包括过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块,过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五均包含有若干数据特征,若所收集信息中包含筛查规则库中的数据特征则被过滤掉,若所收集信息中没有发现筛查规则库中的数据特征则进行存储;
可编辑空模块供用户进行编辑形成新的过滤模块;
还包括分别与过滤模块一、过滤模块二、过滤模块三、过滤模块四、过滤模块五、可编辑空模块对应的用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六,用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六均可供用户自主写入数据特征并被存储在其中;
还包括后台管理模块,后台管理模块可对用户编辑模块一、用户编辑模块二、用户编辑模块三、用户编辑模块四、用户编辑模块五、用户编辑模块六中写入的数据特征进行核查,并作出操作是否写入对应的过滤模块中。
2.根据权利要求1所述的一种新颖的数据挖掘方法,其特征在于:所述的过滤模块一为广告链接过滤模块,所述的过滤模块二为涉黄信息过滤模块,所述的过滤模块三为木马病毒过滤模块,所述的过滤模块四电商销售链接过滤模块,所述的过滤模块五医病广告链接过滤模块。
3.根据权利要求1所述的一种新颖的数据挖掘方法,其特征在于:所述的后台管理模块由人工进行操作,后台管理模块可对筛查规则库进行写入和删除操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370121.4A CN111125534A (zh) | 2019-12-26 | 2019-12-26 | 一种新颖的数据挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370121.4A CN111125534A (zh) | 2019-12-26 | 2019-12-26 | 一种新颖的数据挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111125534A true CN111125534A (zh) | 2020-05-08 |
Family
ID=70503398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911370121.4A Pending CN111125534A (zh) | 2019-12-26 | 2019-12-26 | 一种新颖的数据挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111125534A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166683A (zh) * | 2014-07-21 | 2014-11-26 | 安徽华贞信息科技有限公司 | 一种数据挖掘方法 |
CN108768917A (zh) * | 2017-08-23 | 2018-11-06 | 长安通信科技有限责任公司 | 一种基于网络日志的僵尸网络检测方法及*** |
-
2019
- 2019-12-26 CN CN201911370121.4A patent/CN111125534A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166683A (zh) * | 2014-07-21 | 2014-11-26 | 安徽华贞信息科技有限公司 | 一种数据挖掘方法 |
CN108768917A (zh) * | 2017-08-23 | 2018-11-06 | 长安通信科技有限责任公司 | 一种基于网络日志的僵尸网络检测方法及*** |
Non-Patent Citations (1)
Title |
---|
吕金锁: "《探针技术在网络信息监控***中的应用》" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100447805C (zh) | 文档处理装置和文档处理方法 | |
CN104021159B (zh) | 一种客户端文件清理方法和装置 | |
CN103646078A (zh) | 一种实现互联网宣传监测目标评估的方法及装置 | |
CN102456022A (zh) | 短信管理方法和*** | |
CN103218375A (zh) | 一种poi信息补充方法及装置 | |
CN107016123A (zh) | 文件管理方法及终端设备 | |
CN103605776A (zh) | 信息数据库的数据处理方法和装置 | |
CN102270226B (zh) | 预算数据汇总*** | |
CN109800416A (zh) | 一种电力设备名称识别方法 | |
CN100477593C (zh) | 网络社区中相关讨论区的选取方法及选取装置 | |
CN107515950A (zh) | 一种图像处理方法、装置、终端与计算机可读存储介质 | |
CN107220287A (zh) | 用于日志查询的索引管理方法、装置、存储介质及设备 | |
CN105224560A (zh) | 缓存数据的查找方法和装置 | |
CN103177022A (zh) | 一种恶意文件搜索方法及装置 | |
CN103064908A (zh) | 一种通过内存快速去重名单的方法 | |
CN110287379A (zh) | 一种基于逻辑树的表格拆分与数据提取方法 | |
CN103870489B (zh) | 基于搜索日志的中文人名自扩展识别方法 | |
CN105049334A (zh) | 电子邮件过滤方法及装置 | |
CN109982250A (zh) | 一种位置数据采集方法、设备及计算机存储介质 | |
CN111125534A (zh) | 一种新颖的数据挖掘方法 | |
CN109871476A (zh) | 一种自动生成联系人通讯录的*** | |
CN108520006A (zh) | 一种基于管道筛选的数据挖掘方法 | |
CN105763530A (zh) | 一种基于web的威胁情报采集***及方法 | |
CN108257001A (zh) | 一种关联股票交易品种和数据的可伸缩窗口的方法及*** | |
CN104102739B (zh) | 一种扩充实体库的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200508 |