CN113656607A - 一种文本挖掘装置及储存介质 - Google Patents

一种文本挖掘装置及储存介质 Download PDF

Info

Publication number
CN113656607A
CN113656607A CN202110954922.6A CN202110954922A CN113656607A CN 113656607 A CN113656607 A CN 113656607A CN 202110954922 A CN202110954922 A CN 202110954922A CN 113656607 A CN113656607 A CN 113656607A
Authority
CN
China
Prior art keywords
module
text mining
text
storage
storage medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110954922.6A
Other languages
English (en)
Inventor
宋鸿立
赵丹
宋一佳
宋雨倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN202110954922.6A priority Critical patent/CN113656607A/zh
Publication of CN113656607A publication Critical patent/CN113656607A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种文本挖掘装置及储存介质,包括文本挖掘装置,所述文本挖掘装置包括处理器,所述处理器的输出端双向电连接有信息收发模块。本发明通过设置文本挖掘模块、选取模块、分类模块、向量化模块、模型处理模块、对比判断模块、储存模块、密码锁模块、特征确定模块、字符预测模块、损失确定模块、参数调节模块和储存器相互配合,达到了提高文本挖掘效率、准确度和安全性的优点,能够将获取的目标实体和目标特征的问题以及目标文本输入到预先构建的答案预测模型中,可以准确预测出答案在目标文本中的起始位置和结束位置,增加了答案识别准确率,同时能够锁定文本,提高文本的安全性。

Description

一种文本挖掘装置及储存介质
技术领域
本发明涉及文本技术领域,具体为一种文本挖掘装置及储存介质。
背景技术
文本,是指书面语言的表现形式,从文学角度说,通常是具有完整、***含义的一个句子或多个句子的组合,一个文本可以是一个句子、一个段落或者一个篇章,广义“文本”:任何由书写所固定下来的任何话语,(利科尔)狭义“文本”:由语言文字组成的文学实体,代指“作品”,相对于作者、世界构成一个独立、自足的***,计算机的一种文档类型,该类文档主要用于记载和储存文字信息,而不是图像、声音和格式化数据,常见的文本文档的扩展名有,txt、doc、docx、wps等。
目前现有的文本挖掘方式有以下缺点:现有的文本挖掘是将大量的训练文本输入到神经网络中,经学习训练后可得到通用的解析模型,从而找到答案,虽然可以从文本中挖掘出答案,但是,其答案挖掘方法的效率都较低,且提供给用户问题答***度也不高,同时安全度较低。
发明内容
本发明的目的在于提供了一种文本挖掘装置及储存介质,具备提高文本挖掘效率、准确度和安全性的优点,解决了现有的文本挖掘是将大量的训练文本输入到神经网络中,经学习训练后可得到通用的解析模型,从而找到答案,虽然可以从文本中挖掘出答案,但是,其答案挖掘方法的效率都较低,且提供给用户问题答***度也不高,同时安全度较低的问题。
为实现上述目的,本发明提供如下技术方案:一种文本挖掘装置及储存介质,包括文本挖掘装置,所述文本挖掘装置包括处理器,所述处理器的输出端双向电连接有信息收发模块,所述信息收发模块的输出端双向电连接有云端,所述处理器的输入端单向电连接有操作模块,所述处理器的输出端单向电连接有显示模块,所述处理器的输出端双向电连接有文本挖掘模块,所述文本挖掘模块包括选取模块、分类模块、向量化模块和模型处理模块,所述文本挖掘模块的输出端双向电连接有对比判断模块,所述对比判断模块的输出端与处理器的输入端双向电连接,所述处理器的输出端双向电连接有储存模块,所述处理器的输出端双向电连接有密码锁模块。
优选的,所述操作模块分别包括有操作键盘和操作鼠标,所述操作键盘和操作鼠标的背面均放置在桌面板上。
优选的,所述显示模块电连接有电脑显示屏,所述电脑显示屏的背面放置在桌面板上。
优选的,所述模型处理模块分别包括有特征确定模块、字符预测模块、损失确定模块和参数调节模块。
优选的,所述储存模块电连接有储存器,所述储存器的背面固定安装在文本挖掘装置的内壁,所述储存模块和储存器均为储存介质,且储存介质上储存有计算机程序。
优选的,所述处理器的背面固定安装在文本挖掘装置的内壁,所述信息收发模块的背面固定安装在文本挖掘装置的内壁。
与现有技术相比,本发明的有益效果如下:
1、本发明通过设置文本挖掘模块、选取模块、分类模块、向量化模块、模型处理模块、对比判断模块、储存模块、密码锁模块、特征确定模块、字符预测模块、损失确定模块、参数调节模块和储存器相互配合,达到了提高文本挖掘效率、准确度和安全性的优点,能够将获取的目标实体和目标特征的问题以及目标文本输入到预先构建的答案预测模型中,可以准确预测出答案在目标文本中的起始位置和结束位置,增加了答案识别准确率,同时能够锁定文本,提高文本的安全性。
2、本发明通过设置文本挖掘模块、选取模块、分类模块、向量化模块和模型处理模块相互配合,起到自动挖掘且挖掘准确度高的作用,通过设置模型处理模块、特征确定模块、字符预测模块、损失确定模块和参数调节模块相互配合,起到模型自动处理的作用,通过设置对比判断模块,起到对比判断的作用,提高挖掘精准度,通过设置储存模块和储存器,起到方便储存数据的作用,通过设置密码锁模块,对文本起到自动锁定的作用,通过设置操作模块、操作键盘和操作鼠标相互配合,起到方便使用者操作的作用,通过设置显示模块和电脑显示屏,起到方便使用者查看的作用。
附图说明
图1为本发明***原理图;
图2为本发明操作模块***原理图;
图3为本发明模型处理模块***原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请文件的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利的限制。在本申请文件的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“设置”应做广义理解,例如,可以是固定相连、设置,也可以是可拆卸连接、设置,或一体地连接、设置。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利中的具体含义。
请参阅图1-3,一种文本挖掘装置及储存介质,包括文本挖掘装置,文本挖掘装置包括处理器,处理器的输出端双向电连接有信息收发模块,信息收发模块的输出端双向电连接有云端,处理器的输入端单向电连接有操作模块,处理器的输出端单向电连接有显示模块,处理器的输出端双向电连接有文本挖掘模块,文本挖掘模块包括选取模块、分类模块、向量化模块和模型处理模块,文本挖掘模块的输出端双向电连接有对比判断模块,对比判断模块的输出端与处理器的输入端双向电连接,处理器的输出端双向电连接有储存模块,处理器的输出端双向电连接有密码锁模块,操作模块分别包括有操作键盘和操作鼠标,操作键盘和操作鼠标的背面均放置在桌面板上,显示模块电连接有电脑显示屏,电脑显示屏的背面放置在桌面板上,模型处理模块分别包括有特征确定模块、字符预测模块、损失确定模块和参数调节模块,储存模块电连接有储存器,储存器的背面固定安装在文本挖掘装置的内壁,储存模块和储存器均为储存介质,且储存介质上储存有计算机程序,处理器的背面固定安装在文本挖掘装置的内壁,信息收发模块的背面固定安装在文本挖掘装置的内壁,通过设置文本挖掘模块、选取模块、分类模块、向量化模块和模型处理模块相互配合,起到自动挖掘且挖掘准确度高的作用,通过设置模型处理模块、特征确定模块、字符预测模块、损失确定模块和参数调节模块相互配合,起到模型自动处理的作用,通过设置对比判断模块,起到对比判断的作用,提高挖掘精准度,通过设置储存模块和储存器,起到方便储存数据的作用,通过设置密码锁模块,对文本起到自动锁定的作用,通过设置操作模块、操作键盘和操作鼠标相互配合,起到方便使用者操作的作用,通过设置显示模块和电脑显示屏,起到方便使用者查看的作用,通过设置文本挖掘模块、选取模块、分类模块、向量化模块、模型处理模块、对比判断模块、储存模块、密码锁模块、特征确定模块、字符预测模块、损失确定模块、参数调节模块和储存器相互配合,达到了提高文本挖掘效率、准确度和安全性的优点,能够将获取的目标实体和目标特征的问题以及目标文本输入到预先构建的答案预测模型中,可以准确预测出答案在目标文本中的起始位置和结束位置,增加了答案识别准确率,同时能够锁定文本,提高文本的安全性。
使用时,文本挖掘模块,用于从原始文本中获取挖掘文本,对比判断模块判断挖掘文本是否满足预设条件,若挖掘文本未满足预设条件,将挖掘文本作为原始文本输入文本挖掘模块获取挖掘文本二;若挖掘文本满足预设条件,输出挖掘文本,选取模块,用于根据预设匹配规则从原始文本中选取语料,分类模块,用于根据语料与挖掘目标是否相关将语料分为相关语料和无关语料,向量化模块,用于将相关语料向量化处理,得到向量化语料,模型处理模块,用于将向量化语料输入预设模型中得到挖掘文本,通过设置文本挖掘模块、选取模块、分类模块、向量化模块和模型处理模块相互配合,起到自动挖掘且挖掘准确度高的作用,通过设置模型处理模块、特征确定模块、字符预测模块、损失确定模块和参数调节模块相互配合,起到模型自动处理的作用,通过设置对比判断模块,起到对比判断的作用,提高挖掘精准度,通过设置储存模块和储存器,起到方便储存数据的作用,通过设置密码锁模块,对文本起到自动锁定的作用,从而达到了提高文本挖掘效率、准确度和安全性的优点。
本发明中的控制方式是通过控制器来自动控制,控制器的控制电路通过本领域的技术人员简单编程即可实现,属于本领域的公知常识,并且本申请文件主要用来保护机械装置,所以本申请文件不再详细解释控制方式和电路连接,在此不再作出具体叙述。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种文本挖掘装置及储存介质,包括文本挖掘装置,其特征在于:所述文本挖掘装置包括处理器,所述处理器的输出端双向电连接有信息收发模块,所述信息收发模块的输出端双向电连接有云端,所述处理器的输入端单向电连接有操作模块,所述处理器的输出端单向电连接有显示模块,所述处理器的输出端双向电连接有文本挖掘模块,所述文本挖掘模块包括选取模块、分类模块、向量化模块和模型处理模块,所述文本挖掘模块的输出端双向电连接有对比判断模块,所述对比判断模块的输出端与处理器的输入端双向电连接,所述处理器的输出端双向电连接有储存模块,所述处理器的输出端双向电连接有密码锁模块。
2.根据权利要求1所述的一种文本挖掘装置及储存介质,其特征在于:所述操作模块分别包括有操作键盘和操作鼠标,所述操作键盘和操作鼠标的背面均放置在桌面板上。
3.根据权利要求1所述的一种文本挖掘装置及储存介质,其特征在于:所述显示模块电连接有电脑显示屏,所述电脑显示屏的背面放置在桌面板上。
4.根据权利要求1所述的一种文本挖掘装置及储存介质,其特征在于:所述模型处理模块分别包括有特征确定模块、字符预测模块、损失确定模块和参数调节模块。
5.根据权利要求1所述的一种文本挖掘装置及储存介质,其特征在于:所述储存模块电连接有储存器,所述储存器的背面固定安装在文本挖掘装置的内壁,所述储存模块和储存器均为储存介质,且储存介质上储存有计算机程序。
6.根据权利要求1所述的一种文本挖掘装置及储存介质,其特征在于:所述处理器的背面固定安装在文本挖掘装置的内壁,所述信息收发模块的背面固定安装在文本挖掘装置的内壁。
CN202110954922.6A 2021-08-19 2021-08-19 一种文本挖掘装置及储存介质 Pending CN113656607A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110954922.6A CN113656607A (zh) 2021-08-19 2021-08-19 一种文本挖掘装置及储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110954922.6A CN113656607A (zh) 2021-08-19 2021-08-19 一种文本挖掘装置及储存介质

Publications (1)

Publication Number Publication Date
CN113656607A true CN113656607A (zh) 2021-11-16

Family

ID=78481331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110954922.6A Pending CN113656607A (zh) 2021-08-19 2021-08-19 一种文本挖掘装置及储存介质

Country Status (1)

Country Link
CN (1) CN113656607A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052577A (zh) * 2017-12-08 2018-05-18 北京百度网讯科技有限公司 一种通用文本内容挖掘方法、装置、服务器及存储介质
CN110377686A (zh) * 2019-07-04 2019-10-25 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法
CN111753082A (zh) * 2020-03-23 2020-10-09 北京沃东天骏信息技术有限公司 基于评论数据的文本分类方法及装置、设备和介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052577A (zh) * 2017-12-08 2018-05-18 北京百度网讯科技有限公司 一种通用文本内容挖掘方法、装置、服务器及存储介质
CN110377686A (zh) * 2019-07-04 2019-10-25 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法
CN111753082A (zh) * 2020-03-23 2020-10-09 北京沃东天骏信息技术有限公司 基于评论数据的文本分类方法及装置、设备和介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张丐卓: "文本挖掘及其在信息内容安全中的应用", 《华北科技学院学报》, vol. 15, no. 2, pages 116 - 120 *

Similar Documents

Publication Publication Date Title
CN110489538B (zh) 基于人工智能的语句应答方法、装置及电子设备
CN107908635B (zh) 建立文本分类模型以及文本分类的方法、装置
US11062043B2 (en) Database entity sensitivity classification
US9514417B2 (en) Cloud-based plagiarism detection system performing predicting based on classified feature vectors
Berger et al. A maximum entropy approach to natural language processing
CN112131350B (zh) 文本标签确定方法、装置、终端及可读存储介质
CN111241237B (zh) 一种基于运维业务的智能问答数据处理方法及装置
CN108491389B (zh) 点击诱饵标题语料识别模型训练方法和装置
WO2021218029A1 (zh) 基于人工智能的面试方法、装置、计算机设备及存储介质
US10713288B2 (en) Natural language content generator
CN113221545B (zh) 一种文本处理方法、装置、设备及介质、程序产品
US20220164520A1 (en) Automatic document sketching
US10872208B2 (en) Sentence conversion system, sentence conversion method, and information storage medium
WO2015004006A1 (en) Method and computer server system for receiving and presenting information to a user in a computer network
CN115098061A (zh) 软件开发文档优化方法、装置、计算机设备及存储介质
CN113656607A (zh) 一种文本挖掘装置及储存介质
US11922515B1 (en) Methods and apparatuses for AI digital assistants
KR102496620B1 (ko) Ai 기반 검색 기능을 가지는 ocr 전자연구노트 관리 시스템
CN116633653A (zh) 金融***防火墙管理控制方法、装置、***及存储介质
US11880664B2 (en) Identifying and transforming text difficult to understand by user
CN110249326B (zh) 自然语言内容生成器
WO2021056740A1 (zh) 语言模型构建方法、***、计算机设备及可读存储介质
Xu et al. Speech-driven end-to-end language discrimination toward chinese dialects
Jiang et al. A Discourse Coherence Analysis Method Combining Sentence Embedding and Dimension Grid
US12014428B1 (en) Apparatus and a method for the generation of provider data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination