CN114970446B - 文本转换显示方法及其装置、设备、介质、产品 - Google Patents
文本转换显示方法及其装置、设备、介质、产品 Download PDFInfo
- Publication number
- CN114970446B CN114970446B CN202210823578.1A CN202210823578A CN114970446B CN 114970446 B CN114970446 B CN 114970446B CN 202210823578 A CN202210823578 A CN 202210823578A CN 114970446 B CN114970446 B CN 114970446B
- Authority
- CN
- China
- Prior art keywords
- distribution
- graph
- content
- diagram
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开一种文本转换显示方法、装置、计算机设备及存储介质,包括:读取图形文件中的内容信息;基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图。通过密度的簇聚类方法以及图神经网络对语义相近的实体合并分块最终可以达到自适应的对文档整体进行动态划分的效果,使显示文本整齐规整,可读性增强。
Description
技术领域
本申请涉及人工智能领域,尤其涉及文本转换显示方法、文本转换显示装置、计算机设备及存储介质。
背景技术
在当代数字化的浪潮下,金融科技乃至各个行业主要业务数据的储存形式普遍在由线下的纸质文件转型为以PDF、扫描件以及图片等形式为代表的非格式化文件,以达到节约相应成本、提升日常工作效率等目的。
现有的文档信息提取相关技术大多针对性的处理特定版式的文档,它们多数采用“人工+统计学”的模式,人为提供先验经验提取版式特征进行数据预标注之后再通过机器学习算法或者小样本的统计学习完成最终的要素信息提取。
本发明创造的发明人,在研究中发现:现有技术的技术特点决定了它们只能够对文本内容进行提取,无法根据文本内容对提取的文字进行显示形态划分,提取内容杂乱,可读性差。
发明内容
为解决上述技术问题,本申请的实施例提供了一种能够对转换文本信息进行内容划分显示的本转换显示方法、装置、设备及存储介质。
为实现上述目的,本申请提供一种文本转换显示方法,包括:
读取图形文件中的内容信息,其中,所述内容信息由所述图形文件中各元素的文本信息和空间位置信息拼接生成,所述文本信息和空间位置由预设的图文转换模型提取得到;
基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;
将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;
根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图,其中,所述注意力机制生成所述第一分布图和第二分布图的布局评分,所述目标分布图为所述第一分布图和所述第二分布图中布局评分最高的布局图。
可选地,所述读取图形文件中的内容信息包括:
提取所述图形文件中文字的文本信息和所述文本信息对应的空间位置信息;
将所述文本信息和所述空间位置信息进行拼接生成所述内容信息。
可选地,所述基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图包括:
基于所述密度聚类算法对所述内容信息进行空间聚类,生成多个聚类簇;
分别对所述多个聚类簇进行区别化显示,生成多个内容分组;
由所述多个内容分组生成所述第一分布图。
可选地,所述图神经网络包括:第一图神经网络,所述将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图包括:
将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图。
可选地,所述图神经网络包括:第二图神经网络,所述将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图之后,包括:
将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图。
可选地,所述将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图包括:
将所述第一分布图输入至所述第一图神经网络中,依次读取各所述内容分组的顶点分组;
计算顶点分组与其邻接的内容分组之间的第一注意力系数和第一特征距离;
对所述第一注意力系数和第一特征距离进行加权计算生成所述顶点分组的第一相似特征;
根据所述第一相似特征对各内容分组之间的内容进行布局更新,生成所述第二分布图。
可选地,所述将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图包括:
将所述第二分布图输入至所述第二图神经网络中,依次读取各所述内容分组内的顶点元素;
计算所述顶点元素与其邻接元素之间的第二注意力系数和第二特征距离;
对所述第二注意力系数和第二特征距离进行加权计算生成所述顶点元素的第二相似特征;
根据所述第二相似特征对各内容分组内的元素进行布局更新,生成所述第三分布图。
可选地,所述注意力机制包括注意力评分模型,所述根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图包括:
将所述第一分布图和所述第二分布图分别输入至所述注意力评分模型中,生成所述第一分布图和所述第二分布图的布局评分;
选取所述布局评分得分最高的分布图成为所述目标分布图。
可选地,所述注意力机制包括注意力评分模型,所述根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图包括:
将所述第一分布图、第二分布图和第三分布图分别输入至所述注意力评分模型中,生成所述第一分布图、第二分布图和第三分布图的布局评分;
选取所述布局评分得分最高的分布图成为所述目标分布图。
为实现上述目的,本申请还提供一种文本转换显示装置,包括:
读取模块,用于读取图形文件中的内容信息,其中,所述内容信息由所述图形文件中各元素的文本信息和空间位置信息拼接生成,所述文本信息和空间位置由预设的图文转换模型提取得到;
聚类模块,用于基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;
处理模块,用于将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;
执行模块,用于根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图,其中,所述注意力机制生成所述第一分布图和第二分布图的布局评分,所述目标分布图为所述第一分布图和所述第二分布图中布局评分最高的布局图。
可选地,所述文本转换显示装置还包括:
第一提取子模块,用于提取所述图形文件中文字的文本信息和所述文本信息对应的空间位置信息;
第一生成子模块,用于将所述文本信息和所述空间位置信息进行拼接生成所述内容信息。
可选地,所述文本转换显示装置还包括:
第一聚类子模块,用于基于所述密度聚类算法对所述内容信息进行空间聚类,生成多个聚类簇;
第二生成子模块,用于分别对所述多个聚类簇进行区别化显示,生成多个内容分组;
第一执行子模块,用于由所述多个内容分组生成所述第一分布图。
可选地,所述图神经网络包括:第一图神经网络,所述文本转换显示装置还包括:
第一处理子模块,用于将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图。
可选地,所述图神经网络包括:第二图神经网络,所述文本转换显示装置还包括:
第二处理子模块,用于将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图。
可选地,所述文本转换显示装置还包括:
第一输入子模块,用于将所述第一分布图输入至所述第一图神经网络中,依次读取各所述内容分组的顶点分组;
第一计算子模块,用于计算顶点分组与其邻接的内容分组之间的第一注意力系数和第一特征距离;
第三处理子模块,用于对所述第一注意力系数和第一特征距离进行加权计算生成所述顶点分组的第一相似特征;
第二执行子模块,用于根据所述第一相似特征对各内容分组之间的内容进行布局更新,生成所述第二分布图。
可选地,所述文本转换显示装置还包括:
第二输入子模块,用于将所述第二分布图输入至所述第二图神经网络中,依次读取各所述内容分组内的顶点元素;
第二计算子模块,用于计算所述顶点元素与其邻接元素之间的第二注意力系数和第二特征距离;
第四处理子模块,用于对所述第二注意力系数和第二特征距离进行加权计算生成所述顶点元素的第二相似特征;
第三执行子模块,用于根据所述第二相似特征对各内容分组内的元素进行布局更新,生成所述第三分布图。
可选地,所述注意力机制包括注意力评分模型,所述文本转换显示装置还包括:
第五处理子模块,用于将所述第一分布图和所述第二分布图分别输入至所述注意力评分模型中,生成所述第一分布图和所述第二分布图的布局评分;
第四执行子模块,用于选取所述布局评分得分最高的分布图成为所述目标分布图。
可选地,所述注意力机制包括注意力评分模型,所述文本转换显示装置还包括:
第六处理子模块,用于将所述第一分布图、第二分布图和第三分布图分别输入至所述注意力评分模型中,生成所述第一分布图、第二分布图和第三分布图的布局评分;
第五执行子模块,用于选取所述布局评分得分最高的分布图成为所述目标分布图。
为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的文本转换显示方法。
为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的文本转换显示方法。
本申请实施例的有益效果是:进行文本转换时,通过密度聚类算法对提取的内容信息进行空间聚类,生成由不同内容分组的第一分布图。然后,通过图神经网络对第一分布图中各内容分组以及内容分组中的元素进行更新,生成更新后的第二分布图。最后,通过注意力机制在第一分布图和第二分布图中优选出分部最优的分布图作为目标分布图。通过密度的簇聚类方法以及图神经网络对语义相近的实体合并分块最终可以达到自适应的对文档整体进行动态划分的效果,使显示文本整齐规整,可读性增强。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个具体实施例的文本转换显示方法的基本流程示意图;
图2为本申请一个具体实施例的文本转换显示装置基本结构示意图;
图3为本申请一个具体实施例的计算机设备的基本结构框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信***),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位***)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
请参阅图1,图1为本实施例文件转换方法的基本流程示意图。
如图1所示,
S1100、读取图形文件中的内容信息;
本实施方式中,将纸质文件转换为电子文件时,需要将纸质文件转换为图形文件。纸质文件转换为图形文件时,能够通过扫描或者拍照的方式进行转换。
读取生成图形文件后,通过图文转换模型将图形文件中的文本信息进行提取。在一些实施方式中,图文转换模型为空间图神经网络模型,在读取文本信息时,读取文本信息中每个字符表征元素的空间位置信息,也就是说图文转换模型中每个元素都有两个向量信息,分别是表示元素视觉信息的文本向量,以及表示元素空间位置信息的空间位置向量。
通过图文转换模型得到各个元素的文本信息和空间位置信息两个信息后,将各个元素的文本信息和空间位置信息进行拼接,将各个元素的文本信息和空间位置信息连接在一起。连接文本信息和空间位置信息生成图形文件的内容信息,因此,图形文件的内容信息包括两个维度的信息内容,构成2维空间向量。通过2维空间向量在后续处理过程中,不仅能够读取每个元素的文本向量还能通过空间位置信息计算每个元素之间的空间关系。
S1200、基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;
读取得到图形文件的内容信息后,对内容信息进行聚类,聚类的方式为通过密度聚类算法进行空间聚类。密度聚类算法能够为(不限于):DBSCAN (Density Based SpatialClustering of Application with Noise)算法、OPTICS (Ordering Points To Identifythe Clustering Structure)算法或者DENCLUE (DENsity based CLUstEring)算法。
通过密度聚类算法对内容信息进行聚类,生成多个聚类簇,聚类簇的数量能够为2个、3个、4个或者更多个。每个聚类簇表征内容信息中的一个内容分组,每个内容分组包括多个元素。
生成聚类簇后,对每个聚类簇进行区别化显示,区别化显示的方式为:对每个聚类簇表征的内容分组上覆盖色块蒙版,使不同的内容分组具有不同的颜色分组。区别化显示不局限于此,根据具体运用场景的不同,在一些实施方式中,区别化显示还能够是:字符颜色的区别化显示、字体形状的区别化显示或者字体大小的区别化显示等。
对每个内容分组区别化渲染显示后,由多个内容分组共同组成第一分布图。在第一分布图中包括多个内容分组,多个内容分组分布在背景页面的不同位置区域。在一些实施方式中,为使第一分布图的内容可读性更强,对内容分组进行分布时,设定不同长度的内容分组的分布位置,使第一分布图构建的更加合理。在一些实施方式中,对内容分组进行分布时,识别每个内容分组表征的文本意思,例如,识别内容分组内容为:标题、摘要、正文等文本段落,然后根据人们通常的阅读习惯,对不同内容分组按段落进行排列。
S1300、将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;
通过密度聚类算法对内容信息进行聚类生成第一分布图后,将第一分布图输入至预设的图神经网络中,本实施方式中的图神经网络预先训练至收敛状态,用于对第一分布图进行内容划分的更新。
本实施方式中,图神经网络能够为第一图神经网络,具体地,第一图神经网络为Ex-GAT。第一图神经网络用于对第一分布图中的内容分组进行分组更新。第一图神经网络只对第一分布图中内容分组进行拆分或者合并,不对各分组内容中的元素进行细节调节。具体地,第一图神经网络读取第一分布图的内容分组后,依次将每个内容分组作为顶点分组,将每个顶点分组与其邻接分组之间的位置关系作为边,计算顶点分组与其邻接内容分组之间的第一注意力系数,即计算顶点分组与其邻接内容分组之间第一特征距离,然后,通过顶点分组与其任一邻接内容分组的特征距离与所有第一特征距离的和做比值,生成顶点分组与其任一邻接内容分组之间的相关系数,再对相关系数进行激活处理后,将相关系数映射在o-1的数值区间内,生成顶点分组与其任一邻接内容分组之间的第一注意力系数。
生成顶点分组与其邻接内容分组之间的第一注意力系数和第一特征距离后,对第一注意力系数和第一特征距离进行加权计算,生成该顶点分组的第一相似度特征。依次将每个内容分组作为顶点分组,计算每个顶点分组的第一相似度特征。
计算得到每个顶点分组的第一相似度特征后,根据第一相似度特征对第一分布图进行布局更新,更新的方式为根据每个顶点分组的第一相似度特征,将第一相似度特征相差值小于分组阈值的内容分组进行合并,生成内容信息的第二分布图。分组阈值的设定能够根据用户的实际需要进行任意设定,也能够根据应用场景的不同,进行适应性的调整。
在一些实施方式中,图神经网络能够为还包括第二图神经网络,具体地,第一图神经网络为In-GAT。第二图神经网络用于对第二分布图中各内容分组内的元素进行布局更新。第二图神经网络预先训练至收敛状态,用于对第二分布图内容分组内的元素在内容分组件进行调整更新,本实施方式中,第二图神经网络仅仅对内容分组内的元素相似度值进行计算,而不对内容分组之间的相似度值计算,并且在计算时将选定内容分值之外的内容分组和其他元素进行屏蔽和过滤。
具体地,第二图神经网络读取第二分布图的内容分组,然后,依次以单个内容分组为计算单元进行处理。依次的读取内容分组每个元素作为顶点元素,将每个顶点元素与其邻接元素之间的位置关系作为边,计算顶点元素之间的第二注意力系数,即计算顶点元素与其邻接元素之间的第二特征距离,然后,通过顶点元素与其任一邻接元素的特征距离与所有第二特征距离的和做比值,生成顶点元素与其任一邻接元素之间的相关系数,再对相关系数进行激活处理后,将相关系数映射在o-1的数值区间内,生成顶点元素与其任一邻接元素之间的第二注意力系数。
生成顶点元素与其邻接元素之间的第二注意力系数和第二特征距离后,对第二注意力系数和第二特征距离进行加权计算,生成该顶点元素的第二相似度特征。依次将每个元素作为顶点元素,计算每个元素的第二相似度特征。
计算得到每个顶点元素的第二相似度特征后,根据第二相似度特征对第二分布图进行布局更新,更新的方式为根据每个顶点元素的第二相似度特征,将第二相似度特征相差值小于元素阈值的元素进行合并,生成内容信息的第三分布图。元素阈值的设定能够根据用户的实际需要进行任意设定,也能够根据应用场景的不同,进行适应性的调整。
在一些实施方式中,图神经网络不局限于此,根据具体应用场景的不同,为满足场景的适应性需求,图神经网络还能够为(不限于):图卷积网络(Graph ConvolutionalNetworks)、图注意力网络(Graph Attention Networks)、图自编码机(Graph Auto-encoder)、图生成网络(Graph Generative Networks)或者图时空网络(Graph Spatial-Temporal Networks)。分布图的数量也不局限与第一分布图或者第二分布图,根据图神经网络的数量,分布图还能够对应性的进行增加。
S1400、根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图。
当生成第一分布图和第二分布图后,需要对第一分布图和第二分布图进行图像评分,评分的方式为通过注意力机制计算出第一分布图和第二分布图的布局评分。
注意力机制包括注意力评分模型,注意力评分模型为预先训练至收敛状态用于对图像的布局进行评分的注意力模型。注意力机制还能够为(不限于):多头自注意力机制(Multi-HeadSelf-Attention)、SNAIL(自注意力生成对抗网络Self-Attention GAN)或者神经图灵机(Neural Turing Machines)等模型。
将第一分布图和第二分布图分别输入至注意力评分模型中,注意力评分模型分别对第一分布图和第二分布图的布局评分进行计算。
计算得到第一分布图和第二分布图的布局评分后,确定布局评分最高的分布图作为目标分布图。由于,第二分布图是在第一分布图的基础上进行调整得到的,这个处理过程中有一定的几率出现过拟合的问题,过拟合处理导致第二分布图分布的合理性不如第一分布图。在第一分布图和第二分布图筛选得到目标分布图后,能够避免直接将第二分布图作为目标分布图存在的过拟合问题。
在一些实施方式中,将第一分布图、第二分布图和第三分布图分别输入至注意力评分模型中,注意力评分模型分别对第一分布图、第二分布图和第三分布图的布局评分进行计算。
计算得到第一分布图、第二分布图和第三分布图的布局评分后,确定布局评分最高的分布图作为目标分布图。由于,第二分布图是在第一分布图的基础上进行调整得到的,而第三分布图又是在第二分布图的基础上更新得到的。这个两个处理过程中有一定的几率出现过拟合的问题,过拟合处理导致第二分布图分布的合理性不如第一分布图,第三分布图的分布合理性不如第一分布图或者第二分布图。在第一分布图、第二分布图和第三分布图筛选得到目标分布图后,能够避免直接将第三分布图作为目标分布图存在的过拟合问题。
当分布图的数量不局限于第一分布图、第二分布图和第三分布图时,依次将其他分布图也输入至意力评分模型中,进行布局评分打分,然后,在多个布局评分中选择最高分的分布图作为目标分布图。
在本实施方式中,密度聚类算法之后设计交叉熵损失函数作为其损失函数。第一图神经网络的损失函数为:
其中,N是顶点分组的数量,A代表邻接矩阵,Â代表预测的邻接矩阵,ξ是大小为1e-7的常数。
第二图神经网络的损失函数为:
其中assign代表顶点元素所在的分组矩阵。
第一图神经网络和第二图神经网络的损失函数均为正则化损失函数,能够扩大聚类结果的差异,防止实体聚类不足。
上述实施方式,进行文本转换时,通过密度聚类算法对提取的内容信息进行空间聚类,生成由不同内容分组的第一分布图。然后,通过图神经网络对第一分布图中各内容分组以及内容分组中的元素进行更新,生成更新后的第二分布图。最后,通过注意力机制在第一分布图和第二分布图中优选出分部最优的分布图作为目标分布图。通过密度的簇聚类方法以及图神经网络对语义相近的实体合并分块最终可以达到自适应的对文档整体进行动态划分的效果,使显示文本整齐规整,可读性增强。
在一些实施方式中,内容信息包括文本信息和空间位置信息。具体地,S1100包括:
S1111、提取所述图形文件中文字的文本信息和所述文本信息对应的空间位置信息;
读取生成图形文件后,通过图文转换模型将图形文件中的文本信息进行提取。在一些实施方式中,图文转换模型为空间图神经网络模型,在读取文本信息时,读取文本信息中每个字符表征元素的空间位置信息,也就是说图文转换模型中每个元素都有两个向量信息,分别是表示元素视觉信息的文本向量,以及表示元素空间位置信息的空间位置向量。
S1112、将所述文本信息和所述空间位置信息进行拼接生成所述内容信息。
通过图文转换模型得到各个元素的文本信息和空间位置信息两个信息后,将各个元素的文本信息和空间位置信息进行拼接,将各个元素的文本信息和空间位置信息连接在一起。连接文本信息和空间位置信息生成图形文件的内容信息,因此,图形文件的内容信息包括两个维度的信息内容,构成2维空间向量。通过2维空间向量在后续处理过程中,不仅能够读取每个元素的文本向量还能通过空间位置信息计算每个元素之间的空间关系。
在一些实施方式中,第一分布图包括多个内容分组。具体地,S1200包括:
S1211、基于所述密度聚类算法对所述内容信息进行空间聚类,生成多个聚类簇;
通过密度聚类算法对内容信息进行聚类,生成多个聚类簇,聚类簇的数量能够为2个、3个、4个或者更多个。每个聚类簇表征内容信息中的一个内容分组,每个内容分组包括多个元素。
S1212、分别对所述多个聚类簇进行区别化显示,生成多个内容分组;
生成聚类簇后,对每个聚类簇进行区别化显示,区别化显示的方式为:对每个聚类簇表征的内容分组上覆盖色块蒙版,使不同的内容分组具有不同的颜色分组。区别化显示不局限于此,根据具体运用场景的不同,在一些实施方式中,区别化显示还能够是:字符颜色的区别化显示、字体形状的区别化显示或者字体大小的区别化显示等。
S1213、由所述多个内容分组生成所述第一分布图。
对每个内容分组区别化渲染显示后,由多个内容分组共同组成第一分布图。在第一分布图中包括多个内容分组,多个内容分组分布在背景页面的不同位置区域。在一些实施方式中,为使第一分布图的内容可读性更强,对内容分组进行分布时,设定不同长度的内容分组的分布位置,使第一分布图构建的更加合理。在一些实施方式中,对内容分组进行分布时,识别每个内容分组表征的文本意思,例如,识别内容分组内容为:标题、摘要、正文等文本段落,然后根据人们通常的阅读习惯,对不同内容分组按段落进行排列。
在一些实施方式中图神经网络包括:第一图神经网络。具体地,S1300包括:
S1310、将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图。
更近一步地,S1310包括:
S1311、将所述第一分布图输入至所述第一图神经网络中,依次读取各所述内容分组的顶点分组;
本实施方式中,图神经网络能够为第一图神经网络,具体地,第一图神经网络为Ex-GAT。第一图神经网络用于对第一分布图中的内容分组进行分组更新。第一图神经网络只对第一分布图中内容分组进行拆分或者合并,不对各分组内容中的元素进行细节调节。第一图神经网络读取第一分布图的内容分组后,依次将每个内容分组作为顶点分组。
S1312、计算顶点分组与其邻接的内容分组之间的第一注意力系数和第一特征距离;
将每个顶点分组与其邻接分组之间的位置关系作为边,计算顶点分组与其邻接内容分组之间的第一注意力系数,即计算顶点分组与其邻接内容分组之间第一特征距离,然后,通过顶点分组与其任一邻接内容分组的特征距离与所有第一特征距离的和做比值,生成顶点分组与其任一邻接内容分组之间的相关系数,再对相关系数进行激活处理后,将相关系数映射在0-1的数值区间内,生成顶点分组与其任一邻接内容分组之间的第一注意力系数。
S1313、对所述第一注意力系数和第一特征距离进行加权计算生成所述顶点分组的第一相似特征;
生成顶点分组与其邻接内容分组之间的第一注意力系数和第一特征距离后,对第一注意力系数和第一特征距离进行加权计算,生成该顶点分组的第一相似度特征。依次将每个内容分组作为顶点分组,计算每个顶点分组的第一相似度特征。
S1314、根据所述第一相似特征对各内容分组之间的内容进行布局更新,生成所述第二分布图。
计算得到每个顶点分组的第一相似度特征后,根据第一相似度特征对第一分布图进行布局更新,更新的方式为根据每个顶点分组的第一相似度特征,将第一相似度特征相差值小于分组阈值的内容分组进行合并,生成内容信息的第二分布图。分组阈值的设定能够根据用户的实际需要进行任意设定,也能够根据应用场景的不同,进行适应性的调整。
在一些实施方式中,图神经网络能够为还包括第二图神经网络。具体地,S1300包括:
S1320、将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图。
更近一步地,S1320还包括:
S1321、将所述第二分布图输入至所述第二图神经网络中,依次读取各所述内容分组内的顶点元素;
图神经网络能够为还包括第二图神经网络,具体地,第一图神经网络为In-GAT。第二图神经网络用于对第二分布图中各内容分组内的元素进行布局更新。第二图神经网络预先训练至收敛状态,用于对第二分布图内容分组内的元素在内容分组件进行调整更新,本实施方式中,第二图神经网络仅仅对内容分组内的元素相似度值进行计算,而不对内容分组之间的相似度值计算,并且在计算时将选定内容分值之外的内容分组和其他元素进行屏蔽和过滤。
S1322、计算所述顶点元素与其邻接元素之间的第二注意力系数和第二特征距离;
第二图神经网络读取第二分布图的内容分组,然后,依次以单个内容分组为计算单元进行处理。依次的读取内容分组每个元素作为顶点元素,将每个顶点元素与其邻接元素之间的位置关系作为边,计算顶点元素之间的第二注意力系数,即计算顶点元素与其邻接元素之间的第二特征距离,然后,通过顶点元素与其任一邻接元素的特征距离与所有第二特征距离的和做比值,生成顶点元素与其任一邻接元素之间的相关系数,再对相关系数进行激活处理后,将相关系数映射在o-1的数值区间内,生成顶点元素与其任一邻接元素之间的第二注意力系数。
S1323、对所述第二注意力系数和第二特征距离进行加权计算生成所述顶点元素的第二相似特征;
生成顶点元素与其邻接元素之间的第二注意力系数和第二特征距离后,对第二注意力系数和第二特征距离进行加权计算,生成该顶点元素的第二相似度特征。依次将每个元素作为顶点元素,计算每个元素的第二相似度特征。
S1324、根据所述第二相似特征对各内容分组内的元素进行布局更新,生成所述第三分布图。
计算得到每个顶点元素的第二相似度特征后,根据第二相似度特征对第二分布图进行布局更新,更新的方式为根据每个顶点元素的第二相似度特征,将第二相似度特征相差值小于元素阈值的元素进行合并,生成内容信息的第三分布图。元素阈值的设定能够根据用户的实际需要进行任意设定,也能够根据应用场景的不同,进行适应性的调整。
在一些实施方式中,在第一分布图和第二分布图中筛选目标分布图。具体地,S1400包括:
S1411、将所述第一分布图和所述第二分布图分别输入至所述注意力评分模型中,生成所述第一分布图和所述第二分布图的布局评分;
注意力机制包括注意力评分模型,注意力评分模型为预先训练至收敛状态用于对图像的布局进行评分的注意力模型。
将第一分布图和第二分布图分别输入至注意力评分模型中,注意力评分模型分别对第一分布图和第二分布图的布局评分进行计算。
S1412、选取所述布局评分得分最高的分布图成为所述目标分布图。
计算得到第一分布图和第二分布图的布局评分后,确定布局评分最高的分布图作为目标分布图。由于,第二分布图是在第一分布图的基础上进行调整得到的,这个处理过程中有一定的几率出现过拟合的问题,过拟合处理导致第二分布图分布的合理性不如第一分布图。在第一分布图和第二分布图筛选得到目标分布图后,能够避免直接将第二分布图作为目标分布图存在的过拟合问题。
在一些实施方式中,在第一分布图、第二分布图和第三分布图中筛选目标分布图。具体地,S1400还包括:
S1421、将所述第一分布图、第二分布图和第三分布图分别输入至所述注意力评分模型中,生成所述第一分布图、第二分布图和第三分布图的布局评分;
注意力机制包括注意力评分模型,注意力评分模型为预先训练至收敛状态用于对图像的布局进行评分的注意力模型。
将第一分布图、第二分布图和第三分布图分别输入至注意力评分模型中,注意力评分模型分别对第一分布图、第二分布图和第三分布图的布局评分进行计算。
S1422、选取所述布局评分得分最高的分布图成为所述目标分布图。
计算得到第一分布图、第二分布图和第三分布图的布局评分后,确定布局评分最高的分布图作为目标分布图。由于,第二分布图是在第一分布图的基础上进行调整得到的,而第三分布图又是在第二分布图的基础上更新得到的。这个两个处理过程中有一定的几率出现过拟合的问题,过拟合处理导致第二分布图分布的合理性不如第一分布图,第三分布图的分布合理性不如第一分布图或者第二分布图。在第一分布图、第二分布图和第三分布图筛选得到目标分布图后,能够避免直接将第三分布图作为目标分布图存在的过拟合问题。
具体请参阅图2,图2为本实施例文本转换显示装置基本结构示意图。
如图2所示,一种文本转换显示装置,包括:读取模块1100、聚类模块1200、处理模块1300和执行模块1400。读取模块1100用于读取图形文件中的内容信息;聚类模块1200用于基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;处理模块1300用于将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;执行模块1400用于根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图。
文本转换显示装置进行文本转换时,通过密度聚类算法对提取的内容信息进行空间聚类,生成由不同内容分组的第一分布图。然后,通过图神经网络对第一分布图中各内容分组以及内容分组中的元素进行更新,生成更新后的第二分布图。最后,通过注意力机制在第一分布图和第二分布图中优选出分部最优的分布图作为目标分布图。通过密度的簇聚类方法以及图神经网络对语义相近的实体合并分块最终可以达到自适应的对文档整体进行动态划分的效果,使显示文本整齐规整,可读性增强。
可选地,所述文本转换显示装置还包括:
第一提取子模块,用于提取所述图形文件中文字的文本信息和所述文本信息对应的空间位置信息;
第一生成子模块,用于将所述文本信息和所述空间位置信息进行拼接生成所述内容信息。
可选地,所述文本转换显示装置还包括:
第一聚类子模块,用于基于所述密度聚类算法对所述内容信息进行空间聚类,生成多个聚类簇;
第二生成子模块,用于分别对所述多个聚类簇进行区别化显示,生成多个内容分组;
第一执行子模块,用于由所述多个内容分组生成所述第一分布图。
可选地,所述图神经网络包括:第一图神经网络,所述文本转换显示装置还包括:
第一处理子模块,用于将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图。
可选地,所述图神经网络包括:第二图神经网络,所述文本转换显示装置还包括:
第二处理子模块,用于将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图。
可选地,所述文本转换显示装置还包括:
第一输入子模块,用于将所述第一分布图输入至所述第一图神经网络中,依次读取各所述内容分组的顶点分组;
第一计算子模块,用于计算顶点分组与其邻接的内容分组之间的第一注意力系数和第一特征距离;
第三处理子模块,用于对所述第一注意力系数和第一特征距离进行加权计算生成所述顶点分组的第一相似特征;
第二执行子模块,用于根据所述第一相似特征对各内容分组之间的内容进行布局更新,生成所述第二分布图。
可选地,所述文本转换显示装置还包括:
第二输入子模块,用于将所述第二分布图输入至所述第二图神经网络中,依次读取各所述内容分组内的顶点元素;
第二计算子模块,用于计算所述顶点元素与其邻接元素之间的第二注意力系数和第二特征距离;
第四处理子模块,用于对所述第二注意力系数和第二特征距离进行加权计算生成所述顶点元素的第二相似特征;
第三执行子模块,用于根据所述第二相似特征对各内容分组内的元素进行布局更新,生成所述第三分布图。
可选地,所述注意力机制包括注意力评分模型,所述文本转换显示装置还包括:
第五处理子模块,用于将所述第一分布图和所述第二分布图分别输入至所述注意力评分模型中,生成所述第一分布图和所述第二分布图的布局评分;
第四执行子模块,用于选取所述布局评分得分最高的分布图成为所述目标分布图。
可选地,所述注意力机制包括注意力评分模型,所述文本转换显示装置还包括:
第六处理子模块,用于将所述第一分布图、第二分布图和第三分布图分别输入至所述注意力评分模型中,生成所述第一分布图、第二分布图和第三分布图的布局评分;
第五执行子模块,用于选取所述布局评分得分最高的分布图成为所述目标分布图。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图3,图3为本实施例计算机设备基本结构框图。
如图3所示,计算机设备的内部结构示意图。该计算机设备包括通过***总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作***、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种文本转换显示法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种文本转换显示法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图2中读取模块1100、聚类模块1200、处理模块1300和执行模块1400的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有文本转换显示装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
计算机设备进行文本转换时,通过密度聚类算法对提取的内容信息进行空间聚类,生成由不同内容分组的第一分布图。然后,通过图神经网络对第一分布图中各内容分组以及内容分组中的元素进行更新,生成更新后的第二分布图。最后,通过注意力机制在第一分布图和第二分布图中优选出分部最优的分布图作为目标分布图。通过密度的簇聚类方法以及图神经网络对语义相近的实体合并分块最终可以达到自适应的对文档整体进行动态划分的效果,使显示文本整齐规整,可读性增强。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例文本转换显示方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (12)
1.一种文本转换显示方法,其特征在于,包括:
读取图形文件中的内容信息,其中,所述内容信息由所述图形文件中各元素的文本信息和空间位置信息拼接生成,所述文本信息和空间位置由预设的图文转换模型提取得到;
基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;
将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;
根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图,其中,所述注意力机制生成所述第一分布图和第二分布图的布局评分,所述目标分布图为所述第一分布图和所述第二分布图中布局评分最高的布局图。
2.根据权利要求1所述的文本转换显示方法,其特征在于,所述读取图形文件中的内容信息包括:
提取所述图形文件中文字的文本信息和所述文本信息对应的空间位置信息;
将所述文本信息和所述空间位置信息进行拼接生成所述内容信息。
3.根据权利要求1所述的文本转换显示方法,其特征在于,所述基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图包括:
基于所述密度聚类算法对所述内容信息进行空间聚类,生成多个聚类簇;
分别对所述多个聚类簇进行区别化显示,生成多个内容分组;
由所述多个内容分组生成所述第一分布图。
4.根据权利要求1所述的文本转换显示方法,其特征在于,所述图神经网络包括:第一图神经网络,所述将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图包括:
将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图。
5.根据权利要求4所述的文本转换显示方法,其特征在于,所述图神经网络包括:第二图神经网络,所述将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图之后,包括:
将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图。
6.根据权利要求4或5所述的文本转换显示方法,其特征在于,所述将所述第一分布图输入至所述第一图神经网络中,分别对所述第一分布图中各内容分组间的内容进行布局更新,生成所述第二分布图包括:
将所述第一分布图输入至所述第一图神经网络中,依次读取各所述内容分组的顶点分组;
计算顶点分组与其邻接的内容分组之间的第一注意力系数和第一特征距离;
对所述第一注意力系数和第一特征距离进行加权计算生成所述顶点分组的第一相似特征;
根据所述第一相似特征对各内容分组之间的内容进行布局更新,生成所述第二分布图。
7.根据权利要求5所述的文本转换显示方法,其特征在于,所述将所述第二分布图输入至所述第二图神经网络中,分别对所述第二分布图中各内容分组内的元素进行布局更新,生成第三分布图包括:
将所述第二分布图输入至所述第二图神经网络中,依次读取各所述内容分组内的顶点元素;
计算所述顶点元素与其邻接元素之间的第二注意力系数和第二特征距离;
对所述第二注意力系数和第二特征距离进行加权计算生成所述顶点元素的第二相似特征;
根据所述第二相似特征对各内容分组内的元素进行布局更新,生成所述第三分布图。
8.根据权利要求1所述的文本转换显示方法,其特征在于,所述注意力机制包括注意力评分模型,所述根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图包括:
将所述第一分布图和所述第二分布图分别输入至所述注意力评分模型中,生成所述第一分布图和所述第二分布图的布局评分;
选取所述布局评分得分最高的分布图成为所述目标分布图。
9.根据权利要求5所述的文本转换显示方法,其特征在于,所述注意力机制包括注意力评分模型,所述根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图包括:
将所述第一分布图、第二分布图和第三分布图分别输入至所述注意力评分模型中,生成所述第一分布图、第二分布图和第三分布图的布局评分;
选取所述布局评分得分最高的分布图成为所述目标分布图。
10.一种文本转换显示装置,其特征在于,包括:
读取模块,用于读取图形文件中的内容信息,其中,所述内容信息由所述图形文件中各元素的文本信息和空间位置信息拼接生成,所述文本信息和空间位置由预设的图文转换模型提取得到;
聚类模块,用于基于预设的密度聚类算法,对所述内容信息进行空间聚类,生成所述内容信息的第一分布图,其中,所述第一分布图包括多个内容分组;
处理模块,用于将所述第一分布图输入至预设的图神经网络中,对所述第一分布图进行布局更新生成第二分布图;
执行模块,用于根据预设的注意力机制在所述第一分布图和所述第二分布图中,筛选所述内容信息对应的目标分布图,其中,所述注意力机制生成所述第一分布图和第二分布图的布局评分,所述目标分布图为所述第一分布图和所述第二分布图中布局评分最高的布局图。
11.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现:
如权利要求1-9任一项所述的文本转换显示方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至9中任一项所述的文本转换显示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210823578.1A CN114970446B (zh) | 2022-07-14 | 2022-07-14 | 文本转换显示方法及其装置、设备、介质、产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210823578.1A CN114970446B (zh) | 2022-07-14 | 2022-07-14 | 文本转换显示方法及其装置、设备、介质、产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114970446A CN114970446A (zh) | 2022-08-30 |
CN114970446B true CN114970446B (zh) | 2022-11-01 |
Family
ID=82968905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210823578.1A Active CN114970446B (zh) | 2022-07-14 | 2022-07-14 | 文本转换显示方法及其装置、设备、介质、产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114970446B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709488A (zh) * | 2016-12-20 | 2017-05-24 | 深圳市深信服电子科技有限公司 | 名片识别方法及装置 |
CN109886330A (zh) * | 2019-02-18 | 2019-06-14 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、计算机可读存储介质和计算机设备 |
CN111191651A (zh) * | 2019-12-06 | 2020-05-22 | 中国平安财产保险股份有限公司 | 单证图片识别方法、装置、计算机设备及存储介质 |
CN111245815A (zh) * | 2020-01-07 | 2020-06-05 | 同盾控股有限公司 | 数据处理方法、装置、存储介质及电子设备 |
CN112241481A (zh) * | 2020-10-09 | 2021-01-19 | 中国人民解放军国防科技大学 | 基于图神经网络的跨模态新闻事件分类方法及*** |
CN113761195A (zh) * | 2021-05-24 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及计算机可读存储介质 |
CN113822283A (zh) * | 2021-06-30 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 文本内容处理方法、装置、计算机设备及存储介质 |
CN113989298A (zh) * | 2021-10-26 | 2022-01-28 | 深圳前海环融联易信息科技服务有限公司 | 用于合同文档弯曲文本行校正的方法 |
CN114387650A (zh) * | 2022-01-11 | 2022-04-22 | 浙江商汤科技开发有限公司 | 聚类及模型训练方法和装置、设备及存储介质 |
CN114398881A (zh) * | 2022-01-04 | 2022-04-26 | 北京快确信息科技有限公司 | 基于图神经网络的交易信息识别方法、***及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10515379B2 (en) * | 2016-12-20 | 2019-12-24 | Adobe Inc. | Computerized detection and semantic characterization of trends in digital media content |
CN111047130B (zh) * | 2019-06-11 | 2021-03-02 | 北京嘀嘀无限科技发展有限公司 | 用于交通分析和管理的方法和*** |
CN110457472A (zh) * | 2019-07-16 | 2019-11-15 | 天津大学 | 基于som聚类算法的针对电商产品评论的情感关联分析方法 |
US11720346B2 (en) * | 2020-10-02 | 2023-08-08 | International Business Machines Corporation | Semantic code retrieval using graph matching |
-
2022
- 2022-07-14 CN CN202210823578.1A patent/CN114970446B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709488A (zh) * | 2016-12-20 | 2017-05-24 | 深圳市深信服电子科技有限公司 | 名片识别方法及装置 |
CN109886330A (zh) * | 2019-02-18 | 2019-06-14 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、计算机可读存储介质和计算机设备 |
CN111191651A (zh) * | 2019-12-06 | 2020-05-22 | 中国平安财产保险股份有限公司 | 单证图片识别方法、装置、计算机设备及存储介质 |
CN111245815A (zh) * | 2020-01-07 | 2020-06-05 | 同盾控股有限公司 | 数据处理方法、装置、存储介质及电子设备 |
CN112241481A (zh) * | 2020-10-09 | 2021-01-19 | 中国人民解放军国防科技大学 | 基于图神经网络的跨模态新闻事件分类方法及*** |
CN113761195A (zh) * | 2021-05-24 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及计算机可读存储介质 |
CN113822283A (zh) * | 2021-06-30 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 文本内容处理方法、装置、计算机设备及存储介质 |
CN113989298A (zh) * | 2021-10-26 | 2022-01-28 | 深圳前海环融联易信息科技服务有限公司 | 用于合同文档弯曲文本行校正的方法 |
CN114398881A (zh) * | 2022-01-04 | 2022-04-26 | 北京快确信息科技有限公司 | 基于图神经网络的交易信息识别方法、***及介质 |
CN114387650A (zh) * | 2022-01-11 | 2022-04-22 | 浙江商汤科技开发有限公司 | 聚类及模型训练方法和装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
面向新闻文本的事件推理方法研究;郑欣;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220115;第I138-3600页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114970446A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443864B (zh) | 一种基于单阶段少量样本学习的艺术字体自动生成方法 | |
CN109635805B (zh) | 图像文本定位方法及装置、图像文本识别方法及装置 | |
US20230401833A1 (en) | Method, computer device, and storage medium, for feature fusion model training and sample retrieval | |
CN111583274A (zh) | 图像分割方法、装置、计算机可读存储介质及电子设备 | |
CN113822383B (zh) | 一种基于多域注意力机制的无人机检测方法及*** | |
CN109885796A (zh) | 一种基于深度学习的网络新闻配图匹配性检测方法 | |
CN113762050B (zh) | 图像数据处理方法、装置、设备以及介质 | |
CN112950640A (zh) | 视频人像分割方法、装置、电子设备及存储介质 | |
CN114332586A (zh) | 小目标检测方法及其装置、设备、介质、产品 | |
CN114283281A (zh) | 目标检测方法及其装置、设备、介质、产品 | |
CN114140786A (zh) | 基于HRNet编码与双分支解码的场景文本识别方法 | |
CN115018549A (zh) | 广告文案生成方法及其装置、设备、介质、产品 | |
CN116630183A (zh) | 一种基于生成式对抗网络的文字图像修复方法 | |
CN115099854A (zh) | 广告文案创作方法及其装置、设备、介质、产品 | |
CN111400497A (zh) | 一种文本识别方法、装置、存储介质及电子设备 | |
CN110070042A (zh) | 文字识别方法、装置和电子设备 | |
CN114863440A (zh) | 订单数据处理方法及其装置、设备、介质、产品 | |
CN114970446B (zh) | 文本转换显示方法及其装置、设备、介质、产品 | |
CN112836694A (zh) | 图像文字提取方法、装置、计算机设备及存储介质 | |
CN113821663A (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN113326701A (zh) | 嵌套实体识别方法、装置、计算机设备及存储介质 | |
CN111339734A (zh) | 一种基于文本生成图像的方法 | |
CN113806536B (zh) | 文本分类方法及其装置、设备、介质、产品 | |
CN114565913A (zh) | 文本识别方法及其装置、设备、介质、产品 | |
CN111476066A (zh) | 图像效果的处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |