CN115062126A - 一种语句分析方法、装置、电子设备及可读存储介质 - Google Patents
一种语句分析方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115062126A CN115062126A CN202210642118.9A CN202210642118A CN115062126A CN 115062126 A CN115062126 A CN 115062126A CN 202210642118 A CN202210642118 A CN 202210642118A CN 115062126 A CN115062126 A CN 115062126A
- Authority
- CN
- China
- Prior art keywords
- sentence
- analyzed
- statement
- determining
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例公开了一种语句分析方法、装置、电子设备及可读存储介质,该方法包括:获取待分析语句;将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,能够提升语句分析的效率和准确率。
Description
技术领域
本申请属于信息处理技术领域,尤其涉及一种语句分析方法、装置、电子设备及可读存储介质。
背景技术
语句分析是指,机器依据用户给出的自然语言,理解出用户的意图。在实际的语句分析任务中,通常需要完成多个子任务,这就需要为各个子任务分别设置其对应的分析模型,这时候用多个分析模型来完成就会显得有些不划算,一方面,多个分析模型会有误差累积,另一方面,是多个分析模型的执行过程会增长分析时间。
由此,目前语句分析的准确率和速度不高。
申请内容
本申请实施例提供一种语句分析方法、装置、设备及可读存储介质,能够解决目前语句分析的准确率和速度不高的问题。
第一方面,本申请实施例提供一种语句分析方法,该方法包括:
获取待分析语句;
将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:
确定待分析语句的分类结果;
基于预设的句式分类模版,确定待分析语句的的语义信息;
确定待分析语句对应的表格问答查询语句。
在一种可能的实现方式中,确定待分析语句的分类结果,包括:
通过多头自注意力结构提取待分析语句的语句特征向量;
对语句特征向量进行分类,得到语句特征向量的句式分类;
分别计算语句特征向量所属句式分类的概率;
将概率最高的语句特征向量的句式分类确定为待分析语句的分类结果。
在一种可能的实现方式中,基于预设的句式分类模版,确定待分析语句的语义信息,包括:
通过多头自注意力结构或者循环神经网络结构,提取待分析语句的文本特征向量;
计算文本特征向量与预设的句式分类模版的相似度;
当相似度满足预设条件时,基于句式分类模版确定语义信息。
在一种可能的实现方式中,确定待分析语句对应的表格问答查询语句,包括:
提取待分析语句的文本特征向量,以及属性信息分类;
基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句。
在一种可能的实现方式中,基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句,包括:
提取语句特征向量中的条件特征向量;
基于文本特征向量、属性信息分类和条件特征向量确定表格问答查询语句。
第二方面,本申请实施例提供一种语句分析装置,该装置包括:
获取模块,用于获取待分析语句;
确定模块,用于将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:
确定待分析语句的分类结果;
基于预设的句式分类模版,确定待分析语句的的语义信息;
确定待分析语句对应的表格问答查询语句。
在一种可能的实现方式中,确定模块,包括:
第一提取模块,用于通过多头自注意力结构提取待分析语句的语句特征向量;
分类模块,用于对语句特征向量进行分类,得到语句特征向量的句式分类;
第一计算模块,用于分别计算语句特征向量所属句式分类的概率;
确定模块,具体用于将概率最高的语句特征向量的句式分类确定为待分析语句的分类结果。
在一种可能的实现方式中,确定模块,包括:
第二提取模块,用于通过多头自注意力结构或者循环神经网络结构,提取待分析语句的文本特征向量;
第二计算模块,用于计算文本特征向量与预设的句式分类模版的相似度;
确定模块,具体用于当相似度满足预设条件时,基于句式分类模版确定语义信息。
在一种可能的实现方式中,确定模块,包括:
第二提取模块,用于通过多头自注意力结构提取
第三提取模块,用于提取待分析语句的文本特征向量,以及属性信息分类;
确定模块,具体用于基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句。
在一种可能的实现方式中,第三提取模块,还用于提取语句特征向量中的条件特征向量;
确定模块,具体用于:基于文本特征向量、属性信息分类和条件特征向量确定表格问答查询语句。
第三方面,本申请实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时,实现如第一方面或者第一方面的任一可能实现方式中的方法。
第四方面,本申请实施例提供了一种可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。
本申请实施例中,通过将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,通过提取融合多个子任务的语义理解模型输出的不同位置的表示向量来完成多个子任务,由此,提升了语句分析的准确率和速度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种语句分析方法的流程图;
图2为本申请实施例提供的一种语义理解模型的结构示意图;
图3是本申请实施例提供的一种语句分析装置结构示意图;
图4是本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
首先,对于本申请实施例涉及的技术术语进行介绍。
自注意力语言模型:使用自注意力(self-attention)结构的语言模型,典型代表是BERT模型,它们通过自注意力机制对输入的语句自身进行编码向量表示。Attention机制的本质来自于人类视觉注意力机制。人们视觉在感知东西的时候一般不会是一个场景从到头看到尾每次全部都看,而往往是根据需求观察注意特定的一部分。而且当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。Attention函数的本质可以被描述为一个查询(query)到一系列(键key-值value)对的映射。
多头自注意力结构(multi-head attention,多头attention)是利用多个查询,来平行地计算从输入信息中选取多个信息。每个注意力关注输入信息的不同部分。
自然语言理解任务(natural language understanding,NLU),俗称人机对话。人工智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。
结构化查询语言(Structured Query Language,SQL)是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库***。
NL2SQL(Natural Language to SQL),NL代表自然语言,SQL代表数据库查询语言,该任务为将自然语言转换为数据库查询语言的任务,有很大的实际应用价值,对改善用户与数据库之间的交互方式有很大意义。数据库存储了大量的个人或者企业的生产运营数据,我们每天都会和数据库产生或多或少的交互。通常,查询数据库中的数据需要通过像SQL这样的程序式查询语言来进行交互,这就需要懂SQL语言的专业技术人员来执行这一操作。为了让非专业用户也可以按需查询数据库,需要将自然语言转换为数据库查询语言,NL2SQL就是这样的一项技术,它可以将用户的自然语句转为可以执行的SQL语句。
长短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的循环神经网络结构存在的长期依赖问题而专门设计出来的,所有的循环神经网络结构都具有一种重复神经网络模块的链式形式。简单来说,LSTM是一种特殊的循环神经网络结构网络,该网络设计出来是为了解决长依赖问题。
本申请实施例提供的语句分析方法至少可以应用于下述应用场景中,下面进行说明。
在自然语言理解任务中,有时需要模型完成多个语言理解任务,这时候用多个模型来完成就会显得有些不划算,一是多个模型会有误差累积,二是多个模型的执行会增长推理时间。
基于上述应用场景,下面对本申请实施例提供的语句分析方法进行详细说明。
图1为本申请实施例提供的一种语句分析方法的流程图。
如图1所示,该语句分析方法可以包括步骤110-步骤120,该方法应用于语句分析装置,具体如下所示:
步骤110,获取待分析语句。
步骤120,将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果。其中,子任务包括:
确定待分析语句的分类结果;
基于预设的句式分类模版,确定待分析语句的的语义信息;
确定待分析语句对应的表格问答查询语句。
本申请提供的语句分析方法中,通过将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,通过提取融合多个子任务的语义理解模型输出的不同位置的表示向量来完成多个子任务,由此,提升了语句分析的准确率和速度。
下面,对步骤110-步骤120的内容分别进行描述:
首先,涉及步骤110。
获取待分析语句,该待分析语句可以是用户输入的语句。
其次,涉及步骤120。
将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果。
其中,上述涉及到的融合多个子任务的语义理解模型,是一个能完成多个自然语言理解任务的模型,具体地,可以包括文本分类、文本向量表示(通过向量表示可以进行语义相似度匹配)、表格问答(NL2SQL)任务。这三种子任务可以覆盖绝大部分的自然语言理解任务,在实际的应用场景中,还可以通过组合各个子任务来满足不同的自然语言理解需求。
在一种可能的实施例中,上述涉及到的确定待分析语句的分类结果的步骤中,具体可以包括以下步骤:
通过多头自注意力结构提取待分析语句的语句特征向量;
对语句特征向量进行分类,得到语句特征向量的句式分类;
分别计算语句特征向量所属句式分类的概率;
将概率最高的语句特征向量的句式分类确定为待分析语句的分类结果。
其中,上述涉及到的分类结果,是要确定待分析语句所属的一些类型,比如确定待分析语句是要查属性信息,还是要比大小,或是要查事物间关系等等。
示例性地,待分析语句为“你放假了吗”。首先,通过多头自注意力结构提取待分析语句的语句特征向量;然后,对语句特征向量进行分类,得到语句特征向量的句式分类,确定该待分析语句的句式分类可以包括疑问词问句、是非问句和正反问句;接着,分别计算语句特征向量所属句式分类的概率,具体可以通过计算语句特征向量和预设句式分类的相似度来依次确定语句特征向量所属句式分类的概率;最后,将概率最高的语句特征向量的句式分类确定为待分析语句的分类结果,比如该待分析语句的句式分类为疑问词问句的概率是30%,是非问句的概率是30%,是正反问句的概率是70%。那么该待分析语句的句式分类为正反问句。
在一种可能的实施例中,上述涉及到的基于预设的句式分类模版,确定待分析语句的语义信息的步骤中,具体可以包括以下步骤:
通过多头自注意力结构或者循环神经网络结构,提取待分析语句的文本特征向量;
计算文本特征向量与预设的句式分类模版的相似度;
当相似度满足预设条件时,基于句式分类模版确定语义信息。
其中,句式分类模版,也需要通过模型表示成向量的形式。即上述涉及到的句式分类模版的存在形式是向量。
句式分类模版,是要确定待分析语句具体的语义,比如查询一个酒店信息,相对应的句式分类模版可以包括:酒店电话、酒店地址、酒店设施这种模板,用待分析语句去匹配这些候选的句式分类模版,去确定具体的意图,即确定待分析语句的语义信息。
通过多头自注意力结构或者循环神经网络结构,提取待分析语句的文本特征向量,能够更加精细的对待分析语句需要位置的特征进行提取,接着,计算文本特征向量与预设的句式分类模版的相似度,通过多头自注意力结构或者循环神经网络结构提取的表示向量(即文本特征向量)可以与句式分类模版进行语义相似度匹配;当相似度满足预设条件(如相似度大于预设阈值)时,基于句式分类模版确定待分析语句的语义信息。
由此,通过在需要表示的句子语料位置上再添加多头自注意力结构或者循环神经网络结构,更加精细的对待分析语句需要位置的特征进行提取,达到提升表示向量(即文本特征向量)准确性的目的,进而提升确定的待分析语句的语义信息的准确性。
在一种可能的实施例中,上述涉及到的确定待分析语句对应的表格问答查询语句的步骤中,具体可以包括以下步骤:
提取待分析语句的文本特征向量,以及属性信息分类;
基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句。
基于文本特征向量和属性信息分类可以确定待分析语句对应的表格问答查询语句,待分析语句的属性信息分类的输入,是用来做NL2SQL任务的。属性信息分类用于表示待分析语句的属性,比如数组。
在一种可能的实施例中,上述涉及到的基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句的步骤中,具体可以包括以下步骤:
提取语句特征向量中的条件特征向量;
基于文本特征向量、属性信息分类和条件特征向量确定表格问答查询语句。
示例性地,对于一个W品牌的数据库表格,用户可能会想知道“W品牌的车总共卖了多少辆?”,即当用户提出的待分析语句的语句特征向量的句式分类为问句时,可以提取语句特征向量中的条件特征向量,条件特征向量可以是通过标记出问句(即待分析语句)中所包含的条件值得到的;然后基于文本特征向量、属性信息分类和条件特征向量确定表格问答查询语句。
比如,其相应的表格问答查询语句的表达式可以为“SELECT SUM(销量)FROMTABLE WHERE品牌==W品牌”。该子任务所做的,就是结合用户想要查询的表格,将用户的问句(即待分析语句)转化为相应的SQL语句,从而得到表格问答查询语句。
综上,在本申请实施例中,将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,通过提取融合多个子任务的语义理解模型输出的不同位置的表示向量来完成多个子任务,由此,提升了语句分析的准确率和速度。
基于上述图1所示的语句分析方法,本申请还提供了一种语义理解模型的结构,图2为本申请实施例提供的一种语义理解模型的结构示意图。
如图2所示,该方法应用于语句分析装置,具体如下所示:
本申请的实施例提供一种语义理解模型结构,其中“问句or模板”框就是上面说的语句。图2从上到下是从输入到输出。其中,长方形的框代表模型结构,椭圆形的框代表用于完成各子任务的输出向量,平行四边形的框代表其余输入和中间向量。本申请实施例提供的语义理解模型结构在整句编码的自注意力模型结构上增加了:片段位置上的多头自注意力结构,以及,片段位置上的循环神经网络结构。
图2所示的语义理解模型结构,可以基本以下述方法实现语义理解任务,具体如下所示:
步骤一,将语句输入类BERT模型中,获取全部输入的对应输出;根据是否做NL2SQL任务,输入分两种:
一种是带属性列表(用来做NL2SQL任务)的输入:
[CLS]句子[SEP]属性1[SEP]属性2[SEP]……[SEP]。
另一种是单句输入:[CLS]句子[SEP]。
BERT的输入可以包含一个句子对(句子A和句子B),也可以是单个句子。此外还增加了一些有特殊作用的标志位:[CLS]标志放在第一个句子的首位,经过BERT得到的的表征向量C可以用于后续的分类任务。[SEP]标志用于分开两个输入句子,例如输入句子A和B,要在句子A,句子B后面增加[SEP]标志。
步骤二,取不同位置的模型输出完成不同的子任务,具体如图2所示。
其中,Average表示所有向量求平均获得平均向量,Normalization表示向量再进行归一化。
步骤三,根据句向量表示(即语义相似度匹配任务不达标时)情况,在需要获取表示的句子位置上添加多头自注意力结构和循环神经网络结构,该结构输入是步骤一句子语料对应位置的输出,再对该片段语料进行一次表示。
其中,语义理解模型的结构中,可以完成的子任务包括:
问句分类任务:文本分类任务的输出。
问句模板相似度计算任务:输出的句向量,用于相似度匹配任务。
NL2SQL表格问答任务。
其中,下述是NL2SQL表格问答任务输出,这里以cypher语句举例,其他查询语句如SQL类似。
下面是查询语句的固定模板,其中的带$的槽位需要模型的输出来填($category代表所属表格,这个不需要模型输出),*代表可以没有也可以有一个或多个,这里表示限制条件有一个或多个。
Match(a:$category)
Where a.$W_col$W_col_op$W_value
($W_op$W_col$W_col_op$W_value)*
Return$R_col_agg(a.$R_col)
问句NER提取条件值(W_value):标出问句中所包含的条件值。
其中,上述涉及到的查询语句中的参数含义分别如下所示:
R_num:被选列数量;
W_num_op:条件列数量及其之间关系;包括1)NULL无关(只有一个条件);2)AND与关系;3)OR或关系;
R_col:哪列是被选列;
W_col:哪列是条件列;
R_col_agg:被选列的聚合函数;包括1)Avg均值;2)Collect列表;3)Count计数;4)Max最大值;5)Min最小值;6)sum求和
W_val_match_col:条件值对应哪列;
W_col_op:条件值对应的条件类型,包括1)=等于;2)<>不等于;3)<小于;4)<=小于等于;5)>大于;6)>=大于等于;7)CONTAINS包含(属性值是数组的情况)。
综上,在本申请实施例中,通过将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,通过提取融合多个子任务的语义理解模型输出的不同位置的表示向量来完成多个子任务,由此,提升了语句分析的准确率和速度。
基于上述图1所示的语句分析方法,本申请实施例还提供一种语句分析装置,如图3所示,该装置300可以包括:
获取模块310,用于获取待分析语句。
确定模块320,用于将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果。其中,子任务包括:
确定待分析语句的分类结果;
基于预设的句式分类模版,确定待分析语句的的语义信息;
确定待分析语句对应的表格问答查询语句。
在一种可能的实施例中,确定模块320,包括:
第一提取模块,用于通过多头自注意力结构提取待分析语句的语句特征向量。
分类模块,用于对语句特征向量进行分类,得到语句特征向量的句式分类。
第一计算模块,用于分别计算语句特征向量所属句式分类的概率。
确定模块320,具体用于将概率最高的语句特征向量的句式分类确定为待分析语句的分类结果。
在一种可能的实施例中,确定模块320,包括:
第二提取模块,用于通过多头自注意力结构或者循环神经网络结构,提取待分析语句的文本特征向量。第二计算模块,用于计算文本特征向量与预设的句式分类模版的相似度。
确定模块320,具体用于当相似度满足预设条件时,基于句式分类模版确定语义信息。
在一种可能的实施例中,确定模块320,包括:
第三提取模块,用于提取待分析语句的文本特征向量,以及属性信息分类。
确定模块320,具体用于基于文本特征向量和属性信息分类确定待分析语句对应的表格问答查询语句。
在一种可能的实施例中,第三提取模块,还用于提取语句特征向量中的条件特征向量。
确定模块320,具体用于:基于文本特征向量、属性信息分类和条件特征向量确定表格问答查询语句。
综上,在本申请实施例中,通过将待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,子任务包括:确定待分析语句的分类结果;基于预设的句式分类模版,确定待分析语句的的语义信息;确定待分析语句对应的表格问答查询语句。根据本申请的实施例,通过提取融合多个子任务的语义理解模型输出的不同位置的表示向量来完成多个子任务,由此,提升了语句分析的准确率和速度。
图4示出了本申请实施例提供的一种电子设备的硬件结构示意图。
在电子设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在综合网关容灾设备的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现图所示实施例中的任意一种语句分析方法。
在一个示例中,电子设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的语句分析方法,从而实现结合图1至图2描述的语句分析方法。
另外,结合上述实施例中的语句分析方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现图1至图2中的语句分析方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种语句分析方法,其特征在于,所述方法包括:
获取待分析语句;
将所述待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,所述子任务包括:
确定所述待分析语句的分类结果;
基于预设的句式分类模版,确定所述待分析语句的的语义信息;
确定所述待分析语句对应的表格问答查询语句。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待分析语句的分类结果,包括:
通过多头自注意力结构提取所述待分析语句的语句特征向量;
对所述语句特征向量进行分类,得到所述语句特征向量的句式分类;
分别计算所述语句特征向量所属句式分类的概率;
将概率最高的语句特征向量的句式分类确定为所述待分析语句的分类结果。
3.根据权利要求1所述的方法,其特征在于,所述基于预设的句式分类模版,确定所述待分析语句的的语义信息,包括:
通过多头自注意力结构或者循环神经网络结构,提取所述待分析语句的文本特征向量;
计算所述文本特征向量与预设的句式分类模版的相似度;
当所述相似度满足预设条件时,基于所述句式分类模版确定所述语义信息。
4.根据权利要求1所述的方法,其特征在于,所述确定所述待分析语句对应的表格问答查询语句,包括:
提取所述待分析语句的文本特征向量,以及所述属性信息分类;
基于所述文本特征向量和所述属性信息分类确定所述待分析语句对应的表格问答查询语句。
5.根据权利要求4所述的方法,其特征在于,所述基于所述文本特征向量和所述属性信息分类确定所述待分析语句对应的表格问答查询语句,包括:
提取所述语句特征向量中的条件特征向量;
基于所述文本特征向量、所述属性信息分类和所述条件特征向量确定所述表格问答查询语句。
6.一种语句分析装置,其特征在于,所述装置包括:
获取模块,用于获取待分析语句;
确定模块,用于将所述待分析语句输入至融合多个子任务的语义理解模型,分别输出多个语义理解结果;其中,所述子任务包括:
确定所述待分析语句的分类结果;
基于预设的句式分类模版,确定所述待分析语句的的语义信息;
确定所述待分析语句对应的表格问答查询语句。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,包括:
第一提取模块,用于通过多头自注意力结构提取所述待分析语句的语句特征向量;
分类模块,用于对所述语句特征向量进行分类,得到所述语句特征向量的句式分类;
第一计算模块,用于分别计算所述语句特征向量所属句式分类的概率;
所述确定模块,具体用于将概率最高的语句特征向量的句式分类确定为所述待分析语句的分类结果。
8.根据权利要求6所述的装置,其特征在于,所述确定模块,包括:
第二提取模块,用于通过多头自注意力结构或者循环神经网络结构,提取所述待分析语句的文本特征向量;
第二计算模块,用于计算所述文本特征向量与预设的句式分类模版的相似度;
所述确定模块,具体用于当所述相似度满足预设条件时,基于所述句式分类模版确定所述语义信息。
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的语句分析方法。
10.一种可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的语句分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210642118.9A CN115062126A (zh) | 2022-06-08 | 2022-06-08 | 一种语句分析方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210642118.9A CN115062126A (zh) | 2022-06-08 | 2022-06-08 | 一种语句分析方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115062126A true CN115062126A (zh) | 2022-09-16 |
Family
ID=83201060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210642118.9A Pending CN115062126A (zh) | 2022-06-08 | 2022-06-08 | 一种语句分析方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115062126A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821696A (zh) * | 2023-08-30 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 表格问答模型的训练方法、装置、设备及存储介质 |
-
2022
- 2022-06-08 CN CN202210642118.9A patent/CN115062126A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821696A (zh) * | 2023-08-30 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 表格问答模型的训练方法、装置、设备及存储介质 |
CN116821696B (zh) * | 2023-08-30 | 2023-11-24 | 腾讯科技(深圳)有限公司 | 表格问答模型的训练方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答*** | |
CN108363790B (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN110727779A (zh) | 基于多模型融合的问答方法及*** | |
CN112270196B (zh) | 实体关系的识别方法、装置及电子设备 | |
CN111460250B (zh) | 用于画像的数据的清洗方法、装置、介质及电子设备 | |
CN110580308B (zh) | 信息审核方法及装置、电子设备、存储介质 | |
CN112784066B (zh) | 基于知识图谱的信息反馈方法、装置、终端和存储介质 | |
CN111382248A (zh) | 一种问题回复方法、装置、存储介质及终端设备 | |
CN116719520B (zh) | 代码生成方法及装置 | |
CN112163099A (zh) | 基于知识图谱的文本识别方法、装置、存储介质和服务器 | |
CN111723192B (zh) | 代码推荐方法和装置 | |
CN113742733A (zh) | 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置 | |
CN113095081A (zh) | 疾病的识别方法及装置、存储介质、电子装置 | |
CN115759254A (zh) | 基于知识增强生成式语言模型的问答方法、***及介质 | |
CN111831624A (zh) | 数据表创建方法、装置、计算机设备及存储介质 | |
CN115062126A (zh) | 一种语句分析方法、装置、电子设备及可读存储介质 | |
CN114842982B (zh) | 一种面向医疗信息***的知识表达方法、装置及*** | |
CN109993381B (zh) | 基于知识图谱的需求管理应用方法、装置、设备及介质 | |
CN114118049B (zh) | 信息获取方法、装置、电子设备及存储介质 | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 | |
Sinpang et al. | Detecting ambiguity in requirements analysis using Mamdani fuzzy inference | |
CN112541357B (zh) | 实体识别方法、装置及智能设备 | |
CN115658845A (zh) | 一种适用于开源软件供应链的智能问答方法及装置 | |
CN112883735B (zh) | 一种表单图像的结构化处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |