CN113918701B - 看板展示方法及装置 - Google Patents
看板展示方法及装置 Download PDFInfo
- Publication number
- CN113918701B CN113918701B CN202111220334.6A CN202111220334A CN113918701B CN 113918701 B CN113918701 B CN 113918701B CN 202111220334 A CN202111220334 A CN 202111220334A CN 113918701 B CN113918701 B CN 113918701B
- Authority
- CN
- China
- Prior art keywords
- analysis result
- result
- slot
- intention
- slot position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请公开一种看板展示方法及装置,用以解决看板无法支持复杂的展示需求的问题。其中,一种看板展示方法,包括:输入通过自然语言表达的看板展示请求;通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;根据所述看板展示参数,更新看板展示内容。通过多次歧义消除处理,有效识别复杂的展示需求。
Description
技术领域
本申请涉及商务智能技术领域,尤其涉及一种看板展示方法及装置。
背景技术
随着商务智能平台的持续发展和普及,企业用户对平台的易用性和智能化提出了更高的需求。在传统的商务智能平台中,使用者通过复杂的界面操作进行商务数据的智能化分析和展现,需要对使用者进行操作培训,并且无法快速响应新的分析需求。针对这个问题,业界提出了使用自然语言交互进行智能化数据分析的解决思路,代表有NL2SQL、可视化QA等技术。
在实现现有技术的过程中,发明人发现:
NL2SQL可以将自然语言的单个问句自动解析为可执行的SQL语句,在简单句上有90%左右的准确率,然而在复杂句上只有50%不到的准确率。可视化QA技术实时解析问句输入,能够实时推荐相似问句,或者提示使用者主动选择语义实体,但仍然需要进行复杂的界面交互,且很难处理复杂句。现有的自然语言交互技术,一定程度上提高了商务智能平台的易用性和智能化,但是在复杂句解析能力和交互能力上仍然有待提高。
因此,需要提供一种看板展示方法及装置,用以解决看板无法支持复杂的展示需求的技术问题。
发明内容
本申请实施例提供一种看板展示方法及装置,用以解决看板无法支持复杂的展示需求的技术问题。
具体的,一种看板展示方法,包括以下具体步骤:
输入通过自然语言表达的看板展示请求;
通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;
消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;
根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;
根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;
根据所述看板展示参数,更新看板展示内容。
进一步的,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
进一步的,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
进一步的,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果不存在歧义时,按照预定义规则,验证所述第一意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
进一步的,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为非BI核心数据类型时,根据数据类型特征,选用与类型特征相适应的本地校验方法进行槽位文本校验,得到校验结果;
根据所述校验结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
进一步的,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为BI核心数据类型时,调用商业智能数据接口获取接口数据;
匹配所述第二槽位解析结果的槽位文本与所述接口数据,得到匹配结果;
根据所述匹配结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
进一步的,根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数,包括以下具体步骤:
根据所述第二意图解析结果和所述第三槽位解析结果,结合预设的全局看板参数,进行语义验证,得到验证结果;
当所述验证结果为验证通过时,将所述第二意图解析结果、所述第三槽位解析结果更新至所述全局看板参数,得到看板展示参数。
本申请还提供一种看板展示装置,包括:
输入模块,用于输入通过自然语言表达的看板展示请求;
自然语言处理模块,用于通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;
第一处理模块,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;
第二处理模块,用于根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;
展示预处理模块,用于根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;
更新模块,用于根据所述看板展示参数,更新看板展示内容。
进一步的,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
进一步的,所述第一处理模块,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,具体用于:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
本申请实施例提供的技术方案,至少具有如下有益效果:
通过多次歧义消除处理,有效识别复杂的展示需求。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种看板展示方法的流程图;
图2为本申请实施例提供的一种看板展示装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参照图1,一种看板展示方法,包括以下具体步骤:
S100:输入通过自然语言表达的看板展示请求。
需要指出的是,本申请在实际的应用过程中,这里的自然语言可以是多种形式。优选的,为了贴合实际的应用场景,同时也为了便于操作,这里的看板展示请求可以是通过语音形式表达的请求信息,也可以是直接以文字形式输入的请求信息。这里的语音或者文字信息可以根据实际情况切换为不同的语言。需要说明的是,这里的看板展示请求可以是使用者希望看板显示的内容或者显示的形式。这里的看板可以理解为用于控制相关数据以图形等方式显示的软件中的组件或者控件等。显然,通过看板处理后得到的显示数据最终可以通过显示终端展示给使用者。显而易见的是,以语音或者文字的方式输入看板展示请求,更加贴合应用场景,方便使用。
S200:通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果。
可以理解的是,这里的自然语言处理模型可以理解为自然语言理解模型,是人工智能领域的一种处理模型。以自然语言表达的看板展示请求经过自然语言处理模型处理后,可以生成相应的能够让计算机处理的数据。这里的处理过程可以视为人机交互过程的一部分。第一意图解析结果可以理解为自然语言理解领域中的意图,第一槽位解析结果可以理解为意图对应的槽位。显然,这里的槽位还包括槽位类型和槽位文本。第一意图解析结果的生成过程可以理解为意图识别的过程。第一槽位解析结果的生成过程可以理解为槽位填充的过程。意图识别,可以理解为判断用户要做什么。意图识别的过程是一个文本分类的过程。槽位填充,可以理解为判断出用户做什么之后,确定具体怎么做。显然,以自然语言处理模型的方式解析看板展示请求,可以有效提高工作效率。
进一步的,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
可以理解的是,在本申请的技术方案的最初实施阶段,由于缺少用于自然语言处理模型训练的标注样本,将影响***的快速部署。为了解决这个冷启动问题,本申请提出一种样本生成算法,可以利用预设的意图类别数据及预设的槽位类型以及BI数据来生成训练自然语言处理模型的标注样本,这里的标注样本可以理解为样本数据集。BI数据主要指客户原始数据经过BI数据治理规范之后的指标、维度和维项数据。例如,在句子“显示总营业额”中,可以转换格式为“显示[总营业额](指标)”,这里的“总营业额”对应的是指标数据。在句子“显示[2020年](时间)[武汉](维项)[江岸区](维度)的[利润](指标)”中,“武汉”对应维项数据,“江岸区”对应维度数据,“利润”对应指标数据。BI数据与槽位的实体类型对应,这里的槽位的实体类型可以理解为本申请中预设的槽位类型。采集样本时,采用不放回的随机采样方法从BI数据中随机选取数据填充至样本中槽位的槽位文本位置,成为槽位文本,耗尽后再次从头循环。根据实际的展示需求,预设的意图类别数据可以包括显示看板、排序看板、趋势看板、对比看板、下钻操作、上钻操作、切换操作、新增数据槽位、新增计算操作及新增对比操作等。预设的槽位类型可以包括基础类型、数据相关类型、看板相关类型及其他辅助类型等。显然,这里预设的意图类别数据和预设的槽位类型只是用于举例,实际设置的名称及数量可以根据需求进行相应调整。需要说明的是,这里的基础类型主要包括时间、地点和数字等通用的实体类型;这里的数据相关类型主要包括维度建模的三种类型,即指标、维度和维项;这里的看板相关类型包括图表类型、排序方式、对比操作及计算操作等;这里的其他辅助类型包括用于各种槽位进行歧义消除的类型。显然,这里的样本生成算法采集的样本符合实际的使用环境,以此训练得到的自然语言处理模型可以有效提高识别率。
S300:消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果。
可以理解的是,第一意图解析结果为自然语言处理模型通过流水线处理方式自动解析出来的意图识别结果,对于一些复杂句的意图解析存在歧义的可能性会变大。为提高复杂句的识别率,可以对第一意图解析结果进行意图歧义消除处理。这里的意图歧义消除处理可以理解为把第一意图解析结果处理为意图清晰的意图信息。意图清晰的意图信息可以理解为这里的第二意图解析结果。意图歧义消除之后,可以进一步根据第二意图解析结果,并结合第一槽位解析结果处理得到与第二意图解析结果对应的槽位信息,这里的槽位信息可以理解为第二槽位解析结果。显而易见的是,通过消除意图歧义,可以有效提高复杂句的识别率。
具体的,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
需要指出的是,这里的概率分布数据可以理解为第一意图解析结果所表示的意图为预设的意图类别数据中各个意图的概率。预设的歧义判定方法可以根据实际需要进行设置。在具体的实施过程中,可以预设以下歧义判定方法:当概率分布数据中概率最大的意图对应的概率值小于阈值时,判定存在歧义;当概率分布数据中概率最大的两个意图对应的概率值之差小于阈值时,判定存在歧义;当第一意图解析结果没有相应的意图数据,但是第一槽位解析结果包含实体文本时,这样的第一意图解析结果判定存在歧义。这里的预设的意图歧义消除方法可以根据实际需要进行设置。在具体的实施过程中,预设的意图歧义消除方法可以是通过人机交互的方式完成的对第一意图解析结果的意图歧义消除。预设的意图歧义消除方法也可以是通过意图排序算法,并根据机器学习模型来完成意图歧义的消除。例如,当第一意图解析结果没有相应的意图数据,但是第一槽位解析结果中存在槽位类型,且对应的槽位文本存在实体文本数据时,判定第一意图解析结果存在歧义;根据第一槽位解析结果中的槽位类型及槽位文本,提示用户选择相关的预设的意图类别数据,从而实现意图歧义消除。这里的预定义规则可以理解为预设的意图类别数据所对应的预设的槽位数据的格式及参数数量要求等。例如,在预设的意图类别数据中,假设预设有“展示看板”和“添加计算操作符”的意图类别。在“展示看板”意图下,预设条件为指标或维度的数量不能超过3个;在“添加计算操作符”的意图下,预设条件为必须至少有一个计算操作符(只验证类型,不验证取值)。显然,在进行验证时,如果相应的数据不满足上述预设条件,则相应的验证不通过,最终退出意图歧义的消除方法;如果相应的数据满足上述预设条件时,验证通过,并进行下一步处理。具体的,需要结合现有看板的功能来制定一套边界清晰、功能适用的形式验证规则集,从而形成有效的预定义规则。需要说明的是,这里的验证结果经过判断满足预设条件时,可以确定验证结果中包含消除了歧义的语义清晰的意图信息,即这里的第二意图解析结果。根据这里的语义清晰的意图信息,可以进一步对第一槽位解析结果进行槽位的继承和替换等操作。从而,得到经过初步处理的槽位数据,即这里的第二槽位解析结果。显然,通过结合歧义判定方法、意图歧义消除方法及预定义规则进行意图歧义消除时,可以有效提高处理效率。
进一步的,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果不存在歧义时,按照预定义规则,验证所述第一意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
可以理解的是,在对第一意图解析结果进行意图的歧义判断时,并非所有内容都会存在歧义。当判断第一意图解析结果所表示的意图不存在歧义时,可以确定第一意图解析结果中的意图信息是语义清晰的。经过判断后的第一意图解析结果可以理解为这里的第二意图解析结果。对语义清晰的意图信息和第一槽位解析结果对应的槽位类型验证通过后,可以进一步对第一槽位解析结果进行槽位的继承和替换等操作。从而,得到经过初步处理的槽位数据,即这里的第二槽位解析结果。显然,通过对语义清晰的第一意图解析结果及第一槽位解析结果对应的槽位类型进行验证,可以有效提高数据准确性。
S400:根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果。
需要指出的是,第二槽位解析结果可以理解为新识别的槽位信息。根据槽位信息中槽位类型的不同,槽位文本的校验和歧义消除方式也不同。
具体的,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为非BI核心数据类型时,根据数据类型特征,选用与类型特征相适应的本地校验方法进行槽位文本校验,得到校验结果;
根据所述校验结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
可以理解的是,第二槽位解析结果的槽位类型直接关系到第二槽位解析结果中槽位文本的校验和歧义消除方式。在进行槽位文本的歧义消除前,需要先确认第二槽位解析结果的槽位类型。这里的非BI核心数据类型包括时间和数字等格式规范的类型,还包括地点、计算操作和图表类型等小规模的可枚举类型。这里的本地验证方法包括数据的格式规范校验方法,还包括集合匹配校验方法。当这里的槽位类型为格式规范的类型时,可以直接根据相应数据的格式规范来校验第二显示槽位解析结果的槽位文本。当这里的槽位类型为小规模的可枚举类型时,可以通过匹配槽位类型对应的数据集合和第二显示槽位解析结果的槽位文本进行校验。例如,时间类型的槽位类型,对应的槽位文本需要满足规定的时间格式。小规模的可枚举类型的槽位类型,可以匹配槽位文本与槽位类型对应的文本集合,从而完成校验操作。如果校验出槽位文本存在歧义,则可以通过人机互动的方式或者基于机器学习的自动选择方式,消除相应的槽位文本歧义,并更新第二槽位解析结果的槽位文本,最终得到第三槽位解析结果。显而易见的是,以类型特征相适应的本地校验方法进行槽位文本的校验,可以有效简化槽位文本歧义消除步骤,提高槽位文本的歧义消除效率。
进一步的,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为BI核心数据类型时,调用商业智能数据接口获取接口数据;
匹配所述第二槽位解析结果的槽位文本与所述接口数据,得到匹配结果;
根据所述匹配结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
需要指出的是,这里的BI核心数据类型包括指标、维度和维项等。当这里的槽位类型为BI核心数据类型时,需要实时调用商业智能数据接口来完成校验。这里的BI核心数据类型可以理解为商业智能核心数据类型,商业智能数据接口可以理解为BI数据接口或者BI接口。具体的,在具体进行歧义消除前,需要实时调用商业智能数据接口获取接口数据,匹配接口数据和第二槽位解析结果的槽位文本。当两者完全唯一匹配时,判定第二槽位解析结果的槽位文本不存在歧义。至此,可以用接口数据更新所述第二槽位解析结果的槽位文本,最终得到第三槽位解析结果。当两者无法完全唯一匹配时,判定第二槽位解析结果的槽位文本存在歧义,并触发槽位文本歧义消除操作。这里的接口数据可以理解为BI数据。槽位文本歧义消除操作可以通过人机互动的方式完成,也可以通过基于机器学习的自动歧义消除方法完成。人机互动的方式进行槽位文本歧义消除操作时,需要与用户交互确认槽位文本与BI数据的对应关系,确认成功后用语义明确的BI数据替换第二槽位解析结果的槽位文本,最终得到第三槽位解析结果。显而易见的是,通过商业智能数据接口进行槽位文本的校验,可以有效简化槽位文本歧义消除步骤,提高槽位文本的歧义消除效率。
S500:根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数。
具体的,根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数,包括以下具体步骤:
根据所述第二意图解析结果和所述第三槽位解析结果,结合预设的全局看板参数,进行语义验证,得到验证结果;
当所述验证结果为验证通过时,将所述第二意图解析结果、所述第三槽位解析结果更新至所述全局看板参数,得到看板展示参数。
可以理解的是,这里的第二意图解析结果和第三槽位解析结果都是经过歧义判定和/或处理过的语义明确的信息。显然,为了确保最终的看板展示参数的准确性,需要对第二意图解析结果、第三槽位解析结果及已有的全局看板参数进行验证。这里的验证是对第二意图解析结果所表示的意图、第三槽位解析结果所表示的槽位信息及已有的全局看板参数的综合验证,这里的综合验证在具体操作时可以选用语义验证方法,可以用于验证意图与槽位信息之间的对应关系,还可以用于验证意图、槽位信息及全局看板参数之间的逻辑关系。显然,验证通过后,可以确认第二意图解析结果和第三槽位解析结果为没有歧义的信息,并以此更新全局看板参数,得到最新的可以表示用户展示需求的看板展示参数。通过对最终的消除歧义的第二意图解析结果、第三槽位解析结果及全局看板参数进行语义验证,可以进一步提高复杂展示需求的识别率。
S600:根据所述看板展示参数,更新看板展示内容。
可以理解的是,看板展示参数可以用来驱动看板按照特定的模式进行展示。这里的看板展示参数可以有效表示用户的真实意图,以此更新的看板展示内容可以最终完成复杂的看板展示请求。
请参照图2,本申请还提供一种看板展示装置100,包括:
输入模块11,用于输入通过自然语言表达的看板展示请求;
自然语言处理模块12,用于通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;
第一处理模块13,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;
第二处理模块14,用于根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;
展示预处理模块15,用于根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;
更新模块16,用于根据所述看板展示参数,更新看板展示内容。
需要指出的是,本申请在实际的应用过程中,这里的自然语言可以是多种形式。优选的,为了贴合实际的应用场景,同时也为了便于操作,这里的看板展示请求可以是通过语音形式表达的请求信息,也可以是直接以文字形式输入的请求信息。这里的语音或者文字信息可以根据实际情况切换为不同的语言。需要说明的是,这里的看板展示请求可以是使用者希望看板显示的内容或者显示的形式。这里的看板可以理解为用于控制相关数据以图形等方式显示的软件中的组件或者控件等。显然,通过看板处理后得到的显示数据最终可以通过显示终端展示给使用者。显而易见的是,以语音或者文字的方式输入看板展示请求,更加贴合应用场景,方便使用。这里的自然语言处理模型可以理解为自然语言理解模型,是人工智能领域的一种处理模型。以自然语言表达的看板展示请求经过自然语言处理模型处理后,可以生成相应的能够让计算机处理的数据。这里的处理过程可以视为人机交互的过程的一部分。第一意图解析结果可以理解为自然语言理解中的意图,第一槽位解析结果可以理解为意图对应的槽位。显然,这里的槽位还包括槽位类型和槽位文本。第一意图解析结果的生成过程可以理解为意图识别的过程。第一槽位解析结果的生成过程可以理解为槽位填充的过程。显然,以自然语言处理模型的方式解析看板展示请求,可以有效提高工作效率。第一意图解析结果为自然语言处理模型通过流水线处理方式自动解析出来的意图识别结果,对于一些复杂句的意图解析存在歧义的可能性会变大。为提高复杂句的识别率,可以对第一意图解析结果进行意图歧义消除处理。这里的意图歧义消除处理可以理解为把第一意图解析结果处理为意图清晰的意图信息。意图清晰的意图信息可以理解为第二意图解析结果。意图歧义消除之后,可以进一步根据第二意图解析结果,并结合第一槽位解析结果处理得到与第二意图解析结果对应的槽位信息,这里的槽位信息可以理解为第二槽位解析结果。显而易见的是,通过消除意图歧义,可以有效提高复杂句的识别率。第二槽位解析结果可以理解为新识别的槽位信息。根据槽位信息中槽位类型的不同,槽位文本的校验和歧义消除方式也不同。看板展示参数可以用来驱动看板按照特定的模式进行展示。这里的看板展示参数可以有效表示用户的真实意图,以此更新的看板展示内容可以最终完成复杂的看板展示请求。
进一步的,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
可以理解的是,在本申请的技术方案的最初实施阶段,由于缺少用于自然语言处理模型训练的标注样本,将影响***的快速部署。为了解决这个冷启动问题,本申请提出一种样本生成算法,可以利用预设的意图类别数据及预设的槽位类型以及BI数据来生成训练自然语言处理模型的标注样本,这里的标注样本可以理解为样本数据集。BI数据主要指客户原始数据经过BI数据治理规范之后的指标、维度和维项数据。例如,在句子“显示总营业额”中,可以转换格式为“显示[总营业额](指标)”,这里的“总营业额”对应的是指标数据。在句子“显示[2020年](时间)[武汉](维项)[江岸区](维度)的[利润](指标)”中,“武汉”对应维项数据,“江岸区”对应维度数据,“利润”对应指标数据。BI数据与槽位的实体类型对应,这里的槽位的实体类型可以理解为本申请中预设的槽位类型。采集样本时,采用不放回的随机采样方法从BI数据中随机选取数据填充至样本中槽位的槽位文本位置,成为槽位文本,耗尽后再次从头循环。根据实际的展示需求,预设的意图类别数据可以包括显示看板、排序看板、趋势看板、对比看板、下钻操作、上钻操作、切换操作、新增数据槽位、新增计算操作及新增对比操作等。预设的槽位类型可以包括基础类型、数据相关类型、看板相关类型及其他辅助类型等。显然,这里预设的意图类别数据和预设的槽位类型只是用于举例,实际设置的名称及数量可以根据需求进行相应调整。需要说明的是,这里的基础类型主要包括时间、地点和数字等通用的实体类型;这里的数据相关类型主要包括维度建模的三种类型,即指标、维度和维项;这里的看板相关类型包括图表类型、排序方式、对比操作及计算操作等;这里的其他辅助类型包括用于各种槽位进行歧义消除的类型。显然,这里的样本生成算法采集的样本符合实际的使用环境,以此训练得到的自然语言处理模型可以有效提高识别率。
进一步的,所述第一处理模块13,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,具体用于:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
需要指出的是,这里的概率分布数据可以理解为第一意图解析结果所表示的意图为预设的意图类别数据中各个意图的概率。预设的歧义判定方法可以根据实际需要进行设置。在具体的实施过程中,可以预设以下歧义判定方法:当概率分布数据中概率最大的意图对应的概率值小于阈值时,判定存在歧义;当概率分布数据中概率最大的两个意图对应的概率值之差小于阈值时,判定存在歧义;当第一意图解析结果没有相应的意图数据,但是第一槽位解析结果包含实体文本时,这样的第一意图解析结果判定存在歧义。这里的预设的意图歧义消除方法可以根据实际需要进行设置。在具体的实施过程中,预设的意图歧义消除方法可以是通过人机交互的方式完成的对第一意图解析结果的意图歧义消除。预设的意图歧义消除方法也可以是通过意图排序算法,并根据机器学习模型来完成意图歧义的消除。例如,当第一意图解析结果没有相应的意图数据,但是第一槽位解析结果中存在槽位类型,且对应的槽位文本存在实体文本数据时,判定第一意图解析结果存在歧义;根据第一槽位解析结果中的槽位类型及槽位文本,提示用户选择相关的预设的意图类别数据,从而实现意图歧义消除。这里的预定义规则可以理解为预设的意图类别数据所对应的预设的槽位数据的格式及参数数量要求等。例如,在预设的意图类别数据中,假设预设有“展示看板”和“添加计算操作符”的意图类别。在“展示看板”意图下,预设条件为指标或维度的数量不能超过3个;在“添加计算操作符”的意图下,预设条件为必须至少有一个计算操作符(只验证类型,不验证取值)。显然,在进行验证时,如果相应的数据不满足上述预设条件,则相应的验证不通过,最终退出意图歧义的消除方法;如果相应的数据满足上述预设条件时,验证通过,并进行下一步处理。具体的,需要结合现有看板的功能来制定一套边界清晰、功能适用的形式验证规则集,从而形成有效的预定义规则。需要说明的是,这里的验证结果经过判断满足预设条件时,可以确定验证结果中包含消除了歧义的语义清晰的意图信息,即这里的第二意图解析结果。根据这里的语义清晰的意图信息,可以进一步对第一槽位解析结果进行槽位的继承和替换等操作。从而,得到经过初步处理的槽位数据,即这里的第二槽位解析结果。显然,通过结合歧义判定方法、意图歧义消除方法及预定义规则进行意图歧义消除时,可以有效提高处理效率。
本申请实施例提供的技术方案,至少具有如下有益效果:
通过多次的歧义消除处理,可以有效识别复杂的展示需求。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,有语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种看板展示方法,其特征在于,包括以下具体步骤:
输入通过自然语言表达的看板展示请求;
通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;
消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;
根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;
根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;
根据所述看板展示参数,更新看板展示内容。
2.根据权利要求1所述的展示方法,其特征在于,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
3.根据权利要求1所述的展示方法,其特征在于,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
4.根据权利要求1所述的展示方法,其特征在于,消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,包括以下具体步骤:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果不存在歧义时,按照预定义规则,验证所述第一意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
5.根据权利要求1所述的展示方法,其特征在于,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为非BI核心数据类型时,根据数据类型特征,选用与类型特征相适应的本地校验方法进行槽位文本校验,得到校验结果;
根据所述校验结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
6.根据权利要求1所述的展示方法,其特征在于,根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果,包括以下具体步骤:
确定所述第二槽位解析结果的槽位类型;
当所述槽位类型为BI核心数据类型时,调用商业智能数据接口获取接口数据;
匹配所述第二槽位解析结果的槽位文本与所述接口数据,得到匹配结果;
根据所述匹配结果,更新所述第二槽位解析结果的槽位文本,得到第三槽位解析结果。
7.根据权利要求1所述的展示方法,其特征在于,根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数,包括以下具体步骤:
根据所述第二意图解析结果和所述第三槽位解析结果,结合预设的全局看板参数,进行语义验证,得到验证结果;
当所述验证结果为验证通过时,将所述第二意图解析结果、所述第三槽位解析结果更新至所述全局看板参数,得到看板展示参数。
8.一种看板展示装置,其特征在于,包括:
输入模块,用于输入通过自然语言表达的看板展示请求;
自然语言处理模块,用于通过自然语言处理模型处理所述看板展示请求,得到第一意图解析结果和第一槽位解析结果;
第一处理模块,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果;
第二处理模块,用于根据预设的槽位文本处理规则消除所述第二槽位解析结果的槽位文本歧义,得到第三槽位解析结果;
展示预处理模块,用于根据所述第二意图解析结果、所述第三槽位解析结果及全局看板参数,得到看板展示参数;
更新模块,用于根据所述看板展示参数,更新看板展示内容。
9.根据权利要求8所述的展示装置,其特征在于,所述自然语言处理模型的样本数据集,通过样本生成算法生成,包括以下具体步骤:
根据预设的意图类别数据、预设的槽位类型及BI数据,采集样本,并把采集的样本加入初始数据集;
按照预设的采样数量,循环执行上述样本采集操作,得到样本数据集。
10.根据权利要求8所述的展示装置,其特征在于,所述第一处理模块,用于消除所述第一意图解析结果的意图歧义,并根据消歧结果及所述第一槽位解析结果,得到第二意图解析结果及第二槽位解析结果,具体用于:
根据所述第一意图解析结果的概率分布数据,按照预设的歧义判定方法分析所述第一意图解析结果,得到歧义判断结果;
当所述歧义判断结果为所述第一意图解析结果存在歧义时,通过预设的意图歧义消除方法处理所述第一意图解析结果,得到待验证意图解析结果;
按照预定义规则,验证所述待验证意图解析结果及所述第一槽位解析结果对应的槽位类型,得到验证结果;
当所述验证结果满足预设条件时,根据所述验证结果,得到第二意图解析结果及第二槽位解析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111220334.6A CN113918701B (zh) | 2021-10-20 | 2021-10-20 | 看板展示方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111220334.6A CN113918701B (zh) | 2021-10-20 | 2021-10-20 | 看板展示方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113918701A CN113918701A (zh) | 2022-01-11 |
CN113918701B true CN113918701B (zh) | 2022-04-15 |
Family
ID=79241769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111220334.6A Active CN113918701B (zh) | 2021-10-20 | 2021-10-20 | 看板展示方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113918701B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962233A (zh) * | 2018-07-26 | 2018-12-07 | 苏州思必驰信息科技有限公司 | 用于语音对话平台的语音对话处理方法及*** |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答*** |
CN111368548A (zh) * | 2018-12-07 | 2020-07-03 | 北京京东尚科信息技术有限公司 | 语义识别方法及装置、电子设备和计算机可读存储介质 |
CN111949787A (zh) * | 2020-08-21 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
CN111985249A (zh) * | 2020-09-03 | 2020-11-24 | 贝壳技术有限公司 | 语义分析方法、装置、计算机可读存储介质及电子设备 |
CN112035506A (zh) * | 2019-10-28 | 2020-12-04 | 竹间智能科技(上海)有限公司 | 一种语义识别方法及其设备 |
CN113435205A (zh) * | 2021-04-29 | 2021-09-24 | 北京小米移动软件有限公司 | 语义解析方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10217462B2 (en) * | 2016-08-31 | 2019-02-26 | Microsoft Technology Licensing, Llc | Automating natural language task/dialog authoring by leveraging existing content |
US10496382B2 (en) * | 2018-02-22 | 2019-12-03 | Midea Group Co., Ltd. | Machine generation of context-free grammar for intent deduction |
US10902220B2 (en) * | 2019-04-12 | 2021-01-26 | The Toronto-Dominion Bank | Systems and methods of generating responses associated with natural language input |
-
2021
- 2021-10-20 CN CN202111220334.6A patent/CN113918701B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962233A (zh) * | 2018-07-26 | 2018-12-07 | 苏州思必驰信息科技有限公司 | 用于语音对话平台的语音对话处理方法及*** |
CN111368548A (zh) * | 2018-12-07 | 2020-07-03 | 北京京东尚科信息技术有限公司 | 语义识别方法及装置、电子设备和计算机可读存储介质 |
CN112035506A (zh) * | 2019-10-28 | 2020-12-04 | 竹间智能科技(上海)有限公司 | 一种语义识别方法及其设备 |
CN111026842A (zh) * | 2019-11-29 | 2020-04-17 | 微民保险代理有限公司 | 自然语言处理方法、自然语言处理装置及智能问答*** |
CN111949787A (zh) * | 2020-08-21 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
CN111985249A (zh) * | 2020-09-03 | 2020-11-24 | 贝壳技术有限公司 | 语义分析方法、装置、计算机可读存储介质及电子设备 |
CN113435205A (zh) * | 2021-04-29 | 2021-09-24 | 北京小米移动软件有限公司 | 语义解析方法及装置 |
Non-Patent Citations (3)
Title |
---|
Sentence simplification for spoken language understanding;Gokhan Tur等;《2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20110712;第5628-5631页 * |
基于领域知识的增强约束词向量;王恒升等;《中文信息学报》;20190430;第37-47页 * |
对话*** intent和slot识别;腾讯知文实验室;《https://cloud.tencent.com/developer/article/1147476?fromSource=waituihttps://cloud.tencent.com/developer/article/1147476?fromSource=waitui》;20180613;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113918701A (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9524291B2 (en) | Visual display of semantic information | |
CN112100354A (zh) | 人机对话方法、装置、设备及存储介质 | |
CN110765342A (zh) | 信息查询方法及装置、存储介质、智能终端 | |
CN111507088A (zh) | 语句补全方法、设备及可读存储介质 | |
CN116737908A (zh) | 知识问答方法、装置、设备和存储介质 | |
CN115328756A (zh) | 一种测试用例生成方法、装置及设备 | |
CN112749081A (zh) | 用户界面测试方法及相关装置 | |
CN111858888A (zh) | 一种值机场景的多轮对话*** | |
CN111738018A (zh) | 一种意图理解方法、装置、设备及存储介质 | |
CN115048505A (zh) | 语料筛选方法和装置、电子设备、计算机可读介质 | |
CN114662470A (zh) | 结合大数据的产品点评信息处理方法及*** | |
CN108984777B (zh) | 客户服务方法、装置和计算机可读存储介质 | |
CN110890090A (zh) | 基于上下文的辅助交互控制方法及*** | |
CN113918701B (zh) | 看板展示方法及装置 | |
CN112988704A (zh) | 一种基于ai咨询数据库集群搭建方法和*** | |
CN112288584A (zh) | 保险报案处理方法、装置、计算机可读介质及电子设备 | |
CN117130593A (zh) | 代码处理方法、***和电子设备 | |
CN112287077A (zh) | 用于文档的结合rpa和ai的语句提取方法、装置、存储介质及电子设备 | |
CN114490969B (zh) | 基于表格的问答方法、装置以及电子设备 | |
CN111125368A (zh) | 基于目标对象的法律意见书生成方法 | |
CN116186219A (zh) | 一种人机对话交互方法方法、***及存储介质 | |
KR102118322B1 (ko) | 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법 | |
CN112036188A (zh) | 一种质检例句推荐的方法及装置 | |
CN110209831A (zh) | 模型生成、语义识别的方法、***、设备及存储介质 | |
CN113886553A (zh) | 一种文本生成方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |