CN114185929B - 一种获取用于数据查询的可视化配置的方法及装置 - Google Patents

一种获取用于数据查询的可视化配置的方法及装置 Download PDF

Info

Publication number
CN114185929B
CN114185929B CN202210135224.8A CN202210135224A CN114185929B CN 114185929 B CN114185929 B CN 114185929B CN 202210135224 A CN202210135224 A CN 202210135224A CN 114185929 B CN114185929 B CN 114185929B
Authority
CN
China
Prior art keywords
query
data item
item
target data
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210135224.8A
Other languages
English (en)
Other versions
CN114185929A (zh
Inventor
李俊
陈倩倩
黄亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210135224.8A priority Critical patent/CN114185929B/zh
Publication of CN114185929A publication Critical patent/CN114185929A/zh
Application granted granted Critical
Publication of CN114185929B publication Critical patent/CN114185929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供了一种获取用于数据查询的可视化配置的方法,包括:获取用于对数据存储***进行数据查询的第一语句,第一语句基于自然语言;基于第一语句的自然语义,生成查询逻辑树,查询逻辑树指示,依据自然语义中包含的数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;根据查询逻辑树,确定目标数据项以及查询条件;可视化展示目标数据项以及查询条件。

Description

一种获取用于数据查询的可视化配置的方法及装置
技术领域
本说明书一个或多个实施例涉及自然语言处理领域和数据分析领域,尤其涉及一种获取用于数据查询的可视化配置的方法及装置。
背景技术
在数据分析领域,为了降低数据分析门槛,用户可以通过自然语言表述的方式进行数据查询。但是,很多用户不是专业的分析师,对于数据分析领域并不精通。而根据现有的利用自然语言的数据查询方案,用户还难以对其输入的自然语言的准确性进行确认,从而影响最终获取的查询结果的正确率。
发明内容
本说明书中的实施例旨在提供一种新的数据查询方法。该方法根据自然语言形式的自然查询语句,生成表达查询逻辑、且与数据具体存储方式无关的查询逻辑树,然后根据查询逻辑树生成展现查询的基本要素的可视化配置。利用该方法,将用户输入的自然语句对应的查询要素可视化反馈给用户,便于用户确定其输入的自然语句是否对应于正确的查询要素,并在不正确时可以通过调整输入的自然语句得到正确的查询要素,以获取更准确的数据查询结果。
根据第一方面,提供了一种获取用于数据查询的可视化配置的方法,包括:
获取用于对数据存储***进行数据查询的第一语句,所述第一语句基于自然语言;
基于所述第一语句的自然语义,生成查询逻辑树,所述查询逻辑树指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;
根据所述查询逻辑树,确定所述目标数据项以及所述查询条件;
可视化展示所述目标数据项以及所述查询条件。
在一种可能的实施方式中,所述目标数据项包括指标性数据项和所述指标性数据项对应的区分维度项;
根据所述查询逻辑树,确定所述目标数据项、以及所述查询条件,包括:根据所述查询逻辑树,确定所述指标性数据项、区分维度项、以及所述查询条件;
可视化展示所述目标数据项、以及所述查询条件,包括:
可视化展示所述指标性数据项、区分维度项、以及所述查询条件。
在一种可能的实施方式中,所述查询逻辑树包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;
根据所述查询逻辑树,确定所述指标性数据项、区分维度项、以及所述查询条件,包括:
根据所述目标数据项节点,确定所述目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;
根据所述查询条件节点,确定所述查询条件。
在一种可能的实施方式中,从所述目标数据项中,确定出指标性数据项和所述区分维度项,包括:
根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。
在一种可能的实施方式中,根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项,包括:
若所述目标数据项的取值类型为数值类型,则确定所述目标数据项为数据指标项;
若所述目标数据项的取值类型为非数值类型,则确定所述目标数据项为区分维度项。
在一种可能的实施方式中,所述目标数据项、以及所述查询条件用于生成展示所述数据查询的查询结果的可视化图表。
在一种可能的实施方式中,可视化图表包括折线图、饼图、柱图和表格中的一种。
在一种可能的实施方式中,所述第一语句的自然语义还包括基于所述目标数据项进行的同比/环比计算;所述目标数据项节点包括标记同比/环比计算的节点属性;
所述方法还包括:
根据所述节点属性,确定基于所述目标数据项进行的同比/环比计算;
可视化展示所述目标数据项对应的同比/环比计算标识。
在一种可能的实施方式中,所述第一语句的自然语义还包括对于若干子查询结果的对比展示;
所述基于所述第一语句,生成查询逻辑树,包括:
基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树;
根据所述查询逻辑树,确定所述目标数据项以及所述查询条件,包括:
根据所述若干查询逻辑树,确定若干子查询分别对应的目标数据项和查询条件;
可视化展示所述目标数据项以及所述查询条件,包括:
可视化展示所述若干子查询分别对应的所述目标数据项以及所述查询条件。
在一种可能的实施方式中,在可视化展示所述目标数据项以及所述查询条件之后,还包括:
响应于用户界面操作,更新所述目标数据项、以及所述查询条件中的一项或多项,并展示更新结果。
根据第二方面,提供一种获取用于数据查询的可视化配置的装置,包括:
自然语句获取单元,配置为,获取用于对数据存储***进行数据查询的第一语句,所述第一语句基于自然语言;
查询逻辑树生成单元,配置为,基于所述第一语句的自然语义,生成查询逻辑树,所述查询逻辑树指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;
查询配置确定单元,配置为,根据所述查询逻辑树,确定所述目标数据项以及所述查询条件;
查询配置展示单元,配置为,可视化展示所述目标数据项以及所述查询条件。
在一种可能的实施方式中,所述目标数据项包括指标性数据项和所述指标性数据项对应的区分维度项;
查询配置确定单元,进一步配置为,根据所述查询逻辑树,确定所述指标性数据项、区分维度项、以及所述查询条件;
查询配置展示单元,进一步配置为,可视化展示所述指标性数据项、区分维度项、以及所述查询条件。
在一种可能的实施方式中,所述查询逻辑树包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;
查询配置确定单元,进一步配置为:
根据所述目标数据项节点,确定所述目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;
根据所述查询条件节点,确定所述查询条件。
在一种可能的实施方式中,查询配置确定单元,进一步配置为:
根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。
在一种可能的实施方式中,查询配置确定单元,进一步配置为:
若所述目标数据项的取值类型为数值类型,则确定所述目标数据项为数据指标项;
若所述目标数据项的取值类型为非数值类型,则确定所述目标数据项为区分维度项。
在一种可能的实施方式中,所述目标数据项、以及所述查询条件用于生成展示所述数据查询的查询结果的可视化图表。
在一种可能的实施方式中,可视化图表包括折线图、饼图、柱图和表格中的一种。
在一种可能的实施方式中,所述第一语句的自然语义还包括基于所述目标数据项进行的同比/环比计算;所述目标数据项节点包括标记同比/环比计算的节点属性;
所述装置还包括:
同环比计算确定单元,配置为,根据所述节点属性,确定基于所述目标数据项进行的同比/环比计算;
同环比标识展示单元,配置为,可视化展示所述目标数据项对应的同比/环比计算标识。
在一种可能的实施方式中,所述第一语句的自然语义还包括对于若干子查询结果的对比展示;
查询逻辑树生成单元,进一步配置为,基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树;
查询配置确定单元,进一步配置为,根据所述若干查询逻辑树,确定若干子查询分别对应的目标数据项和查询条件;
查询配置展示单元,进一步配置为,可视化展示所述若干子查询分别对应的所述目标数据项以及所述查询条件。
在一种可能的实施方式中,所述装置还包括:
查询配置更新单元,配置为:
在可视化展示所述目标数据项以及所述查询条件之后,响应于用户界面操作,更新所述目标数据项、以及所述查询条件中的一项或多项,并展示更新结果。
根据第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。
根据第四方面,提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。
利用以上各个方面中的方法、装置、存储介质和计算设备中的一个或多个,可以将用户输入的自然语句对应的查询要素可视化反馈给用户,便于用户确定其输入的自然语句是否对应于正确的查询要素。
附图说明
为了更清楚说明本发明实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出根据本说明书实施例的一种获取用于数据查询的可视化配置的方法的原理示意图;
图2示出根据本说明书实施例的一种获取用于数据查询的可视化配置的方法的流程图;
图3示出根据本说明书实施例的查询逻辑树的示意图;
图4示出根据本说明书实施例的根据查询逻辑树获取查询可视化配置的示意图;
图5示出根据本说明书实施例的根据查询可视化配置生成可视化图表的示意图;
图6示出根据本说明书实施例的一种获取用于数据查询的可视化配置的装置的结构图。
具体实施方式
下面将结合附图,对本发明书提供的方案进行描述。
在数据分析领域,进行数据查询的方案通常可以通过结构化查询语言SQL(Structured Query Language)实现。例如,可以提供SQL编辑器,让用户输入SQL语句进行数据查询。但是,该方案的问题在于:对用户而言,SQL并不适合做为数据分析普及化的工作语言。因此,SQL是面向数据库的领域特定语言DSL (Domain Specific Language),并不是面向数据分析的DSL。一方面,其没有表示出数据分析领域相关知识,不利于用户提高数据分析素养。另一方面,学习SQL需要理解数据库存储和结构的特定知识,相对简单一些的例如表、字段结构等,更复杂的例如处理多表关联JOIN关系的复杂SQL语法等,对于这些知识的用户理解和操作成本非常高,而用户学习这些知识和数据分析本身却并没有直接关系。
此外,在另一些方案中,用户可以通过自然语言表述的方式进行数据查询,这样做降低数据分析的门槛。但是,现有的通过自然语言进行数据查询的方案,也存在如下问题:通常大多数用户不是专业分析师,对于数据分析领域的知识并不了解,对于数据分析领域中的常规概念,例如:什么是指标性数据,什么是展示指标性数据依据的数据维度,什么是数据查询依据的筛选条件等,并不熟悉。也就是说,根据现有的通过自然语言进行数据查询的方案,用户无法直观的了解其进行数据查询中例如指标性数据、维度数据、筛选条件具体是什么。从而用户无法了解自己输入的自然语句中,对应的指标性数据、维度数据、筛选条件是什么,也就无法确定其是否正确。从而,用户可能获取了错误的查询结果,但是不知道其原因何在,如何调整自己的输入语句。
为了解决上述技术问题,本说明书实施例提供了一种获取用于数据查询的可视化配置的方法。图1示出根据本说明书实施例的一种获取用于数据查询的可视化配置的方法的原理示意图。如图1所示,该方法的核心思想是,首先,获取用户输入的自然语言形式的查询语句。然后,解析自然查询语句,获取其自然语义。根据该自然语义,确定查询的逻辑步骤(该逻辑步骤与数据的具体如何存储于数据库中无关),并利用预先设计的、用于表示查询逻辑的中间语言(IL,Intermediate language),即一种以树状结构表示查询逻辑的图形化语言,生成表示查询逻辑步骤的查询逻辑树。最后,根据查询逻辑树,确定例如包括指标性数据、维度数据、筛选条件在内的数据分析要素(即根据数据分析角度的查询配置),并可视化的展示给用户。此后,在一个实施例中,还可以根据可视化的查询配置,生成可视化图表,用于展现查询结果。
相对于现有技术中,直接根据自然语言语句获取查询结果,采用该方法,可以可视化的向用户展现,根据其输入的自然语句得到的、基于数据分析角度的查询要素,即向用户展现根据其输入的自然语句得到的查询可视化配置。用户可以直观的确认自己输入的自然语句中,对应的例如指标性数据、维度数据、筛选条件等查询要素究竟是什么,进而可以判断其输入的语句所对应的查询要素,是否对应其真正的查询目标所在。如果不对应,则例如可以调整其输入语句,然后根据调整后的输入语句对应的可视化配置,来确定调整后的输入语句是否对应其真正的查询目标。用户可以重复上述过程,直到其输入对应其真正的查询目标的自然查询语句。简而言之,通过该方法,用户可以根据向其反馈的查询可视化配置,确定其输入的自然语句是否对应于真正的查询目标,还可以依据该反馈,确定是否调整其输入语句,使其可以更接近其真正查询目标。
图2示出根据本说明书实施例的一种获取用于数据查询的可视化配置的方法的流程图。如图2所示,该方法包括如下步骤:
首先,在步骤21,获取用于对数据存储***进行数据查询的第一语句。
该步骤中,获取的第一语句是基于自然语言的语句,并用于针对数据存储***进行数据查询。在不同的实施例中,可以基于不同的具体方式获取该自然语句。在一个例子中,例如,可以获取用户通过界面输入的自然语句。本说明书实施例所关注的是获取自然语句后,根据自然语句的语言处理和数据查询过程,而对于通过何种具体方式获取该自然语句并不关注。数据存储***,是保存有用户希望通过该自然语句获取的数据的存储***。在不同的实施例中,可以是不同具体类型的数据存储***,具有不同的具体架构方式,本说明书对此均不做限定。
在得到第一语句之后,在步骤22,基于所述第一语句的自然语义,生成查询逻辑树,该查询逻辑树可以指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤。
语句的语义(semantic)即语句所蕴含的意义。也就是说,根据获取到的旨在进行数据查询的自然语句,确定包括查询条件和查询目的(目标数据项)在内的内在含义。在不同的实施例中,确定的自然语义可以具有不同的具体表现形式,本说明书对此不做限定。基于确定的自然语义,可以生成查询逻辑树。该查询逻辑树可以指示,依据自然语义中包括的查询条件,得到目标数据项的中间逻辑步骤。
图3示出根据本说明书实施例的查询逻辑树的示意图。在图3所示的实施例中,用户输入的查询语句为‘最近7天各城市消费总金额的趋势’,根据该查询语句的自然语义,可以得到该条查询语句希望获取的数据项为各城市、各个日期、以及各城市满足筛选条件(最近7天)的各个日期的消费总金额。然后,可以根据该自然语义,生成如图3所示的查询逻辑树,即以树状结构图表示上述查询中各细化的查询逻辑元素之间的结构关系。因此,根据一种实施方式,可以基于自然语义中包括的查询条件和目标数据项,以及预先定义的逻辑节点,生成查询逻辑树。逻辑节点可以表示查询中进一步细化的逻辑元素,例如,查询数据集、查询筛选条件、查询项(即查询的目标数据项)等。在不同的实施例中,逻辑节点可以具有不同的具体定义方式。例如图3所示的实施例中,逻辑节点可以包括查询节点、筛选条件节点、查询数据项节点,其中,筛选条件节点、查询数据项节点作为查询节点的子节点。其中,查询节点可以对应一个查询得到的查询数据集,筛选条件节点、查询数据项节点可以分别对应于获取该查询数据集的数据筛选条件(例如,图3所示实施例中的‘最近7天’)、以及该查询数据集包括的数据项(例如,图3所示实施例中的城市、日期、单日消费总金额)。进而,可以基于对第一语句的自然语义分析,确定查询对应的查询节点、查询节点拥有的筛选条件节点和查询数据项节点,生成查询逻辑树。
在不同的实施例中,一个查询中也可以包括多个不同的查询条件和目标数据项。因此,在一个实施例中,查询逻辑树还可以包括筛选条件组节点和查询数据项组节点;筛选条件组节点作为所述若干筛选条件节点的父节点,并作为查询节点的子节点,所述查询数据项组节点作为若干查询数据项节点的父节点,并作为查询节点的子节点。例如,图3所示的实施例中,查询节点具有子节点-查询数据项组节点,查询数据项组节点包括分别对应于3个查询数据项(城市、单日消费金额、日期)的子节点。查询节点还具有子节点-筛选条件组节点,筛选条件组节点包括分别对应于2个筛选条件的子节点,筛选条件节点1和筛选条件节点2。
在一些生产场景中,用户通过自然语句,希望获取针对特定统计值的环/同比计算的结果。例如,在一个例子中,用户输入的自然查询语句是‘昨天各商品类别的商品数量之和的日环比’,即该查询语句的自然语义指示了基于目标数据项(商品数量和)进行的环比计算。因此,在一个实施例中,第一语句的自然语义还可以包括基于目标数据项进行的同比/环比计算。与之相应,在一个具体的实施例中,第一语句对应的查询逻辑树中,目标数据项节点可以包括标记同比/环比计算的节点属性。例如上述查询为‘昨天各商品类别的商品数量之和的日环比’的例子中,对应的查询逻辑树例如包括对应于目标数据项‘商品数量和’的目标数据项节点,该节点可以具有标记环比计算的节点属性。在不同的实施例中,该节点属性中还可以包括所述同比/环比计算的计算类型和颗粒度信息。在一个实施例中,所述计算类型可以为同/环比率计算、同/环比值计算和同/环比差值计算中的一种。在另一个实施例中,颗粒度信息可以为日环/同比、周环/同比、月环/同比、季环/同比、年环/同比中的一种。
在另一些生产场景中,用户通过自然语句,希望获取若干查询结果集的对比显示。用户输入的自然查询语句是‘前天城市A的基础组的各商品类别的商品数量之和,与昨天城市B的对比组的各商品种类的商品数量之和的对比’。即该查询语句的自然语义指示了若干查询结果(基础组查询和对比组查询)的对比。因此,在一个实施例中,第一语句的自然语义还可以包括对于若干子查询结果的对比展示;可以基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树。
此外,可以看到,查询逻辑树表示的查询要素之间的关系,不涉及其查询的数据在例如数据库中的具体存储结构,例如不涉及城市、消费金额保存于数据库中的哪些表里,这些表之间关系是什么。
在得到查询逻辑树后,在步骤23,根据所述查询逻辑树,确定所述目标数据项以及所述查询条件。
该步骤中,确定目标数据项以及查询条件,是为了在后续步骤中向用户可视化展示。为了进一步明确目标数据项在数据分析中的效用,还可以从目标数据项中确定出指标性数据项和指标性数据项对应的区分维度项,并在后续步骤中展示。其中,指标性数据项是查询旨在获取的分析性数据指标,区分维度项是区别不同的指标性数据所依据的维度数据。因此,在一个实施例中,可以根据查询逻辑树,确定所述指标性数据项、区分维度项、以及查询条件。在另一个实施例中,查询逻辑树可以包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;可以根据目标数据项节点,确定目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;根据所述查询条件节点,确定所述查询条件。例如,图3所示的例子中,从查询逻辑树可以确定的目标数据项有3个,分别为‘城市’、‘单日消费总金额’、‘日期’,从中,可以确定出指标性数据项‘单日消费总金额’。并且,为了清楚的表示指标性数据项,通常查询中还可以包括展示指标性数据所依据的维度数据项,例如,图3中的‘城市’、‘日期’项。图3所示中,从查询逻辑树还可以确定的筛选条件有2个,分别为日期大于‘20200101’和日期小于‘20200107’(假设该日期为最近7天)。
在一个具体的实施例中,可以根据目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。例如,在一个例子中,若目标数据项的取值类型为数值类型,则可以确定所述目标数据项为数据指标项;若目标数据项的取值类型为非数值类型,则可以确定所述目标数据项为区分维度项。图4示出根据本说明书实施例的根据查询逻辑树获取查询可视化配置的示意图,如图4所示,可以根据单日总金额数据项(该项可以其对应的目标数据项节点确定)的数据类型为数值型,确定其为指标数据项。根据城市、日期的数据类型为非数值型,确定其为区分维度项。还可以根据筛选条件节点,确定查询的筛选条件为‘最近七天’。在另一个例子中,该筛选条件也可以具有其他的具体表示方式,例如与‘最近7天’等效的“日期大于‘20200101’并且小于‘20200107’”,本说明书对此不作限制。
在上述目标数据项节点包括标记同比/环比计算的节点属性的实施例中,还可以根据该节点属性,确定基于所述目标数据项进行的同比/环比计算。在一个具体的实施例中,可以进一步确定同比/环比计算的计算类型和计算颗粒度信息。需要注意的是,本说明书实施例并不关注同比/环比运算的具体实施方式,而只关注从数据分析角度,确定和展示用户通过自然语言表达的进行同比/环比计算的目的。
在上述生成若干子查询分别对应的查询逻辑树的实施例中,害可以根据所述若干查询逻辑树,确定若干子查询分别对应的目标数据项和查询条件。需要注意的是,本说明书实施例也不关注若干子查询的具体实施方式,而只关注从数据分析角度,确定和展示用户通过自然语言表达的进行若干子查询结果的对比展示的目的。
此后,在步骤24,可视化展示目标数据项以及查询条件。
该步骤中,向用户可视化展示步骤23中确定的目标数据项以及查询条件。在上述目标数据项包括指标性数据项和区分维度项的实施例中,可以可视化展示所述指标性数据项、区分维度项、以及查询条件。在不同的实施例中,可以具有可视化展示的具体方式,本说明书对此不做限定。
在上述查询旨在针对目标数据项进行同比/环比计算的实施例中,可以可视化展示所述目标数据项对应的同比/环比计算标识。在一个具体的实施例中,可以进一步展示同比/环比计算的计算类型和计算颗粒度信息。
在上述查询旨在得到若干子查询的结果对比的实施例中,可以可视化展示所述若干子查询,以及其分别对应的目标数据项以及查询条件。在一个具体的实施例中,各子查询对应的目标数据项包括指标性数据项和区分维度项,可以可视化展示所述若干子查询,以及其分别对应的目标数据项、区分维度项、以及查询条件。
在一个实施例中,目标数据项、以及所述查询条件可以用于生成展示所述数据查询的查询结果的可视化图表。在不同的实施例中,生成可视化图表的具体方式可以不同,本说明书对此不做限制。在上述目标数据项包括指标性数据项和区分维度项的实施例中,指标性数据项、区分维度项、以及所述查询条件可以用于生成展示所述数据查询的查询结果的可视化图表。在一个具体的实施例中,可视化图表可以包括折线图、饼图、柱图和表格中的一种。图5示出根据本说明书实施例的根据查询可视化配置生成可视化图表的示意图。如图5所示,例如根据查询可视化配置,生成查询结果折线图。具体的,例如可以通过指标数据项‘单日消费总金额’,确定折线图中的y轴。可以通过区分维度项‘日期’,确定折线图中的x轴(通过日期区分不同单日的消费额)。可以通过区分维度项‘城市’,生成不同城市的最近七天的‘单日消费总金额’折线图。
在可视化展示所述目标数据项以及所述查询条件之后,用户可以基于界面操作对目标数据项以及查询条件进行修改,例如添加其他的目标数据项(例如,指标性数据项或区分维度项)或查询条件、删除已有的目标数据项或查询条件、修改已有的查询条件的查询参数等。因此。在一个实施例中,还可以响应于用户界面操作,更新所述目标数据项、以及所述查询条件中的一项或多项,并展示更新结果。
上面介绍了根据本说明书实施例的一种获取用于数据查询的可视化配置的方法。根据另一方面的实施例,还提供一种获取用于数据查询的可视化配置的装置。图6示出根据本说明书实施例的一种获取用于数据查询的可视化配置的装置的结构图。如图6所示,该装置600包括:
自然语句获取单元61,配置为,获取用于对数据存储***进行数据查询的第一语句,所述第一语句基于自然语言;
查询逻辑树生成单元62,配置为,基于所述第一语句的自然语义,生成查询逻辑树,所述查询逻辑树指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;
查询配置确定单元63,配置为,根据所述查询逻辑树,确定所述目标数据项以及所述查询条件;
查询配置展示单元64,配置为,可视化展示所述目标数据项以及所述查询条件。
在一个实施例中,目标数据项可以包括指标性数据项和所述指标性数据项对应的区分维度项;
查询配置确定单元,可以进一步配置为,根据所述查询逻辑树,确定所述指标性数据项、区分维度项、以及所述查询条件;
查询配置展示单元,可以进一步配置为,可视化展示所述指标性数据项、区分维度项、以及所述查询条件。
在一个实施例中,查询逻辑树可以包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;
查询配置确定单元,可以进一步配置为:
根据所述目标数据项节点,确定所述目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;
根据所述查询条件节点,确定所述查询条件。
在一个实施例中,查询配置确定单元,可以进一步配置为:
根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。
在一个实施例中,查询配置确定单元,可以进一步配置为:
若所述目标数据项的取值类型为数值类型,则确定所述目标数据项为数据指标项;
若所述目标数据项的取值类型为非数值类型,则确定所述目标数据项为区分维度项。
在一个实施例中,目标数据项、以及查询条件,可以用于生成展示所述数据查询的查询结果的可视化图表。
在一个实施例中,可视化图表可以包括折线图、饼图、柱图和表格中的一种。
在一个实施例中,第一语句的自然语义还可以包括基于目标数据项进行的同比/环比计算;目标数据项节点可以包括标记同比/环比计算的节点属性;
所述装置还可以包括:
同环比计算确定单元,配置为,根据所述节点属性,确定基于所述目标数据项进行的同比/环比计算;
同环比标识展示单元,配置为,可视化展示所述目标数据项对应的同比/环比计算标识。
在一个实施例中,第一语句的自然语义还可以包括对于若干子查询结果的对比展示;
查询逻辑树生成单元,可以进一步配置为,基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树;
查询配置确定单元,可以进一步配置为,根据所述若干查询逻辑树,确定若干子查询分别对应的目标数据项和查询条件;
查询配置展示单元,可以进一步配置为,可视化展示所述若干子查询分别对应的所述目标数据项以及所述查询条件。
在一个实施例中,所述装置还可以包括:
查询配置更新单元,配置为:
在可视化展示所述目标数据项以及所述查询条件之后,响应于用户界面操作,更新所述目标数据项、以及所述查询条件中的一项或多项,并展示更新结果。
根据又一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述的方法。
需要理解,本文中的“第一”,“第二”等描述,仅仅为了描述的简单而对相似概念进行区分,并不具有其他限定作用。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (16)

1.一种获取用于数据查询的可视化配置的方法,包括:
获取用于对数据存储***进行数据查询的第一语句,所述第一语句基于自然语言;
基于所述第一语句的自然语义,生成查询逻辑树,所述查询逻辑树指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;
根据所述查询逻辑树,确定指标性数据项、区分维度项、以及所述查询条件;其中,所述指标性数据项是所述目标数据项中数值型的分析性数据指标,区分维度项是所述目标数据项中区别不同的指标性数据所依据的非数值型维度数据;
可视化展示所述指标性数据项、区分维度项、以及所述查询条件;
利用所述指标性数据项、区分维度项、以及所述查询条件生成展示所述数据查询的查询结果的可视化图表,所述可视化图表包括折线图、饼图、柱图和表格中的一种,当所述可视化图表包括折线图时,所述折线图分别以所述指标数据项和区分维度项为两个轴而生成。
2.根据权利要求1所述的方法,其中,所述查询逻辑树包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;
根据所述查询逻辑树,确定指标性数据项、区分维度项、以及所述查询条件,包括:
根据所述目标数据项节点,确定所述目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;
根据所述查询条件节点,确定所述查询条件。
3.根据权利要求2所述的方法,其中,从所述目标数据项中,确定出指标性数据项和所述区分维度项,包括:
根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。
4.根据权利要求3所述的方法,其中,根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项,包括:
若所述目标数据项的取值类型为数值类型,则确定所述目标数据项为数据指标项;
若所述目标数据项的取值类型为非数值类型,则确定所述目标数据项为区分维度项。
5.根据权利要求2所述的方法,其中,所述第一语句的自然语义还包括基于所述目标数据项进行的同比/环比计算;所述目标数据项节点包括标记同比/环比计算的节点属性;
所述方法还包括:
根据所述节点属性,确定基于所述目标数据项进行的同比/环比计算;
可视化展示所述目标数据项对应的同比/环比计算标识。
6.根据权利要求1所述的方法,其中,所述第一语句的自然语义还包括对于若干子查询结果的对比展示;
所述基于所述第一语句,生成查询逻辑树,包括:
基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树;
根据所述查询逻辑树,确定指标性数据项、区分维度项、以及所述查询条件,包括:
根据所述若干查询逻辑树,确定若干子查询分别对应的所述指标性数据项、区分维度项、以及所述查询条件;
可视化展示所述指标性数据项、区分维度项、以及所述查询条件,包括:
可视化展示所述若干子查询分别对应的所述指标性数据项、区分维度项、以及所述查询条件。
7.根据权利要求1所述的方法,其中,在可视化展示所述指标性数据项、区分维度项、以及所述查询条件之后,还包括:
响应于用户界面操作,更新所述指标性数据项、区分维度项、以及所述查询条件中的一项或多项,并展示更新结果。
8.一种获取用于数据查询的可视化配置的装置,包括:
自然语句获取单元,配置为,获取用于对数据存储***进行数据查询的第一语句,所述第一语句基于自然语言;
查询逻辑树生成单元,配置为,基于所述第一语句的自然语义,生成查询逻辑树,所述查询逻辑树指示,依据所述自然语义中包含的所述数据查询依据的查询条件,得到旨在获取的目标数据项的中间逻辑步骤;
查询配置确定单元,配置为,根据所述查询逻辑树,确定所述指标性数据项、区分维度项、以及所述查询条件;其中,所述指标性数据项是所述目标数据项中数值型的分析性数据指标,区分维度项是所述目标数据项中区别不同的指标性数据所依据的非数值型维度数据;
查询配置展示单元,配置为,可视化展示所述指标性数据项、区分维度项、以及所述查询条件,以及,利用所述指标性数据项、区分维度项、以及所述查询条件生成展示所述数据查询的查询结果的可视化图表,所述可视化图表包括折线图、饼图、柱图和表格中的一种,当所述可视化图表包括折线图时,所述折线图分别以所述指标数据项和区分维度项为两个轴而生成。
9.根据权利要求8所述的装置,其中,所述查询逻辑树包括对应于所述目标数据项的目标数据项节点、以及对应于所述查询条件的查询条件节点;
查询配置确定单元,进一步配置为:
根据所述目标数据项节点,确定所述目标数据项;从所述目标数据项中,确定出指标性数据项和所述区分维度项;
根据所述查询条件节点,确定所述查询条件。
10.根据权利要求9所述的装置,其中,查询配置确定单元,进一步配置为:
根据所述目标数据项的取值类型,确定所述目标数据项为指标性数据项或区分维度项。
11.根据权利要求10所述的装置,其中,查询配置确定单元,进一步配置为:
若所述目标数据项的取值类型为数值类型,则确定所述目标数据项为数据指标项;
若所述目标数据项的取值类型为非数值类型,则确定所述目标数据项为区分维度项。
12.根据权利要求9所述的装置,其中,所述第一语句的自然语义还包括基于所述目标数据项进行的同比/环比计算;所述目标数据项节点包括标记同比/环比计算的节点属性;
所述装置还包括:
同环比计算确定单元,配置为,根据所述节点属性,确定基于所述目标数据项进行的同比/环比计算;
同环比标识展示单元,配置为,可视化展示所述目标数据项对应的同比/环比计算标识。
13.根据权利要求8所述的装置,其中,所述第一语句的自然语义还包括对于若干子查询结果的对比展示;
查询逻辑树生成单元,进一步配置为,基于所述第一语句,生成若干子查询分别对应的若干查询逻辑树;
查询配置确定单元,进一步配置为,根据所述若干查询逻辑树,确定若干子查询分别对应的所述指标性数据项、区分维度项、以及所述查询条件;
查询配置展示单元,进一步配置为,可视化展示所述若干子查询分别对应的所述指标性数据项、区分维度项、以及所述查询条件。
14.根据权利要求8所述的装置,还包括:
查询配置更新单元,配置为:
在可视化展示所述指标性数据项、区分维度项、以及所述查询条件之后,响应于用户界面操作,更新所述指标性数据项、区分维度项、以及所述查询条件中的一项或多项,并展示更新结果。
15.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项的所述的方法。
16.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
CN202210135224.8A 2022-02-15 2022-02-15 一种获取用于数据查询的可视化配置的方法及装置 Active CN114185929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210135224.8A CN114185929B (zh) 2022-02-15 2022-02-15 一种获取用于数据查询的可视化配置的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210135224.8A CN114185929B (zh) 2022-02-15 2022-02-15 一种获取用于数据查询的可视化配置的方法及装置

Publications (2)

Publication Number Publication Date
CN114185929A CN114185929A (zh) 2022-03-15
CN114185929B true CN114185929B (zh) 2022-11-22

Family

ID=80545921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210135224.8A Active CN114185929B (zh) 2022-02-15 2022-02-15 一种获取用于数据查询的可视化配置的方法及装置

Country Status (1)

Country Link
CN (1) CN114185929B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021189195A1 (zh) * 2020-03-23 2021-09-30 深圳市欢太科技有限公司 数据查询方法、装置、服务器及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080235199A1 (en) * 2007-03-19 2008-09-25 Yunyao Li Natural language query interface, systems, and methods for a database
CN103226606B (zh) * 2013-04-28 2016-08-10 浙江核新同花顺网络信息股份有限公司 查询选取方法及***
US20190102390A1 (en) * 2017-09-29 2019-04-04 Novabase Sgps, S.A. Semantic search engine and visualization platform
CN110727839B (zh) * 2018-06-29 2024-04-26 微软技术许可有限责任公司 自然语言查询的语义解析

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021189195A1 (zh) * 2020-03-23 2021-09-30 深圳市欢太科技有限公司 数据查询方法、装置、服务器及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Using Top Trees For Easy Programming of Tree Algorithms;Vajbar;《CEUR WORKSHOP PROCEEDINGS》;20091231;全文 *
一种数据库汉语查询接口的设计与实现;郝亮等;《计算机技术与发展》;20100610(第06期);全文 *

Also Published As

Publication number Publication date
CN114185929A (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
US9798748B2 (en) Database query builder
JP4965088B2 (ja) データ抽象化モデルにおける関係管理
US7574652B2 (en) Methods for interactively defining transforms and for generating queries by manipulating existing query data
US7644361B2 (en) Method of using recommendations to visually create new views of data across heterogeneous sources
EP1643386A2 (en) Easy-to-use data context filtering
US20060116999A1 (en) Sequential stepwise query condition building
US20040158567A1 (en) Constraint driven schema association
US20040015481A1 (en) Patent data mining
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
Luo et al. Form operation by example: A language for office information processing
US11068131B1 (en) Integrated drill down within a natural language interface for a data analysis platform
CN110442620B (zh) 一种大数据探索和认知方法、装置、设备以及计算机存储介质
US8024656B2 (en) Data analysis using facet attributes
Yu et al. Design and implementation of curriculum system based on knowledge graph
Reichardt et al. Benchmarking the operation times of NoSQL and MySQL databases for Python clients
EP1745390A2 (en) Data and metadata linking form mechanism and method
CN114185929B (zh) 一种获取用于数据查询的可视化配置的方法及装置
Candel et al. Skiql: A unified schema query language
Shrestha et al. Schema matching and data integration with consistent naming on protein crystallization screens
El-Mahgary et al. A form-based query interface for complex queries
BR112021005061A2 (pt) análise de expressões de linguagem natural em uma interface de usuário de visualização de dados
US20220012242A1 (en) Hierarchical datacube query plan generation
CN114817512A (zh) 问答推理方法及装置
WO2003019843A2 (en) Method and apparatus for formatting a data grid for the display of a view
US20230185797A1 (en) Systems and methods for generation and display of query visualizations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant