CN110377659A - 一种智能图表推荐***及方法 - Google Patents

一种智能图表推荐***及方法 Download PDF

Info

Publication number
CN110377659A
CN110377659A CN201910680819.XA CN201910680819A CN110377659A CN 110377659 A CN110377659 A CN 110377659A CN 201910680819 A CN201910680819 A CN 201910680819A CN 110377659 A CN110377659 A CN 110377659A
Authority
CN
China
Prior art keywords
data
module
field
chart
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910680819.XA
Other languages
English (en)
Inventor
彭林伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Digital Data Technology Co Ltd
Original Assignee
Nanjing Digital Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Digital Data Technology Co Ltd filed Critical Nanjing Digital Data Technology Co Ltd
Priority to CN201910680819.XA priority Critical patent/CN110377659A/zh
Publication of CN110377659A publication Critical patent/CN110377659A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于计算机数据处理技术领域,具体地说,是一种智能图表推荐***及方法,包括数据字段数据类型探索模块、数据字段类型模式组合模块、数据内容特征探索模块、数据字段类型模式匹配模块、数据内容特征识别模块、智能图表推荐模块,其中,数据字段数据类型探索模块用于探索给定数据的各个字段的格式类型,数据字段模式组合模块用于将字段的格式类型组合成为一个待匹配的模式,数据内容特征探索模块用于探索给定数据的内容特征,数据字段模式匹配模式用于匹配适合于字段模式的图表类型,数据内容特征识别模块用于识别适合于数据内容特征的图表类型,智能图表推荐模块用于根据匹配与识别的结果智能推荐可视化图表。

Description

一种智能图表推荐***及方法
技术领域
本发明属于计算机数据处理技术领域,具体地说,是一种智能图表推荐***及方法,用于智能快速的进行数据的可视化,大幅降低进行数据可视化时需要的技术能力与操作门槛。
背景技术
目前我们正处于大数据时代,各行各业每时每刻都在产生大量的数据,如何从如此海量的数据中发现价值规律是摆在每个从业人员面前的一个大难题,而传统的数据可视化在根据数据做展示图表时,往往需要作图人员清楚的了解各种类型的图表对于数据本身的要求,同时还必须具有一定的数据分析、商业智能的专业背景,例如作图人员需要非常清楚维度与度量是什么意思,对比维度与对比数值是什么意思,饼图需要几个维度字段和几个数值字段,折线图需要几个维度字段和几个数值字段,饼图的最佳展示效果要求维度值在多少的范围之内等等。这些专业知识背景大大增加了数据分析的难度,提高了数据分析的门槛,使得大量的数据无法得到有效的分析。
发明内容
为了解决上述技术问题,本发明披露了一种智能图表推荐***及方法,使用者几乎不需要具备任何数据分析、商业智能的专业背景的前提下,也能够快速、准确的将拥有的数据进行有效可视化,使用者只需要将希望进行可视化的数据输入***中,***即可根据数据中字段的模式以及数据内容本身的特征智能的推荐可视化图表进行数据的展示,极大地减少了数据分析的难度,降低了数据分析的门槛,使得人人都可以参与到数据分析之中。
本发明采用的具体技术方案如下:
一种智能图表推荐***,包括数据字段数据类型探索模块、数据字段类型模式组合模块、数据内容特征探索模块、数据字段类型模式匹配模块、数据内容特征识别模块、智能图表推荐模块,其中,数据字段数据类型探索模块用于探索给定数据的各个字段的格式类型,数据字段模式组合模块用于将字段的格式类型组合成为一个待匹配的模式,数据内容特征探索模块用于探索给定数据的内容特征,数据字段模式匹配模式用于匹配适合于字段模式的图表类型,数据内容特征识别模块用于识别适合于数据内容特征的图表类型,智能图表推荐模块用于根据匹配与识别的结果智能推荐可视化图表。
本发明还披露了一种智能图表推荐方法,包括以下步骤:
步骤一:对给定的数据DATA在数据字段数据类型探索模块中通过机器学习算法对每个字段的数据类型进行识别,得出每个字段的数据类型;
步骤二:将希望可视化的字段在数据字段类型模式组合模块中将各个字段的数据类型按照模式组合后得到一个待匹配的模式pattern;
步骤三:对数据通过数据内容特征探索模块进行数据内容本身的特征探索,得到数据特征模型model;
步骤四:将之前得到的待匹配的模式pattern在所有可用的图表中进行模式匹配,得到一个待选可用的图表集charts’;
步骤五:将之前得到的数据特征模型model在待选可用的图表集charts’中进行识别匹配,每一个图表都会得到一个匹配度的分数;
步骤六:将图表得到的分数进行排序后,智能推荐得分高的图表进行数据可视化。
本发明的有益效果:本发明披露的一种智能图表推荐***及方法屏蔽了数据分析的专业术语与要求,突破了使用者的专业限制。它只需要使用者选择好需要做可视化的数据,***即可根据数据的字段模式与数据内容特征智能的推荐最适合的图表进行可视化。
附图说明
图1是本发明的实施例流程示意图。
具体实施方式
为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
一种智能图表推荐***,包括数据字段数据类型探索模块、数据字段类型模式组合模块、数据内容特征探索模块、数据字段类型模式匹配模块、数据内容特征识别模块、智能图表推荐模块,其中,数据字段数据类型探索模块用于探索给定数据的各个字段的格式类型,数据字段模式组合模块用于将字段的格式类型组合成为一个待匹配的模式,数据内容特征探索模块用于探索给定数据的内容特征,数据字段模式匹配模式用于匹配适合于字段模式的图表类型,数据内容特征识别模块用于识别适合于数据内容特征的图表类型,智能图表推荐模块用于根据匹配与识别的结果智能推荐可视化图表。
一种智能图表推荐方法,包括以下步骤:
步骤一:对给定的数据DATA在数据字段数据类型探索模块中通过机器学习算法对每个字段的数据类型进行识别,得出每个字段的数据类型;
步骤二:将希望可视化的字段在数据字段类型模式组合模块中将各个字段的数据类型按照模式组合后得到一个待匹配的模式pattern;
步骤三:对数据通过数据内容特征探索模块进行数据内容本身的特征探索,得到数据特征模型model;
步骤四:将之前得到的待匹配的模式pattern在所有可用的图表中进行模式匹配,得到一个待选可用的图表集charts’;
步骤五:将之前得到的数据特征模型model在待选可用的图表集charts’中进行识别匹配,每一个图表都会得到一个匹配度的分数;
步骤六:将图表得到的分数进行排序后,智能推荐得分高的图表进行数据可视化。
实施例:如图1所示,一种智能图表推荐方法具体步骤如下:
首先我们拥有一个待可视化分析的数据集T,假设T中一共有5个字段,分别为C1、C2、C3、C4和C5,此时我们需要对T中每一个字段的数据类型进行自动识别,识别算法为f(T),即
Type(C1…C5)=f(T)。
此时我们假设得到的5个字段的数据类型分别为:字符串、日期、数字、数字、数字,即数据类型序列为:String、Date、Number、Number、Number,为了便于后续描述,此处可以简写为SDNNN。
然后用户根据可视化需要选择若干个字段进行分析展示,此时我们假设用户选择了C1、C3和C4这三个字段进行可视化展示,那么此时待展示的字段列表的数据字段模式P就是字符串、数字、数字。即
P=SNN
然后我们将从所有已有图表的模式库Ps中进行模式的匹配,以下是已有图表的模式库Ps的部分信息:
使用模式P=SNN在上述的图表模式中进行匹配,可以匹配到的模式为??N、?...?N以及?N…N,但是根据数据类型更加明确的进行匹配,可以发现模式Q=?N…N将更加满足模式P的匹配度,故而此时应将模式Q作为最满足的匹配模式,此时筛选出的图表类型为:基础折线、折线面积、堆叠面积、基础柱状、堆叠柱状、散点图以及雷达图。即
Ps’={基础折线、折线面积、堆叠面积、基础柱状、堆叠柱状、雷达图}
然后我们根据选定的字段C1、C3、C4对实际的数据内容特征进行分析建模,为了描述简单,将从结果数据条数,数字的量级,结果数据是否强顺序性三个特征进行建模。假设我们分析数据内容特征后发现数据内容特征M为结果数据条数为10条,字段C3的量级为千,字段C4的量级也为千,结果数据没有强顺序性,即
M={条数10;字段量级1为千,字段量级2为千;结果数据无强顺序性}
然后我们将从Ps’中进行特征的匹配,以下是Ps’图表库的特征信息:
根据当前的数据特征M到上表中进行识别匹配,可以得到如下的结果表:
可以发现其中基础柱状图与堆叠柱状图的得分基本相同,并列最高,故而***此时将自动推荐基础柱状图与堆叠柱状图进行数据的可视化。
由于实际可视化过程中的图表类型远大于上述表格中的类型,故而针对每一种的数据字段类型模式与数据内容特征模型***均会智能的匹配最适合的图表,而无需使用者具备非常专业的数据分析背景知识,大大提升了数据分析可视化的效率,降低了数据分析可视化的使用门槛。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (2)

1.一种智能图表推荐***,其特征在于,包括数据字段数据类型探索模块、数据字段类型模式组合模块、数据内容特征探索模块、数据字段类型模式匹配模块、数据内容特征识别模块、智能图表推荐模块,其中,所述数据字段数据类型探索模块用于探索给定数据的各个字段的格式类型,所述数据字段模式组合模块用于将字段的格式类型组合成为一个待匹配的模式,所述数据内容特征探索模块用于探索给定数据的内容特征,所述数据字段模式匹配模式用于匹配适合于字段模式的图表类型,所述数据内容特征识别模块用于识别适合于数据内容特征的图表类型,所述智能图表推荐模块用于根据匹配与识别的结果智能推荐可视化图表。
2.一种智能图表推荐方法,其特征在于,包括以下步骤:
步骤一:对给定的数据DATA在数据字段数据类型探索模块中通过机器学习算法对每个字段的数据类型进行识别,得出每个字段的数据类型;
步骤二:将希望可视化的字段在数据字段类型模式组合模块中将各个字段的数据类型按照模式组合后得到一个待匹配的模式pattern;
步骤三:对数据通过数据内容特征探索模块进行数据内容本身的特征探索,得到数据特征模型model;
步骤四:将之前得到的待匹配的模式pattern在所有可用的图表中进行模式匹配,得到一个待选可用的图表集charts’;
步骤五:将之前得到的数据特征模型model在待选可用的图表集charts’中进行识别匹配,每一个图表都会得到一个匹配度的分数;
步骤六:将图表得到的分数进行排序后,智能推荐得分高的图表进行数据可视化。
CN201910680819.XA 2019-07-25 2019-07-25 一种智能图表推荐***及方法 Pending CN110377659A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910680819.XA CN110377659A (zh) 2019-07-25 2019-07-25 一种智能图表推荐***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910680819.XA CN110377659A (zh) 2019-07-25 2019-07-25 一种智能图表推荐***及方法

Publications (1)

Publication Number Publication Date
CN110377659A true CN110377659A (zh) 2019-10-25

Family

ID=68256332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910680819.XA Pending CN110377659A (zh) 2019-07-25 2019-07-25 一种智能图表推荐***及方法

Country Status (1)

Country Link
CN (1) CN110377659A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881311A (zh) * 2020-08-06 2020-11-03 泰山信息科技有限公司 一种图表类型的智能推荐方法、装置、设备及存储介质
CN112256789A (zh) * 2020-10-19 2021-01-22 杭州比智科技有限公司 数据智能可视化分析方法和装置
CN112819918A (zh) * 2021-01-29 2021-05-18 北京易莱信科技有限公司 可视化图表的智能生成方法及装置
CN113986904A (zh) * 2021-11-08 2022-01-28 深圳赛诺百应科技有限公司 一种基于互联网的商业智能数据分析***
WO2023142482A1 (zh) * 2022-01-26 2023-08-03 华为云计算技术有限公司 一种图表组件选择方法和数据可视化设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964084A (zh) * 2010-09-26 2011-02-02 南京中图数码科技有限公司 应用于城市综合管线***的动态网络结构智能建模及处理方法
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和***
CN106407170A (zh) * 2016-09-30 2017-02-15 上海冰穹网络科技有限公司 数据报表快速生成方法及***
CN107180117A (zh) * 2017-06-30 2017-09-19 东软集团股份有限公司 图表推荐方法、装置和计算机设备
CN108255897A (zh) * 2017-02-17 2018-07-06 平安科技(深圳)有限公司 可视化图表数据转换处理方法和装置
CN108268953A (zh) * 2018-01-12 2018-07-10 天津瑞源电气有限公司 基于特征数据采集算法的设备追溯方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964084A (zh) * 2010-09-26 2011-02-02 南京中图数码科技有限公司 应用于城市综合管线***的动态网络结构智能建模及处理方法
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和***
CN106407170A (zh) * 2016-09-30 2017-02-15 上海冰穹网络科技有限公司 数据报表快速生成方法及***
CN108255897A (zh) * 2017-02-17 2018-07-06 平安科技(深圳)有限公司 可视化图表数据转换处理方法和装置
CN107180117A (zh) * 2017-06-30 2017-09-19 东软集团股份有限公司 图表推荐方法、装置和计算机设备
CN108268953A (zh) * 2018-01-12 2018-07-10 天津瑞源电气有限公司 基于特征数据采集算法的设备追溯方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881311A (zh) * 2020-08-06 2020-11-03 泰山信息科技有限公司 一种图表类型的智能推荐方法、装置、设备及存储介质
CN111881311B (zh) * 2020-08-06 2023-06-23 泰山信息科技有限公司 一种图表类型的智能推荐方法、装置、设备及存储介质
CN112256789A (zh) * 2020-10-19 2021-01-22 杭州比智科技有限公司 数据智能可视化分析方法和装置
CN112256789B (zh) * 2020-10-19 2022-06-17 杭州比智科技有限公司 数据智能可视化分析方法和装置
CN112819918A (zh) * 2021-01-29 2021-05-18 北京易莱信科技有限公司 可视化图表的智能生成方法及装置
CN113986904A (zh) * 2021-11-08 2022-01-28 深圳赛诺百应科技有限公司 一种基于互联网的商业智能数据分析***
WO2023142482A1 (zh) * 2022-01-26 2023-08-03 华为云计算技术有限公司 一种图表组件选择方法和数据可视化设备

Similar Documents

Publication Publication Date Title
CN110377659A (zh) 一种智能图表推荐***及方法
CN107766371A (zh) 一种文本信息分类方法及其装置
CN107563381A (zh) 基于全卷积网络的多特征融合的目标检测方法
CN110427990A (zh) 一种基于卷积神经网络的艺术图像分类方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN109740686A (zh) 一种基于区域池化和特征融合的深度学习图像多标记分类方法
CN106095893A (zh) 一种跨媒体检索方法
CN103106262B (zh) 文档分类、支持向量机模型生成的方法和装置
CN106126585B (zh) 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN109492026A (zh) 一种基于改进的主动学习技术的电信欺诈分类检测方法
CN110059697A (zh) 一种基于深度学习的肺结节自动分割方法
WO2021051864A1 (zh) 词典扩充方法及装置、电子设备、存储介质
CN109446333A (zh) 一种实现中文文本分类的方法及相关设备
CN107273295A (zh) 一种基于文本混乱度的软件问题报告分类方法
CN109002463A (zh) 一种基于深度度量模型的文本检测方法
CN112836067B (zh) 基于知识图谱的智能搜索方法
CN101894263A (zh) 基于水平集和局部敏感判别映射的植物物种计算机辅助分类***及分类方法
CN112365471A (zh) 基于深度学习的***细胞智能检测方法
Shete et al. TasselGAN: An application of the generative adversarial model for creating field-based maize tassel data
CN110008828A (zh) 基于差异正则化的成对约束成分分析度量优化方法
CN104573701B (zh) 一种玉米雄穗性状的自动检测方法
CN107392251A (zh) 一种使用分类图片提升目标检测网络性能的方法
CN109033322A (zh) 一种多维数据的测试方法和装置
CN104966075A (zh) 一种基于二维判别特征的人脸识别方法与***
CN103473275A (zh) 一种采用多特征融合的图像自动标注方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191025

RJ01 Rejection of invention patent application after publication