CN112130845A - 一种基于人工智能的图表智能化生成方法 - Google Patents

一种基于人工智能的图表智能化生成方法 Download PDF

Info

Publication number
CN112130845A
CN112130845A CN202010996608.XA CN202010996608A CN112130845A CN 112130845 A CN112130845 A CN 112130845A CN 202010996608 A CN202010996608 A CN 202010996608A CN 112130845 A CN112130845 A CN 112130845A
Authority
CN
China
Prior art keywords
chart
data
generation method
artificial intelligence
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010996608.XA
Other languages
English (en)
Other versions
CN112130845B (zh
Inventor
陈碧勇
方敏
胡金波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Nanxun Co ltd
Original Assignee
Xiamen Nanxun Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Nanxun Co ltd filed Critical Xiamen Nanxun Co ltd
Priority to CN202010996608.XA priority Critical patent/CN112130845B/zh
Publication of CN112130845A publication Critical patent/CN112130845A/zh
Application granted granted Critical
Publication of CN112130845B publication Critical patent/CN112130845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/33Intelligent editors

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的图表智能化生成方法,包括以下步骤:S1、根据输入文本或上传的图片,识别分析意图;S2、对数据进行转换和清洗,转换为统一的数据结构;S3、根据分析意图,结合数据类型,进行特征识别;S4、根据图表知识库和推荐引擎,生成推荐图表;S5、AI预测引擎自动选择模型和特征进行趋势预测;S6、根据图表大小结合数据量进行组件布局自适应;S7、生成个性化配置,进行图表渲染。本发明的方法方便开发人员和用户使用,操作简单,只需要调用方法,传入数据和分析意图,就可以自动生成图表,还能进行趋势预测,大大提升了开发效率、降低研发成本、减少可视化工具的制作成本。

Description

一种基于人工智能的图表智能化生成方法
技术领域
本发明涉及数据处理技术领域,特别涉及一种基于人工智能的图表智能化生成方法。
背景技术
在图表生成问题上,对于开发人员来讲,就目前流行的D3、Echarts等图表类库,其存在如下问题:其一,学习成本高,数以百计的配置项,需要进行组合调试才能达到想要的效果;其二,开发成本高,每种图表使用的数据格式各不相同,需要针对每种图表进行数据转换;其三,沟通成本高,设计师不确定设计出来的图表是否能被开发出来,需要进行反复沟通,导致开发效率低下、产品开发耗时长等问题。而对于用户来讲,用户通常不具备专业的可视化知识,不了解图形语法、图表各个维度和配置的含义,面对众多的配置项,常常感到无从下手,经常存在错误使用图表的情况,用户体验较差。
发明内容
为解决上述问题,本发明提供了一种基于人工智能的图表智能化生成方法。
本发明采用以下技术方案:
一种基于人工智能的图表智能化生成方法,包括以下步骤:
S1、根据输入文本或上传的图片,识别分析意图;
S2、对数据进行转换和清洗,转换为统一的数据结构;
S3、根据分析意图,结合数据类型,进行特征识别;
S4、根据图表知识库和推荐引擎,生成推荐图表;
S5、AI预测引擎自动选择模型和特征进行趋势预测;
S6、根据图表大小结合数据量进行组件布局自适应;
S7、生成个性化配置,进行图表渲染。
进一步地,所述步骤S1具体为:判断意图来源的类型,若输入的是文本,则对输入的文本进行分词,通过语义分析,找到关键词所对应的图表类型;若输入的是图片,则采用图像识别对图片进行分析,对比本地训练好的模型,找出匹配度最高的图表类型。
进一步地,所述步骤S2具体为:进入数据准备阶段,对所有的输入数据,均统一转为二维数组结构的数据集,对数值、日期字段的有效性和合法性进行判断处理,并记录每个字段的类型信息。
进一步地,所述步骤S3具体为:对所述数据集的字段种类和个数进行分析,记录数据集的数据特征,所述数据特征包括维度、数值个数、数据类型或数值特点,进一步分析字段间的关系,筛选出相关的数据字段。
进一步地,所述步骤S4具体为:事先在将图表用法信息汇总,形成图表知识库,所述图表知识库包含不同图表的名称、类别、定义、分析意图或数据要求;再根据所述分析意图和所述数据特征,将所述图表知识库作为训练集,使用决策树算法训练得到的一个用于判断图表类型的决策树模型;然后输入意图关键字,生成匹配度最高的图表类型。
进一步地,所述步骤S5中的所述AI预测引擎底层依托Spark技术,预测的趋势采用虚线绘制,同时计算数值轴的方差、标准差或回归统计特征进行辅助增强。
进一步地,所述步骤S6具体为:基于数据和图表类型,对图表进行具体细节配置;根据所述图表类型以及显示空间的大小,计算可视化的有效显示负荷,动态调整各组件的布局。
进一步地,所述步骤S7具体为:根据图形语法、图表知识库预制的主题配置信息将图表渲染出来,若用户采用上传照片的方式输入分析意图,则自动识别手稿图风格,从图片中提取颜色及其相应占比,自动调整主题。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
1、本发明的方法可以处理掉大数据可视化的所有中间环节,开发人员不再需要熟悉数以百计的配置项,也不需要进行数据集的转换,使用时,只需要调用方法,传入数据和分析意图,就可以自动生成图表,还能进行趋势预测,大大提升了开发效率、降低研发成本、减少可视化工具的制作成本;
2、可以降低用户使用成本,原本用户需要花大量时间在图表的配置和选取上面,通过智能化生成图表,可以让用户更专注于数据的分析和决策。
附图说明
图1为本发明的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,一种基于人工智能的图表智能化生成方法,包括以下步骤:
S1、根据输入文本或上传的图片,识别分析意图;
S2、对数据进行转换和清洗,转换为统一的数据结构;
S3、根据分析意图,结合数据类型,进行特征识别;
S4、根据图表知识库和推荐引擎,生成推荐图表;
S5、AI预测引擎自动选择模型和特征进行趋势预测;
S6、根据图表大小结合数据量进行组件布局自适应;
S7、生成个性化配置,进行图表渲染。
所述步骤S1具体为:判断意图来源的类型,若输入的是文本,则对输入的文本进行分词,通过语义分析,找到关键词所对应的图表类型;若输入的是图片,则采用图像识别对图片进行分析,对比本地训练好的模型,找出匹配度最高的图表类型。
所述步骤S2具体为:进入数据准备阶段,对所有的输入数据,均统一转为二维数组结构的数据集,对数值、日期字段的有效性和合法性进行判断处理,并记录每个字段的类型信息。
该阶段主要进行数据的转换和清洗,若分析意图涉及地图类型的图表,则对数据进行坐标转换,首先对数据进行映射处理,每份数据都统一映射到唯一的邮政编码,再通过邮政编码查找对应区域的经纬度信息。
所述步骤S3具体为:对所述数据集的字段种类和个数进行分析,记录数据集的数据特征,所述数据特征包括维度、数值个数、数据类型或数值特点,进一步分析字段间的关系,筛选出相关的数据字段。
所述步骤S4具体为:事先在将图表用法信息汇总,形成图表知识库,所述图表知识库包含不同图表的名称、类别、定义、分析意图或数据要求;再根据所述分析意图和所述数据特征,将所述图表知识库作为训练集,使用决策树算法训练得到的一个用于判断图表类型的决策树模型;然后输入意图关键字,生成匹配度最高的图表类型。
所述步骤S5中的所述AI预测引擎底层依托Spark技术,预测的趋势采用虚线绘制,同时计算数值轴的方差、标准差或回归统计特征进行辅助增强。
AI预测引擎底层依托Spark技术,支持丰富的预测分析、机器学习等算法,常见的有回归、分类、聚类等。通过业务数据训练好的预测模型,可对天气、营销活动、销售指标等进行趋势预测。
所述步骤S6具体为:基于数据和图表类型,对图表进行具体细节配置;根据所述图表类型以及显示空间的大小,计算可视化的有效显示负荷,动态调整各组件的布局。
其中具体细节配置包括X轴和Y轴标签过长自动旋转、文本超过可见区域自动切割等。
所述步骤S7具体为:根据图形语法、图表知识库预制的主题配置信息将图表渲染出来,若用户采用上传照片的方式输入分析意图,则自动识别手稿图风格,从图片中提取颜色及其相应占比,自动调整主题。
本实施例的方法可以处理掉大数据可视化的所有中间环节,开发人员不再需要熟悉数以百计的配置项,也不需要进行数据集的转换,使用时,只需要调用方法,传入数据和分析意图,就可以自动生成图表,还能进行趋势预测,大大提升了开发效率、降低研发成本、减少可视化工具的制作成本;此外,还可以降低用户使用成本,原本用户需要花大量时间在图表的配置和选取上面,通过智能化生成图表,可以让用户更专注于数据的分析和决策。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种基于人工智能的图表智能化生成方法,其特征在于:包括以下步骤:
S1、根据输入文本或上传的图片,识别分析意图;
S2、对数据进行转换和清洗,转换为统一的数据结构;
S3、根据分析意图,结合数据类型,进行特征识别;
S4、根据图表知识库和推荐引擎,生成推荐图表;
S5、AI预测引擎自动选择模型和特征进行趋势预测;
S6、根据图表大小结合数据量进行组件布局自适应;
S7、生成个性化配置,进行图表渲染。
2.如权利要求1所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S1具体为:判断意图来源的类型,若输入的是文本,则对输入的文本进行分词,通过语义分析,找到关键词所对应的图表类型;若输入的是图片,则采用图像识别对图片进行分析,对比本地训练好的模型,找出匹配度最高的图表类型。
3.如权利要求2所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S2具体为:进入数据准备阶段,对所有的输入数据,均统一转为二维数组结构的数据集,对数值、日期字段的有效性和合法性进行判断处理,并记录每个字段的类型信息。
4.如权利要求3所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S3具体为:对所述数据集的字段种类和个数进行分析,记录数据集的数据特征,所述数据特征包括维度、数值个数、数据类型或数值特点,进一步分析字段间的关系,筛选出相关的数据字段。
5.如权利要求4所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S4具体为:事先在将图表用法信息汇总,形成图表知识库,所述图表知识库包含不同图表的名称、类别、定义、分析意图或数据要求;再根据所述分析意图和所述数据特征,将所述图表知识库作为训练集,使用决策树算法训练得到的一个用于判断图表类型的决策树模型;然后输入意图关键字,生成匹配度最高的图表类型。
6.如权利要求5所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S5中的所述AI预测引擎底层依托Spark技术,预测的趋势采用虚线绘制,同时计算数值轴的方差、标准差或回归统计特征进行辅助增强。
7.如权利要求6所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S6具体为:基于数据和图表类型,对图表进行具体细节配置;根据所述图表类型以及显示空间的大小,计算可视化的有效显示负荷,动态调整各组件的布局。
8.如权利要求7所述的一种基于人工智能的图表智能化生成方法,其特征在于:所述步骤S7具体为:根据图形语法、图表知识库预制的主题配置信息将图表渲染出来,若用户采用上传照片的方式输入分析意图,则自动识别手稿图风格,从图片中提取颜色及其相应占比,自动调整主题。
CN202010996608.XA 2020-09-21 2020-09-21 一种基于人工智能的图表智能化生成方法 Active CN112130845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010996608.XA CN112130845B (zh) 2020-09-21 2020-09-21 一种基于人工智能的图表智能化生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010996608.XA CN112130845B (zh) 2020-09-21 2020-09-21 一种基于人工智能的图表智能化生成方法

Publications (2)

Publication Number Publication Date
CN112130845A true CN112130845A (zh) 2020-12-25
CN112130845B CN112130845B (zh) 2022-05-24

Family

ID=73842090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010996608.XA Active CN112130845B (zh) 2020-09-21 2020-09-21 一种基于人工智能的图表智能化生成方法

Country Status (1)

Country Link
CN (1) CN112130845B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434568A (zh) * 2021-06-01 2021-09-24 深圳市酷开网络科技股份有限公司 一种多源数据处理方法、装置、智能终端及存储介质
CN114741080A (zh) * 2022-04-24 2022-07-12 北京格睿德思信息科技有限公司 一种基于人工智能的大数据展示方法
CN115857906A (zh) * 2023-02-02 2023-03-28 ***数字城市科技有限公司 低代码图表生成的方法、***、电子设备及介质
CN116226487A (zh) * 2023-04-25 2023-06-06 杭州比智科技有限公司 一种基于图形识别的数据大屏可视化方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103733191A (zh) * 2011-08-10 2014-04-16 微软公司 趋势图表的自动生成
CN107169119A (zh) * 2017-05-26 2017-09-15 九次方大数据信息集团有限公司 基于数据结构识别的自动化可视化呈现方法与***
CN109740135A (zh) * 2018-12-19 2019-05-10 平安普惠企业管理有限公司 图表生成方法及装置、电子设备和存储介质
CN110427411A (zh) * 2019-08-02 2019-11-08 河南开合软件技术有限公司 一种通过图层将关联数据进行可视化的方法
US20200285672A1 (en) * 2019-03-04 2020-09-10 Shashi Ranjan Kumar Automatic selection of visualizations representing data based on data analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103733191A (zh) * 2011-08-10 2014-04-16 微软公司 趋势图表的自动生成
CN107169119A (zh) * 2017-05-26 2017-09-15 九次方大数据信息集团有限公司 基于数据结构识别的自动化可视化呈现方法与***
CN109740135A (zh) * 2018-12-19 2019-05-10 平安普惠企业管理有限公司 图表生成方法及装置、电子设备和存储介质
US20200285672A1 (en) * 2019-03-04 2020-09-10 Shashi Ranjan Kumar Automatic selection of visualizations representing data based on data analysis
CN110427411A (zh) * 2019-08-02 2019-11-08 河南开合软件技术有限公司 一种通过图层将关联数据进行可视化的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张志亮 等: "空间数据智能统计方法研究与软件实现", 《世界地质》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434568A (zh) * 2021-06-01 2021-09-24 深圳市酷开网络科技股份有限公司 一种多源数据处理方法、装置、智能终端及存储介质
CN114741080A (zh) * 2022-04-24 2022-07-12 北京格睿德思信息科技有限公司 一种基于人工智能的大数据展示方法
CN115857906A (zh) * 2023-02-02 2023-03-28 ***数字城市科技有限公司 低代码图表生成的方法、***、电子设备及介质
CN116226487A (zh) * 2023-04-25 2023-06-06 杭州比智科技有限公司 一种基于图形识别的数据大屏可视化方法及***

Also Published As

Publication number Publication date
CN112130845B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN112130845B (zh) 一种基于人工智能的图表智能化生成方法
US10817527B1 (en) Systems and methods of using natural language processing for visual analysis of a data set
CN112395506A (zh) 一种资讯推荐方法、装置、电子设备和存储介质
CN109710935B (zh) 一种基于文物知识图谱的博物馆导览与知识推荐方法
CN111368042A (zh) 智能问答方法、装置、计算机设备及计算机存储介质
KR20170093713A (ko) 인공 지능을 기반으로 하는 모바일 검색 방법 및 장치
US11836172B2 (en) Facilitating generation of data visualizations via natural language processing
CN112948534A (zh) 一种智能人机对话的交互方法、***和电子设备
US20180197040A1 (en) System And Method Of Generating A Semantic Representation Of A Target Image For An Image Processing Operation
US20230134235A1 (en) Applying a Visual Analytics Intent Language to Generate Data Visualizations
CN111125457A (zh) 一种深度跨模态哈希检索方法及装置
CN116628228B (zh) 一种rpa流程推荐方法以及计算机可读存储介质
US20230244862A1 (en) Form processing method and apparatus, device, and storage medium
CN117493491A (zh) 一种基于机器学习的自然语言处理方法及***
CN113821296A (zh) 可视化界面生成方法、电子设备及存储介质
US11314793B2 (en) Query processing
US11409763B1 (en) Applying a visual analytics intent language to generate data visualizations
CN114546326A (zh) 一种虚拟人手语生成方法和***
JP7493195B1 (ja) プログラム、方法、情報処理装置、システム
Weinzierl et al. Predictive Business Process Monitoringwith Context Information from Documents.
US20230308731A1 (en) Method for providing service of producing multimedia conversion content by using image resource matching, and apparatus thereof
CN117473115A (zh) 封面生成方法、装置、终端设备以及存储介质
CN112489633A (zh) 语音特征编码网络的训练方法、装置及存储介质
CN117831641A (zh) 一种支持智能对话和查询的病原微生物信息***
CN117807317A (zh) 基于智能体的交互方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant