CN108241735A - 一种数据分析方法及设备 - Google Patents

一种数据分析方法及设备 Download PDF

Info

Publication number
CN108241735A
CN108241735A CN201711264823.5A CN201711264823A CN108241735A CN 108241735 A CN108241735 A CN 108241735A CN 201711264823 A CN201711264823 A CN 201711264823A CN 108241735 A CN108241735 A CN 108241735A
Authority
CN
China
Prior art keywords
data
information
user
input
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711264823.5A
Other languages
English (en)
Inventor
徐常亮
张云远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinhua Wisdom Cloud Technology Co Ltd
Original Assignee
Xinhua Wisdom Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinhua Wisdom Cloud Technology Co Ltd filed Critical Xinhua Wisdom Cloud Technology Co Ltd
Priority to CN201711264823.5A priority Critical patent/CN108241735A/zh
Publication of CN108241735A publication Critical patent/CN108241735A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种数据分析的方案,该方案首先获取用户的语句输入信息,然后对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息,根据所述来源相关信息获取所述数据分析任务所需的数据,并且根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果,由此在进行数据分析任务时结合了自然语言处理等人工智能技术,用于自动分析用户输入的语句的含义及目的,大大简化了用户进行数据分析时的工作量,提高了处理效率。

Description

一种数据分析方法及设备
技术领域
本申请涉及信息技术领域,尤其涉及一种数据分析方法及设备。
背景技术
随着社会各行业信息化及自动化程度的不断提升,在各公司或部门积累的数据种类和数量也越来越多,用户对于数据的使用及分析需求不断增长,但是数据的分析处理以及结果的展示时,仍然需要由技术开发人员通过编写程序代码、SQL(Structured QueryLanguage,结构化查询语言)或者由用户通过拖拽生成任务等方式生成数据处理任务,并确定最终的展示界面,过程比较繁重,效率不高。
申请内容
本申请的一个目的是提供一种数据分析方法及设备,用以解决现有技术中在进行数据分析时较为繁琐、效率不高的问题。
为实现上述目的,本申请提供了一种数据分析方法,该方法包括:
获取用户的语句输入信息;
对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息;
根据所述来源相关信息获取所述数据分析任务所需的数据;
根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
进一步地,所述语句输入信息为语音信息或文本信息。
进一步地,对所述语句输入信息进行语义识别,包括:
若所述语句输入信息为语音信息,对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,并对所述文本信息进行语义识别;
若所述语句输入信息为文本信息,对所述文本信息进行语义识别。
进一步地,根据所述来源相关信息获取所述数据分析任务所需的数据,包括:
根据所述来源相关信息确定数据来源;
从所述数据来源中获取所述数据分析任务所需的数据。
进一步地,生成分析结果之后,还包括:
向所述用户呈现所述分析结果。
进一步地,所述意图信息还包括展示方式信息;
向所述用户呈现所述分析结果,包括:
根据所述展示方式信息确定分析结果的展示方式;
以所述展示方式向所述用户呈现所述分析结果。
进一步地,向所述用户呈现所述分析结果,包括:
生成关于所述分析结果的语音信息;
向所述用户播放关于所述分析结果的语音信息。
进一步地,获取的所述用户的语句输入信息由用户根据前一次数据分析的分析结果确定。
基于本申请的另一方面,还提供了一种数据分析设备,该设备包括:
输入装置,用于获取用户的语句输入信息;
意图识别装置,用于对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息;
数据获取装置,用于根据所述来源相关信息获取所述数据分析任务所需的数据;
分析处理装置,用于根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
进一步地,所述语句输入信息为语音信息或文本信息。
进一步地,所述意图识别装置,用于在所述语句输入信息为语音信息时,对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,并对所述文本信息进行语义识别;以及在所述语句输入信息为文本信息时,对所述文本信息进行语义识别。
进一步地,所述用于数据获取装置,用于根据所述来源相关信息确定数据来源,以及从所述数据来源中获取所述数据分析任务所需的数据。
进一步地,所述设备还包括呈现装置,用于在生成分析结果之后,向所述用户呈现所述分析结果。
进一步地,所述意图信息还包括展示方式信息;
所述呈现装置,用于根据所述展示方式信息确定分析结果的展示方式,以所述展示方式向所述用户呈现所述分析结果。
进一步地,所述呈现装置,用于生成关于所述分析结果的语音信息,向所述用户播放关于所述分析结果的语音信息。
进一步地,所述输入设备获取的所述用户的语句输入信息由用户根据前一次数据分析的分析结果确定。
本申请还提供了一种数据分析设备,该设备包括:
处理器;以及
存储有机器可读指令的一个或多个机器可读介质,当所述处理器执行所述机器可读指令时,使得所述设备执行前述的方法。
本申请提供的方案中,首先获取用户的语句输入信息,然后对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息,根据所述来源相关信息获取所述数据分析任务所需的数据,并且根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果,由此在进行数据分析任务时结合了自然语言处理等人工智能技术,用于自动分析用户输入的语句的含义及目的,大大简化了用户进行数据分析时的工作量,提高了处理效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例提供的一种数据分析方法的处理流程图;
图2为采用本申请实施例提供方法进行数据分析时的处理流程图;
图3为本申请实施例提供的一种数据分析设备的结构示意图;
图4为本申请实施例提供的另一种数据分析设备的结构示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请实施例提供了一种数据分析方法,该方法的处理流程如图1所示,包括以下步骤:
步骤S101,获取用户的语句输入信息。在本申请的一些实施例中,该语句输入信息是指自然语言形式的输入信息,可以是用户通过语音输入的方式输入的语音信息,也可以是用户通过其它的方式输入的文本信息等。例如,用户可以通过设备上的麦克风等音频输入装置来输入语音信息,或者通过键盘、手写板等直接输入文本信息。
步骤S102,对所述语句输入信息进行语义识别,确定数据分析任务的意图信息。由于在实际场景中,语句输入信息可以是语音信息,也可以是文本信息,因此在不同的情况下,需要进行相应的处理。例如,若所述语句输入信息为文本信息时,可以直接对所述文本信息进行语义识别。其中,本申请实施例在实现语义识别时,可以使用任意一种已有的自然语言处理技术,例如,先采用分词算法将完整的文本信息分解成多个单词组成的序列,然后可以基于神经网络算法对这些单词序列所表示的语义进行识别,最终确定该文本信息所表示的含义,从而确定数据分析任务的意图信息。
在另一种情况下,若用户输入的语句输入信息是语音信息,则可以先对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,然后在对该文本信息进行语义识别,来确定确定数据分析任务的意图信息。
数据分析任务的意图信息是指与本次数据处理任务有关的参数,主要包括来源相关信息和处理相关信息。其中,所述来源相关信息与本次数据处理任务所需要的数据相关,例如,可以是关于数据所涉及的领域、数据所涉及的时间、数据所涉及的区域等。而所述处理相关信息是指对数据如何进行处理进行限定的参数,例如可以是对数据进行汇总求和、计算平均值、计算变化趋势等。
步骤S103,根据所述来源相关信息获取所述数据分析任务所需的数据。由于来源相关信息所述是与本次数据处理任务所需要的数据相关的参数,用于限定数据的来源,例如可以是XX数据库关于A公司B时间段的销售数据,由此可以根据该来源相关信息先确定数据来源,然后在从所述数据来源中获取所述数据分析任务所需的数据,作为后续进行数据分析的依据。
在实际场景中,若用于数据分析的数据都来自于特定的数据库(如公司的内部数据库),则可以根据不同类型的数据库自动生成数据库查询语句,从而实现数据的获取。例如对于SQL数据库,则可以自动生成SQL查询语句,例如:
select month,sale_amt from sales
where date>='201606'
上述查询语句表示从销售数据库中按月份查询从2016年6月份至今的销售数据。
步骤S104,根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
由于处理相关信息是指对数据如何进行处理进行限定的参数,例如可以是对数据进行汇总求和、计算平均值、计算变化趋势等。以汇总求和为例,对于前述查询到的从2016年6月份至今每个月的销售数据,对其进行汇总后,可以计算出从2016年6月份至今的总销售量。若处理相关信息中指定需要计算平均值,则可以对2016年6月份至今每个月的销售数据进行平均值计算,从而获取到每个月的平均销售量。若需要计算变化趋势,则可以最终计算出每个月销售额增加或者减少的比例等。
在实际场景中,处理相关信息所指定的数据分析处理的方式,可以根据实际数据分析任务的需求预先设定。例如,在销售数据分析的领域,还可以预测后续几个月的销售量、与去年同期的变化等。此外,除了销售数据分析的领域,还可以本申请实施例还可以应用于其它任意的数据分析场景中。
在本申请的一些实施例中,在生成分析结果之后,还可以向所述用户呈现所述分析结果,使得用户能够直观的查看数据分析的结果。在实际场景中,分析结果可以采用不同的方式来呈现,以适应实际场景的需求或者用户的偏好。而本申请的一些实施例中,所述意图信息还可以包括展示方式信息,该展示方式信息与分析结果的展示方式相关,例如可以是采用图表、图像、表格等方式进行展示等。
以前述2016年6月份至今每个月的销售数据的变化趋势为例,用户希望采用折线图的方式进行展示,则可以才语句输入信息中包含该信息,使得语义识别获取的意图信息中能够包含相应的展示方式信息。由此,在向所述用户呈现所述分析结果时,可以根据所述展示方式信息确定分析结果的展示方式,即折线图的展示方式,然后以该展示方式向所述用户呈现所述分析结果。
在本申请的另一实施例中,还可以采用语音的方式来向用户告知分析结果,由此可以在一些用户不方便查看的场景中使得用户能够方便的得知分析结果,例如终端设备不具备显示屏或者显示屏较小,或者在驾驶车辆等不方便查看的场景。在本实施例中,向所述用户呈现所述分析结果时,可以先生成关于所述分析结果的语音信息,即采用语音的形式来表示数据分析的结果。以前述2016年6月份至今每个月的销售数据的平均值为例,若平均值为xxx,则可以生成语音信息“2016年6月份至今每个月的销售数据的平均值为xxx”,然后向所述用户播放关于所述分析结果的语音信息,使得用户可以通过听的方式,获取到该语音信息包含的内容,从而在不方便查看时也可以获知分析结果。
在实际场景中,用户在获知分析结果之后,可以继续通过语音输入信息来进行进一步的数据分析,从而对分析结果进行进一步地调整,例如转换展示方式、调整数据的范围等,然后重复上述处理以达到满足用户的分析需求。
由此可知,本方案所获取的所述用户的语句输入信息,可以是由用户根据前一次数据分析的分析结果确定的。例如,当用户第一次输入的语句输入信息的意图为“统计某3个月的销售数据的变化趋势,以折线图表示”时,若用户发现反馈的分析结果无法得出有效的结论,则可以调整下一次输入的信息,例如通过语音的方式输入如下语句“继续统计后两个月销售数据的变化趋势”,以便于得到后两个月的变化趋势的折线图。若用户觉得折线图无法直观的表现变化趋势,需要改变展示的形式为柱状图,则可以通过语音调整下一次输入的信息为“使用柱状图表示变化趋势”,从而在下一次数据分析时,将分析结果的折线图调整为柱状图。
图2示出了采用本申请实施例提供的数据分析方法进行数据分析时的处理流程,包括了以下几个处理步骤:
步骤S201,首先用户通过麦克风等语音输入装置进行语音输入。
步骤S202,输入的语音信息通过语音识别后,识别出对应的文本信息,即“展示去年6月到现在的本公司销售趋势折线图”。
步骤S203,对该文本信息进行自然语言处理,识别其语义,提取关于本次数据分析的意图信息。可以根据实际场景的需求建立意图识别模型,通过该模型对文本信息进行处理,提取相应的意图信息。对于本实施例中的文本信息,其提取出的意图信息至少会包含以下几部分内容,即语义领域为销售,意图类型为销售趋势、折线图,语义要素包含:时间为去年6月到现在、数据范围为本公司。这些内容可以根据数据分析任务的实际需求作为来源相关信息、处理相关信息以及展示方式信息。
步骤S204,结合意图信息,可以自动生成对应的数据处理任务,该任务可以用SQL或者自动调用其它的程序代码模块的方式完成。例如本实施例中,即生成如下SQL语句来从数据库中查询相应的内容。
select month,sale_amt from sales
where date>='201606'
步骤S205,执行数据处理任务,获取数据,并进行数据分析生成分析结果。
步骤S206,展示分析结果,具体方式可以根据实际需求来选择,例如生成图表、生成语音、生成图像等方式。该分析结果提供给用户之后,用户可以基于结果对数据分析任务进行进一步的调整。
基于同一发明构思,本申请实施例中还提供了数据分析设备,所述设备对应的方法是前述实施例中的方法,并且其解决问题的原理与该方法相似。
图3示出了本申请实施例提供的一种数据分析设备,该设备包括输入装置310、意图识别装置320、数据获取装置330和分析处理装置340。其中,输入装置310用于获取用户的语句输入信息。在本申请的一些实施例中,该语句输入信息是指自然语言形式的输入信息,可以是用户通过语音输入的方式输入的语音信息,也可以是用户通过其它的方式输入的文本信息等。例如,用户可以通过设备上的麦克风等音频输入装置来输入语音信息,或者通过键盘、手写板等直接输入文本信息。
意图识别装置320用于对所述语句输入信息进行语义识别,确定数据分析任务的意图信息。由于在实际场景中,语句输入信息可以是语音信息,也可以是文本信息,因此在不同的情况下,需要进行相应的处理。例如,若所述语句输入信息为文本信息时,意图识别装置可以直接对所述文本信息进行语义识别。其中,本申请实施例在实现语义识别时,可以使用任意一种已有的自然语言处理技术,例如,先采用分词算法将完整的文本信息分解成多个单词组成的序列,然后可以基于神经网络算法对这些单词序列所表示的语义进行识别,最终确定该文本信息所表示的含义,从而确定数据分析任务的意图信息。
在另一种情况下,若用户输入的语句输入信息是语音信息,则意图识别装置可以先对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,然后在对该文本信息进行语义识别,来确定确定数据分析任务的意图信息。
数据分析任务的意图信息是指与本次数据处理任务有关的参数,主要包括来源相关信息和处理相关信息。其中,所述来源相关信息与本次数据处理任务所需要的数据相关,例如,可以是关于数据所涉及的领域、数据所涉及的时间、数据所涉及的区域等。而所述处理相关信息是指对数据如何进行处理进行限定的参数,例如可以是对数据进行汇总求和、计算平均值、计算变化趋势等。
数据获取装置330用于根据所述来源相关信息获取所述数据分析任务所需的数据。由于来源相关信息所述是与本次数据处理任务所需要的数据相关的参数,用于限定数据的来源,例如可以是XX数据库关于A公司B时间段的销售数据,由此可以根据该来源相关信息先确定数据来源,然后在从所述数据来源中获取所述数据分析任务所需的数据,作为后续进行数据分析的依据。
在实际场景中,若用于数据分析的数据都来自于特定的数据库(如公司的内部数据库),则可以根据不同类型的数据库自动生成数据库查询语句,从而实现数据的获取。例如对于SQL数据库,则可以自动生成SQL查询语句,例如:
select month,sale_amt from sales
where date>='201606'
上述查询语句表示从销售数据库中按月份查询从2016年6月份至今的销售数据。
分析处理装置340用于根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
由于处理相关信息是指对数据如何进行处理进行限定的参数,例如可以是对数据进行汇总求和、计算平均值、计算变化趋势等。以汇总求和为例,对于前述查询到的从2016年6月份至今每个月的销售数据,对其进行汇总后,可以计算出从2016年6月份至今的总销售量。若处理相关信息中指定需要计算平均值,则可以对2016年6月份至今每个月的销售数据进行平均值计算,从而获取到每个月的平均销售量。若需要计算变化趋势,则可以最终计算出每个月销售额增加或者减少的比例等。
在实际场景中,处理相关信息所指定的数据分析处理的方式,可以根据实际数据分析任务的需求预先设定。例如,在销售数据分析的领域,还可以预测后续几个月的销售量、与去年同期的变化等。此外,除了销售数据分析的领域,还可以本申请实施例还可以应用于其它任意的数据分析场景中。
在本申请的一些实施例中,数据分析设备还可以包括一呈现装置,该呈现装置用于在生成分析结果之后,还可以向所述用户呈现所述分析结果,使得用户能够直观的查看数据分析的结果。在实际场景中,分析结果可以采用不同的方式来呈现,以适应实际场景的需求或者用户的偏好。而本申请的一些实施例中,所述意图信息还可以包括展示方式信息,该展示方式信息与分析结果的展示方式相关,例如可以是采用图表、图像、表格等方式进行展示等。
以前述2016年6月份至今每个月的销售数据的变化趋势为例,用户希望采用折线图的方式进行展示,则可以才语句输入信息中包含该信息,使得语义识别获取的意图信息中能够包含相应的展示方式信息。由此,在向所述用户呈现所述分析结果时,呈现装置可以根据所述展示方式信息确定分析结果的展示方式,即折线图的展示方式,然后以该展示方式向所述用户呈现所述分析结果。
在本申请的另一实施例中,还可以采用语音的方式来向用户告知分析结果,由此可以在一些用户不方便查看的场景中使得用户能够方便的得知分析结果,例如终端设备不具备显示屏或者显示屏较小,或者在驾驶车辆等不方便查看的场景。在本实施例中,向所述用户呈现所述分析结果时,呈现装置可以先生成关于所述分析结果的语音信息,即采用语音的形式来表示数据分析的结果。以前述2016年6月份至今每个月的销售数据的平均值为例,若平均值为xxx,则可以生成语音信息“2016年6月份至今每个月的销售数据的平均值为xxx”,然后呈现装置向所述用户播放关于所述分析结果的语音信息,使得用户可以通过听的方式,获取到该语音信息包含的内容,从而在不方便查看时也可以获知分析结果。
在实际场景中,用户在获知分析结果之后,可以继续通过语音输入信息来进行进一步的数据分析,从而对分析结果进行进一步地调整,例如转换展示方式、调整数据的范围等,然后重复上述处理以达到满足用户的分析需求。
由此可知,本方案中输入装置所获取的所述用户的语句输入信息,可以是由用户根据前一次数据分析的分析结果确定的。例如,当用户第一次输入的语句输入信息的意图为“统计某3个月的销售数据的变化趋势,以折线图表示”时,若用户发现反馈的分析结果无法得出有效的结论,则可以调整下一次输入的信息,例如通过语音的方式输入如下语句“继续统计后两个月销售数据的变化趋势”,以便于得到后两个月的变化趋势的折线图。若用户觉得折线图无法直观的表现变化趋势,需要改变展示的形式为柱状图,则可以通过语音调整下一次输入的信息为“使用柱状图表示变化趋势”,从而在下一次数据分析时,将分析结果的折线图调整为柱状图。
本申请提供的方案中,首先获取用户的语句输入信息,然后对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息,根据所述来源相关信息获取所述数据分析任务所需的数据,并且根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果,由此在进行数据分析任务时结合了自然语言处理等人工智能技术,用于自动分析用户输入的语句的含义及目的,大大简化了用户进行数据分析时的工作量,提高了处理效率。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个如图4所示的设备,该设备包括存储有机器可读指令的一个或多个机器可读介质410和用于执行机器可读指令的处理器420,其中,当该机器可读指令被该处理器执行时,使得所述设备执行基于前述根据本申请的多个实施例的方法和/或技术方案。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (17)

1.一种数据分析方法,其中,该方法包括:
获取用户的语句输入信息;
对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息;
根据所述来源相关信息获取所述数据分析任务所需的数据;
根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
2.根据权利要求1所述的方法,其中,所述语句输入信息为语音信息或文本信息。
3.根据权利要求2所述的方法,其中,对所述语句输入信息进行语义识别,包括:
若所述语句输入信息为语音信息,对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,并对所述文本信息进行语义识别;
若所述语句输入信息为文本信息,对所述文本信息进行语义识别。
4.根据权利要求1所述的方法,其中,根据所述来源相关信息获取所述数据分析任务所需的数据,包括:
根据所述来源相关信息确定数据来源;
从所述数据来源中获取所述数据分析任务所需的数据。
5.根据权利要求1所述的方法,其中,生成分析结果之后,还包括:
向所述用户呈现所述分析结果。
6.根据权利要求5所述的方法,其中,所述意图信息还包括展示方式信息;
向所述用户呈现所述分析结果,包括:
根据所述展示方式信息确定分析结果的展示方式;
以所述展示方式向所述用户呈现所述分析结果。
7.根据权利要求5所述的方法,其中,向所述用户呈现所述分析结果,包括:
生成关于所述分析结果的语音信息;
向所述用户播放关于所述分析结果的语音信息。
8.根据权利要求1所述的方法,其中,获取的所述用户的语句输入信息由用户根据前一次数据分析的分析结果确定。
9.一种数据分析设备,其中,该设备包括:
输入装置,用于获取用户的语句输入信息;
意图识别装置,用于对所述语句输入信息进行语义识别,确定数据分析任务的意图信息,其中,所述意图信息包括来源相关信息和处理相关信息;
数据获取装置,用于根据所述来源相关信息获取所述数据分析任务所需的数据;
分析处理装置,用于根据所述处理相关信息对所述数据进行数据分析处理,生成分析结果。
10.根据权利要求9所述的设备,其中,所述语句输入信息为语音信息或文本信息。
11.根据权利要求10所述的设备,其中,所述意图识别装置,用于在所述语句输入信息为语音信息时,对所述语音信息进行语音识别,获取该语音信息所对应的文本信息,并对所述文本信息进行语义识别;以及在所述语句输入信息为文本信息时,对所述文本信息进行语义识别。
12.根据权利要求9所述的设备,其中,所述用于数据获取装置,用于根据所述来源相关信息确定数据来源,以及从所述数据来源中获取所述数据分析任务所需的数据。
13.根据权利要求9所述的设备,其中,所述设备还包括:
呈现装置,用于在生成分析结果之后,向所述用户呈现所述分析结果。
14.根据权利要求13所述的设备,其中,所述意图信息还包括展示方式信息;
所述呈现装置,用于根据所述展示方式信息确定分析结果的展示方式,以所述展示方式向所述用户呈现所述分析结果。
15.根据权利要求13所述的设备,其中,所述呈现装置,用于生成关于所述分析结果的语音信息,向所述用户播放关于所述分析结果的语音信息。
16.根据权利要求9所述的设备,其中,所述输入装置获取的所述用户的语句输入信息由用户根据前一次数据分析的分析结果确定。
17.一种数据分析设备,其中,该设备包括:
处理器;以及
存储有机器可读指令的一个或多个机器可读介质,当所述处理器执行所述机器可读指令时,使得所述设备执行如权利要求1至8中任一项所述的方法。
CN201711264823.5A 2017-12-05 2017-12-05 一种数据分析方法及设备 Pending CN108241735A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711264823.5A CN108241735A (zh) 2017-12-05 2017-12-05 一种数据分析方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711264823.5A CN108241735A (zh) 2017-12-05 2017-12-05 一种数据分析方法及设备

Publications (1)

Publication Number Publication Date
CN108241735A true CN108241735A (zh) 2018-07-03

Family

ID=62701057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711264823.5A Pending CN108241735A (zh) 2017-12-05 2017-12-05 一种数据分析方法及设备

Country Status (1)

Country Link
CN (1) CN108241735A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188163A (zh) * 2019-04-13 2019-08-30 上海策友信息科技有限公司 基于自然语言的智能数据处理***
CN111125145A (zh) * 2019-11-26 2020-05-08 复旦大学 一种通过自然语言获取数据库信息的自动化***
CN111753527A (zh) * 2020-06-29 2020-10-09 平安科技(深圳)有限公司 基于自然语言处理的数据分析方法、装置和计算机设备
CN112306312A (zh) * 2019-07-29 2021-02-02 阿里巴巴集团控股有限公司 数据处理方法、数据处理***、信息创建方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319958A1 (en) * 2007-06-22 2008-12-25 Sutirtha Bhattacharya Dynamic Metadata based Query Formulation for Multiple Heterogeneous Database Systems
CN106682147A (zh) * 2016-12-22 2017-05-17 北京锐安科技有限公司 一种基于海量数据的查询方法及装置
CN107193948A (zh) * 2017-05-22 2017-09-22 邢加和 人机对话数据分析方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319958A1 (en) * 2007-06-22 2008-12-25 Sutirtha Bhattacharya Dynamic Metadata based Query Formulation for Multiple Heterogeneous Database Systems
CN106682147A (zh) * 2016-12-22 2017-05-17 北京锐安科技有限公司 一种基于海量数据的查询方法及装置
CN107193948A (zh) * 2017-05-22 2017-09-22 邢加和 人机对话数据分析方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188163A (zh) * 2019-04-13 2019-08-30 上海策友信息科技有限公司 基于自然语言的智能数据处理***
CN112306312A (zh) * 2019-07-29 2021-02-02 阿里巴巴集团控股有限公司 数据处理方法、数据处理***、信息创建方法及设备
CN111125145A (zh) * 2019-11-26 2020-05-08 复旦大学 一种通过自然语言获取数据库信息的自动化***
CN111753527A (zh) * 2020-06-29 2020-10-09 平安科技(深圳)有限公司 基于自然语言处理的数据分析方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN108241735A (zh) 一种数据分析方法及设备
US20180210883A1 (en) System for converting natural language questions into sql-semantic queries based on a dimensional model
Saayman et al. Non-linear models for tourism demand forecasting
US20210081759A1 (en) Deep neural network based user segmentation
US10866700B1 (en) Systems and methods for ingesting and parsing datasets generated from disparate data sources
US11966873B2 (en) Data distillery for signal detection
CN106909931B (zh) 一种用于机器学习模型的特征生成方法、装置和电子设备
CN104933081A (zh) 一种搜索建议提供方法及装置
US20190114711A1 (en) Financial analysis system and method for unstructured text data
US20180308152A1 (en) Data Processing Method and Apparatus
US11410644B2 (en) Generating training datasets for a supervised learning topic model from outputs of a discovery topic model
CN110046303B (zh) 一种基于需求匹配平台实现的信息推荐方法及装置
US11553085B2 (en) Method and apparatus for predicting customer satisfaction from a conversation
WO2018196607A1 (zh) 一种文本信息展示方法及装置
CA3083303C (en) Signal discovery using artificial intelligence models
CN115544214B (zh) 一种事件处理方法、设备及计算机可读存储介质
US20210271983A1 (en) Machine intelligence for research and analytics (mira) system and method
CN116680494A (zh) 应用推荐页面的生成方法、装置、存储介质以及电子设备
CN108764021B (zh) 一种作弊视频识别方法和装置
CN110020118B (zh) 一种计算用户之间相似度的方法及装置
CN113609271B (zh) 基于知识图谱的业务处理方法、装置、设备及存储介质
CN111353688B (zh) 一种用户资源分配方法以及装置
CN110796505A (zh) 一种业务对象推荐方法以及装置
US20110131245A1 (en) Identifying a group of products relevant to data provided by a user
CN110019771B (zh) 文本处理的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180703