CN106547807A - 数据分析方法与装置 - Google Patents

数据分析方法与装置 Download PDF

Info

Publication number
CN106547807A
CN106547807A CN201510683234.5A CN201510683234A CN106547807A CN 106547807 A CN106547807 A CN 106547807A CN 201510683234 A CN201510683234 A CN 201510683234A CN 106547807 A CN106547807 A CN 106547807A
Authority
CN
China
Prior art keywords
data
those
inquiry
feature
arithmetic element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510683234.5A
Other languages
English (en)
Other versions
CN106547807B (zh
Inventor
黄信骞
陈弘轩
崔文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of CN106547807A publication Critical patent/CN106547807A/zh
Application granted granted Critical
Publication of CN106547807B publication Critical patent/CN106547807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据分析方法与装置。数据分析方法包括以下步骤。整合一数据库中针对一事件的多笔查询指令,以获得被查询的数个特征。各个特征以一限制范围进行查询。于各个特征的各个限制范围下,数据库被查询出数笔查询数据。判断此些查询数据的一数据量是否高于一预定数量范围或低于预定数量范围。若数据量高于预定数量范围,则根据此些特征,降低此些查询数据的数据量。若数据量低于预定数量范围,则根据此些特征,增加此些查询数据的数据量。依据此些查询数据,分析特征与事件的一相关性。

Description

数据分析方法与装置
技术领域
本发明是有关于一种数据分析方法与装置。
背景技术
随着信息技术的发展,发展出云端运算、电子商务等各种产业。这些产业通常必须面对巨量数据的分析。业者经常需要对巨量数据进行数据感知器(data sensor)的发掘。数据感知器是影响某一事件的几个主要因素。然而,分析巨量数据是一项相当大的挑战。***必须穷举各种特征,并取出相当多的数据来进行分析。这种方式相当没有效率,且造成***很大的负担。
发明内容
本发明有关于一种数据分析方法与装置。
根据本发明的第一方面,提出一种数据分析方法。数据分析方法包括以下步骤。整合一数据库中针对一事件的多笔查询指令,以获得被查询的数个特征。各个特征被以一限制范围进行查询。于各个特征的各个限制范围下,数据库被查询出数笔查询数据。判断此些查询数据的一数据量是否高于一预定数量范围或低于预定数量范围。若数据量高于预定数量范围,则根据此些特征,降低此些查询数据的数据量。若数据量低于预定数量范围,则根据此些特征,增加此些查询数据的数据量。依据此些查询数据,分析此些特征与事件的一相关性。
根据本发明的第二方面,提出一种数据分析***。数据分析***包括一数据库、一用户接口、一运算单元及一分析单元。用户接口用以接收数个用户针对一事件的多笔查询指令。运算单元连接于数据库及用户接口。运算单元用以整合此些查询指令,以获得被查询的数个特征。各个特征被以一限制范围进行查询。于各个特征的各个限制范围下,数据库被查询出数笔查询数据。若数据量高于一预定数量范围,则运算单元根据此些特征,降低此些查询数据的数据量。若数据量低于预定数量范围,则运算单元根据此些特征,增加此些查询数据的数据量。分析单元连接于数据库及运算单元。分析单元用以依据此些查询数据,分析此些特征与事件的一相关性。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施例,并配合所附图式,作详细说明如下:
附图说明
图1绘示数据分析***的示意图。
图2绘示数据分析方法的流程图。
图3绘示多笔数据的示意图。
图4A~4C绘示查询影响某一特征的因素的三笔查询指令的示意图。
图5绘示图4A~4C的数笔查询指令的整合示意图。
图6绘示降低查询数据的数据量的一示意图。
图7绘示降低查询数据的数据量的另一示意图。
图8绘示降低查询数据的数据量的另一示意图。
图9绘示增加查询数据的数掘量的一示意图。
图10绘示增加查询数据的数据量的另一示意图。
符号说明:
100:数据分析***
110:数据库
120:用户接口
130:运算单元
140:分析单元
N1、N1’、N2、N3、N4、N10:特征
Ra1、Ra2、Rb1、Rb2、Rb3、Rc4、R1’、R1”:限制范围
S110、S120、S130、S140、S150:流程步骤
具体实施方式
请参照图1,其绘示数据分析***100的示意图。数据分析***100用以对巨量数据进行分析,以发掘出与某一事件(event)相关的数据感知器(data sensor)。数据感知器是影响某一事件的几个主要因素。举例来说,在晶圆制造过程中,影响制程良率的因素相当繁杂。为了找出影响制程良率的因素,会在机台上设置一些感知器,例如是温度感知器、压力感知器等等。通过分析这些感知器的数值,可以找出哪些感知器与制程良率相关,藉此作为机台设定的依据。模拟上述概念,在其他应用上,数据分析***100可以从学生的各项数据中,进行数据感知器的发掘,以分析出影响数学成绩的主要因素为何。数据感知器即为分析出的主要因素。或者,电子商务的营收遽增时,可以从各项营业数据中,进行数据感知器的发掘,以分析出造成营收遽增的主要因素为何。
数据分析***100包括一数据库110、一用户接口120、一运算单元130及一分析单元140。数据库110用以储存各种数据,例如是一内存、一硬盘、一云端储存装置、一记忆卡或一光盘片。用户接口120用以提供用户输入各项信息,例如是一键盘或一触控屏幕。运算单元130连接于数据库110及用户接口120,运算单元130用以进行各种数据运算程序或判断程序。分析单元140连接于数据库110及运算单元130,分析单元140用以进行各种分析程序或判断程序。运算单元130及分析单元140例如分别是一集成电路、一韧体电路、一电路板、或储存数组程序代码的记录媒体。运算单元130与分析单元140可以是独立的两个对象、或者可以是整合的一个对象。
在数据量庞大时,数据感知器的发掘显得相当的困难,以下搭配一流程图详细说明数据分析***100如何在庞大数据量下进行数据感知器的发掘。
请参照图2,其绘示数据分析方法的流程图。在一实施例中,数据库110已储存巨量的多笔数据。用户接口120用以提供用户针对一事件输入查询指令,以了解影响此事件的因素。举例来说,请参照图3,其绘示多笔数据的示意图。各笔数据记录特征N1~N10的内容。除了以表格的呈现方式以外,在另一实施例中,此些数据可以树形图、雷达图等方式呈现。举例来说,某一用户查询造成电子商务的营收遽增的主要因素时,可以输入「商品价格」、「购买地点」等特征,且限定「商品价格」的限制范围为「大于1000元」、「购买地点」的限制范围为「台北市」,来进行观察。另一使用者查询造成营收遽增的主要因素时,可以输入「天气」、「平面广告金额」等特征,且限定「天气」的限制范围为「雨天」、「平面广告金额」的限制范围为「大于30万元」,来进行观察。多个查询指令可以由不同用户输入;或者,多个查询指令可以由同一用户输入。此些查询指令储存亦于数据库110中。
在步骤S110中,运算单元130整合数据库120中针对一事件的多笔查询指令,以获得被查询的数个特征。举例来说,请参照图4A~4C,其绘示欲查询影响特征N10的因素的三笔查询指令的示意图。如图4A所示,第一个查询指令对特征N1及特征N2分别以限制范围Ra1及限制范围Ra2进行查询。如图4B所示,第二个查询指令对特征N1、特征N2及特征N3分别以限制范围Rb1、限制范围Rb2及限制范围Rb3进行查询。如图4C所示,第三个查询指令对特征N4以限制范围Rc4进行查询。
请参照图5,其绘示图4A~4C的数笔查询指令的整合示意图。运算单元130整合图4A~4C的三笔查询指令后,得到被查询的特征N1、特征N2、特征N3、特征N4。特征N1具有限制范围R1,特征N2具有限制范围R2,特征N3具有限制范围R3,特征N4具有限制范围R4。在一实施例中,整合的方式可以是将所有查询指令查询过的特征进行联集,以选取出所有曾经查询过的至少一次特征。或者,在另一实施例中,整合的方式可以是将所有查询过的特征进行交集,以选取出被所有查询指令均查询过的特征。此外,第一笔查询指令及第二笔查询指令均有特征N1,特征N1的限制范围R1可以是限制范围Ra1及特征Rb1的联集。在另一实施例中,特征N1的限制范围R1可以是限制范围Ra1及特征Rb1的交集。在图5的实施例中,采用联集的方式来整合出特征N1、N2、N3、N4,并以联集的方式整合出限制范围R1、R2、R3、R4。于各个特征N1、N2、N3、N4的各个限制范围R1、R2、R3、R4下,数据库120被查询出数笔查询数据。
在步骤S120中,运算单元130判断此些查询数据的一数据量是否高于一预定数量范围或低于此预定数量范围。若数据量高于此预定数量范围,则进入步骤S130的数据收缩程序(data shrink procedure);若数据量低于此预定数量范围,则进入步骤S140的数据扩大程序(data expandprocedure);若数据量落入此预定数量范围,则进入步骤S150。预定数量范围根据数据分析***100的运算能力而定,而不超过运算能力的上限。举例来说,预定数量范围例如是1~2万笔。
在步骤S130中,根据特征,降低查询数据的数据量。步骤S130可以采取多种作法,以下分别一一说明。
在一实施例中,运算单元130可以依据特征于查询指令的使用次数,剔除部分的特征,以降低数据量。举例来说,请参照图6,其绘示降低查询数据的数据量的一示意图。于图5中,被查询的特征N1、N2、N3、N4有四个。其中于第一~第三个查询指令中,特征N1、N2使用2次,特征N3使用1次,特征N4使用1次。故可以剔除使用此数较低的特征N3、特征N4,而保留特征N1、特征N2。如此一来,仅留下满足特征N1的限制范围R1或特征N2的限制范围R2的查询数据,使其数据量能够有效降低。
在另一实施例中,运算单元130可以缩小限制范围,以降低数据量。举例来说,请参照图7,其绘示降低查询数据的数据量的另一示意图。运算单元130可以将特征N1的限制范围R1缩小为限制范围R1’,例如是将「大于30万元」缩小为「大于50万元」。如此一来,查询数据的数据量能够有效降低。
在另一实施例中,运算单元130可以抽样此些查询数据,以降低数据量。举例来说,请参照图8,其绘示降低查询数据的数据量的另一示意图。当数据量为预定数量范围的平均值的3/2倍时,则可以2/3的比率进行抽样。抽样的方式例如是对满足特征N1的限制范围R1的数笔数据中,抽取2/3的数据,其余1/3予以舍弃。对满足特征N2的限制范围R2的数笔数据中,抽取2/3的数据,其余1/3予以舍弃。对满足特征N3的限制范围R3的数笔数据中,抽取2/3的数据,其余1/3予以舍弃。对满足特征N4的限制范围R4的数笔数据中,抽取2/3的数据,其余1/3予以舍弃。图8中,打勾者为保留的数据。如此一来,数据量可缩减为原来的2/3,而落于预定数量范围内。
步骤S130的数据收缩程序(data shrink procedure)完成后,则回至步骤S120重新进行判断。
在步骤S140中,运算单元130根据特征,增加查询数据的数据量。步骤S130可以采取多种作法,以下分别一一说明。
在一实施例中,运算单元130可以提升特征的层级,以增加数据量。举例来说,请参照图9,其绘示增加查询数据的数据量的一示意图。特征N1例如是「平面广告金额」,特征N1的限制范围R1例如是「大于30万元」。运算单元130可以将特征N1的层级提升至特征N1’,例如是「各种广告金额」。如此一来,包含电视广告金额大于30万元的数据也会加入。使得查询数据的数据量能够有效增加。
在另一实施例中,运算单元130可以放大限制范围,以增加数据量。举例来说,请参照图10,其绘示降低查询数据的数据量的另一示意图。运算单元130可以将特征N1的限制范围R1放大为限制范围R1”,例如是将「大于30万元」放大为「大于10万元」。如此一来,查询数据的数据量能够有效增加。
步骤S140的数据扩大程序(data expand procedure)完成后,则回至步骤S120重新进行判断。
在步骤150中,分析单元140依据查询数掘,分析特征与事件的一相关性。分析单元140可以采用自适应增强(Adaptive boosting)算法、最小绝对压缩挑选法(LASSO)、逐步回归法(Stepwise Regression)等机器学习方法来分析特征与事件的相关性,并获得相关于事件的数据感知器(data sensor)。
因应巨量数据时代的来临,上述各种实施例可以透过数个查询指令的整合,快速发掘可能为数据感知器的特征,有效降巨量数据的分析复杂度。并且,透过数据收缩程序(data shrink procedure),有效避免数据过于庞大而无法负荷的情况。再者,透过数据扩大程序(data expand procedure),可以获得足够的数据量,以提升发掘数据感知器的精准度。
综上所述,虽然本发明已以较佳实施例公开如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求的保护范围所界定者为准。

Claims (16)

1.一种数据分析方法,包括:
整合一数据库中针对一事件的多笔查询指令,以获得被查询的多个特征,各该特征以一限制范围进行查询,于各该特征的各该限制范围下,该数据库被查询出多笔查询数据;
判断该些查询数据的一数据量是否高于一预定数量范围或低于该预定数量范围;
若该数据量高于该预定数量范围,则根据该些特征,降低该些查询数据的该数据量;
若该数据量低于该预定数量范围,则根据该些特征,增加该些查询数据的该数据量;以及
依据该些查询数据,分析该些特征与该事件的一相关性。
2.如权利要求1所述的数据分析方法,其中降低该些查询数据的该数据量的步骤包括:
依据该些特征于该些查询指令的使用次数,剔除部分的该些特征。
3.如权利要求1所述的数据分析方法,其中降低该些查询数据的该数据量的步骤包括:
缩小部分的该些限制范围。
4.如权利要求1所述的数据分析方法,其中降低该些查询数据的该数据量的步骤包括:
抽样该些查询数据。
5.如权利要求1所述的数据分析方法,其中增加该些查询数据的该数据量的步骤包括:
提升部分该些特征的层级。
6.如权利要求1所述的数据分析方法,其中增加该些查询数据的该数据量的步骤包括:
放大部分该些限制范围。
7.如权利要求1所述的数据分析方法,其中该些查询指令由至少二用户输入。
8.如权利要求1所述的数据分析方法,其中该些查询指令的其中两个由同一使用者输入。
9.一种数据分析***,包括:
一数据库;
一用户接口,用以接收多个使用者针对一事件的多笔查询指令;
一运算单元,连接于该数据库及该用户接口,该运算单元用以整合该些查询指令,以获得被查询的多个特征,各该特征以一限制范围进行查询,于各该特征的各该限制范围下,该数据库被查询出多笔查询数据;若该数据量高于一预定数量范围,则该运算单元根据该些特征,降低该些查询数据的该数据量;若该数据量低于该预定数量范围,则该运算单元根据该些特征,增加该些查询数据的该数据量;以及
一分析单元,连接于该数据库及该运算单元,该分析单元用以依据该些查询数据,分析该些与该事件的一相关性。
10.如权利要求9所述的数据分析***,其中该运算单元依据该些特征于该些查询指令的使用次数,剔除部分的该些特征,以降低该些查询数据的该数据量。
11.如权利要求9所述的数据分析***,其中该运算单元缩小部分该些限制范围,以降低该些查询数据的该数据量。
12.如权利要求9所述的数据分析***,其中该运算单元抽样该些查询数据,以降低该些查询数据的该数据量。
13.如权利要求9所述的数据分析***,其中该运算单元提升部分该些特征的层级,以增加该些查询数据的该数据量。
14.如权利要求9所述的数据分析***,其中该运算单元放大部分该些限制范围,以增加该些查询数据的该数据量。
15.如权利要求9所述的数据分析***,其中该些查询指令由至少二用户输入。
16.如权利要求9所述的数据分析***,其中该些查询指令的其中两个由同一使用者输入。
CN201510683234.5A 2015-09-23 2015-10-20 数据分析方法与装置 Active CN106547807B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW104131381A TWI607331B (zh) 2015-09-23 2015-09-23 資料分析方法與裝置
TW104131381 2015-09-23

Publications (2)

Publication Number Publication Date
CN106547807A true CN106547807A (zh) 2017-03-29
CN106547807B CN106547807B (zh) 2021-01-22

Family

ID=58282486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510683234.5A Active CN106547807B (zh) 2015-09-23 2015-10-20 数据分析方法与装置

Country Status (3)

Country Link
US (1) US11086881B2 (zh)
CN (1) CN106547807B (zh)
TW (1) TWI607331B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114357875A (zh) * 2021-12-27 2022-04-15 广州龙数科技有限公司 基于机器学习的智能数据处理***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11645605B2 (en) * 2019-08-22 2023-05-09 Sap Se Contextual IoT with blockchain

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118618A (zh) * 2006-08-02 2008-02-06 力晶半导体股份有限公司 工程数据分析数据库的查询***与方法
CN101441645A (zh) * 2007-11-23 2009-05-27 财团法人工业技术研究院 技术数据分析的***与方法
CN101751400A (zh) * 2008-12-09 2010-06-23 财团法人工业技术研究院 技术数据分析的***与方法以及专利分析的***
CN101814085A (zh) * 2010-02-04 2010-08-25 林培光 基于wdb特征和用户查询请求的web数据库选择方法
CN102576360A (zh) * 2009-09-29 2012-07-11 株式会社东芝 检索装置及***
CN103116649A (zh) * 2013-02-28 2013-05-22 用友软件股份有限公司 数据分析***和数据分析方法
CN103577429A (zh) * 2012-07-25 2014-02-12 阿里巴巴集团控股有限公司 数据分析、数据查询方法及装置
KR20140021934A (ko) * 2012-08-13 2014-02-21 양용철 외국인 관광객을 위한 인터넷 데이터 전용 스마트 폰의 임대 수익사업의 사업모델
CN103678402A (zh) * 2012-09-21 2014-03-26 厦门雅迅网络股份有限公司 一种海量数据下数据实时统计的方法
CN104090901A (zh) * 2013-12-31 2014-10-08 腾讯数码(天津)有限公司 一种对数据进行处理的方法、装置及服务器
TWM491908U (zh) * 2014-08-21 2014-12-11 shu-zhen Lin 整合式房屋物件配對系統
TW201516718A (zh) * 2013-10-29 2015-05-01 Chunghwa Telecom Co Ltd 調整大量資料檢索結果的方法
CN104679884A (zh) * 2015-03-16 2015-06-03 北京奇虎科技有限公司 数据库的数据分析方法、装置以及***
CN104750681A (zh) * 2013-12-25 2015-07-01 ***通信集团辽宁有限公司 一种海量数据的处理方法及装置
CN104794003A (zh) * 2015-02-04 2015-07-22 汉鼎信息科技股份有限公司 一种整合实时和非实时模式的大数据分析***
CN104834730A (zh) * 2015-05-15 2015-08-12 北京京东尚科信息技术有限公司 数据分析***和方法
KR20150096005A (ko) * 2014-02-13 2015-08-24 주식회사 더존다스 Gui 레이아웃 편집 시스템 및 그 제공방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832482A (en) 1997-02-20 1998-11-03 International Business Machines Corporation Method for mining causality rules with applications to electronic commerce
WO2002008948A2 (en) * 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
US6931612B1 (en) * 2002-05-15 2005-08-16 Lsi Logic Corporation Design and optimization methods for integrated circuits
US7836051B1 (en) 2003-10-13 2010-11-16 Amazon Technologies, Inc. Predictive analysis of browse activity data of users of a database access system in which items are arranged in a hierarchy
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US20140156628A1 (en) 2005-10-26 2014-06-05 Cortica Ltd. System and method for determination of causality based on big data analysis
US7904355B1 (en) 2007-02-20 2011-03-08 Vendavo, Inc. Systems and methods for a revenue causality analyzer
US8412598B2 (en) 2008-02-06 2013-04-02 John Early Systems and methods for a causality analyzer
US8762364B2 (en) 2008-03-18 2014-06-24 Yahoo! Inc. Personalizing sponsored search advertising layout using user behavior history
KR101045955B1 (ko) 2008-11-14 2011-07-04 한국과학기술정보연구원 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
US8655821B2 (en) 2009-02-04 2014-02-18 Konstantinos (Constantin) F. Aliferis Local causal and Markov blanket induction method for causal discovery and feature selection from data
US8392443B1 (en) * 2009-03-17 2013-03-05 Google Inc. Refining search queries
JP2012008659A (ja) 2010-06-22 2012-01-12 Sony Corp データ処理装置、データ処理方法、およびプログラム
US20130117272A1 (en) 2011-11-03 2013-05-09 Microsoft Corporation Systems and methods for handling attributes and intervals of big data
WO2013099002A1 (ja) * 2011-12-28 2013-07-04 楽天株式会社 検索装置、検索方法、検索プログラム及び記録媒体
TWI472936B (zh) 2012-05-11 2015-02-11 Univ Nat Taiwan 人物照片搜尋系統
US20140006338A1 (en) 2012-06-29 2014-01-02 Applied Materials, Inc. Big data analytics system
US20140214883A1 (en) * 2013-01-29 2014-07-31 Google Inc. Keyword trending data
US20140289174A1 (en) 2013-03-15 2014-09-25 Alexander Statnikov Data Analysis Computer System and Method For Causal Discovery with Experimentation Optimization
US9720940B2 (en) 2013-03-15 2017-08-01 Konstantinos (Constantin) F. Aliferis Data analysis computer system and method for parallelized and modularized analysis of big data
CN104517020B (zh) 2013-09-30 2017-10-20 日电(中国)有限公司 用于因果效应分析的特征提取方法和装置
US10068008B2 (en) * 2014-08-28 2018-09-04 Microsoft Technologies Licensing, LLC Spelling correction of email queries

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118618A (zh) * 2006-08-02 2008-02-06 力晶半导体股份有限公司 工程数据分析数据库的查询***与方法
CN101441645A (zh) * 2007-11-23 2009-05-27 财团法人工业技术研究院 技术数据分析的***与方法
CN101441645B (zh) * 2007-11-23 2016-09-28 财团法人工业技术研究院 技术数据分析的***与方法
CN101751400A (zh) * 2008-12-09 2010-06-23 财团法人工业技术研究院 技术数据分析的***与方法以及专利分析的***
CN102576360A (zh) * 2009-09-29 2012-07-11 株式会社东芝 检索装置及***
CN101814085A (zh) * 2010-02-04 2010-08-25 林培光 基于wdb特征和用户查询请求的web数据库选择方法
CN103577429A (zh) * 2012-07-25 2014-02-12 阿里巴巴集团控股有限公司 数据分析、数据查询方法及装置
KR20140021934A (ko) * 2012-08-13 2014-02-21 양용철 외국인 관광객을 위한 인터넷 데이터 전용 스마트 폰의 임대 수익사업의 사업모델
CN103678402A (zh) * 2012-09-21 2014-03-26 厦门雅迅网络股份有限公司 一种海量数据下数据实时统计的方法
CN103116649A (zh) * 2013-02-28 2013-05-22 用友软件股份有限公司 数据分析***和数据分析方法
TW201516718A (zh) * 2013-10-29 2015-05-01 Chunghwa Telecom Co Ltd 調整大量資料檢索結果的方法
CN104750681A (zh) * 2013-12-25 2015-07-01 ***通信集团辽宁有限公司 一种海量数据的处理方法及装置
CN104090901A (zh) * 2013-12-31 2014-10-08 腾讯数码(天津)有限公司 一种对数据进行处理的方法、装置及服务器
KR20150096005A (ko) * 2014-02-13 2015-08-24 주식회사 더존다스 Gui 레이아웃 편집 시스템 및 그 제공방법
TWM491908U (zh) * 2014-08-21 2014-12-11 shu-zhen Lin 整合式房屋物件配對系統
CN104794003A (zh) * 2015-02-04 2015-07-22 汉鼎信息科技股份有限公司 一种整合实时和非实时模式的大数据分析***
CN104794003B (zh) * 2015-02-04 2019-06-04 汉鼎宇佑互联网股份有限公司 一种整合实时和非实时模式的大数据分析***
CN104679884A (zh) * 2015-03-16 2015-06-03 北京奇虎科技有限公司 数据库的数据分析方法、装置以及***
CN104834730A (zh) * 2015-05-15 2015-08-12 北京京东尚科信息技术有限公司 数据分析***和方法
CN104834730B (zh) * 2015-05-15 2018-06-01 北京京东尚科信息技术有限公司 数据分析***和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114357875A (zh) * 2021-12-27 2022-04-15 广州龙数科技有限公司 基于机器学习的智能数据处理***

Also Published As

Publication number Publication date
US11086881B2 (en) 2021-08-10
TW201712579A (zh) 2017-04-01
TWI607331B (zh) 2017-12-01
US20170083583A1 (en) 2017-03-23
CN106547807B (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
Gauch Jr Statistical analysis of yield trials by AMMI and GGE
TWI772673B (zh) 行業識別模型確定方法和裝置
Temple Growth regressions and what the textbooks don’t tell you
Hannan et al. Dynamics of organizational populations: Density, legitimation, and competition
CN107633254A (zh) 建立预测模型的装置、方法及计算机可读存储介质
CN105181678B (zh) 基于激光诱导击穿光谱的水稻品种鉴别方法
CN109804363A (zh) 使用通过示例的格式修改的连接
CN109298840A (zh) 基于数据湖的数据集成方法、服务器及存储介质
US20180253414A1 (en) Determining output presentation type
WO2020228283A1 (zh) 特征提取方法、装置及计算机可读存储介质
CN110414277B (zh) 基于多特征参数的门级硬件木马检测方法
CN106462596A (zh) 生成上下文搜索呈现
CN110110754A (zh) 基于代价局部泛化误差的不平衡问题的分类方法
CN109614982A (zh) 产品分析方法、装置、计算机设备以及存储介质
CN107885754B (zh) 基于lda模型从交易数据中提取信用变量的方法和装置
CN106547807A (zh) 数据分析方法与装置
CN102841124B (zh) 用于质谱分析的离子选择优化
Pancrazi et al. Transparency, political conflict, and debt
Silverman et al. Predicting origins of coherent air mass trajectories using a neural network—the case of dry intrusions
CN108369647A (zh) 基于图像的质量控制
CN106951918A (zh) 一种用于冷冻电镜分析的单颗粒图像聚类方法
CN110837604B (zh) 基于住房监控平台的数据分析方法及装置
CN114021716A (zh) 一种模型训练的方法、***及电子设备
Fleming et al. Sensitivity of a white‐tailed deer habitat‐suitability index model to error in satellite land‐cover data: implications for wildlife habitat‐suitability studies
Alharbi et al. Demographic group prediction based on smart device user recognition gestures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant