CN110096529B - 一种基于多维矢量数据的网络数据挖掘方法和*** - Google Patents

一种基于多维矢量数据的网络数据挖掘方法和*** Download PDF

Info

Publication number
CN110096529B
CN110096529B CN201910305243.9A CN201910305243A CN110096529B CN 110096529 B CN110096529 B CN 110096529B CN 201910305243 A CN201910305243 A CN 201910305243A CN 110096529 B CN110096529 B CN 110096529B
Authority
CN
China
Prior art keywords
information
data
family
network
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910305243.9A
Other languages
English (en)
Other versions
CN110096529A (zh
Inventor
张俊曦
邢国贤
王石
赵学豪
吴坤鹏
朱翼署
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Jinlian Beijing Technology Co ltd
Original Assignee
Zhongke Jinlian Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Jinlian Beijing Technology Co ltd filed Critical Zhongke Jinlian Beijing Technology Co ltd
Priority to CN201910305243.9A priority Critical patent/CN110096529B/zh
Publication of CN110096529A publication Critical patent/CN110096529A/zh
Application granted granted Critical
Publication of CN110096529B publication Critical patent/CN110096529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多维矢量数据的网络数据挖掘方法和***。方法包括:将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源,根据设定条件搜索所述多个多维矢量数据源,并汇总搜索结果,对汇总的搜索结果进行聚类分析,产生信息数据族集合,对所述信息数据族集合中的每一个信息数据族统计其空间矢量分布,通过关联度分析获得网络数据的关联性。通过将网络信息数据源中的网络信息矢量化,减少了聚类分析和关联度分析运算的复杂性,保证了信息数据族的快速收敛,实现了多角度的关联度分析,提高了数据挖掘的效率。

Description

一种基于多维矢量数据的网络数据挖掘方法和***
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于多维矢量数据的网络数据挖掘方法和***。
背景技术
在互联网时代,随着移动互联网的普及和广泛应用,任何一个的事件都会在网络空间上产生大量的网络信息,包括但不限于自媒体用户公众号、微博、朋友圈、短视频、图片等相关内容。这些信息的特点是:信息量大、内容繁杂、形式多样、増长速度快、传播速度快、交互功能强。但是,由于这些网络信息零碎、分布范围广、多语种、无序、缺乏统一的数据库管理,因此试图人工从这些数据中还原事件的演化过程、发现关键环节、消除不良舆论影响较为困难。
现有技术中提出了采用数据挖掘技术分析热点事件网络信息的技术方案。以网络空间中提取的热点事件关键词为依托,通过与物理空间的数据集进行协同聚类,根据聚类结果提取物理空间与热点事件相关的信息样本,让用户可以快速、全面了解热点事件的相关信息。
然而,随着关键词数量增多,一方面协同聚类运算复杂度提高,难以快速获得聚类结果,另一方面缺少不同类型关键词之间的关联性分析,导致分析不够全面,数据挖掘效率较低。
发明内容
为了解决上述的聚类运算复杂度高,难以快速获得聚类结果,数据分析不够全面,数据挖掘效率较低的技术问题,本发明提出了一种基于多维矢量数据的网络数据挖掘方法和***。
一种基于多维矢量数据的网络数据挖掘方法,包括:将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源,根据设定条件搜索所述多个多维矢量数据源,并汇总搜索结果,对汇总的搜索结果进行聚类分析,产生信息数据族集合,对所述信息数据族集合中的每一个信息数据族统计其空间矢量分布,通过关联度分析获得网络数据的关联性。
进一步地,所述多维矢量数据源表示为DATA(a,r,p),a为行为信息分量,r为关系信息分量,p为位置信息分量。
进一步地,所述通过关联度分析获得网络数据的关联性包括计算每两个信息数据族之间的关联度,确定与事件的关联度高的信息数据族。
进一步地,所述通过关联度分析获得网络数据的关联性包括统计信息数据族中行为、关系、位置分量的分布情况,确定与事件关联度高的行为、关系和/或位置信息。
进一步地,还包括:计算信息数据族中代表行为、关系和/或位置分量的多个关键词与事件中代表行为、关系和/或位置分量的多个关键词的重合度,并进行归一化处理,将归一化后重合度大的关键词作为与时间关联度高的行为、关系和/或位置信息。
一种基于多维矢量数据的网络信息挖掘***,包括:矢量化模块,用于将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源,搜索模块,用于根据设定条件搜索所述多个多维矢量数据源,并汇总搜索结果,聚类分析模块,用于对汇总的搜索结果进行聚类分析,产生信息数据族集合,关联度分析模块,用于对所述信息数据族集合中的每一个信息数据族统计其空间矢量分布,通过关联度分析获得网络数据的关联性。
进一步地,所述多维矢量数据源表示为DATA(a,r,p),a为行为信息分量,r为关系信息分量,p为位置信息分量。
进一步地,所述通过关联度分析获得网络数据的关联性包括计算每两个信息数据族之间的关联度,确定与事件的关联度高的信息数据族。
进一步地,所述通过关联度分析获得网络数据的关联性包括统计信息数据族中行为、关系、位置分量的分布情况,确定与事件关联度高的行为、关系和/或位置信息。
进一步地,所述关联度分析模块还用于计算信息数据族中代表行为、关系和/或位置分量的多个关键词与事件中代表行为、关系和/或位置分量的多个关键词的重合度,并进行归一化处理,将归一化后重合度大的关键词作为与时间关联度高的行为、关系和/或位置信息。
本发明的有益效果:通过将网络信息数据源中的网络信息矢量化,减少了聚类分析和关联度分析运算的复杂性,保证了信息数据族的快速收敛,实现了多角度的关联度分析,提高了数据挖掘的效率。本发明实施例提出的方法和***可用于网络信息的控制,例如,为用户提供热点事件的相关信息或者可能感兴趣的内容。
附图说明
图1是根据本发明实施例提出的事件的信息三维空间示意图;
图2是根据本发明实施例提出的基于多维矢量数据的网络数据挖掘方法的方法流程图;
图3是根据本发明实施例提出的一种二维分布的聚类结果示意图;
图4是根据本发明实施例提出的一种基于多维矢量数据的网络数据挖掘***方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。但本领域技术人员知晓,本发明并不局限于附图和以下实施例。
本发明实施例提出了一种基于多维矢量数据的网络数据挖掘方法。
移动互联网时代,在社会上已经产生了影响的事件,将产生大量的网络信息。每一个事件可以包含多个信息集合,例如行为(action)集合、关系(relationship)集合和位置(position)集合等。行为是指人们一切有目的的活动,由一系列简单动作构成的,通常表现出来的一切动作的统称。关系是指人与人之间,人与事物之间,事物与事物之间的相互联系。位置是指确定的地理位置。事件的信息集合ei可以表示为三个子集之和,即:{∑ak+∑rn+∑pm}∈ei。其中,[i k n m]=1,2……n,∑ak为行为信息子集,∑rn为关系信息子集,∑pm为位置信息子集。如图1所示,通过将行为、关系和位置作为三维空间中的X,Y,Z轴,可以在三维空间中描述一个事件的信息集合。事件信息来源于信息源,因而事件信息集合ei也来源于信息源。每一个信息源可以包含行为信息子集、关系信息子集和位置信息子集中的一种或多种。
图2是根据本发明实施例提出的一种基于多维矢量数据的网络数据挖掘方法。如图2所示,在步骤210中,将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源。以三维矢量数据源为例,将行为、关系和位置作为三维空间中的X,Y,Z轴,三维矢量数据源可以表示为DATA(a,r,p),即三维空间中的一个点。从事件信息的原点到这个点的向量,代表了网络信息矢量化。如果网络信息数据源中只包含行为信息子集、关系信息子集和位置信息子集中的一种或两种,不包含的信息子集分量则表示为0。例如网络信息数据源包含行为信息子集、关系信息子集,则三维矢量数据源表示为DATA(a,r,0)。可以选择更多的维度构建多维矢量数据。
在步骤220中,根据设定条件搜索多个多维矢量数据源,获得多个网络信息数据源的矢量信息。可以采用多次迭代搜索的方式进行搜索,例如在完成第一次搜索后,将得到的结果作为搜索元素再进行搜索。迭代次数一般不超过3次。完成搜索后,将搜索结果进行汇总。
在步骤230中,对汇总的搜索结果进行多种参数的聚类分析,获得多样式分布的聚类结果,产生信息数据族的集合。如图3所示,分别使用基于密度和基于网格(搜索迭代次数作为网格的标尺)的方法进行聚类分析,得到二维分布的聚类结果,聚类结果包括多个信息数据族,每个信息数据族都分别包含了具有矢量信息的信息元素。
在步骤240中,对每一个信息数据族的空间矢量分布进行统计,进行关联度分析获得网络数据的关联性。通过关联度分析,确定与事件关联度高的信息族,以及信息族中主要的信息元素,从而对事件作出正确的研判。计算每两个信息数据族之间的关联度,确定哪些信息族与事件的关联度高。两个信息族之间的距离越近,其关联度越高。统计信息数据族中行为、关系、位置分量的分布情况,确定哪些行为、关系、位置与事件关联度较高。计算信息数据族中代表行为/关系/位置分量的多个关键词与事件中行为/关系/位置分量多个关键词的重合度,并进行归一化处理。将归一化后重合度较大的关键词作为与时间关联度较高的行为/关系/位置元素。
通过将网络信息数据源中的网络信息矢量化,减少了聚类分析和关联度分析运算的复杂性,保证了信息数据族的快速收敛,实现了多角度的关联度分析,提高了数据挖掘的效率。
本发明实施例还提出了一种基于多维矢量数据的网络数据挖掘***。
图4是根据本发明实施例提出的一种基于多维矢量数据的网络数据挖掘***。如图4所示,网络数据挖掘***包括矢量化模块410,用于将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源。以三维矢量数据源为例,将行为、关系和位置作为三维空间中的X,Y,Z轴,三维矢量数据源可以表示为DATA(a,r,p),即三维空间中的一个点。从事件信息的原点到这个点的向量,代表了网络信息矢量化。如果网络信息数据源中只包含行为信息子集、关系信息子集和位置信息子集中的一种或两种,不包含的信息子集分量则表示为0。例如网络信息数据源包含行为信息子集、关系信息子集,则三维矢量数据源表示为DATA(a,r,0)。可以选择更多的维度构建多维矢量数据。
网络数据挖掘***包括搜索模块420,用于根据设定条件搜索多个多维矢量数据源,获得多个网络信息数据源的矢量信息。可以采用多次迭代搜索的方式进行搜索,例如在完成第一次搜索后,将得到的结果作为搜索元素再进行搜索。迭代次数一般不超过3次。完成搜索后,将搜索结果进行汇总。
网络数据挖掘***包括聚类分析模块430,用于对汇总的搜索结果进行多种参数的聚类分析,获得多样式分布的聚类结果,产生信息数据族的集合。分别使用基于密度和基于网格(搜索迭代次数作为网格的标尺)的方法进行聚类分析,得到二维分布的聚类结果,聚类结果包括多个信息数据族,每个信息数据族都分别包含了具有矢量信息的信息元素。
网络数据挖掘***包括关联度分析模块440,用于对每一个信息数据族的空间矢量分布进行统计,进行关联度分析获得网络数据的关联性。通过关联度分析,确定与事件关联度高的信息族,以及信息族中主要的信息元素,从而对事件作出正确的研判。计算每两个信息数据族之间的关联度,确定哪些信息族与事件的关联度高。两个信息族之间的距离越近,其关联度越高。统计信息数据族中行为、关系、位置分量的分布情况,确定哪些行为、关系、位置与事件关联度较高。
在一实施例中,所述关联度分析模块440还用于计算信息数据族中代表行为/关系/位置分量的多个关键词与事件中行为/关系/位置分量多个关键词的重合度,并进行归一化处理。将归一化后重合度较大的关键词作为与时间关联度较高的行为/关系/位置元素。
通过将网络信息数据源中的网络信息矢量化,减少了聚类分析和关联度分析运算的复杂性,保证了信息数据族的快速收敛,实现了多角度的关联度分析,提高了数据挖掘的效率。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上,对本发明的实施方式进行了说明。但是,本发明不限定于上述实施方式。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于多维矢量数据的网络数据挖掘方法,其特征在于,包括:
将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源,
根据设定条件搜索所述多个多维矢量数据源,并汇总搜索结果,
对汇总的搜索结果进行聚类分析,产生信息数据族集合,
对所述信息数据族集合中的每一个信息数据族统计其空间矢量分布,通过关联度分析获得网络数据的关联性,计算每两个信息数据族之间的关联度,确定与事件关联度高的信息族,以及信息族中主要的信息元素,统计信息数据族中行为、关系和位置分量的分布情况,确定与事件关联度高的行为、关系和/或位置信息,从而对事件作出正确的研判;
其中,将行为、关系和位置分别作为三维空间的X、Y和Z轴,所述多维矢量数据源表示为DATA(a,r,p),a为行为信息分量,r为关系信息分量,p为位置信息分量。
2.如权利要求1所述的数据挖掘方法,其特征在于,还包括:计算信息数据族中代表行为、关系和/或位置分量的多个关键词与事件中代表行为、关系和/或位置分量的多个关键词的重合度,并进行归一化处理,将归一化后重合度大的关键词作为与事件关联度高的行为、关系和/或位置信息。
3.一种基于多维矢量数据的网络数据挖掘***,其特征在于,包括:
矢量化模块,用于将多个网络信息数据源中的网络信息矢量化,形成多个多维矢量数据源,
搜索模块,用于根据设定条件搜索所述多个多维矢量数据源,并汇总搜索结果,
聚类分析模块,用于对汇总的搜索结果进行聚类分析,产生信息数据族集合,
关联度分析模块,用于对所述信息数据族集合中的每一个信息数据族统计其空间矢量分布,通过关联度分析获得网络数据的关联性,计算每两个信息数据族之间的关联度,确定与事件关联度高的信息族,以及信息族中主要的信息元素,统计信息数据族中行为、关系和位置分量的分布情况,确定与事件关联度高的行为、关系和/或位置信息,从而对事件作出正确的研判;
其中,将行为、关系和位置分别作为三维空间的X、Y和Z轴,所述多维矢量数据源表示为DATA(a,r,p),a为行为信息分量,r为关系信息分量,p为位置信息分量。
4.如权利要求3所述的数据挖掘***,其特征在于,所述关联度分析模块还用于计算信息数据族中代表行为、关系和/或位置分量的多个关键词与事件中代表行为、关系和/或位置分量的多个关键词的重合度,并进行归一化处理,将归一化后重合度大的关键词作为与事件关联度高的行为、关系和/或位置信息。
CN201910305243.9A 2019-04-16 2019-04-16 一种基于多维矢量数据的网络数据挖掘方法和*** Active CN110096529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910305243.9A CN110096529B (zh) 2019-04-16 2019-04-16 一种基于多维矢量数据的网络数据挖掘方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910305243.9A CN110096529B (zh) 2019-04-16 2019-04-16 一种基于多维矢量数据的网络数据挖掘方法和***

Publications (2)

Publication Number Publication Date
CN110096529A CN110096529A (zh) 2019-08-06
CN110096529B true CN110096529B (zh) 2021-07-16

Family

ID=67444890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910305243.9A Active CN110096529B (zh) 2019-04-16 2019-04-16 一种基于多维矢量数据的网络数据挖掘方法和***

Country Status (1)

Country Link
CN (1) CN110096529B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331995A (zh) * 2011-07-08 2012-01-25 华东师范大学 一种基于点源的地球信息三维模型的信息采集方法和***
CN105488628A (zh) * 2015-11-30 2016-04-13 国网天津市电力公司 一种面向电力大数据可视化的数据挖掘方法
CN106304015A (zh) * 2015-05-28 2017-01-04 中兴通讯股份有限公司 用户设备的确定方法及装置
CN109344212A (zh) * 2018-08-24 2019-02-15 武汉中地数码科技有限公司 一种面向主题特征的地理大数据挖掘推荐的方法及***
CN109389158A (zh) * 2018-09-19 2019-02-26 成都城电电力工程设计有限公司 基于数据挖掘和人机互动的电网调度早会***构架方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880719A (zh) * 2012-10-16 2013-01-16 四川大学 基于位置社交网络的用户轨迹相似性挖掘方法
CN103812719B (zh) * 2012-11-12 2018-05-18 华为技术有限公司 集群***的失效预测方法及装置
CN105608219B (zh) * 2016-01-07 2019-06-18 上海通创信息技术有限公司 一种基于聚类的流式推荐引擎、推荐***以及推荐方法
CN106599436A (zh) * 2016-12-08 2017-04-26 湖南大学 办公建筑用户在室行为预测方法
CN106844585A (zh) * 2017-01-10 2017-06-13 广东精规划信息科技股份有限公司 一种基于多源物联网位置感知的时空关系分析***
CN107133632A (zh) * 2017-02-27 2017-09-05 国网冀北电力有限公司 一种风电设备故障诊断方法及***
US11621969B2 (en) * 2017-04-26 2023-04-04 Elasticsearch B.V. Clustering and outlier detection in anomaly and causation detection for computing environments
CN108345660A (zh) * 2018-01-31 2018-07-31 山东汇贸电子口岸有限公司 一种基于政府数据的数据分析方法
CN109376185A (zh) * 2018-10-25 2019-02-22 广州市金禧信息技术服务有限公司 大数据环境下的数据挖掘***及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331995A (zh) * 2011-07-08 2012-01-25 华东师范大学 一种基于点源的地球信息三维模型的信息采集方法和***
CN106304015A (zh) * 2015-05-28 2017-01-04 中兴通讯股份有限公司 用户设备的确定方法及装置
CN105488628A (zh) * 2015-11-30 2016-04-13 国网天津市电力公司 一种面向电力大数据可视化的数据挖掘方法
CN109344212A (zh) * 2018-08-24 2019-02-15 武汉中地数码科技有限公司 一种面向主题特征的地理大数据挖掘推荐的方法及***
CN109389158A (zh) * 2018-09-19 2019-02-26 成都城电电力工程设计有限公司 基于数据挖掘和人机互动的电网调度早会***构架方法

Also Published As

Publication number Publication date
CN110096529A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
Skoutas et al. Ranking and clustering web services using multicriteria dominance relationships
US9152691B2 (en) System and method for performing set operations with defined sketch accuracy distribution
US9747349B2 (en) System and method for distributing queries to a group of databases and expediting data access
Wang et al. Locating structural centers: A density-based clustering method for community detection
CN109885773B (zh) 一种文章个性化推荐方法、***、介质及设备
Gao et al. Answering why-not questions on reverse top-k queries
Liu et al. U-skyline: A new skyline query for uncertain databases
CN104573130A (zh) 基于群体计算的实体解析方法及装置
Jiang et al. Probabilistic skylines on uncertain data: model and bounding-pruning-refining methods
Wang et al. Mining maximal sub-prevalent co-location patterns
CN113760891B (zh) 一种数据表的生成方法、装置、设备和存储介质
US11868346B2 (en) Automated linear clustering recommendation for database zone maps
Singh et al. Nearest keyword set search in multi-dimensional datasets
Yu et al. Effective algorithms for vertical mining probabilistic frequent patterns in uncertain mobile environments
Lin et al. BigIN4: Instant, interactive insight identification for multi-dimensional big data
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
Rehs A supervised machine learning approach to author disambiguation in the Web of Science
CN115905630A (zh) 一种图数据库查询方法、装置、设备及存储介质
Saad et al. Efficient skyline computation on uncertain dimensions
CN111159559A (zh) 根据用户需求和用户行为构建推荐引擎的方法
US20200257684A1 (en) Higher-order data sketching for ad-hoc query estimation
Goyle et al. Dataassist: A machine learning approach to data cleaning and preparation
Swidan et al. A model for processing skyline queries in crowd-sourced databases
Gao et al. Efficient algorithms for finding the most desirable skyline objects
Skhiri et al. Large graph mining: recent developments, challenges and potential solutions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100102 room 16b557, 16 / F, 101, floor 4-33, building 13, District 4, Wangjing Dongyuan, Chaoyang District, Beijing

Patentee after: ZHONGKE JINLIAN (BEIJING) TECHNOLOGY Co.,Ltd.

Address before: 100102 605, 6th floor, building 13, yard 18, ziyue Road, a 1 Laiguangying middle street, Chaoyang District, Beijing

Patentee before: ZHONGKE JINLIAN (BEIJING) TECHNOLOGY Co.,Ltd.