CN106202092A - 数据处理的方法及*** - Google Patents

数据处理的方法及*** Download PDF

Info

Publication number
CN106202092A
CN106202092A CN201510222356.4A CN201510222356A CN106202092A CN 106202092 A CN106202092 A CN 106202092A CN 201510222356 A CN201510222356 A CN 201510222356A CN 106202092 A CN106202092 A CN 106202092A
Authority
CN
China
Prior art keywords
key
value pair
focus
pending
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510222356.4A
Other languages
English (en)
Other versions
CN106202092B (zh
Inventor
韩旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510222356.4A priority Critical patent/CN106202092B/zh
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to JP2017557451A priority patent/JP6779231B2/ja
Priority to ES16789273T priority patent/ES2808948T3/es
Priority to PL16789273T priority patent/PL3293641T3/pl
Priority to SG11201708917SA priority patent/SG11201708917SA/en
Priority to EP16789273.6A priority patent/EP3293641B1/en
Priority to KR1020177034735A priority patent/KR102134952B1/ko
Priority to PCT/CN2016/079812 priority patent/WO2016177279A1/zh
Publication of CN106202092A publication Critical patent/CN106202092A/zh
Priority to US15/797,537 priority patent/US10592491B2/en
Priority to US16/800,641 priority patent/US10872070B2/en
Application granted granted Critical
Publication of CN106202092B publication Critical patent/CN106202092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/08Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种数据处理的方法及其***。该方法包括以下步骤:根据筛选规则,从待处理的键值对中选择部分作为热点键值对;对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;对中间结果键值对执行归约处理,生成供调用的最终结果键值对;其中,键值对包括表征属性的键值和表征属性内容的键值。在该方法及其对应的***中,数据处理***将热点键值对预先处理以便业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。

Description

数据处理的方法及***
技术领域
本申请涉及大数据技术领域,尤其涉及一种数据处理的方法及***。
背景技术
随着计算机技术的发展,计算机需要处理的数据量也越来越大,单台计算机已经不能处理一些大规模的数据,因此发展出将多台计算机联合起来构成计算机群以并行处理大规模数据的技术。
Hadoop分布式集群***架构即是这样的***架构。Hadoop***可以使用大量廉价的计算机构成计算机集群,通过该集群取代昂贵的高运算速度的计算机进行高速运算和存储。Hadoop***主要包括分布式文件***和映射(Map)归约(Reduce)***。其中,分布式文件***进行数据管理和数据存储。映射归约***实现对分布式文件***输入的数据进行运算处理,主要包括:将待处理数据集分解为多个数据块;分别对每个数据块中的每个原始键值对数据执行Map处理,得到与每个原始键值对数据对应的中间结果键值对数据;在得到与所有原始键值对数据对应的中间结果键值对数据后,再对所有中间结果键值对数据进行相应的归约(Reduce)处理,得到相应的最终结果键值对数据。
通过上述处理方式,可以将一个大的任务拆成较大数量的小任务并由处于分布式***中的较大数量的计算机(也称为任务执行者)来执行。这样可以完成对海量数据的快速处理。这种处理方式仍然没有减少总的计算资源,而是将需要的大量计算资源分配给了大量的计算机,从而可以大大压缩需要的处理时间。对于对时间敏感度不高的离线场景来说,这种处理方式较为适合。对于在线业务场景,例如即时通讯场景,一般要求在短时间内完成海量数据处理并输出结果,因此对时间较为敏感。
在实现本申请过程中,发明人发现现有技术中至少存在如下问题:
对时间较为敏感的在线业务场景中,仍然是占用大量计算机资源对海量数据完成处理,即处理的数据量仍然是巨大的。因此,Hadoop***处理数据过程消耗的时间冗长,造成业务***调用Hadoop***对数据处理结果的等待时间长,执行效率低,不能满足具体的业务顺畅的诉求,进而导致用户体验差。
因此,发明人在对现有的数据处理的方法进行研究的基础上,提供一种执行效率高、用户体验好的数据处理的方法及***。
发明内容
本申请实施例提供一种执行效率高、用户体验好的数据处理的方法,具体的,一种数据处理的方法,包括以下步骤:
根据筛选规则,从待处理的键值对中选择部分作为热点键值对;
对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;
对中间结果键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征数值的键值。
本申请实施例还提供一种数据处理的方法,包括以下步骤:
对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
本申请实施例还提供一种数据处理的***,包括:
筛选模块,用于根据筛选规则,从待处理的键值对中选择部分作为热点键值对;
映射模块,用于对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;
归约模块,用于对中间结果键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征数值的键值。
本申请实施例还提供一种数据处理的***,包括:
映射模块,用于对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
筛选模块,用于根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
归约模块,用于对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
本申请实施例提供的数据处理的方法和***,至少具有如下有益效果:
数据处理***将热点键值对预先处理以便业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的数据处理的方法的流程图。
图2为本申请实施例提供的从映射键值对中选择部分作为热点键值对的流程图。
图3为本申请实施例提供的数据处理的***的结构示意图。
具体实施方式
为了解决现有的数据处理的方法的数据处理时间长、执行效率低,不能满足具体的业务顺畅的诉求,进而导致用户体验差的技术问题,本申请实施例提供了一种数据处理的方法及其对应***。在该方法及其对应的***中,数据处理***将热点键值对预先处理以便业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
Hadoop***可以包括:
客户端JobClient,用于提交Map-Reduce工作;
工作调度器JobTracker,其为一个Java进程,用于协调整个工作的运行;
任务调度器TaskTracker,其为一个Java进程,运行此工作的任务;
分布式文件***(Hadoop Distributed File System,HDFS),用于在各个进程间共享工作相关的文件。
Hadoop***的工作流程可以包括:
一、任务提交。
客户端向工作调度器请求一个新的工作代码,创建一个新的工作实例,调用submitJob函数。
二、任务初始化。
当工作调度器收到submitJob函数调用的时候,获取并初始化任务。工作调度器创建任务,并分配任务代码。
三、任务分配。
工作调度器给任务调度器分配任务。
四、任务执行。
任务调度器被分配了一个任务后,开始运行此任务。映射过程中,任务调度器调用map函数处理任务,也即处理原始键值对生成中间结果键值对,并将中间结果键值对按照键值的顺序输出。然后,任务调度器调用reduce函数处理中间结果键值对生成最终结果键值对。
五、任务结束
工作调度器获得任务调度器的所有任务运行成功的报告后,结束工作。
图1为本申请实施例提供的数据处理的方法的流程图,具体包括以下步骤:
S100:根据筛选规则,从待处理的键值对中选择部分作为热点键值对。
数据体现为描述数据性质的属性及数值,也就是通常讲的键值对。键值对包括表征属性的键值和表征属性内容的键值。属性内容包括但不限于列表list、哈希表hash map、字符串、数值、布尔值、有序列表array、null值等。例如,{“姓名”:“王小二”}表示人物的“姓名”为“王小二”的数据。
在一个具体实施例中,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:可以随机选择若干待处理的键值对作为热点键值对。实际上,判断待处理的键值对是否是热点键值对是一个复杂的过程,尤其是待处理键值对的数量级在百万,甚至上亿的情形下。在本申请实施例中,数据处理***随机选择若干待处理键值对作为热点键值对,从而可以简化待处理键值对是否是热点键值对的判断过程,提高使用该方法的数据处理效率。
将热点键值对预先处理供业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
在又一个具体实施例中,请参照图2,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:
S101:随机选择第一数量的待处理的键值对作为待选键值对;
S102:统计待选键值对中每一键值对被调用的频度;
S103:按照频度排列待选键值对;
S104:从待选键值对中选择第二数量的、调用的频度位于前列的键值对作为热点键值对;
其中,第一数量大于第二数量。
在本申请实施例中,首先,数据处理***随机选择第一数量的映射键值对作为待选键值对。第一数量通常与具体的业务相对应。该第一数量的数值可以是根据历史经验设定的固定值,也可以是计算机动态调整变化生成的数值。
然后,数据处理***统计待选键值对中每一键值对被调用的频度,按照频度排列待选键值对。在具体的业务活动中,往往需要调取一定数量的键值对来对业务***进行支持。此时,数据处理***对每一键值对被调用的频度——一段时间内被调用的次数——进行追踪记录。进一步的,数据处理***还可以按照被调用的频度从大到小排列键值对。
接着,数据处理***从待选键值对中选择第二数量的、调用的频度位于前列的键值对作为热点键值对。其中,第一数量大于第二数量。同样,该第二数量的数值可以是根据历史经验设定的固定值,也可以是数据处理***动态调整变化生成的数值。选择出来的热点键值对相对于其他的待选键值对被调用的频度大。数据处理***预先将热点键值对处理,而不是对其他的待选键值对进行预先处理。预先处理过的键值对被调用的概率大于其他键值对被调用的概率。从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
进一步的,在本申请实施例中,从映射键值对中选择部分作为热点键值对,还包括:
在随机选择第一数量的待处理的键值对作为待选键值对的步骤之前,设定待选键值对的业务类别条件集;
选择符合业务类别条件集的待处理的键值对。
在本申请实施例中,业务类别条件集可以根据历史经验设定的固定,也可以动态调整变化生成。实际上,一种业务活动的业务***调用的键值对往往带有一些特有的性质以区别于其他业务活动。例如,推送信息的业务***调用的键值对,相较于支付的业务***调用的键值对,有其特有的性质。推送信息的业务***,可以与表示接收者年龄的键值对相关。例如,婚庆商品的推送信息对于年龄在16岁以下的接收者通常属于垃圾信息。推送信息的业务***的业务类别条件集包含表示年龄的键值对时,可以取得较好的推送效果。
因此,设定待处理的键值对的业务类别条件集,数据处理***经过业务类别条件集的判断可以过滤掉大量的待处理的键值对,提高热点键值对的选择精确度,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
在本申请的又一个具体实施例中,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:
设定热点键值对的调用频度阈值;
当键值对被调用的频度大于调用频度阈值时,将该键值对设置为热点键值对。
在本申请实施例中,设定键值对的调用频度阈值,当键值对的被调用的频度大于调用频度阈值时,数据处理***将该键值对设置为热点键值对。数据处理***预先将热点键值对处理,而不是对其他的键值对进行预先处理。预先处理过的键值对被调用的概率大于其他键值对被调用的概率。从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
S200:对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对。
在本申请提供的一个实施例中,客户端JobClient向工作调度器提交Map-Reduce工作,创建一个新的工作实例,调用submitJob函数。当工作调度器收到submitJob函数调用的时候,获取并初始化任务。工作调度器创建一个任务,并分配一个任务代码。工作调度器给任务调度器分配任务。任务调度器被分配了一个任务后,开始运行此任务。映射过程中,任务调度器调用map函数处理任务,也即处理原始键值对生成中间结果键值对,并将中间结果键值对按照键值的顺序输出。
S300:对中间结果键值对执行归约处理,生成供调用的最终结果键值对。
在本步骤中,任务调度器调用reduce函数处理中间结果键值对生成最终结果键值对。工作调度器获得任务调度器的所有任务运行成功的报告后,将最终结果键值对存入分布式文件***,并结束工作。
在本申请实施例中,数据处理***将热点键值对预先处理以便业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
在本申请提供的一个实施例中,方法还包括:
使用机器学习模型,优化对筛选规则。
机器学习模型,涉及人工智能。在本申请实施例中,使用机器学习模型对筛选规则进行优化。数据处理***运行一段时间后,热点键值对和非热点键值对判断的准确性可以显著提高。从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
使用何种机器学习模型,根据具体的业务***来进行选择,下面简单介绍一种机器学习模型对筛选规则的优化。
具体的,使用机器学习模型中的聚类算法,统计键值对被调用的频度随单一属性的分布状况;
根据键值对被调用的频度随单一属性的分布状况,选择键值对被调用的频度不小于预设频度阈值的属性内容的键值的区间;
设定所述属性内容的键值的区间为筛选规则的规则条件。
仍以上面的推送信息的业务***为例来说明。假设,业务***统计出推送信息的业务超出某一预设比例,例如50%,调用表示接收者年龄的键值对。机器学习模型通过K-means聚类算法对筛选规则进行优化。
假设要把样本集(表示接收者年龄的键值对及其被调用的频度)分为m个类别(频度段),算法描述如下:
(1)适当选择m个类别(频度段)的初始中心(频度);
(2)在第k次迭代中,对任意一个样本(表示接收者年龄的键值对及其被调用的频度),求其到m个中心的距离(频度差),将该样本(表示接收者年龄的键值对及其被调用的频度)归到距离最短的中心所在的类别(频度段);
(3)利用均值方法更新该类别(频度段)的中心值(频度);
(4)对于所有的m个中心值(频度),如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代;
(5)针对m个类别(频度段)中的每一个类别(频度段)适当选择n个类别(年龄段)的初始中心(年龄);
(6)在第k次迭代中,对任意一个样本(表示接收者年龄的键值对及其被调用的频度),求其到n个中心的距离(年龄差),将该样本(表示接收者年龄的键值对及其被调用的频度)归到距离最短的中心所在的类别(年龄段);
(7)利用均值方法更新该类别(年龄段)的中心值(年龄);
(8)对于所有的n个中心值(年龄),如果利用(6)(7)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代。
通过该算法,可以计算出调用的频度大的待处理的键值对随年龄的聚类规律。将接收者年龄位于某个类别(年龄段)作为筛选规则的规则条件,例如,将表示接收者年龄位于12-18岁作为待处理的键值对是热点键值对的规则条件。业务***通过机器学习模型对筛选规则优化后,则根据优化后的筛选规则,将热点键值对从待处理的键值对中筛选出。
在本申请提供的实施例中,规则优化模块,还用于:
当一个属性的键值对和另一属性的键值对被具有同一业务代码的业务***调用时,将这两个属性的键值对的属性内容的键值的区间的并集设定为筛选规则的规则条件。
假设,机器学习模型完成接收者年龄这一维度对筛选规则的优化后,还完成了接收者职业这一维度对筛选规则的优化。
数据处理***计算出接收者处于某一年龄段的待处理的键值对和接收者属于某一职业的待处理的键值对,与推送信息高度相关。例如,某待处理的键值对表示接收者处于20-30年龄段,某待处理的键值对表示接收者处于计算机行业,业务***推送信息时,对同时具有这两个维度特征的接收者能获得良好的业务推广效果。则,机器学习模型将表示接收者处于20-30年龄段的待处理的键值对,和表示接收者处于计算机行业的待处理的键值对进行关联形成热点键值对数据组。
数据处理***通过机器学习模型进一步对热点键值对数据组被调用的频度进行排序,将热点键值对数据组区分为热点数据组和非热点数据组。热点数据组的一种动态调整模式为:设定热点数据组的调用的频度阈值,当数据组中键值对被调用的频度大于频度阈值时,将该数据组设定为热点数据组。
在本申请实施例中,设定数据组处理优先级值。该优先级值由待处理的键值对的加权和值算得。根据该优先级值,动态调整数据组的处理优先级。当数据组中某一键值对被调用一次,数据组的优先级值增加一个单位。当某一数据组的优先级值超过其前一个数据组的优先级值时,数据处理***将该数据组前置一位。经过机器学习模型对筛选规则的优化,数据处理***从待处理的键值对中选择出的热点键值对是被调用频度位于前列的映射键值对,其中由键值对关联形成的热点数据组是被调用频度位于前列的数据组,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
在本申请提供的一个实施例中,方法还包括:
当非热点键值对被调用时,使用归约函数处理非热点键值对生成供调用的数据。
在本申请实施例中,热点键值对由数据处理***使用归约函数预先处理生成供业务***调用的数据;非热点键值对在被业务***调用时,由数据处理***使用归约函数即时处理,生成供业务***调用的数据。从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
在本申请实施例的一种替代方式中,数据处理的方法,包括以下步骤:
对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
需要指出的是,与前面提供的具体实施例的差别在于:选择部分作为热点键值对的步骤,设置于映射处理步骤之后。在本申请实施例中,降低了归约处理的键值对的数据量,可以在一定程度上解决数据量巨大的问题,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
以上是本申请实施例提供的数据处理的方法,基于同样的思路,请参照图3,本申请还提供一种数据处理的***1,包括:
筛选模块10,用于根据筛选规则,从待处理的键值对中选择部分作为热点键值对;
映射模块20,用于对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;
归约模块30,用于对中间结果键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征数值的键值。
进一步的,筛选模块10,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
随机选择若干待处理的键值对作为热点键值对。
进一步的,筛选模块10,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
随机选择第一数量的待处理的键值对作为待选键值对;
统计待选键值对中每一键值对被调用的频度;
按照频度排列待选键值对;
从待选键值对中选择第二数量的、调用的频度位于前列的键值对作为热点键值对;
其中,第一数量大于第二数量。
进一步的,筛选模块10,用于从映射键值对中选择部分作为热点键值对,具体还用于:
在随机选择第一数量的待处理的键值对作为待选键值对的步骤之前,设定待选键值对的业务类别条件集;
选择符合业务类别条件集的待处理的键值对。
进一步的,筛选模块10,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
设定热点键值对的调用频度阈值;
当键值对被调用的频度大于调用频度阈值时,将该键值对设置为热点键值对。
进一步的,***还包括规则优化模块40,用于:
使用机器学习模型,优化对筛选规则。
进一步的,映射模块20,用于:
当非热点键值对被调用时,对非热点键值对执行映射处理,得到与非热点键值对对应的中间结果键值对。
进一步的,一种数据处理的***1,包括:
映射模块20,用于对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
筛选模块10,用于根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
归约模块30,用于对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
在本申请实施例中,数据处理***将热点键值对预先处理以便业务***调用,而非热点键值对在业务***调用时才进行处理,从而,减少了为业务***提供后台服务的数据处理***需要即时处理的数据量,提高数据处理执行效率,减少了业务***获得数据处理结果的等待时间,业务处理顺畅,进而用户体验好。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数值处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数值处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数值处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数值处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数值结构、程序的模块或其他数值。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数值信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (20)

1.一种数据处理的方法,其特征在于,包括以下步骤:
根据筛选规则,从待处理的键值对中选择部分作为热点键值对;
对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;
对中间结果键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
2.如权利要求1所述的方法,其特征在于,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:
随机选择若干待处理的键值对作为热点键值对。
3.如权利要求1所述的方法,其特征在于,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:
随机选择第一数量的待处理的键值对作为待选键值对;
统计待选键值对中每一键值对被调用的频度;
按照频度排列待选键值对;
从待选键值对中按照调用频度由高到低的顺序选择第二数量的键值对作为热点键值对;
其中,第一数量大于第二数量。
4.如权利要求3所述的方法,其特征在于,所述根据筛选规则,从映射键值对中选择部分作为热点键值对,还包括:
在随机选择第一数量的待处理的键值对作为待选键值对的步骤之前,设定待选键值对的业务类别条件集;
选择符合业务类别条件集的待处理的键值对。
5.如权利要求1所述的方法,其特征在于,根据筛选规则,从待处理的键值对中选择部分作为热点键值对,具体包括:
设定热点键值对的调用频度阈值;
当键值对被调用的频度大于调用频度阈值时,将该键值对设置为热点键值对。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
使用机器学习模型,优化筛选规则。
7.如权利要求6所述的方法,其特征在于,使用机器学习模型,优化筛选规则,具体包括:
使用机器学习模型中的聚类算法,统计键值对被调用的频度随单一属性的分布状况;
根据键值对被调用的频度随单一属性的分布状况,选择键值对被调用的频度不小于预设频度阈值的属性内容的键值的区间;
设定所述属性内容的键值的区间为筛选规则的规则条件。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
当一个属性的键值对和另一属性的键值对被具有同一业务代码的业务***调用时,将这两个属性的键值对的属性内容的键值的区间的并集设定为筛选规则的规则条件。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
当非热点键值对被调用时,使用归约函数处理非热点键值对生成供调用的数据。
10.一种数据处理的方法,其特征在于,包括以下步骤:
对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
11.一种数据处理的***,其特征在于,包括:
筛选模块,用于根据筛选规则,从待处理的键值对中选择部分作为热点键值对;
映射模块,用于对热点键值对执行映射处理,得到与热点键值对对应的中间结果键值对;
归约模块,用于对中间结果键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征数值的键值。
12.如权利要求11所述的***,其特征在于,所述筛选模块,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
随机选择若干待处理的键值对作为热点键值对。
13.如权利要求11所述的***,其特征在于,所述筛选模块,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
随机选择第一数量的待处理的键值对作为待选键值对;
统计待选键值对中每一键值对被调用的频度;
按照频度排列待选键值对;
从待选键值对中选择第二数量的、调用的频度位于前列的键值对作为热点键值对;
其中,第一数量大于第二数量。
14.如权利要求13所述的***,其特征在于,所述筛选模块,用于从映射键值对中选择部分作为热点键值对,具体还用于:
在随机选择第一数量的待处理的键值对作为待选键值对的步骤之前,设定待选键值对的业务类别条件集;
选择符合业务类别条件集的待处理的键值对。
15.如权利要求11所述的***,其特征在于,所述筛选模块,用于从待处理的键值对中选择部分作为热点键值对,具体用于:
设定热点键值对的调用频度阈值;
当键值对被调用的频度大于调用频度阈值时,将该键值对设置为热点键值对。
16.如权利要求11所述的***,其特征在于,所述***还包括规则优化模块,用于:
使用机器学习模型,优化对筛选规则。
17.如权利要求16所述的***,其特征在于,所述规则优化模块,用于:
使用机器学习模型中的聚类算法,统计键值对被调用的频度随单一属性的分布状况;
根据键值对被调用的频度随单一属性的分布状况,选择键值对被调用的频度不小于预设频度阈值的属性内容的键值的区间;
设定所述属性内容的键值的区间为筛选规则的规则条件。
18.如权利要求17所述的***,其特征在于,所述规则优化模块,还用于:
当一个属性的键值对和另一属性的键值对被具有同一业务代码的业务***调用时,将这两个属性的键值对的属性内容的键值的区间的并集设定为筛选规则的规则条件。
19.如权利要求18所述的***,其特征在于,当非热点键值对被调用时,所述映射模块,用于:
对非热点键值对执行映射处理,得到与非热点键值对对应的中间结果键值对。
20.一种数据处理的***,其特征在于,包括:
映射模块,用于对待处理的键值对执行映射处理,得到与待处理的键值对对应的中间结果键值对;
筛选模块,用于根据筛选规则,从中间结果键值对中选择部分作为热点键值对;
归约模块,用于对热点键值对执行归约处理,生成供调用的最终结果键值对;
其中,键值对包括表征属性的键值和表征属性内容的键值。
CN201510222356.4A 2015-05-04 2015-05-04 数据处理的方法及*** Active CN106202092B (zh)

Priority Applications (10)

Application Number Priority Date Filing Date Title
CN201510222356.4A CN106202092B (zh) 2015-05-04 2015-05-04 数据处理的方法及***
PCT/CN2016/079812 WO2016177279A1 (zh) 2015-05-04 2016-04-21 数据处理的方法及***
PL16789273T PL3293641T3 (pl) 2015-05-04 2016-04-21 Sposób i system przetwarzania danych
SG11201708917SA SG11201708917SA (en) 2015-05-04 2016-04-21 Data processing method and system
EP16789273.6A EP3293641B1 (en) 2015-05-04 2016-04-21 Data processing method and system
KR1020177034735A KR102134952B1 (ko) 2015-05-04 2016-04-21 데이터 처리 방법 및 시스템
JP2017557451A JP6779231B2 (ja) 2015-05-04 2016-04-21 データ処理方法及びシステム
ES16789273T ES2808948T3 (es) 2015-05-04 2016-04-21 Método y sistema de procesamiento de datos
US15/797,537 US10592491B2 (en) 2015-05-04 2017-10-30 Distributed data processing
US16/800,641 US10872070B2 (en) 2015-05-04 2020-02-25 Distributed data processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510222356.4A CN106202092B (zh) 2015-05-04 2015-05-04 数据处理的方法及***

Publications (2)

Publication Number Publication Date
CN106202092A true CN106202092A (zh) 2016-12-07
CN106202092B CN106202092B (zh) 2020-03-06

Family

ID=57218083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510222356.4A Active CN106202092B (zh) 2015-05-04 2015-05-04 数据处理的方法及***

Country Status (9)

Country Link
US (2) US10592491B2 (zh)
EP (1) EP3293641B1 (zh)
JP (1) JP6779231B2 (zh)
KR (1) KR102134952B1 (zh)
CN (1) CN106202092B (zh)
ES (1) ES2808948T3 (zh)
PL (1) PL3293641T3 (zh)
SG (1) SG11201708917SA (zh)
WO (1) WO2016177279A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347513A (zh) * 2019-07-15 2019-10-18 中国工商银行股份有限公司 热点数据批量调度方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202092B (zh) 2015-05-04 2020-03-06 阿里巴巴集团控股有限公司 数据处理的方法及***
WO2017107118A1 (en) * 2015-12-24 2017-06-29 Intel Corporation Facilitating efficient communication and data processing across clusters of computing machines in heterogeneous computing environment
CN111597187B (zh) * 2017-08-30 2023-09-01 第四范式(北京)技术有限公司 用于执行机器学习的分布式***及其方法
US11044091B1 (en) * 2018-03-15 2021-06-22 Secure Channels Inc. System and method for securely transmitting non-pki encrypted messages
US11804955B1 (en) 2019-09-13 2023-10-31 Chol, Inc. Method and system for modulated waveform encryption
WO2021120140A1 (en) * 2019-12-20 2021-06-24 Intel Corporation Managing runtime apparatus for tiered object memory placement
CN116432903B (zh) * 2023-04-01 2024-06-11 国网新疆电力有限公司电力科学研究院 一种通信仿真数据管理***
CN116346827B (zh) * 2023-05-30 2023-08-11 中国地质大学(北京) 一种面向倾斜数据流的实时分组方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102388374A (zh) * 2011-09-28 2012-03-21 华为技术有限公司 存储数据的方法和装置
CN102456031A (zh) * 2010-10-26 2012-05-16 腾讯科技(深圳)有限公司 一种MapReduce***和处理数据流的方法
US20120304186A1 (en) * 2011-05-26 2012-11-29 International Business Machines Corporation Scheduling Mapreduce Jobs in the Presence of Priority Classes
CN103838844A (zh) * 2014-03-03 2014-06-04 珠海市君天电子科技有限公司 一种键值对数据存储、传输方法及装置
CN104077297A (zh) * 2013-03-27 2014-10-01 日电(中国)有限公司 基于本体的查询方法及装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756919B1 (en) * 2004-06-18 2010-07-13 Google Inc. Large-scale data processing in a distributed and parallel processing enviornment
US8726290B2 (en) * 2008-06-12 2014-05-13 Yahoo! Inc. System and/or method for balancing allocation of data among reduce processes by reallocation
CN101645067A (zh) 2008-08-05 2010-02-10 北京大学 一种讨论区集合中热点讨论区的预测方法
JP5229731B2 (ja) * 2008-10-07 2013-07-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 更新頻度に基づくキャッシュ機構
US8370493B2 (en) * 2008-12-12 2013-02-05 Amazon Technologies, Inc. Saving program execution state
EP2325762A1 (en) * 2009-10-27 2011-05-25 Exalead Method and system for processing information of a stream of information
CN102141995B (zh) * 2010-01-29 2013-06-12 国际商业机器公司 简化并行计算***中的传输的***与方法
CN102236581B (zh) * 2010-04-30 2013-08-14 国际商业机器公司 用于数据中心的映射化简方法和***
CN102314336B (zh) * 2010-07-05 2016-04-13 深圳市腾讯计算机***有限公司 一种数据处理方法和***
JP5552449B2 (ja) * 2011-01-31 2014-07-16 日本電信電話株式会社 データ分析及び機械学習処理装置及び方法及びプログラム
JP5637071B2 (ja) * 2011-05-27 2014-12-10 富士通株式会社 処理プログラム、処理方法及び処理装置
CN103019614B (zh) 2011-09-23 2015-11-25 阿里巴巴集团控股有限公司 分布式存储***管理装置及方法
JP5888336B2 (ja) * 2011-10-06 2016-03-22 富士通株式会社 データ処理方法、分散処理システムおよびプログラム
TWI461929B (zh) 2011-12-09 2014-11-21 Promise Tecnnology Inc 雲端數據儲存系統
JP5919825B2 (ja) * 2012-01-05 2016-05-18 富士通株式会社 データ処理方法、分散処理システムおよびプログラム
US9367601B2 (en) * 2012-03-26 2016-06-14 Duke University Cost-based optimization of configuration parameters and cluster sizing for hadoop
WO2013153620A1 (ja) * 2012-04-10 2013-10-17 株式会社日立製作所 データ処理システム及びデータ処理方法
TWI610166B (zh) 2012-06-04 2018-01-01 飛康國際網路科技股份有限公司 自動災難復原和資料遷移系統及方法
WO2014020735A1 (ja) * 2012-08-02 2014-02-06 富士通株式会社 データ処理方法、情報処理装置およびプログラム
US20150363467A1 (en) 2013-01-31 2015-12-17 Hewlett-Packard Development Company, L.P. Performing an index operation in a mapreduce environment
CN104142950A (zh) 2013-05-10 2014-11-12 中国人民大学 基于关键词提取和基尼系数的微博用户分类方法
US9424274B2 (en) * 2013-06-03 2016-08-23 Zettaset, Inc. Management of intermediate data spills during the shuffle phase of a map-reduce job
IN2013MU02918A (zh) * 2013-09-10 2015-07-03 Tata Consultancy Services Ltd
CN103995882B (zh) 2014-05-28 2017-07-07 南京大学 基于MapReduce的概率频繁项集挖掘方法
CN104331464A (zh) * 2014-10-31 2015-02-04 许继电气股份有限公司 一种基于MapReduce的监控数据优先预取处理方法
CN104536830A (zh) 2015-01-09 2015-04-22 哈尔滨工程大学 一种基于MapReduce的KNN文本分类方法
CN106202092B (zh) 2015-05-04 2020-03-06 阿里巴巴集团控股有限公司 数据处理的方法及***
CN107193500A (zh) 2017-05-26 2017-09-22 郑州云海信息技术有限公司 一种分布式文件***分层存储方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456031A (zh) * 2010-10-26 2012-05-16 腾讯科技(深圳)有限公司 一种MapReduce***和处理数据流的方法
US20120304186A1 (en) * 2011-05-26 2012-11-29 International Business Machines Corporation Scheduling Mapreduce Jobs in the Presence of Priority Classes
CN102388374A (zh) * 2011-09-28 2012-03-21 华为技术有限公司 存储数据的方法和装置
CN104077297A (zh) * 2013-03-27 2014-10-01 日电(中国)有限公司 基于本体的查询方法及装置
CN103838844A (zh) * 2014-03-03 2014-06-04 珠海市君天电子科技有限公司 一种键值对数据存储、传输方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347513A (zh) * 2019-07-15 2019-10-18 中国工商银行股份有限公司 热点数据批量调度方法及装置

Also Published As

Publication number Publication date
WO2016177279A1 (zh) 2016-11-10
JP2018515844A (ja) 2018-06-14
SG11201708917SA (en) 2017-11-29
KR102134952B1 (ko) 2020-07-17
PL3293641T3 (pl) 2021-02-08
CN106202092B (zh) 2020-03-06
US20200192882A1 (en) 2020-06-18
EP3293641B1 (en) 2020-06-17
EP3293641A4 (en) 2018-10-17
US20180046658A1 (en) 2018-02-15
US10592491B2 (en) 2020-03-17
JP6779231B2 (ja) 2020-11-04
US10872070B2 (en) 2020-12-22
KR20180002758A (ko) 2018-01-08
ES2808948T3 (es) 2021-03-02
EP3293641A1 (en) 2018-03-14

Similar Documents

Publication Publication Date Title
CN106202092A (zh) 数据处理的方法及***
CN1956457B (zh) 用于安排网格计算***中的网格作业的方法和设备
WO2016110234A1 (zh) 面向云平台应用的服务推荐方法、设备及***
CN105700948A (zh) 一种用于在集群中调度计算任务的方法与设备
CN103345514A (zh) 大数据环境下的流式数据处理方法
CN109669985A (zh) 在微服务环境中使用相关数据分配执行任务
CN110347515B (zh) 一种适合边缘计算环境的资源优化分配方法
CN110471923A (zh) 一种区块链交易记录的处理方法及装置
CN110019298A (zh) 数据处理方法和装置
CN106383746A (zh) 大数据处理***的配置参数确定方法和装置
CN107291539A (zh) 基于资源重要程度的集群程序调度方法
CN108270805A (zh) 用于数据处理的资源分配方法及装置
Delavar et al. A synthetic heuristic algorithm for independent task scheduling in cloud systems
CN108415912A (zh) 基于MapReduce模型的数据处理方法和设备
CN110413927B (zh) 在发布订阅***中基于匹配实时性的优化方法及***
CN114429195A (zh) 混合专家模型训练的性能优化方法和装置
CN104239520B (zh) 一种基于历史信息的hdfs数据块放置策略
CN107155215B (zh) 一种应用归属服务集群的分配方法和装置
CN107402812A (zh) 集群资源调度方法、装置、设备及存储介质
CN110267717B (zh) 在多租户环境中按不同单独租户自动生成自动缩放呼叫规则的方法及装置
CN109902178A (zh) 一种多级文本分类方法及***
CN108256694A (zh) 基于重复遗传算法的模糊时间序列预测***、方法及装置
CN112487721B (zh) 一种工单排产实现方法、设备及介质
CN109828718B (zh) 一种磁盘存储负载均衡方法及装置
CN114035906A (zh) 虚拟机迁移方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1230758

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200922

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200922

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.