WO2017161984A1

WO2017161984A1 - 数据集群的部署方法、装置、***及计算机存储介质

Info

Publication number: WO2017161984A1
Application number: PCT/CN2017/074073
Authority: WO
Inventors: 杨桂荣
Original assignee: 中兴通讯股份有限公司
Priority date: 2016-03-24
Filing date: 2017-02-20
Publication date: 2017-09-28
Also published as: CN107229646A

Abstract

本发明实施例公开了一种数据集群的部署方法、装置、***及计算机存储介质。所述方法包括：获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

Description

数据集群的部署方法、装置、***及计算机存储介质

技术领域

本发明涉及通信领域，具体而言，涉及一种数据集群的部署方法、装置、***及计算机存储介质。

背景技术

随着互联网的发展，为了满足用户对海量数据的存储需求，通常会使用数据集群***存储海量数据。例如，使用Apache开发的分布式***基础架构，即海杜普(Hadoop)***，存储海量数据。但是，很多数据集群***往往存在部署和管理复杂的问题，下面以Hadoop***为例进行说明。

Hadoop***是一个能够对大量数据进行分布式处理的开源软件框架，该***包括分布式文件***(Hadoop Distributed File System，简称为HDFS)和分布式数据库(Hbase)，该***的存储核心是分布式文件***(HDFS)。HDFS适合运行在通用的硬件上，并且需要部署在大量机器上，以此来支持大规模的数据集和高吞吐量的数据访问。HDFS通过可以分布在不同机器上的多个副本数来实现高容错性。

另外，Hadoop***还包括很多其他组件，用来实现资源调度、数据存储以及和外部的连接，如YARN、HBASE、zookeeper、HIVE、Impala、MapReduce、Oozie、Sqoop、Flume等，Hadoop***包括的组件如图1所示。

Hadoop集群功能强大，应用广泛，但是由于其***复杂，Hadoop集群的部署和管理非常繁杂，动辄需要数十台服务器的安装部署，十分耗费精力，如何快速自动化地构建可用的Hadoop集群并管理监控其运行状态成为值得研究的重要课题。

针对相关技术中，数据集群的部署和管理较为复杂的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例期望提供一种数据集群的部署方法、装置、***及计算机存储介质，以至少解决相关技术中数据集群的部署和管理较为复杂的问题。

根据本发明实施例的第一方面，提供了一种数据集群的部署方法，包括：获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；向云平台发送携带有第一配置信息的第一部署请求，其中，所述第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

在一实施例中，所述获取用于数据集群***部署的第一配置信息包括：接收用户定义的第一配置文件；根据第一配置文件获取所述第一配置信息。

在一实施例中，所述根据第一配置文件获取第一配置信息包括：解析第一配置文件，获得与数据集群***部署相关的第一配置参数；根据所述第一配置参数计算第一配置信息。

在一实施例中，所述第一配置文件中还包括用于数据集群***部署的组件的信息；所述在向云平台发送携带有第一配置信息的第一部署请求之后，所述方法还包括：检测硬件资源是否创建成功；在硬件资源创建成功的情况下，根据用于数据集群***部署的组件的信息生成插件。

在一实施例中，所述根据用于数据集群***部署的组件的信息生成插件包括：获取第一数据集群***版本文件信息，其中，所述第一数据集群***版本文件信息为所部署的数据集群***的版本文件的信息；根据用于数据集群***部署的组件的信息和第一数据集群***版本文件信息对应的版本文件，生成插件。

在一实施例中，所述插件为具备组件功能的插件。

在一实施例中，所述插件为多个插件，所述多个插件以层状结构部署。

在一实施例中，在根据用于数据集群***部署的组件的信息生成插件之后，所述方法还包括：运行所述插件，以实现以下过程至少之一：网络环境配置；组件资源分配；时钟同步；将组件配置到所部署的数据集群***的目标节点。

在一实施例中，在运行所述插件之后，所述方法还包括：监测数据集群***的运行环境，其中，运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对数据集群***进行调优；和/或，监测数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对数据集群***进行调优。

在一实施例中，所述方法还包括：接收用于数据集群***升级的第二配置文件；解析第二配置文件，得到与数据集群***升级相关的第二配置参数；根据第二配置参数判断数据集群***升级是否需要增加硬件资源和/或配置；在需要增加硬件资源和/或配置的情况下，向云平台发送携带有第二配置参数的第二部署请求，其中，第二部署请求用于请求云平台根据第二配置参数创建数据集群***升级所需的硬件资源和/或配置。

在一实施例中，所述第二配置文件中还包括用于数据集群***升级的组件的信息；在不需要增加硬件资源和/或配置的情况下，所述方法还包括：获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；根据用于所述数据集群***升级的组件的信息和第二数据集群***版本文件信息对应的版本文件，生成插件。

根据本发明的第二方面，提供了一种数据集群的部署装置，包括：获取模块，配置为获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；发送模块，配置为向云平台发送携带有第一配置信息的第一部署请求，其中，所述第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

在一实施例中，所述获取模块，配置为接收用户定义的第一配置文件；根据所述第一配置文件获取所述第一配置信息。

在一实施例中，所述获取模块，配置为解析所述第一配置文件，获得与所述数据集群***部署相关的第一配置参数；根据所述第一配置参数计算所述第一配置信息。

在一实施例中，所述第一配置文件中还包括用于所述数据集群***部署的组件的信息；所述装置还包括生成模块，配置为在所述发送模块向云平台发送携带有所述第一配置信息的第一部署请求之后，检测所述硬件资源是否创建成功；在所述硬件资源创建成功的情况下，根据用于所述数据集群***部署的组件的信息生成插件。

在一实施例中，所述生成模块，配置为获取第一数据集群***版本文件信息，其中，所述第一数据集群***版本文件信息为所部署的数据集群***的版本文件的信息；根据用于所述数据集群***部署的组件的信息和所述第一数据集群***版本文件信息对应的版本文件，生成所述插件。

在一实施例中，所述装置还包括运行模块，配置为在所述生成模块根据用于所述数据集群***部署的组件的信息生成插件之后，运行所述插件，以实现以下过程至少之一：网络环境配置；组件资源分配；时钟同步；将所述组件配置到所部署的数据集群***的目标节点。

在一实施例中，所述装置还包括监测模块，配置为监测所述数据集群***的运行环境，其中，所述运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对所述数据集群***进行调优；和/或，监测所述数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对所述数据集群***进行调优。

在一实施例中，所述装置还包括判断模块；

所述获取模块，还配置为接收用于所述数据集群***升级的第二配置文件；解析所述第二配置文件，得到与所述数据集群***升级相关的第二配置参数；

所述判断模块，配置为根据所述第二配置参数判断所述数据集群***升级是否需要增加硬件资源和/或配置；

所述发送模块，配置为在需要增加硬件资源和/或配置的情况下，向所述云平台发送携带有所述第二配置参数的第二部署请求，其中，所述第二部署请求用于请求所述云平台根据所述第二配置参数创建所述数据集群***升级所需的硬件资源和/或配置。

在一实施例中，所述装置还包括生成模块；所述第二配置文件中还包括用于所述数据集群***升级的组件的信息；

所述获取模块，还配置为在所述判断模块判定不需要增加硬件资源和/或配置的情况下，获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；

所述生成模块，配置为根据用于所述数据集群***升级的组件的信息和所述第二数据集群***版本文件信息对应的版本文件，生成插件。

根据本发明的第三方面，提供了一种数据集群的部署***，包括：处理器，配置为获取用于数据集群***部署的第一配置信息，向云平台发送携带有所述第一配置信息的第一部署请求，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息，所述第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/ 或配置；云平台，配置为根据所述第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

根据本发明实施例的第四方面，提供了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行本发明实施例所述的数据集群的部署方法。

本发明实施例通过获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，实现了通过云平台批量创建硬件资源和/或配置，解决了数据集群的部署和管理较为复杂的问题，进而有效简化了数据集群的实际开发环境、测试环境及生产环境等方面的部署过程，能够大幅度节约设备和人力，提高了数据集群的部署效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是相关技术中Hadoop***的组件结构示意图；

图2是根据本发明实施例的数据集群的部署方法的流程图；

图3是根据本发明实施例的数据集群的部署装置的结构框图；

图4是根据本发明实施例的数据集群的部署***的示意图；

图5是根据本发明实施例的一种数据集群的部署***的示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

在本实施例中提供了一种数据集群的部署方法，图2是根据本发明实施例的数据集群的部署方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；

步骤S204，向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

其中，云平台为利用云技术搭建起来的一个服务平台，可以提供基础设施或者虚拟化环境等服务。

其中，部署数据集群***所需的硬件资源包括***部署所需的基础设施。

其中，云平台可以是基于PAAS(Platform-as-a-Service，可简称为平台即服务)的云平台，基于PAAS的云平台能够为hadoop***提供足够的硬件支持。

在本实施中，第一配置信息可以是用户自定义的配置文件中的相关配置信息，例如，第一配置信息可以包括以下数据的至少之一：用户选定的虚拟机模板的相关数据、用户自定义的待部署的数据集群***中需要安装的组件、基础设施搭建相关的参数等。另外，可以预先将配置文件系列化标准化，在使用时用户只需要更改少量的参数就可以完成数据集群***的配置，并且该配置文件是用户唯一需要填写的部署清单，数据集群***的部署变得更加简单。

作为一种实施方式，本发明实施例的数据集群的部署方法适用于大数据集群的部署，例如，hadoop***的部署。

上述实施例，通过获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，实现了通过云平台批量创建硬件资源和/或配置，解决了数据集群的部署和管理较为复杂的问题，进而有效简化了数据集群的实际开发环境、测试环境及生产环境等方面的部署过程，能够大幅度节约设备和人力，提高了数据集群的部署效率。

作为一种实施方式，所述获取用于数据集群***部署的第一配置信息包括：接收用户定义的第一配置文件；根据第一配置文件获取第一配置信息。其中，所述第一配置文件是用户自定义的(用户根据自身需求对标准配置文件进行参数的修改和/或选择，以获得第一配置文件)，配置方法更能满足用户的需求，并且部署操作更加便捷。

作为一种实施方式，所述根据第一配置文件获取第一配置信息包括：解析第一配置文件，获得与数据集群***部署相关的第一配置参数；根据第一配置参数计算第一配置信息。

在本实施例中，用户提供数据集群***部署需要的第一配置文件，处理器接收到该第一配置文件后，解析第一配置文件中的参数，自动计算出需要的硬件资源(基础设施)和配置情况，然后触发自动部署请求，向PAAS云平台发送创建硬件资源和/或配置的请求，所述请求中携带有计算得到的硬件资源和/或配置信息。该实施例在接收到用户的配置文件后，会自动触发一系列的解析、请求等操作，无需用户再投入精力，部署过程十分高效、便捷。

作为一种实施方式，所述第一配置文件中还包括用于数据集群***部署的组件的信息；所述在向云平台发送携带有第一配置信息的第一部署请求之后，还包括：检测硬件资源是否创建成功；在硬件资源创建成功的情况下，根据用于数据集群***部署的组件的信息生成插件。

在本实施例中，在硬件资源创建成功之后，可自动生成一个主控模块，在主控模块的控制下，可根据第一配置文件自动生成插件，并将插件配置并运行起来。

作为一种实施方式，所述根据用于数据集群***部署的组件的信息生成插件包括：获取第一数据集群***版本文件信息，其中，所述第一数据集群***版本文件信息为所部署的数据集群***的版本文件的信息；根据用于数据集群***部署的组件的信息和第一数据集群***版本文件信息对应的版本文件，生成插件。

其中，所述第一数据集群***版本文件信息可以是待部署的大数据集群***的版本安装包，可通过操作人员从版本机上获取并放至版本目录中。

例如，在hadoop***的部署中，在硬件资源创建成功之后，可自动生成一个主控模块，在主控模块的控制下，可以根据用户定义的配置文件(包括组件的参数)和hadoop版本文件自动生成插件。

作为一种实施方式，所述第一部署请求还用于请求从云平台中存储的多个数据集群***版本文件中选择需要的虚拟主机模板，以生成虚拟机。

在本实施例中，云平台可预先存储多个虚拟主机模板，用户根据需要在配置文件中选定需要的虚拟主机模板，并通过请求消息发送至云平台，云平台根据请求确定需要生成的虚拟机。

作为一种实施方式，所述插件为带有组件功能的插件，所述插件能够独立运行。

在本实施例中，通过远程命令自动生成包含组件功能的插件，该插件可脱离操作***独立运行。其中，插件可以看作是组件的载体。大数据集群***可以看作是由一系列的组件构成的。带有组件功能的插件是指一个可随时部署的插件，该插件具有需要部署的组件的功能。例如，一个HIVE版本包的安装需要涉及诸多的配置，而该实施例通过生成具有组件功能的插件，仅仅需要配置该插件即可完成对组件的复杂配置过程，有效提高了组件的配置效率。该实施例有效克服了现有大数据集群***的部署中需要多个组件按照次序逐个部署而造成的效率低下的缺陷，有效提升了大数据集群***的部署效率。

作为一种实施方式，在根据用于数据集群***部署的组件的信息生成插件之后，还包括：运行插件，以实现以下过程至少之一：网络环境配置；组件资源分配；时钟同步；将所述组件配置到所部署的数据集群***的目标节点。

在本实施例中，可以通过批量配置工具自动配置所有的插件，以实现网络环境配置、组件资源分配、时钟同步、将所述组件配置到所部署的数据集群***的目标节点等操作。

作为一种实施方式，所述插件为多个插件，多个插件以层状结构部署。

在本实施例中，通过大数据插件层状化部署，可以支持插件的灵活使用，方便***的调整和扩容，以及自动进行性能调优。

作为一种实施方式，在运行插件之后，所述方法还包括：监测数据集群***的运行环境，其中，运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对数据集群***进行调优；和/或，监测数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对数据集群***进行调优。

本实施例可以实现安全和监控的自动化，作为一种实施方式，利用Kerberos(Kerberos为一种安全认证的***)进行身份认证，自动化监控数据集群***的相关组件的运行情况。环境若运行正常，和/或***正常运行，则持续监控；环境若发生资源占用异常，和/或***处于异常状态，则自动通知主控进程，主控进程自动完成对数据集群***的自动调优。

作为一种实施方式，所述方法还包括：接收用于数据集群***升级的第二配置文件；解析第二配置文件，得到与数据集群***升级相关的第二配置参数；根据第二配置参数判断数据集群***升级是否需要增加硬件资源和/或配置；在需要增加硬件资源和/或配置的情况下，向云平台发送携带有第二配置参数的第二部署请求，其中，第二部署请求用于请求云平台根据第二配置参数创建数据集群***升级所需的硬件资源和/或配置。

作为一种实施方式，所述第二配置文件中还包括用于数据集群***升级的组件的信息，在不需要增加硬件资源和/或配置的情况下，还包括：获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；根据用于数据集群***升级的组件的信息和第二数据集群***版本文件信息对应的版本文件，生成插件。

其中，所述第二数据集群***版本文件信息可以是待升级到的大数据集群***的版本包，可通过操作人员从版本机上获取并放至版本目录中。

上述实施例提供了数据集群***需要升级时的配置方法。具体地，用户提供数据集群***升级需要的配置文件(第二配置文件)，处理器接收到配置文件后，解析配置文件中的参数，自动计算出升级是否需要增加硬件资源(基础设施)和配置情况。若需要，则触发自动部署请求，向PAAS平台发送创建基础设施的请求，请求携带有计算出的配置信息，在基础设施创建成功后，自动通知主控模块，以通过主控模块控制相应的插件生成；若不需要，则处理器(处理器中的插件自动生成模块)通过主控模块，并基于配置文件和新的数据集群***版本文件(第二数据集群***版本文件信息对应的版本文件)自动生成插件；处理器(处理器中的批量配置模块)按照配置文件把待升级插件停止并替换成新的插件然后配置并运行起来。

在上述过程中，处理器同样可利用安全和监控自动化功能通过Kerberos进行身份认证，自动化监控数据集群***相关组件的运行情况。其中，环境若运行正常，和/或数据集群***正常运行，持续监控；环境若发生资源占用异常和/或***出现异常状态，可自动通知主控进程，主控进程自动完成对数据集群***的自动调优。

通过上述实施例，在数据集群***需要升级时，无需停止数据集群***的运行即可实现***的升级，从而实现了无缝升级，提高了用户体验。

上述实施提出的数据集群的部署方法，可通过组件的插件化进行大数据环境的部署，扩展可更新的组件插件仓库，通过PAAS云平台进行存储和管理，通过自动化部署脚本和管理脚本进行部署和管理，并通过自动收集***信息，对大数据集群的健康情况进行监控，从而达到了自动部署和管理大数据环境的效果。另外，大数据插件层状化部署，可以支持插件的灵活使用，方便调整和扩容，支持自动执行性能调优。此外，该方法易于对应用进行自动打包和部署、创建轻量PAAS环境等优点，在实际开发/测试环境部署或者生产环境部署方面能够大幅度地节约设备和人力资源，提高部署效率，同时该方法还实现了大数据平台的无缝升级。

下面，根据两种具体实施方式来进一步说明本发明提供的数据集群的部署方法。

实施例一

下面根据本发明实施例提供了一种数据集群的部署方法，该方法包括以下的步骤：

步骤11：用户提供hadoop***部署需要的配置文件；其中，所述配置文件相当于上述的第一配置文件。

步骤12：处理器接收到配置文件后，解析配置文件中参数，自动计算出需要的基础设施和配置情况，然后触发自动部署请求，向PaaS平台发送创建基础设施和/或配置的请求，请求中携带计算得到的配置信息；其中，所述请求相当于上述的第一部署请求。

步骤13：基础设施创建成功后，自动生成hadoop主控模块。

步骤14：插件自动生成模块在主控模块的控制下，根据标准配置文件和hadoop版本文件(第一数据集群版本文件信息对应的版本文件)自动生成组件插件。

步骤15：批量配置模块按照配置文件把插件配置并运行起来。

步骤16：安全和监控模块自动利用Kerberos进行身份认证，自动化监控hadoop相关组件的运行情况

步骤17：环境若运行正常，和/或***正常运行，则持续监控。

步骤18：环境若发生资源占用异常或者***出现异常状况，则自动通知主控进程，主控进程自动完成对hadoop***的自动调优。

实施例二

下面根据本发明实施例提供了另外一种数据集群的部署方法，该方法应用于大数据***的升级，该方法包括以下的步骤：

步骤21：用户提供hadoop***升级需要的配置文件。

步骤22：处理器接收到配置文件后，解析配置文件中的参数，自动计算出升级是否需要增加基础设施和/或配置，若需要，则触发执行步骤23；若不需要，则触发执行步骤25。

步骤23：触发自动部署请求，向PaaS平台发送创建基础设施请求(所述基础设施请求相当于上述的第二部署请求)，所述请求携带有计算得到的配置信息。

步骤24：基础设施创建成功后，自动通知hadoop主控模块。

步骤25：插件自动生成模块在主控模块的控制下，根据配置文件和新的hadoop版本文件(第二数据集群***版本文件信息对应的版本文件)自动生成组件插件。

步骤26：批量配置模块按照配置文件把待升级插件停止并替换成新的插件，并将新的插件配置并运行起来。

步骤27：安全和监控模块自动利用Kerberos进行身份认证，自动化监控Hadoop相关组件的运行情况。

步骤28：环境若运行正常，和/或***正常运行，则持续监控。

步骤29：环境若发生资源占用异常或者***出现异常状况，则自动通知主控进程，主控进程自动完成对hadoop***的自动调优。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种数据集群的部署装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的数据集群的部署装置的结构框图，如图3所示，该装置包括：

获取模块30，配置为获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；

发送模块32，配置为向云平台发送携带有第一配置信息的第一部署请求，其中，所述第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

在本实施例中，通过所述获取模块30获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；所述发送模块32向云平台发送携带有第一配置信息的第一部署请求，其中，所述第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，实现了通过云平台批量创建硬件资源和/或配置，解决了数据集群的部署和管理较为复杂的问题，进而有效简化了数据集群的实际开发环境、测试环境及生产环境等方面的部署过程，能够大幅度节约设备和人力，提高了数据集群的部署效率。

作为一种实施方式，所述获取模块30，配置为接收用户定义的第一配置文件；根据所述第一配置文件获取所述第一配置信息。

作为一种实施方式，所述获取模块30，配置为解析所述第一配置文件，获得与所述数据集群***部署相关的第一配置参数；根据所述第一配置参数计算所述第一配置信息。

作为一种实施方式，所述第一配置文件中还包括用于所述数据集群***部署的组件的信息；所述装置还包括生成模块，配置为在所述发送模块向云平台发送携带有所述第一配置信息的第一部署请求之后，检测所述硬件资源是否创建成功；在所述硬件资源创建成功的情况下，根据用于所述数据集群***部署的组件的信息生成插件。

作为一种实施方式，所述生成模块，配置为获取第一数据集群***版本文件信息，其中，所述第一数据集群***版本文件信息为所部署的数据集群***的版本文件的信息；根据用于所述数据集群***部署的组件的信息和所述第一数据集群***版本文件信息对应的版本文件，生成所述插件。

作为一种实施方式，所述装置还包括运行模块，配置为在所述生成模块根据用于所述数据集群***部署的组件的信息生成插件之后，运行所述插件，以实现以下过程至少之一：网络环境配置；组件资源分配；时钟同步；将所述组件配置到所部署的数据集群***的目标节点。

作为一种实施方式，所述装置还包括监测模块，配置为监测所述数据集群***的运行环境，其中，所述运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对所述数据集群***进行调优；和/或，监测所述数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对所述数据集群***进行调优。

作为一种实施方式，所述装置还包括判断模块；

所述获取模块30，还配置为接收用于所述数据集群***升级的第二配置文件；解析所述第二配置文件，得到与所述数据集群***升级相关的第二配置参数；

所述发送模块32，配置为在需要增加硬件资源和/或配置的情况下，向所述云平台发送携带有所述第二配置参数的第二部署请求，其中，所述第二部署请求用于请求所述云平台根据所述第二配置参数创建所述数据集群***升级所需的硬件资源和/或配置。

作为一种实施方式，所述装置还包括生成模块；所述第二配置文件中还包括用于所述数据集群***升级的组件的信息；

所述获取模块30，还配置为在所述判断模块判定不需要增加硬件资源和/或配置的情况下，获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；

需要说明的是，上述各个模块是可以通过软件或硬件来实现的：上述模块均位于同一处理器中；或者，上述模块分别位于多个处理器中。

在本实施例中还提供了一种数据集群的部署***，该***用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。

图4是根据本发明实施例的数据集群的部署***的示意图，如图4所示，所述***包括：

处理器40，配置为获取用于数据集群***部署的第一配置信息，向云平台发送携带有第一配置信息的第一部署请求，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置；

云平台42，配置为根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

在本实施例中，通过处理器40获取用于数据集群***部署的第一配置信息，并向云平台发送携带有第一配置信息的第一部署请求，其中，所述第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，所述云平台42根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，实现了通过云平台批量创建硬件资源和/或配置，解决了数据集群的部署和管理较为复杂的问题，进而有效简化了数据集群的实际开发环境、测试环境及生产环境等方面的部署过程，能够大幅度节约设备和人力，提高了数据集群的部署效率。

图5是根据本发明实施例的一种数据集群的部署***的示意图。其中，在该数据集群的部署***中，上述的处理器40还可以包括：主控模块502、插件生成模块504、标准配置模块506、批量配置模块508以及安全和监控模块510。各模块的功能具体如下：

所述主控模块502：该模块配置为将插件组装并运行起来，以及具有将数据集群***版本文件组装成可以不依赖于硬件和操作***独立运行的插件的功能。例如，可以将大数据的组件，如YARN、HBASE、zookeeper、HIVE、Impala、MapReduce、Oozie、Sqoop、Flume等，封装成单独的插件，使得插件可以脱离操作***和硬件独立部署，具有完全的隔离性，并且可以复用硬件和操作***的资源。

所述插件生成模块504：配置为利用容器技术和集装箱技术，通过主控模块，按照定制的功能将数据集群***版本文件组装成插件，以供部署和使用。

所述标准配置模块506(可实现数据集群的部署装置中获取模块和发送模块的功能)：配置为将数据集群***配置文件系列化、标准化，在使用时只需更改少量的参数即可完成数据集群***的配置。其中，配置文件是用户唯一需要填写的部署清单。标准配置模块可实现配置文件的标准化，通过提取数据集群的可配置项，形成标准配置文件，简化了用户操作，提高了用户体验。

所述批量配置模块508：配置为使用批量配置工具，根据配置文件(如上述的第一配置文件和第二配置文件)，自动配置所有的插件，用于支持包括网络环境构建、组件资源分配、时钟同步以及应用配置到节点等操作，用于为数据集群***组件提供统一的配置环境。

所述安全和监控模块510：配置为利用Kerberos(hadoop自带的Kerberos身份认证***)进行身份认证。该模块可自动化监控数据集群***相关组件的运行情况，并根据资源占用情况完成对数据集群***的调优。

所述云平台42用于为数据集群***提供足够的硬件支持。在云计算平台(云平台)中存储常用操作***的虚拟主机模版，云平台可通过用户选定的虚拟机模版以及配置参数为用户搭建数据集群所需的主控计算机，然后再通过配置文件，确定需要安装的组件，确认无误后，处理器40会自动生成需要的插件，并将其部署为层状结构，搭建好大数据集群。

根据该实施例的数据集群的部署***，实现了基于插件化的数据集群***的部署，并且支持自动化部署和组件分配，将插件以层状插件的形式部署在集群中，可支持灵活使用，方便调整和扩容，可实现自动性能调优。该数据集群的部署***通过云平台实现了批量构造硬件资源和/或配置，解决了现有技术中数据集群的部署和管理较为复杂的问题。

本发明的实施例还提供了一种存储介质。作为一种实施方式，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S202，获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；

S204，向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置。

作为一种实施方式，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

作为一种实施方式，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个***，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

工业实用性

本发明实施例的技术方案通过获取用于数据集群***部署的第一配置信息，其中，第一配置信息包括部署数据集群***所需的硬件资源和/或配置的信息；向云平台发送携带有第一配置信息的第一部署请求，其中，第一部署请求用于请求云平台根据第一配置信息创建数据集群***部署所需的硬件资源和/或配置，实现了通过云平台批量创建硬件资源和/或配置，解决了数据集群的部署和管理较为复杂的问题，进而有效简化了数据集群的实际开发环境、测试环境及生产环境等方面的部署过程，能够大幅度节约设备和人力，提高了数据集群的部署效率。

Claims

一种数据集群的部署方法，包括：

获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署所述数据集群***所需的硬件资源和/或配置的信息；

向云平台发送携带有所述第一配置信息的第一部署请求，其中，所述第一部署请求用于请求所述云平台根据所述第一配置信息创建所述数据集群***部署所需的硬件资源和/或配置。
根据权利要求1所述的方法，其中，所述获取用于数据集群***部署的第一配置信息包括：

接收用户定义的第一配置文件；

根据所述第一配置文件获取所述第一配置信息。
根据权利要求2所述的方法，其中，所述根据所述第一配置文件获取所述第一配置信息包括：

解析所述第一配置文件，获得与所述数据集群***部署相关的第一配置参数；

根据所述第一配置参数计算所述第一配置信息。
根据权利要求2所述的方法，其中，所述第一配置文件中还包括用于所述数据集群***部署的组件的信息；所述在向云平台发送携带有所述第一配置信息的第一部署请求之后，所述方法还包括：

检测所述硬件资源是否创建成功；

在所述硬件资源创建成功的情况下，根据用于所述数据集群***部署的组件的信息生成插件。
根据权利要求4所述的方法，其中，所述根据用于所述数据集群***部署的组件的信息生成插件包括：

获取第一数据集群***版本文件信息，其中，所述第一数据集群*** 版本文件信息为所部署的数据集群***的版本文件的信息；

根据用于所述数据集群***部署的组件的信息和所述第一数据集群***版本文件信息对应的版本文件，生成所述插件。
根据权利要求4-5中任一项所述的方法，其中，所述插件为具备组件功能的插件。
根据权利要求4-5中任一项所述的方法，其中，所述插件为多个插件，所述多个插件以层状结构部署。
根据权利要求4所述的方法，其中，在根据用于所述数据集群***部署的组件的信息生成插件之后，所述方法还包括：

运行所述插件，以实现以下过程至少之一：

网络环境配置；组件资源分配；时钟同步；将所述组件配置到所部署的数据集群***的目标节点。
根据权利要求8所述的方法，其中，在运行所述插件之后，所述方法还包括：

监测所述数据集群***的运行环境，其中，所述运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对所述数据集群***进行调优；和/或，

监测所述数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对所述数据集群***进行调优。
根据权利要求1所述的方法，其中，所述方法还包括：

接收用于所述数据集群***升级的第二配置文件；

解析所述第二配置文件，得到与所述数据集群***升级相关的第二配置参数；

根据所述第二配置参数判断所述数据集群***升级是否需要增加硬件资源和/或配置；

在需要增加硬件资源和/或配置的情况下，向所述云平台发送携带有所述第二配置参数的第二部署请求，其中，所述第二部署请求用于请求所述云平台根据所述第二配置参数创建所述数据集群***升级所需的硬件资源和/或配置。
根据权利要求10所述的方法，其中，所述第二配置文件中还包括用于所述数据集群***升级的组件的信息；在不需要增加硬件资源和/或配置的情况下，所述方法还包括：

获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；

根据用于所述数据集群***升级的组件的信息和所述第二数据集群***版本文件信息对应的版本文件，生成插件。
一种数据集群的部署装置，包括：

获取模块，配置为获取用于数据集群***部署的第一配置信息，其中，所述第一配置信息包括部署所述数据集群***所需的硬件资源和/或配置的信息；

发送模块，配置为向云平台发送携带有所述第一配置信息的第一部署请求，其中，所述第一部署请求用于请求所述云平台根据所述第一配置信息创建所述数据集群***部署所需的硬件资源和/或配置。
根据权利要求12所述的装置，其中，所述获取模块，配置为接收用户定义的第一配置文件；根据所述第一配置文件获取所述第一配置信息。
根据权利要求13所述的装置，其中，所述获取模块，配置为解析所述第一配置文件，获得与所述数据集群***部署相关的第一配置参数；根据所述第一配置参数计算所述第一配置信息。
根据权利要求13所述的装置，其中，所述第一配置文件中还包括用于所述数据集群***部署的组件的信息；所述装置还包括生成模块，配置为在所述发送模块向云平台发送携带有所述第一配置信息的第一部署请求之后，检测所述硬件资源是否创建成功；在所述硬件资源创建成功的情况下，根据用于所述数据集群***部署的组件的信息生成插件。
根据权利要求15所述的装置，其中，所述生成模块，配置为获取第一数据集群***版本文件信息，其中，所述第一数据集群***版本文件信息为所部署的数据集群***的版本文件的信息；根据用于所述数据集群***部署的组件的信息和所述第一数据集群***版本文件信息对应的版本文件，生成所述插件。
根据权利要求15所述的装置，其中，所述装置还包括运行模块，配置为在所述生成模块根据用于所述数据集群***部署的组件的信息生成插件之后，运行所述插件，以实现以下过程至少之一：网络环境配置；组件资源分配；时钟同步；将所述组件配置到所部署的数据集群***的目标节点。
根据权利要求17所述的装置，其中，所述装置还包括监测模块，配置为监测所述数据集群***的运行环境，其中，所述运行环境包括资源占用状况，在监测到发生资源占用状况异常的情况下，自动对所述数据集群***进行调优；和/或，监测所述数据集群***的运行状态，在发生数据集群***的运行状态异常的情况下，自动对所述数据集群***进行调优。
根据权利要求12所述的装置，其中，所述装置还包括判断模块；

所述获取模块，还配置为接收用于所述数据集群***升级的第二配置文件；解析所述第二配置文件，得到与所述数据集群***升级相关的第二配置参数；

所述判断模块，配置为根据所述第二配置参数判断所述数据集群***升级是否需要增加硬件资源和/或配置；

所述发送模块，配置为在需要增加硬件资源和/或配置的情况下，向所述云平台发送携带有所述第二配置参数的第二部署请求，其中，所述第二部署请求用于请求所述云平台根据所述第二配置参数创建所述数据集群***升级所需的硬件资源和/或配置。
根据权利要求19所述的装置，其中，所述装置还包括生成模块；所述第二配置文件中还包括用于所述数据集群***升级的组件的信息；

所述获取模块，还配置为在所述判断模块判定不需要增加硬件资源和/或配置的情况下，获取第二数据集群***版本文件信息，其中，所述第二数据集群***版本文件信息为升级后的数据集群***的版本文件的信息；

所述生成模块，配置为根据用于所述数据集群***升级的组件的信息和所述第二数据集群***版本文件信息对应的版本文件，生成插件。
一种数据集群的部署***，包括：

处理器，配置为获取用于数据集群***部署的第一配置信息，向云平台发送携带有所述第一配置信息的第一部署请求，其中，所述第一配置信息包括部署所述数据集群***所需的硬件资源和/或配置的信息，所述第一部署请求用于请求所述云平台根据所述第一配置信息创建所述数据集群***部署所需的硬件资源和/或配置；

所述云平台，配置为根据所述第一配置信息创建所述数据集群***部署所需的硬件资源和/或配置。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至11任一项所述的数据集群的部署方法。