CN107682395A - 一种大数据云计算运行***及方法 - Google Patents
一种大数据云计算运行***及方法 Download PDFInfo
- Publication number
- CN107682395A CN107682395A CN201710736166.3A CN201710736166A CN107682395A CN 107682395 A CN107682395 A CN 107682395A CN 201710736166 A CN201710736166 A CN 201710736166A CN 107682395 A CN107682395 A CN 107682395A
- Authority
- CN
- China
- Prior art keywords
- data
- cloud computing
- module
- runtime
- server group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种大数据云计算运行***及方法,包括大数据运行***和云计算服务器组,所述运行***包括处理流程集成模块、历史数据采集模块、实时数据采集模块、存储模块、数据分享模块,所述处理流程集成模块,用于集中处理数据;所述历史数据采集模块,用于采集非交易数据;所述实时数据采集模块,用于实时采集即时发生的业务数据;所述存储模块,用于存储采集的所述历史数据和业务数据。本发明大数据***极大降低了大数据***的使用门槛,并且使组织内部大数据相关资源能方便共享,是一套可持续的可累积的大数据***,并且云计算服务器组保证了数据传输过程的正确性,数据的隐私性,保证了服务器组正常工作的高可靠性。
Description
技术领域
本发明涉及计算机信息存储与处理技术领域,具体为一种大数据云计算运行***及方法。
背景技术
随着计算机和互联网技术的快速发展,我们处在了一个信息***的时代,为了处理大量的信息,出现了大数据的概念。所谓大数据,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。由于数据的海量特性,人们仅仅凭一己之力很难对这些数据这些分析,但是在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据逐步为人类创造更多的价值。
云计算(Cloud computing),是一种新兴的共享基础架构的方法,可以将巨大的***池连接在一起以提供各种IT服务。云计算通常有狭义云计算和广义云计算之分。其中,广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务。
然而现有大数据云计算***在使用不同提供商提供的服务时,尤其是使用多个小规模云计算提供商提供的云服务时,因为云服务之间的能力和接口不兼容,必须分别建立针对每个大数据***的接口和平台,造成了不便,同时也造成了***资源的浪费,整体***效率低下以上这些问题就给业界造成很大的困挠,那么如何发明出一种大数据云计算运行***及方法,这成为我们需要解决的问题。
发明内容
本发明的目的在于提供一种大数据云计算运行***及方法,解决了背景技术中所提出的问题。
为解决上述问题,本发明提供如下技术方案:一种大数据云计算运行***及方法,包括大数据运行***和云计算服务器组,所述运行***包括处理流程集成模块、历史数据采集模块、实时数据采集模块、存储模块、数据分享模块,所述处理流程集成模块,用于集中处理数据;所述历史数据采集模块,用于采集非交易数据;所述实时数据采集模块,用于实时采集即时发生的业务数据;所述存储模块,用于存储采集的所述历史数据和业务数据;所述处理模块,用于处理采集的历史数据和业务数据,获得处理后的数据;所述数据分享模块,用于分享所述处理后的数据,所述大数据运行***与所述云计算服务器组信息互通。
优选的,所述大数据运行***对数据处理方法包括以下:
S1,对数据格式进行转换,建立适用于非关系数据库进行存储的格式;
S2,将数据分为基础数据和专业数据,采用集中式和分布式结合的策略对数据进行存储,存储时所有数据都进行备份;所述集中式和分布式结合的策略包括:对于高于预设频率的基础数据采用集中式存储,由数据管理中心统一维护,对于低于预设频率的专业数据采用分布式存储,由各专业数据中心分别维护;
S3,建立相应的数据检索算法,对数据进行快速检索,所述数据检索算法采用目录检索和搜索引擎相结合的方式进行,具体包括:建立数据目录,根据目录对数据进行初步检索;在搜索引擎输入关键词,对数据进行精确检索;搜索引擎按照一定的方式寻找匹配的数据,并根据数据与关键词的匹配程度进行排序反馈给用户。
S4,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出的数据存入云数据库,从而实现树状型结构分类***。
优选的,所述处理模块包括SQL处理单元、通用算法处理单元及开源处理单元;所述SQL处理单元用于支持用户直接使用SQL语句处理所述历史数据和交易数据。
优选的,所述云计算服务器组设有云计算处理模块,所述云计算处理模块,用于通过接收模块接收云计算请求者的云计算请求,从中解析出请求,选择所述云计算请求者提供的云计算服务和资源及功能模式,执行云服务操作。
优选的,所述云计算服务器组执行方法如下:
A,向中间件服务器注册;用户通过客户端向中间件服务器注册,并设置该用户可用的云计算服务器组;
B,中间件服务器根据客户端登录的用户,搜索本地数据库,查找出当前用户能够操作的文件、可用的云计算服务器组;
C,用户在本地选择需要上传的计算模式文件,将其分成设定大小的数据块后传输到中间件服务器;
D,中间件服务器对上传的计算模式文件进行校验;如果缺失某数据块或未通过校验,则要求该用户所在客户端对该数据块进行重传,如果正确,则将数据传输到该用户可用的云计算服务器组。
与现有技术相比,本发明的有益效果如下:
本发明大数据***极大降低了大数据***的使用门槛,并且使组织内部大数据相关资源能方便共享,是一套可持续的可累积的大数据***,并且云计算服务器组保证了数据传输过程的正确性,数据的隐私性,保证了服务器组正常工作的高可靠性。
附图说明
图1为本发明整体***原理框架示意图;
图2为本发明处理模块原理框架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本实用发明提供一种技术方案:一种大数据云计算运行***及方法,包括大数据运行***和云计算服务器组,所述运行***包括处理流程集成模块、历史数据采集模块、实时数据采集模块、存储模块、数据分享模块,所述处理流程集成模块,用于集中处理数据;所述历史数据采集模块,用于采集非交易数据;所述实时数据采集模块,用于实时采集即时发生的业务数据;所述存储模块,用于存储采集的所述历史数据和业务数据;所述处理模块,用于处理采集的历史数据和业务数据,获得处理后的数据;所述数据分享模块,用于分享所述处理后的数据,所述大数据运行***与所述云计算服务器组信息互通。
所述大数据运行***对数据处理方法包括以下:
S1,对数据格式进行转换,建立适用于非关系数据库进行存储的格式;
S2,将数据分为基础数据和专业数据,采用集中式和分布式结合的策略对数据进行存储,存储时所有数据都进行备份;所述集中式和分布式结合的策略包括:对于高于预设频率的基础数据采用集中式存储,由数据管理中心统一维护,对于低于预设频率的专业数据采用分布式存储,由各专业数据中心分别维护;
S3,建立相应的数据检索算法,对数据进行快速检索,所述数据检索算法采用目录检索和搜索引擎相结合的方式进行,具体包括:建立数据目录,根据目录对数据进行初步检索;在搜索引擎输入关键词,对数据进行精确检索;搜索引擎按照一定的方式寻找匹配的数据,并根据数据与关键词的匹配程度进行排序反馈给用户。
S4,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出的数据存入云数据库,从而实现树状型结构分类***。
所述处理模块包括SQL处理单元、通用算法处理单元及开源处理单元;所述SQL处理单元用于支持用户直接使用SQL语句处理所述历史数据和交易数据。
所述云计算服务器组设有云计算处理模块,所述云计算处理模块,用于通过接收模块接收云计算请求者的云计算请求,从中解析出请求,选择所述云计算请求者提供的云计算服务和资源及功能模式,执行云服务操作。
所述云计算服务器组执行方法如下:
A,向中间件服务器注册;用户通过客户端向中间件服务器注册,并设置该用户可用的云计算服务器组;
B,中间件服务器根据客户端登录的用户,搜索本地数据库,查找出当前用户能够操作的文件、可用的云计算服务器组;
C,用户在本地选择需要上传的计算模式文件,将其分成设定大小的数据块后传输到中间件服务器;
D,中间件服务器对上传的计算模式文件进行校验;如果缺失某数据块或未通过校验,则要求该用户所在客户端对该数据块进行重传,如果正确,则将数据传输到该用户可用的云计算服务器组。
综上,本发明大数据***极大降低了大数据***的使用门槛,并且使组织内部大数据相关资源能方便共享,是一套可持续的可累积的大数据***,并且云计算服务器组保证了数据传输过程的正确性,数据的隐私性,保证了服务器组正常工作的高可靠性。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种大数据云计算运行***及方法,包括大数据运行***和云计算服务器组,其特征在于:所述运行***包括处理流程集成模块、历史数据采集模块、实时数据采集模块、存储模块、数据分享模块,所述处理流程集成模块,用于集中处理数据;所述历史数据采集模块,用于采集非交易数据;所述实时数据采集模块,用于实时采集即时发生的业务数据;所述存储模块,用于存储采集的所述历史数据和业务数据;所述处理模块,用于处理采集的历史数据和业务数据,获得处理后的数据;所述数据分享模块,用于分享所述处理后的数据,所述大数据运行***与所述云计算服务器组信息互通。
2.根据权利要求1所述的一种大数据云计算运行***及方法,其特征在于:所述大数据运行***对数据处理方法包括以下:
S1,对数据格式进行转换,建立适用于非关系数据库进行存储的格式;
S2,将数据分为基础数据和专业数据,采用集中式和分布式结合的策略对数据进行存储,存储时所有数据都进行备份;所述集中式和分布式结合的策略包括:对于高于预设频率的基础数据采用集中式存储,由数据管理中心统一维护,对于低于预设频率的专业数据采用分布式存储,由各专业数据中心分别维护;
S3,建立相应的数据检索算法,对数据进行快速检索,所述数据检索算法采用目录检索和搜索引擎相结合的方式进行,具体包括:建立数据目录,根据目录对数据进行初步检索;在搜索引擎输入关键词,对数据进行精确检索;搜索引擎按照一定的方式寻找匹配的数据,并根据数据与关键词的匹配程度进行排序反馈给用户。
S4,由数据源,数据分类单元,数据编号单元,云数据库依次连接构成,所述数据编号单元还包括:数据位置编号,数据时间编号,数据容量编号;所述数据分类单元有效地将所属数据源进行类别的分类,在不同的类别数据下,采用所述数据编号单元,对不同类别的相同类型数据进行数据位置,数据时间,数据容量的类别进行分类,并将分类出的数据存入云数据库,从而实现树状型结构分类***。
3.根据权利要求1所述的一种大数据云计算运行***及方法,其特征在于:所述处理模块包括SQL处理单元、通用算法处理单元及开源处理单元;所述SQL处理单元用于支持用户直接使用SQL语句处理所述历史数据和交易数据。
4.根据权利要求1所述的一种大数据云计算运行***及方法,其特征在于:所述云计算服务器组设有云计算处理模块,所述云计算处理模块,用于通过接收模块接收云计算请求者的云计算请求,从中解析出请求,选择所述云计算请求者提供的云计算服务和资源及功能模式,执行云服务操作。
5.根据权利要求1所述的一种大数据云计算运行***及方法,其特征在于:所述云计算服务器组执行方法如下:
A,向中间件服务器注册;用户通过客户端向中间件服务器注册,并设置该用户可用的云计算服务器组;
B,中间件服务器根据客户端登录的用户,搜索本地数据库,查找出当前用户能够操作的文件、可用的云计算服务器组;
C,用户在本地选择需要上传的计算模式文件,将其分成设定大小的数据块后传输到中间件服务器;
D,中间件服务器对上传的计算模式文件进行校验;如果缺失某数据块或未通过校验,则要求该用户所在客户端对该数据块进行重传,如果正确,则将数据传输到该用户可用的云计算服务器组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710736166.3A CN107682395A (zh) | 2017-08-24 | 2017-08-24 | 一种大数据云计算运行***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710736166.3A CN107682395A (zh) | 2017-08-24 | 2017-08-24 | 一种大数据云计算运行***及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107682395A true CN107682395A (zh) | 2018-02-09 |
Family
ID=61135254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710736166.3A Pending CN107682395A (zh) | 2017-08-24 | 2017-08-24 | 一种大数据云计算运行***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107682395A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416067A (zh) * | 2018-03-29 | 2018-08-17 | 重庆大学 | 工业过程中海量数据处理和存储过程的优化执行估算方法 |
CN109063028A (zh) * | 2018-07-09 | 2018-12-21 | 清远网博信息技术有限公司 | 一种旅游数据推送的方法、*** |
CN109299213A (zh) * | 2018-10-15 | 2019-02-01 | 临沂大学 | 一种论文编辑搜索方法 |
WO2019184618A1 (zh) * | 2018-03-28 | 2019-10-03 | 腾讯科技(深圳)有限公司 | 数据存储的方法、装置、服务器和存储介质 |
CN110457281A (zh) * | 2019-08-14 | 2019-11-15 | 北京博睿宏远数据科技股份有限公司 | 数据处理方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102255933A (zh) * | 2010-05-20 | 2011-11-23 | 中兴通讯股份有限公司 | 云服务中介、云计算方法及云*** |
CN102307233A (zh) * | 2011-08-24 | 2012-01-04 | 无锡中科方德软件有限公司 | 一种云计算服务器的云计算方法 |
CN104462585A (zh) * | 2014-12-29 | 2015-03-25 | 芜湖乐锐思信息咨询有限公司 | 一种大数据分类*** |
US20150341232A1 (en) * | 2014-05-22 | 2015-11-26 | Facebook, Inc. | Daily Counts and Usage Probabilities For a User of an Online Service |
CN106203146A (zh) * | 2016-08-30 | 2016-12-07 | 广东港鑫科技有限公司 | 一种大数据安全管理*** |
CN106648672A (zh) * | 2016-12-28 | 2017-05-10 | 北京云星宇交通科技股份有限公司 | 一种大数据开发与运行方法及*** |
-
2017
- 2017-08-24 CN CN201710736166.3A patent/CN107682395A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102255933A (zh) * | 2010-05-20 | 2011-11-23 | 中兴通讯股份有限公司 | 云服务中介、云计算方法及云*** |
CN102307233A (zh) * | 2011-08-24 | 2012-01-04 | 无锡中科方德软件有限公司 | 一种云计算服务器的云计算方法 |
US20150341232A1 (en) * | 2014-05-22 | 2015-11-26 | Facebook, Inc. | Daily Counts and Usage Probabilities For a User of an Online Service |
CN104462585A (zh) * | 2014-12-29 | 2015-03-25 | 芜湖乐锐思信息咨询有限公司 | 一种大数据分类*** |
CN106203146A (zh) * | 2016-08-30 | 2016-12-07 | 广东港鑫科技有限公司 | 一种大数据安全管理*** |
CN106648672A (zh) * | 2016-12-28 | 2017-05-10 | 北京云星宇交通科技股份有限公司 | 一种大数据开发与运行方法及*** |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019184618A1 (zh) * | 2018-03-28 | 2019-10-03 | 腾讯科技(深圳)有限公司 | 数据存储的方法、装置、服务器和存储介质 |
CN110309233A (zh) * | 2018-03-28 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 数据存储的方法、装置、服务器和存储介质 |
US11275759B2 (en) | 2018-03-28 | 2022-03-15 | Tencent Technology (Shenzhen) Company Limited | Data storage method and apparatus, server, and storage medium |
CN110309233B (zh) * | 2018-03-28 | 2022-11-15 | 腾讯科技(深圳)有限公司 | 数据存储的方法、装置、服务器和存储介质 |
CN108416067A (zh) * | 2018-03-29 | 2018-08-17 | 重庆大学 | 工业过程中海量数据处理和存储过程的优化执行估算方法 |
CN109063028A (zh) * | 2018-07-09 | 2018-12-21 | 清远网博信息技术有限公司 | 一种旅游数据推送的方法、*** |
CN109299213A (zh) * | 2018-10-15 | 2019-02-01 | 临沂大学 | 一种论文编辑搜索方法 |
CN110457281A (zh) * | 2019-08-14 | 2019-11-15 | 北京博睿宏远数据科技股份有限公司 | 数据处理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107682395A (zh) | 一种大数据云计算运行***及方法 | |
CN111435344B (zh) | 一种基于大数据的钻井提速影响因素分析模型 | |
Ma et al. | Big graph search: challenges and techniques | |
CN103631922B (zh) | 基于Hadoop集群的大规模Web信息提取方法及*** | |
CN109189782A (zh) | 一种区块链商品交易查询中的索引方法 | |
CN109815254B (zh) | 基于大数据的跨地域任务调度方法及*** | |
CN102722553A (zh) | 基于用户日志分析的分布式倒排索引组织方法 | |
CN107301197A (zh) | 一种业务数据跟踪处理***及方法 | |
CN111552885B (zh) | 实现自动化实时消息推送运营的***及其方法 | |
CN102375837A (zh) | 数据采集***和方法 | |
CN101446966A (zh) | 数据存储方法及*** | |
CN104239377A (zh) | 跨平台的数据检索方法及装置 | |
CN102200979A (zh) | 一种分布式并行信息检索***及其方法 | |
CN101739398A (zh) | 分布式数据库多连接查询优化算法 | |
CN105183809A (zh) | 一种云平台数据查询方法 | |
CN104615734B (zh) | 一种社区管理服务大数据处理***及其处理方法 | |
CN106682206A (zh) | 一种大数据处理方法及*** | |
CN107046557A (zh) | 移动云计算环境下动态Skyline查询的智能医疗呼叫查询*** | |
CN102279891A (zh) | 一种并行搜索it日志的检索方法、装置及*** | |
CN108228787A (zh) | 按照多级类目处理信息的方法和装置 | |
CN115934856A (zh) | 一种构造综合能源数据资产的方法和*** | |
CN103412883A (zh) | 基于p2p技术的语义智能信息发布订阅方法 | |
CN102981913A (zh) | 支持大规模分布式增量计算的推理控制方法及推理控制*** | |
CN100370458C (zh) | 资料整合与分析***及方法 | |
CN113806446A (zh) | 一种大数据海量数据快速检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180209 |
|
RJ01 | Rejection of invention patent application after publication |