CN103067296A - 一种实现hpc集群登录节点负载均衡的方法 - Google Patents

一种实现hpc集群登录节点负载均衡的方法 Download PDF

Info

Publication number
CN103067296A
CN103067296A CN2013100179411A CN201310017941A CN103067296A CN 103067296 A CN103067296 A CN 103067296A CN 2013100179411 A CN2013100179411 A CN 2013100179411A CN 201310017941 A CN201310017941 A CN 201310017941A CN 103067296 A CN103067296 A CN 103067296A
Authority
CN
China
Prior art keywords
node
cluster
load
login
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100179411A
Other languages
English (en)
Other versions
CN103067296B (zh
Inventor
陈良华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310017941.1A priority Critical patent/CN103067296B/zh
Publication of CN103067296A publication Critical patent/CN103067296A/zh
Application granted granted Critical
Publication of CN103067296B publication Critical patent/CN103067296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Multi Processors (AREA)

Abstract

本发明提供一种实现HPC集群登录节点负载均衡的方法,本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡***适用于成百、数千个节点的大规模HPC集群***。集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器。

Description

一种实现HPC集群登录节点负载均衡的方法
技术领域
本发明涉及基于linux操作***的HPC集群登录节点的负载均衡,具体涉及一种实现HPC集群登录节点负载均衡的方法。
背景技术
高性能计算(HPC) 集群通常采用大规模计算节点进行计算,伴随着大型集群的普及应用,高性能计算用户的数量也越来越多。为了保证集群的安全性和稳定性,不建议高性能计算用户直接登录到管理节点进行程序的便也和作业提交。
对于传统的HPC集群,通常采用单个调度节点,或者独立的多个调度节点进行程序编译和计算作业的提交和资源分配。在这种环境中,存在以下几点不足:
1)调度节点宕机影响将会整个集群运算作业的提交和运行;
2)如果登录节点存在正在编译的程序,登录节点的性能没有保障;
3)集群用户直接登录到调度节点,容易对操作***和pbs***造成误操作等,存在安全隐患。
发明内容
本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡***适用于成百、数千个节点的大规模HPC集群***。
本发明的技术方案是按以下方式实现的,该方法包括***物理结构和负载均衡调度***的部署,其中:
a) ***物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度***的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
本发明的有益效果
1)HPC集群通常配置登录节点,以便高性能用户进行程序的编译和作业的提交;
2)针对大规模HPC集群多个登录节点进行负载均衡,以满足高性能用户的分流,减轻登录节点的压力;
3)通过IPVSADM或硬件负载均衡设备,针对ssh端口22实现多个计算节点作业调度负载均衡;
4)通过登录节点的负载均衡功能,实现HPC集群程序编译和作业调度环节的冗余,并保证集群运行的稳定性和安全性。
附图说明
图1是登录节点负载均衡***结构示意图;
图2是登录节点负载均衡流程图。
具体实施方式
下面结合附图对本发明的方法作进一步详细说明。
本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡***适用于成百、数千个节点的大规模HPC集群***。
该方法包括***物理结构和负载均衡调度***的部署,其中:
c) ***物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;负载均衡设备可以使用浪潮TS8650G3等硬件负载均衡设备;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
d)负载均衡调度***的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
除本发明的说明书公开的技术特征外均为本专业技术人员的公职技术。

Claims (1)

1.一种实现HPC集群登录节点负载均衡的方法,其特征在于,该方法包括***物理结构和负载均衡调度***的部署,其中:
a)***物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度***的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
CN201310017941.1A 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法 Active CN103067296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310017941.1A CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310017941.1A CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Publications (2)

Publication Number Publication Date
CN103067296A true CN103067296A (zh) 2013-04-24
CN103067296B CN103067296B (zh) 2017-05-10

Family

ID=48109764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310017941.1A Active CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Country Status (1)

Country Link
CN (1) CN103067296B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297543A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种基于计算机集群作业调度的方法
CN104301417A (zh) * 2014-10-22 2015-01-21 网宿科技股份有限公司 一种负载均衡方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617126A (zh) * 2003-11-11 2005-05-18 联想(北京)有限公司 一种计算机机群***及其作业管理方法
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、***和主服务器
CN102571782A (zh) * 2011-12-29 2012-07-11 浙江大学 一种新型负载平衡服务器集群***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617126A (zh) * 2003-11-11 2005-05-18 联想(北京)有限公司 一种计算机机群***及其作业管理方法
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、***和主服务器
CN102571782A (zh) * 2011-12-29 2012-07-11 浙江大学 一种新型负载平衡服务器集群***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297543A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种基于计算机集群作业调度的方法
CN104301417A (zh) * 2014-10-22 2015-01-21 网宿科技股份有限公司 一种负载均衡方法及装置
CN104301417B (zh) * 2014-10-22 2018-08-07 网宿科技股份有限公司 一种负载均衡方法及装置

Also Published As

Publication number Publication date
CN103067296B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN109120494B (zh) 在云计算***中接入物理机的方法
US10171294B2 (en) Information processing device and system design support method
CN114363021B (zh) 网络靶场***、网络靶场***的虚拟网络实现方法及装置
AU2013375618B2 (en) Load sharing method and apparatus
CN102457439A (zh) 一种云计算***的虚拟交换***及其虚拟交换方法
Moghaddam et al. Cloud computing: Vision, architecture and Characteristics
CN103581325B (zh) 一种云计算资源池***及其实现方法
CN110008005B (zh) 基于云平台的电网通信资源虚拟机迁移***及方法
CN105894159A (zh) 一种跨领域跨平台的用户统一管理***的实现方法
CN104301417B (zh) 一种负载均衡方法及装置
CA2931687A1 (en) System and method for creating service chains and virtual networks in the cloud
CN103377402A (zh) 一种多用户分析***以及相应的装置和方法
CN108900651A (zh) 基于多租户环境的Kubernetes与Neutron对接方法、存储介质、设备
CN104283959A (zh) 一种适用于云平台的基于性能分级的存储机制
CN108600344A (zh) 一种网络访问请求调度方法、装置和存储介质
CN104363306A (zh) 一种企业私有云管理控制方法
Chang et al. Architecture design of datacenter for cloud english education platform
CN114610440A (zh) 模拟机***的运行环境构建方法及***
CN103986665A (zh) 云海os中网络负载均衡的方法
CN103067296A (zh) 一种实现hpc集群登录节点负载均衡的方法
CN203225789U (zh) 基于云计算的虚拟桌面终端***
CN104166581A (zh) 一种面向增量制造设备的虚拟化方法
CN114363164B (zh) 云网络服务编排控制方法、***、存储介质和电子设备
CN105046393A (zh) 基于云计算的交通资源管理***
CN104994137B (zh) 一种网络透明代理的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant