当前位置>主页 > 期刊在线 > 信息技术 >

信息技术2019年5期

中小型规模高性能计算集群的搭建与维护
文洮,金能智,马尧,赵志威
(甘肃省计算中心,甘肃 兰州 730030)

摘  要:高性能计算在近几年得到了充分的发展,越来越多的高校、科研院所开始搭建适合自己需求的高性能计算集群,搭建的过程除了硬件、软件、运行环境这些必要的条件以外,后期的维护也是需要重点关注的领域。本文分析了高性能计算集群的特征、搭建需求、整体思路以及后期维护需要注意的问题,并且通过实用的算例测试了集群并行效率,希望为该领域的科研用户以及管理人员提供借鉴。


关键词:高性能计算;集群;搭建;维护;并行效率



中图分类号:TP393        文献标识码:A        文章编号:2096-4706(2019)05-0020-05


Construction and Maintenance of Small and Medium Scale High Performance Computing Cluster

WEN Tao,JIN Nengzhi,MA Yao,ZHAO Zhiwei

(Gansu Computing Center,Lanzhou 730030,China)

Abstract:High-performance computing has been fully developed in recent years. More and more universities and research institutes have begun to build high-performance computing clusters that suit their needs. The construction process is in addition to the necessary conditions of hardware,software and operating environment,later maintenance should also be the area of focus. This paper analyzes the characteristics of the high-performance computing cluster,the requirements of the construction,the overall idea and the problems that need to be paid attention to in the later maintenance,and tests the parallel efficiency of the cluster with practical examples,which provides a reference for the technicians who use and maintain the high-performance computing cluster.

Keywords:high performance computing;cluster;build;maintain;parallel efficiency


参考文献:

[1] 郑晓欢,陈明奇,唐川,等. 全球高性能计算发展态势分析 [J]. 世界科技研究与发展,2018,40(3):249-260.

[2] 袁国兴,姚继锋.2017 年中国高性能计算机发展现状分析 [J]. 计算机工程与科学,2017,39(12):2161-2166.

[3] 邓宾. 高性能计算集群的建立及管理 [J]. 自动化与仪器仪表,2014(2):149-151.

[4] 王涛,李强. 全球未来计算竞争态势及对我国的启示 [J].电信技术,2018(6):43-46.

[5] 钱德沛. 我国高性能计算的回顾与展望 [J]. 民主与科学,2017(4):20-23.

[6] 孟玲玲. 高性能计算集群系统建设与运行管理研究 [J]. 软件导刊,2017,16(3):138-140.

[7] 迟学斌. 高性能计算环境与应用 [J]. 国防科技工业,2018(5):21-22.

[8] 钟泽秀,詹晓东,裴春梅. 低成本的高性能计算环境的搭建 [J]. 芜湖职业技术学院学报,2016,18(4):33-36.

[9] 陈晓霞,孙婧. 中国气象局的高性能计算机系统 [J]. 科研信息化技术与应用,2012,3(5):83-90.

[10] 黄建强,孟永伟,曹腾飞,等. 青海大学三江源数据分析中心高性能计算集群的构建与设备管理[J]. 实验技术与管理,2014,31(12):237-240.

[11] 高永国,邓津. 甘肃省地震局高性能计算系统 [J]. 地震地磁观测与研究,2018,39(1):149-153.

[12] 游伟倩,盛乐标,张予倩. 南京大学大型高性能计算集群平台建设研究 [J]. 科技创新导报,2018,15(4):126-127.

[13] 郭宇,葛佳斌. 高性能计算集群运维自动化研究 [J]. 网络安全技术与应用,2017(6):59-61.

[14] 金能智,者建武,李唐艳,等. 基于Linux 的高性能计算集群MPI 并行环境配置研究 [J]. 科技创新导报,2017,14(3):116-117.

[15] 朱宏武,尹新怀,罗丹,等. 湖南省气象局远程高性能计算环境的设计与实现 [J]. 南京信息工程大学学报(自然科学版),2016,8(3):259-266.

[16] 中科曙光.Gridview3.2 普通用户用户手册 [Z]. 曙光信息产业股份有限公司,2013.

[17] 李博. 通信机房的运行维护工作探究 [J]. 信息系统工程,2018(9):101.


作者简介:文洮(1987-),女,汉族,甘肃人,助理研究员, 研究生,研究方向:高性能计算、数值模拟等。