Speaker
Ms
然 杜
(高能所)
Description
资源管理和调度系统是高性能计算集群的关键系统,不同资源管理和调度系统对其应用场景各有侧重。高能所计算集群发展至今,随着集群规模和用户需求的变化,形成了PBS、HTCondor和SLURM多资源管理和调度系统并存的现状。在此过程中,往往需要研究资源管理和调度系统的资源管理策略、作业调度算法、系统整体性能等。为了方便研究,开发了一个作业测试工具集。该工具集适用于上述多个资源管理和调度系统,可根据研究目的生成测试作业库,并提供图形化结果分析工具。本文将在详细阐述该工具集的架构和设计后,给出一个利用该工具集进行作业调度算法研究的实例,以展示该工具集的作用和效果。
Primary author
Ms
然 杜
(高能所)
Co-authors
Dr
Jiaheng Zou
(高能所)
Ms
Jingyan SHI Jingyan
(高能所)
SUN Zhenyu
(高能所)
Mr
Xiaowei JIANG Xiaowei
(高能所)
谭宏楠
(高能所)