Speaker
垚松 程
(中国科学院高能物理研究所)
Description
随着许多大型高能物理实验的推进,需要处理和分析的数据量显著增加,对计算资源的需求飞速增长。例如高海拔宇宙线观测站(LHAASO),它是一个复合型阵列,主要由平方公里阵列(KM2A)、水切伦科夫探测器阵列(WCDA)和广角切伦科夫望远镜阵列(WFCTA)这三个子阵列组成。自2020年实验开始运行以来,它们的模拟作业一直在Intel X86集群上运行,由于CPU资源有限,仅生产了第一阶段计划数据的一部分。因此有必要探索新的并拓展现有的计算服务设备。2021年,在中国广东省东莞市建成了包含10k CPU核心的ARM计算集群,我们在此之上构建了一个基于ARM架构的应用程序生态系统,以支持高能物理离线数据处理。我们的主要工作包括:将基于KM2A、WCDA和WFCTA实验的离线软件移植到ARM机器上运行,在ARM集群中制定数据传输和作业调度策略,并评估在Intel X86和ARM集群中的性能和功耗。结果表明,LHAASO模拟作业在ARM计算集群可以正确运行;基于Intel X86架构的CPU单核性能优于ARM CPU,但是对于多核架构的整个服务器来说,ARM服务器性能更好。