1. IE browser is NOT supported anymore. Please use Chrome, Firefox or Edge instead.
2. If you are a new user, please register to get an IHEP SSO account through https://login.ihep.ac.cn/registlight.jsp Any questions, please email us at helpdesk@ihep.ac.cn or call 88236855.
3. If you need to create a conference in the "Conferences, Workshops and Events" zone, please email us at helpdesk@ihep.ac.cn.
4. The max file size allowed for upload is 100 Mb.
8–14 Jul 2023
青海宾馆
Asia/Shanghai timezone

面向HEPS的IO方法设计与优化

12 Jul 2023, 14:45
15m
三楼305会议室

三楼305会议室

Speaker

Dr 世园 符 (中国科学院高能物理所计算中心)

Description

北京在建的同步辐射光源装置预计每天产生数百TB的数据量,每年的数据量达到PB量级,对IO、存储和科学计算带来极大压力。实验过程中需要在线处理用于快速判断数据采集质量,目前从磁盘读取海量实验数据读取存在严重的IO瓶颈,因此HEPS亟需稳定高效的IO方法克服以上困难,首先分析光源下计算任务的读取模式,结合HDF5分块存储特性,减少数据跳读,结合并行异步策略加速读写,减少IO在计算过程中的占比;其次通过压缩的方式减少数据体积,为保证数据完整性,压缩采用无损的方式,引入压缩会带来额外的时间和资源消耗,而不同的数据压缩效果也有所不同,所以,以加速整个科学计算为目标,综合评价引入压缩的提升,自动触发压缩过程及压缩方法。因此本文拟通过以上方法优化HDF5在HEPS科学计算过程中的IO速度,加速科学结果产出。未来以流处理的方式可以规避海量数据落盘再读取导致的IO瓶颈问题,因此最后本文首先介绍了未来HEPS场景下IO方法的设计思路。

Primary authors

Dr 世园 符 (中国科学院高能物理所计算中心) Dr 誉 胡 (中国科学院高能物理所计算中心) 建利 刘 法制 齐 (高能所) Dr 浩凯 孙 (中国科学院高能物理所计算中心) 磊 王 锐 刘

Presentation materials