1. IE browser is NOT supported anymore. Please use Chrome, Firefox or Edge instead.
2. If you are a new user, please register to get an IHEP SSO account through https://login.ihep.ac.cn/registlight.jsp Any questions, please email us at helpdesk@ihep.ac.cn or call 88236855.
3. If you need to create a conference in the "Conferences, Workshops and Events" zone, please email us at helpdesk@ihep.ac.cn.
4. The max file size allowed for upload is 100 Mb.
8–14 Jul 2023
青海宾馆
Asia/Shanghai timezone

Hepsptycho多GPU及AI并行软件开发进展

11 Jul 2023, 14:00
15m
三楼305会议室

三楼305会议室

分会报告 先进光源数据与软件 先进光源数据与软件

Speaker

Dr 王 磊 (IHEP)

Description

Ptychography是一种相干衍射成像技术,能够提供在X光衍射波长极限内样品的相位分辨率重建图像。在光学实验中,使用小孔或者其它光学仪器将X光探针聚焦到待扫描样品上。样品每个预定位置的衍射图样由放置在样品1m距离(或更远)之后的探测器捕获。相邻两个扫描位置需要一定的重叠比例,以此来保证被记录的实验数据能够多倍冗余,为ePIE算法或者DM算法的重建提供足够多的信息。
针对ePIE算法和DM算法,现有的开源软件并未提供QT界面及提供完备的工作流,无法为用户提供友好的实验元数据参数的快速导入GUI及基于CUDA C++的多GPU并行重建迭代过程。Hepsptycho软件由高能物理研究所计算中心与多学科中心B2线站联合开发,程序核心均由CUDA C++实现,以实现在NVIDIA GPU上的并行计算,同时使用MPICH作为多GPU卡协同并行重建的框架,实现了迭代收敛的计算时间随GPU增加而线性递减。其元数据由HDF5文件提供导入,可以大大降低用户的软件学习成本。
在ePIE算法的基础上,计算中心与B2线站初步改写了算法核心模块,将其升级为快速稳定收敛的mPIE算法。
针对相干衍射实验数据量巨大而导致从硬盘读入缓慢的问题,Hepsptycho借鉴开源软件的单进程内多线程读入经验而非多MPI进程并行读入经验,大幅提高了IO的速度。
同时,由计算中心及B2线站联合开发的AI 快速重建模块(名称暂定为W1-Net 神经网络模块),正在逐步集成到Hepsptycho软件中,这为用户进行实际光学实验前的参数快速调试提供了强大的模拟支撑。
在国产化加速卡及软件框架应用方面,hepsptycho正在联合中科曙光及百度的科学家,尝试使用国产DCU+百度paddlepaddle推理框架实现AI的训练及推理过程,而非NVIDIA GPU+ TensorFlow的组合,以实现“国产替代”的目标。

Primary author

Dr 王 磊 (IHEP)

Co-authors

Presentation materials