Speaker
Mr
德智 黄
(高能所)
Description
宇宙线的起源一直是当代基础科学的重要难题。瞄准这一目标,高海拔宇宙线观测站(LHAASO)应运而生。LHASSO是新一代的复合型宇宙线探测阵列,由水切伦科夫探测器(WCDA);广角切伦科夫望远镜阵列(WFCTA);地面簇射例子阵列(KM2A)三部分组成。WCDA是LHASSO其中一个重要的组成部分,通过对宇宙线或者伽马射线形成的空气簇射的次级产物在水中产生的切伦科夫光的观察,可以重建出原初宇宙线或者伽马射线的方向,能量等信息用于后续的研究。
LHAASO-WCDA具有较高的噪声率和巨大数据量。为了应对挑战,我们发展了一套快速的数据处理方法来压缩数据量,解决数据存储和传输瓶颈。同时过滤噪声,提高信噪比,使实验和数据分析更加经济有效的展开。压缩传输数据量的需求决定了这种方法必须是在线进行的。基于WCDA实验高本底噪声率的特点,我们发展了快速遍举法。利用对不同天区的快速遍举找到相对准确的簇射方向,选择簇射前锋面附近一定时间窗口内的信号进行记录保存,剩下的信号大部分为噪声,所以我们选择丢掉。从而实现对数据有效的过滤。最后把过滤后得到数据进行进一步压缩,从位于稻城的实验站点传输回高能所用于后续的离线精确重建和分析工作。在快速遍举法中我们首先把可视天区分成许多个等立体角的单元,每个单元代表一个特定的方向。对于任意一个探测到的簇射事例,对每个天区代表的方向进行遍历,把着火探测器的位置和时间转换到把垂直于此天区方向作为z轴的一个坐标系上,然后在此坐标系下计算着火点时间排序后平台区域的宽度,这个宽度由时间基本不变的着火点的个数来衡量。原则上越靠近准确的簇射方向,平台宽度就会越大。通过对整个天区中所有单元进行遍历,就可以找到最可几天区的位置。
在整套快速遍举法中,我们需要对每个天区进行历遍,每个天区的时间信号都需要进行排序,这也是整个算法运行中时间消耗最多的一部分。由于我们对每个天区都进行了同样的操作,只是每个天区的数据有所差异,那么如果我们能够在这个基础上对这一部分程序进行并行处理,可以极大的提高程序运行的效率。由GPU来承担并行处理的任务在速度和程序实现方面都表现出了巨大的优势。随着Nvidia公司提出CUDA技术的应用,使用GPU加速通用运算越来越得到了大家得认可。在整套快速遍举法中,当天区划分完成后,需要对数千个的天区进行同样的操作时我们把数据传输给GPU并行处理,完成这部分的数据处理后把结果传回CPU接着进行后面的分析。这样我们充分利用了CPU和GPU在运算上的优点。在本篇文章中我们对在线噪声过滤算法进行了介绍,同时对比了在CPU和GPU上的运行速度。当整个应用成熟之后,LHAASO的在站机房可以用较小规模的GPU服务器代替,同时提高WCDA对瞬态源的预警。
Primary author
Mr
德智 黄
(高能所)