Speaker
Description
近几年随着人工智能技术的发展,机器学习(Machine Learning,ML),尤其是图神经网络(Graph Neural Networks,GNNs),为径迹重建提供了全新解决方案并取得显著结果。然而,当前相关研究仍面临关键瓶颈:公开数据集与评估指标尚不统一,现有数据集多面向强子对撞机的高堆积、高多重数环境设计,与$\tau$-粲物理实验所对应的低本底、低多重数、高精度测量需求存在显著差异,导致面向$\tau$-粲物理实验的专用数据集与评估指标长期缺失,严重限制了相关ML方法的公平对比与快速迭代。
针对上述难题,本工作构建了一套完整的数据集产生与径迹重建性能分析工作体系。首先通过单粒子与多粒子产生子完成蒙特卡洛(Monte Carlo, MC)模拟数据生成,并设计预处理流程构建机器学习径迹重建数据集;随后将机器学习寻迹结果通过外联式导入或内联式推理两种方式集成到 BOSS 框架,完成后续径迹拟合;最后开发了径迹重建性能分析算法,用于评估与可视化重建结果。
在此体系下,本工作发布了一套基于北京正负电子对撞机II(Beijing Electron Positron Collider II, BEPCII)上北京谱仪III(Beijing Spectrometer III, BESIII)漂移室(Multilayer Drift Chamber, MDC)的MC模拟数据集,包含单径迹与双径迹事例,双径迹事例又包含常规双径迹与近邻双径迹两类,涵盖不同样本种类、输入特征与多级标签定义、数据集规模划分,并提供了官方访问方式。为实现标准化、可对比的性能评估,本文针对径迹重建任务的核心需求,采用了一套专用评估指标,系统涵盖有无拟合两种情况下的径迹效率、克隆径迹率、假径迹率以及径迹参数分辨率等关键维度。