1. IE browser is NOT supported anymore. Please use Chrome, Firefox or Edge instead.
2. If you are a new user, please register to get an IHEP SSO account through https://login.ihep.ac.cn/registlight.jsp Any questions, please email us at helpdesk@ihep.ac.cn or call 88236855.
3. If you need to create a conference in the "Conferences, Workshops and Events" zone, please email us at helpdesk@ihep.ac.cn.
4. The max file size allowed for upload is 100 Mb.
26 June 2024 to 2 July 2024
青海宾馆
Asia/Shanghai timezone

CEPC上基于DeepSets模型的喷注标记算法研究

28 Jun 2024, 14:15
15m
三楼305会议室

三楼305会议室

分会报告 人工智能与应用

Speaker

Libo Liao (wuzhou univercity)

Description

背景介绍 2012年在大型强子对撞机(LHC)上发现希格斯(Higgs)玻色子是粒子物理学界的大事件,该发现不仅补全了标准模型缺失的最后一角,而且开启了粒子物理探索的新篇章。由于WZH三种玻色子(尤其是希格斯玻色子)与新物理现象及新物理规律的联系十分密切,因此精确测量他们的性质,是探索新物理现象和新物理规律的关键手段。强子喷注是WZH三种玻色子最主要的衰变末态,因此喷注的重建(Clustering)和标记(Tagging)算法对实现WZH三种玻色子的精确测量至关重要。本文主要介绍喷注的标记算法。传统喷注标记算法有两种,第一种是基于选择条件和人工变量,第二种是基于传统机器学习算法,比如决策树(Boost Decision Tree, BDT)和神经网络(MLP)。近年来,随着深度学习的发展及其性能的进一步提升,越来越多的深度学习算法应用于粒子物理实验中,例如依旧基于人工提取变量方法的DNN算法、基于图像识别的CNN算法和序列处理的RNN算法,以及本文在正负电子对撞机(CEPC)上采取的基于DeepSets模型的神经网络方法对夸克喷注标记进行分析。
数据、模型和性能 本研究采用了新提出的、基于DeepSets的能量流深度学习算法以及Z玻色子强衰变末态产生的喷注模拟数据集,尝试对重味夸克喷注的标记进行研究。其中Z玻色子衰变为bb\barcc\bar,(ss\baruu\bardd\bar) 等5种不同强子末态。所有数据通过Whizard 1.9.5 产生,再用Pythia进行强子化模拟,最后再采取CEPC CDR的基准探测器对蒙特卡洛样本进行探测器模拟和重建。DeepSets模型有以下三个特点:第一,喷注中末态粒子的顺序交换不影响喷注的性质,因此DeepSets模型必须考虑粒子顺序交换不变性这一对称性;第二,在顺序交换不变性的基础上采用多个的过滤器充分提取喷注的关键物理特征;第三,把提取出的特征作为DNN的输入进行标记。以上的数据集和模型在采用GPU进行充分训练后,与传统的决策树和XGboost算法相比,其性能提高约6%,使平均精度从80%提高到85%左右。

Summary

讨论和展望 基于DeepSets模型的初步研究对夸克喷注标记给出了乐观的结果,下一步作者将进行两方面工作:一是对数据信息进行进一步发掘,以及对模型的超参数进行深入优化,期望得到性能的进一步提高;二是尝试对完整事例进行标记,预期能对WZH三种玻色子性质的精确测量有较大作用,例如使得WZH三种玻色子的衰变分支比测量有显著的精度提高。

Primary author

Libo Liao (wuzhou univercity)

Co-author

Dr LI Gang ( EPD.IHEP ) (高能所)

Presentation materials