1. IE browser is NOT supported anymore. Please use Chrome, Firefox or Edge instead.
2. If you are a new user, please register to get an IHEP SSO account through https://login.ihep.ac.cn/regist.jsp Any questions, please email us at helpdesk@ihep.ac.cn or call 88236855.
3. If you need to create a conference in the "Conferences, Workshops and Events" zone, please email us at helpdesk@ihep.ac.cn.
4. The max file size allowed for upload is 100 Mb.

第二十届全国科学计算与信息化会议

Asia/Shanghai
青海宾馆

青海宾馆

Gang Chen (IHEP)
Description

      全国科学计算与信息化会议面向全国科学研究人员以及计算机专家与工程技术人员,搭建一个沟通交流平台,探讨科学研究需求、实际工作经验以及新技术发展与应用,以更好的提升计算机与信息技术在现代科学研究的应用水平。

       第二十届届全国科学计算与信息化会议由中国核学会核电子学与核探测技术分会主办,中国科学院高能物理研究所承办,定于2021年9月13日至17日在青海省西宁市召开。会议将邀请多名知名学者做特邀报告,并专门举办先进光源数据技术研讨会。会议汇集高能物理与核物理、同步辐射光源、空间天文等领域的科研人员和计算机专家,共同分享科学计算、电子学技术、科学数据管理等方面的最新动态及研究成果。

会议延期通知

      近期,全国新冠疫情趋于稳定,但防疫措施和政策到目前还没有放松。线下会议是大家不可替代的交流平台,会务组一直在努力希望能按时举办本次会议。但到最后一分钟,有关上级部门最终仍建议会议延期。所以会务组不得不拖到现在才非常遗憾地宣布第二十届全国科学计算与信息化会议延期召开,具体召开日期另行通知。 会议延期给各位参会代表带来不便,深感抱歉!感谢大家的理解和支持!如果已经交费的参会代表需要办理退费或者因退机票产生费用等事宜,请联系会务组。

 

会议费缴纳与住宿预定已开放


1、已开通在线缴费。可通过工商银行APP、微信、支付宝扫码缴费。

 


2、酒店住宿预定已经开放,请登录会议网站在个人注册表中选择。具体步骤:登录网站——>点击左侧“Registration Form”——>酒店预定(如有合住首选人请务必填写合住人姓名)。

 

    • 1:00 PM 6:00 PM
      注册
    • 8:00 AM 9:00 AM
      注册
    • 9:00 AM 9:10 AM
      会议开幕
      Convener: Dr Gang Chen (IHEP)
    • 9:10 AM 10:20 AM
      大会报告I
      Convener: Dr Gang Chen (IHEP)
      • 9:10 AM
        科学数据管理策略及共享 35m
        Speaker: Prof. 辉 张
      • 9:45 AM
        国家基础科学数据中心 35m
        Speaker: Prof. 良霖 胡
    • 10:20 AM 10:50 AM
      合影与茶歇
    • 10:50 AM 12:30 PM
      大会报告II
      Convener: Dr Gang Chen (IHEP)
      • 10:50 AM
        天文科学数据共享与服务 35m
        Speaker: Chenzhou Cui (University of Chinese Academy of Sciences)
      • 11:25 AM
        高能物理科学数据共享与服务 35m
      • 12:00 PM
        高性能计算及异构计算 30m
    • 2:00 PM 3:30 PM
      核电子学与探测技术
      • 2:00 PM
        白光中子实验装置多用途TPC的读出电子学研究进展 15m
        近年来,国内外核天体物理、核医学、核能利用等领域对中子核数据的精度提出了越来越高的要求。而中国散裂中子源反角白光中子源(Back-n)是我国第一个高通量、宽能谱、脉冲化的中子源,非常适合开展高精度核数据测量。Back-n计划建造一个基于时间投影室(TPC)的核数据测量装置,可以进行轻带电粒子测量、裂变产物测量、中子共振照相等科学实验。该TPC端面采用高位置分辨的Micromegas探测器,并利用电子漂移时间获得带电粒子的径迹和能量。该装置同时也可结合中子飞行时间测量方法实现对于入射中子能量的测量。为了验证此装置的可行性,合作组成员搭建了1519路阳极读出原型TPC探测器,并结合此探测器的读出需求设计了一套可拓展架构的电子学读出方案。此读出电子学系统与原型探测器于Back-n成功进行了联调实验,成功地测得了轻带电粒子得径迹和能量,可以对中子诱发轻带电粒子进行良好粒子鉴别。通过原型探测器实验,我们实现了TPC核数据测量装置的原理性验证以及此可拓展架构读出电子学的功能性验证,为目标上万路阳极读出的TPC核数据测量装置的实现打下了基础。
        Speaker: Mr 朕 陈 (中国科学技术大学核探测与核电子学国家重点实验室)
      • 2:15 PM
        反角白光中子源ΔE-ΔE-E轻粒子探测望远镜探测阵列研制及应用 15m
        中子诱发轻带电粒子出射(n,lcp)反应的截面测量,特别是双微分截面的测量有重要意义,但由于中子源及测量技术的限制,目前该能区的数据缺乏测量。随着中国散裂中子源(CSNS)的建成,反角白光中子源(Back-n)于2018年投入运行。白光中子源可以提供eV至MeV宽能区的中子束流,为(n, lcp)研究提供了良好的研究平台。为了进行(n, lcp)反应研究及反应截面测量,需要对反应产生的轻带电粒子产物进行粒子鉴别。除了使用ΔE-E方法进行核素鉴别外,在白光中子源建设了一套ΔE-ΔE-E轻粒子探测望远镜探测阵列。ΔE-ΔE-E望远镜系统分为硅阵列探测器、ΔE-E望远镜系统、ΔE-ΔE-E望远镜系统三个阶段完成,并且可以用来开展不同物理目标的实验测量。硅阵列探测器由15块500um厚的PIN型硅探测器组成,每块硅探测器的有效探测面积是20mm×25mm。每块硅探测器距离靶的中心的距离是20cm,15块硅探测器可以覆盖18到160度的粒子出射角。探测器的信号经由Mesytec公司生产的MSI-8前放放大处理后进入白光中子源的共用电子学进行波形数字化及存储。共用电子学基于3U的PXIe,波形数字化的采样率为1G Hz,采样精度为12bit。使用四组份α源(234U:4.775 MeV;239Pu:5.155 MeV;238Pu:5.499 MeV;244Cm:5.805 MeV)进行探测器测试及能量刻度,得到每块探测器的能量刻度系数。对于5.499MeV α源,硅探测器的能量分辨率好于1%。利用低气压多丝正比室探测器与硅探测器,以及硅探测器与CsI(Tl)探测器组成的ΔE-E望远镜系统,在束实验获得了0.5-100MeV的质子的ΔE-E鉴别结果。 使用硅阵列探测器及ΔE-E望远镜系统,在白光中子源开展了6Li(n, t)α 、1H(n,n) 1H 以及10B(n, α) 7Li实验研究。在实验汇总,利用硅阵列探测器输出的波形,使用平滑滤波等波形处理方法,提取信号的幅度及时间信息。由波形的时间信息可以得到相对应的中子的飞行时间,进而得到中子的能量。在每块硅探测器的幅度-飞行时间二维谱中,可以看到反应产物的粒子鉴别带。在6Li(n, t)α反应中,得到了t和α的鉴别带;在10B(n, α) 7Li反应中,得到了7Li和α的鉴别带;而在1H(n,n) 1H反应中,清晰地得到了质子的鉴别带,以及能量大于6.5MeV的质子穿透硅探测器的特征。硅阵列探测器中的每块探测器均得到了良好的核素鉴别效果,意味着测量到了反应的截面角分布。在数据分析中,在eV-MeV能区取出80个能点,进行单个能点的截面角分布分析,得到能点的微分截面分布。同时,通过勒让德多项式拟合,得到总截面。在6Li(n, t)α、10B(n, α) 7Li与1H(n,n) 1H研究工作中,得到了系统的截面结果;经过与ENDF/B-VIII.0, JEFF-3.3等数据库中的已知部分结果对比,本工作在已有数据部分与数据库中的数据符合很好,同时也弥补了数据库中的数据缺失。 ΔE-ΔE-E轻粒子探测望远镜探测阵列的整体方案于2019年通过专家评审,探测器于2020年组装完成,望远镜阵列内有16个低气压多丝正比室探测器,16块硅探测器以及16块CsI(Tl)探测器,每个望远镜阵列腔体内有接线100余根。2020年7月初在Back-n开展了48小时的测试实验,目前正在计划利用ΔE-ΔE-E轻粒子探测望远镜探测阵列开展物理实验。 此外,在Back-n也开展了硅探测器的脉冲形状甄别等相关研究工作,目前取得了不错的进展。
        Speaker: Dr Wei Jiang (IHEP)
      • 2:30 PM
        Back-n多用途时间投影室 15m
        Back-n白光中子源依托中国散裂中子源建设,利用质子打靶产生的反冲中子进行核数据测量、探测器标定、材料辐照和单粒子效应等方面的研究。在Back-n一期建设,研制了基本的实验谱仪/探测器,如:多层裂变电离室探测器用来测量裂变截面和全截面;C6D6谱仪用来测量中子俘获截面;基于E-E的阵列探测器用来测量中子诱发轻带电粒子。其中轻带电粒子出射实验采用的方式是在真空靶室内布局一组ΔE-E探测器,测量轻带电粒子能量并进行粒子鉴别。其主要特点是粒子鉴别方法简单。其不足之处在于:ΔE-E鉴别方法有最低鉴别阈值,无法鉴别低能出射带电粒子;探测器个数受空间限制覆盖角度小、探测器效率低;整个系统必须位于真空靶室内,系统结构复杂受限制较大;测量的精度收到探测器颗粒度限制,无法精确测量出射粒子角度。核裂变截面测量探测器为快响应多层裂变电离室,这样优点在于结构简单。缺点在于信号小,受干扰较大;没有粒子鉴别功能,本底α影响下精度难以提高;对靶的均匀性要求较高等。在束剖面监测装置使用的是Micromegas探测器,由于探测器不具备顶点识别功能,使用重心算法造成性能限制,无法做到更好的位置分辨。 以上这些探测器在每次测量中都需要进行真空管道拆装,探测器调试的等过程,浪费了大量宝贵的束流时间。与此同时,每种探测器都有些不足之处,制约了高精度数据测量,亟需改进。 在未来基于Back-n白光中子源的高精度数据测量中,新型高效的探测器设备是重中之重。一些基于高密度闪烁体及半导体阵列的γ射线探测器预研已经开展。在裂变碎片和带电粒子探测器的研究上,Back-n合作组目前着眼于使用更具有前沿特点的高性能气体探测器——时间投影室。 时间投影室(TPC)探测器是在1978年由Nygren从屏栅电离室(GIC)改进而来的。通过测量带电粒子电离出的电子漂移时间结合二维位置灵敏读出,TPC探测器可以重建出非常好的3D粒子径迹,通过粒子能量损失和径迹长度测量,它可以给出元素粒子分辨甚至可以给出轻带电粒子的同位素的分辨。TPC可以覆盖几乎所有粒子的出射角度,并保持较低的物质量,更适应在较低能量的核反应产物测量。对比传统探测器,TPC具有以下几个明显优势:具备较强的带电粒子鉴别能力;可以测量能量极低的次级反应产物;可以覆盖4π立体角,且具备微分截面测量能力。TPC的应用会将现有的核数据测量精度大幅度提高,从而达到核工程及核物理科学需求。 Back-n多用途时间投影室可以作为裂变截面、带电粒子截面、白光中子能谱及束斑的高精度测量的重要手段。在未来,还可以应用在高γ本底的中子辐射场及高精度中子成像实验中,成为核数据测量、中子探测的有力工具。
        Speaker: 孙艳坤
      • 2:45 PM
        基于分布式数据流平台的中子谱仪通用化数据处理框架 15m
        中国散裂中子源的二期工程项目中,使用了一套基于数据流的通用化框架作为所有束线谱仪的技术方案。这套全新规划的设计根植于中子谱仪的运行模式和数据特征,内容上涵盖了从底层硬件规范到上层应用拓扑的各个环节,旨在解决传统中子谱仪由子系统耦合复杂造成的低效状况,同时提供灵活多样的部署配置和便捷高效的运维管理。针对未来中子束流通量将大幅提升的趋势,新设计利用业界优秀开源工具,结合对硬件接口的规范和软件适配,实现了基于分布式消息网络的数据流处理平台,并进一步扩展EPICS控制、监测报警与显示服务等标准化接口,在确保系统稳定性和冗余性的基础上实现了全链条的数据处理服务,并达到了极高吞吐压力的承载性能。新的通用化设计框架大幅提升了中子谱仪的建设和运行效率,同时亦可有效降低部署和运行维护阶段的人力成本,其将是推动材料分析等相关学科和应用产业进一步繁荣发展的重要因素。
        Speaker: 滕海云 (高能所)
        Paper
      • 3:00 PM
        基于USB的数据获取系统开发 15m
        在 Linux 或 Windows 中运行的传统数据采集 (DAQ) 系统不是实时系统。高吞吐量时事件丢失非常频繁。对DAQ软件开发也有很高的要求。同时,在USB传输过程中,作为设备的读出系统非常普遍。所以如果我们能开发一个USB主机内核,作为一个DAQ系统就很容易了。为了最小化系统,选择TUSB1310A USB芯片作为PHY层,支持主机和设备,链路层和协议层都将在FPGA中实现。为了快速验证,使用 KC705 板作为母板,使用包含两个 TUSB1310A 芯片的 HiTech USB 板作为子板。主机内核基于实现设备功能的大正内核开发,实现设备USB上电检测、USB复位、高速设备检测、枚举和帧同步。
        Speaker: Mr 哲 宁 (中国科学院高能物理研究所)
      • 3:15 PM
        CSNS多物理谱仪数据获取软件研制 15m
        CSNS多物理谱仪数据获取软件研制 肖亮1,3,4,滕海云1,3,4,孙志嘉1,3,4,庄建1,3,4,赵豫斌1,3,4,周健荣1,3,4,骆宏1,3,4, 赵东旭1,3,4,王修库1,3,4,周科1,3,4,沈培讯1,2,5 (1.核探测与核电子学国家重点实验室,北京 100049;2.中国科学院高能物理研究所,北京 100049; 3.中国科学院高能物理研究所东莞研究部,东莞 523803;4.散裂中子源科学中心,东莞 523808; 5.中国科学院大学,北京 100049) 摘 要:本文研制了中国散裂中子源(China Spallation Neutron Source,CSNS)工程中多物理谱仪(Multi-Physics Instrument,MPI)的数据获取(Data Acquisition, DAQ)软件。 多物理谱仪是散裂中子源科学中心、东莞理工学院和香港城市大学共同建设的国内首台中子全散射谱仪,也是CSNS第一台合作谱仪。多物理谱仪数据获取软件主要负责读出、按脉冲序号(PulseID)解析、在线修正和像素转换以及上传中子击中3He管探测器的位置信息。 多物理谱仪探测器物理设计由68个3He管模块和2个束流监测器组成,每个3He管模块包含8根3He管探测器。其中多物理谱仪一期建设包含30个3He管模块和1个束流监测器。多物理谱仪数据获取软件通过网络读出方式将探测器击中位置信息数据进行读出、解析、修正以及上传,提供给物理分析使用。多物理谱仪数据获取软件具有同时配置70块电子学板的寄存器,并控制各数据读出程序工作的功能。 MPI DAQ选择CentOS 7.8作为运行控制和取数服务器集群的操作系统,采用于C++语言为主要研发工具,研制了数据读出和处理系统软件。 多物理谱仪DAQ软件外部接口主要涉及探测器和电子学、控制以及物理软件分析等系统的数据和状态进行交互。DAQ软件需要对探测器和电子学系统进行运行控制并获取数据,同时与控制系统完成PV状态机交互并提交报警信息,将击中位置信息数据(Event(X、Y、tof))处理好,并上传给物理分析使用。像素信息的规范格式主要包含:脉冲信息(PluseID)、像素信息(PixedID)以及飞行时间信息(TOF)。 多物理谱仪数据获取对位置信息数据的处理中引入了全在线数据流的处理机制。前端读出模块采用多级缓存,从电子学数字板通过千兆网络读出原始电子学数据并写入读出缓存;读出缓存数据进行完整脉冲包截取,并存入下一级缓存;得到的完整脉冲包转入在线像素化模块,进行像素运算,获取完整事例数据,按照多系统设计约定转换为像素数据格式,并上传给物理软件分析系统使用。此外,数据获取软件的运行监控模块会对像素事例数据进行全部在线监控,并完成各类在线谱的监测和报警处理。同时前期为了排查数据流处理问题,DAQ在读出缓存模块,增加了电子学原始数据存盘线程,可以设置保留原始数据的有效天数的功能,能够有效排查和定位数据问题,并给与解决方案。 目前多物理谱仪数据获取软件已经经过了探测器样机刻度测试,并完成多物理谱仪现场部署安装,以及参与运行了6个多月的用户样品实验。数据获取软件整体运行稳定可靠,良好地完成了数据读出和数据处理任务。 关键词:多物理谱仪;数据获取;在线修正;PulseID编号;位置信息像素化
        Speaker: XIAO Liang (高能所)
    • 2:00 PM 3:30 PM
      科学计算技术与平台
      • 2:00 PM
        基于分布式数据流平台的谱仪快速智能诊断技术研究 15m
        随着中国散裂中子源谱仪的新建与升级,谱仪类数据流规模与复杂程度与日俱增,庞大运行状态监控和数据分析需求是保证装置运行效能的重要内容。研究针对谱仪类大型科学装置的通用型数据流快速诊断分析平台,运用大数据预处理技术去除其中的冗余信息并将有用的数据筛选出来运算分析,将运算分析结果归类标记,并上传至在线监测诊断平台中实时关联监测告警。避免了信息孤岛的发生,辅助运维团队实现数据中心的实时监控,智能诊断,自动化管理。提升用户服务效能与核心技术,为未来大型谱仪类科学装置快速诊断技术的发展做出贡献。
        Speaker: 科 周 (IHEP)
        Paper
      • 2:15 PM
        国产ARM处理器上的格点量子色动力学计算 15m
        格点量子色动力学(格点QCD)是从QCD第一性原理出发,并能系统性地改进计算误差的非微扰QCD理论,其核心是通过Monte Carlo方法来模拟QCD路径积分。一方面,格点QCD是目前最为成功和重要的非微扰计算方法,在强子谱、强子结构、QCD相变、标准模型精确检验等方面有着非常基础且重要的研究。另一方面,格点QCD是高能物理领域需要大规模并行计算的最主要应用。格点计算需要消耗大量计算资源,其核心是求解大规模稀疏线性方程组$Dx=b$,其中$D$为离散的Dirac算符,一般可以采用Krylov子空间迭代算法来求解该方程,此类稀疏线性方程的求解也体现在产生规范场组态这一所有格点计算的基础中,其资源消耗约为$L^5a^{-7}m_\pi^{-6}$,其中$L$为格子长度,$a$为格距,$m_\pi$为介子质量。因此,在物理参数点下的格点QCD研究需要消耗大量计算资源,相关的算法研究也是该领域的热点。 另一方面,目前的格点QCD相关的算法和软件研究以美国USQCD合作组开源的Chroma框架和QUDA GPU加速库为代表,但其仅在NVIDIA GPU和x86 CPU上有优化的算法实现。而基于国产处理器的格点算法研究则较为缺乏,当前仅有在国产超算神威太湖之光上开发的支持CG算法的SWLQCD程序库。此外,下一代超级计算机的计算能力将达到exaFLOPS(每秒$10^{18}$次浮点运算),即E级超算。但即将到来的E级超算架构迥异,比如美国橡树岭国家实验室的Frontier和阿贡国家实验室的Aurora将基于AMD的CPU和GPU,劳伦斯利弗莫尔国家实验室的El Capitan将基于Intel的CPU和GPU,目前世界超算TOP500榜单排名第一的日本的富岳基于ARM架构,而国内即将推出的E级超算将可能基于国产ARM和申威处理器。 因此,本研究基于华为鲲鹏920 ARM处理器,编译并测试了格点QCD常用的Chroma软件框架,重点关注稀疏矩阵求解算法,并与传统的Intel 6248R 处理器相比较,测试其随时空格子规模变化的强扩展和弱扩展性,发现在浮点利用率和扩展性上,鲲鹏处理器略优于Intel处理器,这为将来基于国产ARM处理器的更深入的算法研究奠定了基础。
        Speaker: Dr 玮 孙 (中国科学院高能物理研究所)
      • 2:30 PM
        Kubernetes异构资源调度策略的研究与实现 15m
        随着容器即服务的快速发展,海量的服务正在从虚拟机的单体架构迁移到基于容器的云原生架构,谷歌的开源容器编排工具kubernetes已经成为在云环境中部署容器化应用的事实标准。在实际科学数据分析应用中,往往需要 GPU 等异构计算资源来加速计算过程,但是 kubernetes 原生调度器 kuer-shceduler 并不支持异构资源例如 GPU 的调度。 在现有的硬件资源拓展方案中,kubernets 提供了设备插件框架来拓展硬件资源,GPU 厂商(例如 Nvidia和AMD)实现了设备插件并将拓展资源 GPU 暴露为可调度的资源。然而,现有的拓展资源仅能作为整数资源使用,并且每个容器对资源是独占的,例如每个容器可以请求一个或多个 GPU,但是不能使用小数来请求部分GPU,如果集群中有不同型号的GPU,仅仅按数量分配,如果分配到配置较低的硬件有可能无法满足用户需求,相反也可能会造成硬件资源的浪费。 通过上述的阐述与分析,本文提出了一种基于 kubernetes 的异构计算资源调度框架,可以更细粒度的为应用分配计算资源(可以声明 GPU 核心数量以及显存大小),使用智能灵活的调度策略透明的将应用调度到具备合适的异构计算资源的节点上,并且实现负载均衡,既可以满足用户需求又能提升硬件资源的利用效率。论文主要完成了以下工作:1)实现了一个 kubernetes 自定义资源,用来拓展 kubernets 原生 API。具体方式是,实现一个 GPU 资源的自定义资源,将该自定义资源注册到 kubernetes ETCD 数据库中,该自定义资源包含了 GPU 的状态信息例如 GPU卡的数量,核心和显存的使用情况等,然后实现一个 kubernets 控制器,用来动态获取 GPU 卡的信息并不断更新自定义资源的状态。这样调度器就可以以原生 api 获取 GPU 资源的信息,从而实现了异构资源的整合。 2)设计实现了一个 kubernets 调度框架,该调度框架分为预选和优选两个阶段,在预选阶段实现了一个过滤器,可以将不满足用户需求的节点过滤掉。在优选阶段实现了一个打分策略,为所有满足用户需求的节点进行打分,将得分最高的节点与用户的应用进行绑定。本文使用空闲数量最大的节点作为应用最合适的节点,从而实现资源的负载均衡。3)在面向高能光源远程交互式计算系统中,该kubernetes调度策略的研究,实现了资源自动调度与负载均衡等,很好的为图像线站基于GPU的CT图像重建提供服务。
        Speaker: Mr 志彬 刘 (高能所)
      • 2:45 PM
        基于OMAT的一平台多中心监控方案设计与实现 15m
        高能物理计算领域一平台多中心方案,旨在整合分布在各个地域的高能物理计算、存储资源,形成逻辑统一的大规模集群,通过统一管理、运维、资源调配作业分发,降低多计算中心运维成本,优化计算、存储资源配置,实现硬件资源和业务需求的高效对接,从而缓解高能物理日益增长的科学计算需求。 为更好的应对各个地域的站点资源运维管理,通过对高能所计算集群开放运维分析平台(OMAT)进行重构,设计实现了支持异地实时采集分析的一平台多中心监控设计方案。 监控范围层面,该方案不断拓展采集手段已支持节点性能、系统服务、存储性能、日志分析、动力环境、网络流量、作业调度和资源使用情况等领域的数据采集和分析展现。运维告警层面,该方案设计实现了统一告警平台,支持监控数据基于业务告警策略实时分析和告警,同时支持异地数据漏采实时告警,保证跨地域数据采集的真实性、可靠性和完整性。监控数据可视化层面,该方案基于数据可视化实际需求,设计实现了面向特定应用需求的数据缓存层用于存储关键的指标型监控数据,使用极小的存储空间,实现监控平台业务层数据和核心层数据的解耦合,保障监控数据的持久化。 该监控方案现已应用于高能物理一平台多中心的日常运维,较好的实现高能所站点和其他异地站点的日常运维监控需求。
        Speaker: Mr 胡 HU Qingbao (高能所)
      • 3:00 PM
        实验控制系统云平台 15m
        ##                 摘要   LHAASO,全称高海拔宇宙线观测站,建设在平均海拔4410米的四川稻城海子山,是国家“十二五”期间启动的重大科技基础设施。整个实验站由四种探测器阵列组成,包括电磁粒子探测器阵列、缪子探测器阵列、水切伦科夫探测器阵列和广角切伦科夫望远镜阵列。LHAASO在高能宇宙线观测方面处于国际领先水平。LHAASO发现了银河系内超高能宇宙加速器,观测到1.4拍电子伏的伽马光子,开启了“超高能伽马天文学”时代。   LHAASO实验中探测器众多,且探测器位置分布较为分散;数据量大,服务器计算任务重;数据流软件规模大,分布式地运行在几十台服务器上。人工检查探测器、服务器和软件运行状态成为艰难的任务,且在发生某些故障时不容易恢复。为保证实验在运行期间的稳定性,各个探测器阵列运行状态以及计算机集群状态的可观察性,满足实验控制需要,且在故障发生时能够尽量自动恢复,基于微服务的软件开发思想和Java语言开发了一套实验控制软件。 本文主要论述了此实验控制软件实现的功能,以及软件架构。   首先软件为不同的探测器阵列都提供了监控。监控包括对探测器状态的收集与展示,而且在探测器故障时能够使其重启。针对数据流软件和服务器,也实现了监控功能,包括对数据流软件状态的监控和得到的物理数据的监控;此外还实现了对数据流软件的控制功能。实验的运行状态信息,以及实验的启停控制都通过网页提供给实验人员。 实验控制软件的整体设计吸收了微服务的设计思想,实现了松耦合,可拔插、易扩展的分布式软件。软件的每个功能模块都已单个服务的方式独立运行;运行信息和监控信息通过消息队列进行缓存和中间处理,经过处理后一部分信息被存入数据库,实现了信息的分级处理和组件间的解耦。信息展示页面通过独立运行的后台服务查询数据库中的信息。   除此之外,因该软件设计时对数据展示和控制功能进行了分区,因此能够服务于多个实验,复用性强。   目前为止,该软件已经在LHAASO实验上稳定运行,帮助LHAASO物理实验人员顺利获得了多项重要物理和天文学实验成果。 **关键词**:微服务、实验控制、实验监控、多实验复用
        Speaker: Dr 泽众 于 (IHEP, UCAS, China)
      • 3:15 PM
        容器技术在高能物理中的应用 15m
        虚拟化容器是一种操作系统层面但极为轻量的虚拟化技术。目前在高性能和高通量计算领域中广泛应用。本文主要介绍在中科院高能物理研究所计算站点中如何借助虚拟化容器技术提高物理计算的稳定性、可靠性,提升计算资源的利用率,并介绍容器应用中关键的镜像管理、容器编排和运行安全等技术。
        Speaker: Mr Wei Zheng (IHEP)
    • 3:30 PM 4:00 PM
      茶歇 30m
    • 4:00 PM 5:30 PM
      科学数据存储与管理
      • 4:00 PM
        海洋科学大数据汇交与共享管理系统建设 15m
        科研数据的价值在大数据时代是重者恒重,特别是对于以调查观测为基础的海洋科学,科研观测数据尤为重要。而科研人员掌握的大量原始调查观测数据,一般只存放在个人电脑或移动存储设备中,造成了数据“各自为战”的局面。如何帮助科研人员科学管理分散的数据,让数据活起来,更加充分的发挥数据效能,创造更多的价值,是现在科研数据管理的重要工作之一。 为更好支撑海洋科学研究,推进海洋科学数据共享,设计研发了海洋科学大数据汇交与共享管理系统。系统采用B/S模式,按照数据层、服务层、应用层三层架构设计,统一部署,并将应用服务器和数据服务器分离。提供海洋科学数据的在线化、流程化、自助式的汇交、管理和共享服务以及计算资源服务,支持科研人员与数据中心共同建设、管理、运维数据,实现多源数据融合汇聚,集中存储,统一标准,规范管理,实现数据的四统一,即统一编码、统一管理、统一存储、统一发布。汇聚多渠道数据资源,包括科研项目数据汇交管理、论文关联数据汇交、DOI/CSTR注册服务以及相应审核流程管理。统一数据资源编码和标准,设计标准化的元数据格式,涵盖了元数据信息、联系信息、摘要和详细描述、扩展信息、相关文献、使用声明以及实体数据、数据图和数据说明文件等。提供数据集/数据产品的统一展示与发布,包括中英文两种方式的数据展示、检索和下载数据。实现数据分级分类共享,公开共享的数据提供直接下载,申请共享的数据提供申请下载,经审批流程审批后可以将数据共享给申请人。实体数据集中存储管理,在到数据服务器,保障数据安全,统一管理和检索。 系统具有如下特色: (1) 设置标准的元数据存储格式,可下载元数据模板,通过文件导入实现数据快速入库存储。 (2) 科研人员通过“个人中心”可自助管理和维护各自汇交的数据、论文、成果等信息,并可根据需要更新数据和数据信息,查看数据浏览、下载情况,掌握数据流向。 (3) 统一展示和发布“专题数据产品”,为每个数据集/数据产品设置独立的中英文网页,全面展示数据信息的同时,可以方便地查询下载数据。 (4) 提供微信小程序展示数据产品,更便捷。 (5) 科研人员提交DOI/CSTR申请后,经审核通过可以自动生成DOI/CSTR注册码并发布链接地址。 (6) 系统管理模块,提供网站用户管理、权限管理和日志信息等,保证数据安全。
        Speaker: 焕萍 任 (grace)
      • 4:15 PM
        LHAASO数据管理系统及关键技术研究 15m
        我国高海拔宇宙射线观测站(LHAASO)实验致力于探测高能宇宙线起源研究,采用边建设边取数的方式,今年将完成全面工程建设,预计每年大约产生6PB数据,具有数据量大、结构复杂、实时性强、多中心处理(稻城、北京、成都)等特点,是我国目前产生数据量最多的大科学装置之一,对数据存储系统提出了很高的要求。目前LHAASO实验已积累了超过10PB实验数据,总文件数超过2亿。本文将着重介绍当前LHAASO实验的数据管理系统现状,包括主要实验数据存储系统、数据流管理以及数据远程访问等关键技术,并就未来LHAASO实验数据管理的发展方向进行探讨。
        Speaker: Haibo LI (高能所)
      • 4:30 PM
        XFEL科学元数据标准研究 15m
        上海硬X射线自由电子激光装置(英文缩写SHINE)是国家重大科技基础设施建设“十三五”规划的优先启动项目,拥有超高峰值亮度和平均亮度、高重复频率、飞秒级超快脉冲、优良的时间和空间相干等特性,同时具备纳米级的超高空间分辨能力和飞秒级的超快时间分辨能力。SHINE的建成将使我国拥有最新的高重频X射线自由电子激光光源,为物理、化学、材料、生命科学等学科领域提供高分辨成像、超快过程探索、先进结构解析等尖端手段,为我国基础科学的前沿研究带来前所未有的前景。 SHINE将采用高帧频大阵列多像素探测器系统,兼之具备单脉冲成像能力与高重频的特点,SHINE建成后将产生海量的实验数据。SHINE运行初期数据峰值通量将达到~100 GB/s,需要有~100 PB量级的数据存储能力;远期预计数据峰值通量将达到~5 TB/s,同时数据存储能力需要达到EB级别,这对数据管理系统提出了比较高的要求。 科学元数据在实验数据的管理中发挥着重要作用,完善的科学元数据管理系统通过记录实验方案,实验装置及配置情况,实验数据存储情况和实验数据分析过程等,可以实现对科学数据的全生命周期的管理。科学元数据管理系统不仅能帮助用户快速检索和理解实验数据,而且有利于科学数据的开放与共享,从而促进大科学装置的科学产出。 然而元数据作为描述数据的数据,其涵盖范围可以非常广泛。目前在国内外的大科学装置中并没有明确的资料说明科学元数据应当具体包含哪些信息。鉴于科学元数据来源比较多,设计科学元数据管理系统时需要充分考虑与控制系统、诊断系统和探测器系统等软件的接口,因此规范化的科学元数据组成对科学元数据管理系统的建设十分重要,大大降低系统的接口设计难度。另外,用户也更容易理解和使用规范化采集的科学元数据。 本项工作以X射线自由电子激光(XFEL)的科学元数据标准为研究目标,研究内容主要包括两个方面:1. XFEL科学元数据应该记录哪些信息?2. XFEL科学元数据的采集、传输与存储方法。该工作注重借鉴世界上XFEL装置在科学元数据管理方面的研究经验,同时与国内其它先进光源一起紧密合作,力争推动该研究成果成为XFEL科学元数据管理领域的标准化文件。
        Speaker: 晓峰 张 (Henan Normal University)
      • 4:45 PM
        数据湖架构下边缘站点 XCache SE 技术的研究与实现 15m
        LHAASO、JUNO等高能物理实验每年产生海量的数据,对现有的网络传输、存储管理架构提出了巨大的挑战。单一的大型中心站点不足以应对海量的实验数据给计算与存储系统带来的巨大的挑战,众多小型边缘站点的加入能够有效缓解资源不足的困境。 国际上针对海量数据的存储与处理,提出了数据湖(data lake)的概念, 在全局数据管理方面开发了RUCIO等元数据管理系统,而小型的边缘站点因存储能力相对不足, 无法长久存储数据, 适合做缓存来使用。XRootD 协议是高能物理数据传输和分析中常用的一种协议, 基于 XRootD 的 XRootD Proxy Cache (XCache)缓存系统因为部署简单、管理方便, 得到越来越多的应用. XCache 还可以做为 volatile 的 Storage SE 注册到 RUCIO 等全局数据管理系统中. 但 XCache 本身没有元数据管理, 不能将数据注册到全局数据管理系统中, 也没有将缓存数据暴露的接口提供给计算调度系统, 难以做到最大程度的缓存数据复用. 因此, 我们将探讨XCache 元数据管理的技术方案. 并实现XCache管理的数据到RUCIO等全局数据管理系统中的注册, 以及与HTCondor等任务调度系统进行耦合, 让调度系统实现对边缘站点数据的感知.
        Speaker: Dr Yujiang Bi (IHEP)
      • 5:00 PM
        基于EOS和XRootD的可计算存储服务研究与实现 15m
        在过去的十年中,随着移动互联网、云计算和大数据技术的快速发展,数据在不同领域呈现爆发式增长。同时,数据密集型计算也逐渐代替计算密集型计算成为当前主流的计算模式。由于数据密集型计算具有计算访存比低、数据访问不规则的特点,使得传统的计算机系统结构在处理数据密集型计算应用时存在严重的“存储墙”问题。 高能物理是典型的数据密集型计算,本文报告了可计算存储服务在高能物理计算平台上的部署,以提高高能物理海量数据背景下特定应用的计算效率。在高能物理计算模式中存在一类高统计量计算,这类应用需要访问大量数据进行分析。传统的“计算-存储”分离的体系结构在大数据量的背景下需要进行高频次数据移动,而这容易产生更长时间更频繁的排队时延和网络拥塞,因此将计算下推,使其更靠近存储,可以有效的缓解这一状况。一般而言,存储节点同样存在部署分布式文件系统所必须的CPU等计算资源,而这些计算资源的计算能力通常是被忽略的。因此,利用存储节点本地的计算资源进行一部分运算既可以减少网络压力又可以提高总体的计算能力。 本文介绍了基于EOS和XRootD的可计算存储服务的实现。可计算存储服务以插件的形式接入XRootD,用户使用时与正常使用EOS系统类似,部署简单,不额外增加硬件成本,使得用户可调用存储节点的计算资源,提高计算效率、减少网络资源占用。 本文使用decode应用程序测试了可计算存储服务的性能,结果表示在高并发量的条件下,可计算存储计算模式较传统计算模式计算时间缩短了72.1%,且保持了更好的系统稳定性。
        Speaker: Minxing Zhang (IHEP)
      • 5:15 PM
        将EOS从X86 (Intel)移植到aarch64(ARM)架构 15m
        随着多个大型高能物理项目的推进,实验需要处理和存储的数据量显著增加,这对数据存储系统提出了更高的要求。本文讨论了将分布式磁盘存储系统EOS从x86_64架构移植到aarch64架构的工作,目的是减轻对单一类型芯片架构的依赖并提供一种更经济有效的存储解决方案。在移植的过程中,最大的挑战是许多EOS依赖程序没有官方发布的ARM架构版本,并且软件的部分代码也需要相应地进行调整。尽管存在这些挑战,我们还是成功地将EOS移植到aarch64架构。此外,本文也讨论了移植后的软件性能测试以及未来的计划。
        Speaker: Mr Yaosong Cheng (IHEP)
    • 4:00 PM 5:30 PM
      科研信息化系统
      • 4:00 PM
        SOC可视化平台的研发与实现 15m
        随着互联网及移动应用技术的快速发展,政府、企业通过互联网信息系统向公众和用户提供服务,为用户提供便利的同时,信息系统也成了国内外黑客的攻击目标。而近年来网络中不断爆发的安全事件,对国家的安全和经济产生了巨大的危害。防范各类网络安全风险刻不容缓。在国家战略层面,习总书记在网络安全和信息化工作座谈会上指示“加快构建关键信息基础设施安全保障体系,全天候全方位感知网络安全态势”,做好整体态势可视、可控,才能抵御网络风险。如何对网络攻击、漏洞、隐患等威胁做到全面实时感知并迅速发出预警,及时进行处置成为了大家的共同关注点。中科院高能所计算中心服务于多个国内外高能物理实验,拥有大量存储和计算资源,面对每日汇聚和交互的海量数据,通过人工的方式很难及时的定位网络威胁,如不对这些资源施加防范,必将遭到黑客们的攻击和利用,因此提升主动防御能力势在必行。人工智能结合大数据技术在近年来提供了一种很好的解决问题的方式,利用海量的数据训练人工智能模型,从而使得我们可以利用人工智能实时地对网络状态进行监控。所以,为了及时响应网络攻击并发出预警,搭建结合人工智能的网络态势感知平台是十分必要的。本文搭建的SOC可视化平台通过将网络中产生的安全日志、数据包、流量数据等信息进行预处理,之后利用ES、MySQL对数据进行存储;进一步利用KNN、CNN、LSTM和随机森林等人工智能算法对网络中的流量、ip行为等进行分析处理;最后我们将分析的结果传送到我们的平台,利用各种图表、仪表等展示分析我们的结果,最终实现安全态势的监测预警和实时的可视化展示。该平台投入运行后,能够及时地收集、处理、分析并通过可视化展示我们的系统安全状态,能够及时地发现和处理网络中的异常行为,在高能所网络安全运维中起到了重要的作用。
        Speaker: 郭超奇
      • 4:15 PM
        一种基于机器学习的网络异常流量检测算法 15m
        随着计算机网络高速发展,网络技术日新月异,越来越多的网络应用程序普及在人们的日常生活和科研教育中,对我们的社会和经济具有战略意义。这些发展导致了高度动态的网络,其中流量波动和看似随机、异常的流量模式更加难以检测,导致网络安全事件增长和爆发的速度也较之从前有了爆炸式的增长。网络中的入侵行为、对网络基础设施破坏的攻击事件对经济甚至国家安全所带来的危害性也大大加强。如何实时准确地发现大规模网络中存在的异常流量行为,及时有效地解决安全问题是一个非常有意义的课题。传统的异常流量检测方法已经不能够再满足互联网的安全需求。而近几年以深度学习为研究方法的网络异常流量检测技术很好地满足了互联网的安全需求,不仅能进行动态的预防,而且从原始数据的输入到最终结果的输出不需要人为干预,同时,深度学习的各种算法在海量数据处理上面相对于传统机器学习算法表现出了更加明显的优势。流量异常检测旨在发现和描述影响网络基础设施的关键异常,这些异常的来源可能是恶意的或无意的,例如攻击、故障、错误配置,或者合法但不正常的网络使用,例如突发访问。 本文旨在对网络异常检测领域的现状进行分析,提出了一种基于深度神经网络的网络异常流量弱检测方法。该方法将深度神经网络技术与传统入侵检测系统(IDS)相结合,使单个IDS能够具有处理不同类型的网络攻击的能力;首先通过Zeek所探测到的流量数据信息进行特征构建,获取流量数据之间的关联规则并进行冗余特征约简,之后对流量特征数据进行归一化,根据奇安信、安恒等APT防御平台及人工初筛对流量行为是否异常进行标注,随后进行KNN、CNN+LSTM以及随机森林模型的训练,得到相对应训练模型用于实际检测过程中。在检测过程中,我们采用两层过滤结构,由KNN和CNN+LSTM检测方法作为检测的第一层过滤方法,随机森林检测方法作为第二层过滤;如果二者对某一流量的行为判定一致,则直接进行相应处理,若二者判定结果不一致,将进行第二层过滤,由随机森林检测方法进行最终的判定。我们利用KDD-CUP99数据集对检测方法进行验证,所有层组合在一起,检测准确率为 97.83%;同时,我们利用上述方法构建数据特征用于真实网络中,能够有效地检测出实际网络中发生的攻击行为。结果表明,通过将机器学习应用于 IDS,不仅提高了系统对恶意数据包的敏感性,还可以保持高度复杂或以前未知的攻击的安全性。
        Speaker: 王浩帆 (高能所)
      • 4:30 PM
        基于DNS日志的异常域名检测 15m
        随着互联网技术的迅猛发展,在给生活带来便利的同时,也给网络安全带来了各种各样的挑战。众所周知由于互联网中存在着大量的不安全与不确定因素,包括僵尸网络、蠕虫、垃圾软件、恶意软件、DDoS攻击等,使得现如今互联网安全威胁日益剧增,攻击手段也越来越多样,攻击目的也各式各样,包括篡改数据、窃取隐私、耗费系统资源等。 CNCERT 互联网安全威胁报告在互联网安全威胁报告中指出,2020年9月14日-9月20日境内感染网络病毒的主机数量约为58.6万个,其中包括境内被木马或被僵尸程序控制的主机约53.5万以及境内感染飞客(conficker)蠕虫的主机约5.1万。 而作为互联网中最核心的基础设施之一,域名系统(Domain Name System,DNS)是大多数网络应用与服务的基础,保障着各种日常网络应用的正常进行,其主要功能是实现域名与IP的映射,连接到Internet的每个设备都有一个唯一的IP地址,其他计算机可以使用该IP地址来查找设备。DNS服务器消除了人们记忆 IP 地址的需要,用户只需要记住域名,而不需要记住由长串数字组成的IP地址,能够使人更方便地访问互联网。但同时也遇到了日益严峻的网络安全问题,比如常见的攻击方式有DNS欺骗、DNS隧道、DNS劫持等。这些安全威胁影响了我国的互联网安全环境,在我国的国家互联网应急中心,也将 DNS 域名的安全性分析列为了国家网络安全局势的核心部件之一。此外,也有许多的公司在异常域名检测领域投入了研究,例如国外的 OpenDNS、国内的腾讯、360 等公司。因此为了提高网络的安全性,打击使用DNS流量的违法活动,需要有实际可行的方法对互联网网络异常域名进行检测。目前前人关于异常域名检测的方法主要有以下四种:基于模型的检测、基于邻近度的检测、基于黑白名单的检测以及基于聚类的检测。然而这些方案在检测效率上并没有很好的效果,通常会花费较多的时间与精力,不满足高速网络环境下工作的条件,缺乏实时可靠性,同时误报率较高。 因此,针对以上描述的缺陷,本文提出了一种新型异常域名检测方法,该方法通过提取不同的域名特征,比如域名访问次数、域名长度、域名的平均长度、域名中是否包含特定名称等特征,结合支持向量机SVM技术,同时通过中国科学院高能物理研究所计算中心真实的DNS流量数据集进行实验验证,为了更好的体现实验结果,过滤到部分反查域名,实验结果表明,该方法的检测准确率较高,有利于异常域名的检测。
        Speaker: 刘佳豪
      • 4:45 PM
        高能所web网站安全防护 15m
        随着互联网的快速发展,通过浏览器分享信息,获取新闻,购物,聊天等成为人们工作、生活中越来越不可缺少的工具。对于科研工作来说,通过网页共享数据,获取最新工作进展,了解世界前沿发展状况,成为不可缺少的工作手段之一,发挥着越来越重要的作用。如何保证web网站安全运行,不受黑客攻击,成为一个重要问题。 高能所 web 网站数量多,其中不乏重要且大型高能物理实验的网站,例如:BES3、大亚湾中微子实验、JUNO等高能物理实验的网站,分布在不同的实验区域。并且,网站技术架构复杂多样,开发年代分布较广,网站安全风险较大。 面对这种情况,我们从几个方面加强防护手段: (1)网站资产清查与梳理;(2)网站安全风险评估;(3)服务器自身漏洞修补 (4)防火墙严格控制策略 (5)web 应用防火墙(WAF)对服务器的防护 (6)合理的防护架构。 通过这些安全防护措施,加强了服务器自身安全, 尽量做到服务自身无漏洞,再结合WAF防护, 使我所的web网站安全性得到很大提高。
        Speaker: Ms 兰馨 马 (高能所)
      • 5:00 PM
        基于DNS日志的在网终端数量分析与研究 15m
        DNS域名解析服务作为互联网环境的重要基础设施,所有关联到DNS服务器的终端都会不定时的向DNS服务器发送域名解析请求,存在高并发、高持续性的特点,而DNS服务器的解析性能往往受硬件、授权等限制,存在性能瓶颈。因此,基于所有到DNS服务器进行域名解析的终端,都会产生DNS解析日志这一特点,开展DNS服务终端数量的分析与研究。衡量不同时间节点的DNS服务终端规模,进而分析DNS服务器的性能与负载状态,优化DNS服务终端群,降低DNS服务系统开销,对缓解性能瓶颈有作用。 本文提出一种DNS服务终端分析方法,以DNS解析日志为数据源,分析服务终端的在、离网状态,计算出DNS服务终端的数量和规模。本研究使用具有设备在线时间短、变化快等特点的无线网络真实数据进行对比验证,可达到91.1%的准确率、92.2%的精确率和86.6%的召回率。该方法分析出来的服务终端数量趋势与其他网管工具统计的数量趋势基本一致,表明该算法具有一定的实用价值,亦能解决单一DNS环境下服务终端数量的侦测与统计等问题。
        Speaker: Mr 明山 夏 (高能所)
    • 9:00 AM 10:30 AM
      先进光源数据技术研讨会
      Convener: Mr Fazhi 齐法制 (高能所)
      • 9:00 AM
        Progresses of Data Science in SHINE Project 30m
        The rapid development of X-ray free electron laser (EFEL) facilities has opened a new paradigm of X-ray measurement. They can deliver ultra-short and coherent x-ray pulses with extremely high brilliance, thus enabling the observation of the physical and chemical behaviors in condensed matters and biomaterials, at high spatial and temporal resolution simultaneously. Shanghai HIgh repetitioN rate XFEL and Extreme light facility (SHINE) has started its construction in April 2018 and may become one of most sophisticated XFEL facilities in the world. The advanced detectors for XFEL allow an extremely high throughput of data rates and volumes. Big data has been identified as one of the major challenges in XFEL experiments, e.g. serial femtosecond crystallography and single-particle imaging. Dedicated data center and DAQ system shall be developed to meet the requirement of data acquisition, real-time analysis, and big data management of various instruments. A R&D data platform has already been built for the high throughput data processing based on high performance cluster as well as cloud computing. Algorithms and softwares of data acquisition, data management and analysis for tackling XFEL big data are also under development. In this presentation, most recent progresses of SHINE data science will be reported as well as envision of next decade.
        Speaker: Prof. Ping Huai (ShanghaiTech University)
      • 9:30 AM
        HEPS高通量多模态实验数据采集软件研制规划与进展 30m
        Speaker: 一 张 (ihep)
      • 10:00 AM
        APD探测器阵列数据获取软件的设计 30m
        同步辐射是相对论性带电粒子在电磁场的作用下沿弯转轨道前进时发出的电磁辐射。作为电磁辐射波,它的波长可以从红外、可见光一直延伸到X射线。同步辐射光源是依托加速器和一系列的光束线以及实验站运行的一台大科学装置,可以开展各种不同的实验研究,它已经成为了众多学科前沿研究领域必不可少的研究手段,并在这些领域不断产生新的研究成果。目前我国正在建造的高能同步辐射光源(High Energy Photon Source,简称HEPS)为第四代同步辐射光源。伴随着同步辐射光源性能的不断提高,各个光束线站对探测器的性能也提出了更高的要求。 在同步辐射设备上进行的纳秒级时间分辨实验中,基于雪崩光电二极管(简称APD)探测器的研究具有重要意义。在APD探测器阵列的实验系统中,对应的电子学和数据获取软件是整个系统不可或缺且极为关键的组成部分。HEPS作为新一代光源,光源能量得到大幅度提升,光源每条光束线上探测器产生的数据量也大幅度提升,对电子学设计、数据获取系统软件的读出带宽和在线处理能力都提出了更高的需求。数据获取系统需要读出原始数据(并非经电子学处理后的填图数据),以便实验人员对数据进行更为细致地分析。 本文主要对高能同步辐射光源上拟采用的雪崩光电二极管时间分辨探测器系统的数据获取系统进行介绍,在确定系统软件框架的设计方案和关键技术选取的前提下,为项目的后续开展做好进一步的技术储备。
        Speaker: Prof. qiuju Li (IHEP)
    • 10:30 AM 11:00 AM
      茶歇
    • 11:00 AM 12:30 PM
      先进光源数据技术研讨会
      Convener: 平 怀 (Shanghaitech University)
      • 11:00 AM
        基于使用封闭性商业软件的同步辐射实验站的科学数据收集与处理 20m
        【目的】 合肥光源是面向国内外用户的准第三代同步辐射光源装置,可应用于众多的基础研究与应用领域,尤其有助于在多学科交叉碰撞、融合的基础上产生基础研究和应用研究的原创性突破。然而随着实验技术的快速发展,科学数据及其元数据的数据量迅速增加,再加上装置现有信息化水平的限制,如数据分散存储、缺少在线数据处理平台、管理方式落后等,已经严重影响到了研究效率,亟需构建科学数据的集中管理平台。 合肥光源的软X射线成像站利用同步辐射高亮度和穿透性强等特性及软X射线所具有的特殊性质,能够对完整含水厚样品进行纳米分辨三维成像,为生命科学、医学、材料科学以及环境科学等领域提供强有力的研究平台。然而该实验站建设时使用的是蔡司Xradia 825 Synchrotron实验设备和配套的封闭性商业软件,只能进行数据的采集和简单处理,很难进行自动化上传数据改造,这正是科学数据集中管理与在线处理的前提条件。 本文将介绍基于软X射线成像站的半自动数据采集方法、科学数据集中存储管理和在线数据处理平台。 【方法】 一、半自动数据采集方法: 软X射线成像实验完成后,商业软件会生成相应的实验数据文件。传统上用户使用移动存储取得这些文件,而与实验相关的元数据则需要手动记录。为了采集实验数据文件与元数据,我们开发了基于PyQt框架的半自动数据采集程序。采集程序能自动获取用户课题和部分与实验相关的元数据,其他实验元数据则需要用户手动录入,实验数据文件也需要手动指定,然后同时上传至元数据目录和科学数据存储服务器。 二、科学数据集中存储管理: 大科学装置常用的元数据目录有ICAT与SciCat。SciCat的数据结构灵活,可扩展性强。我们使用SciCat存储元数据,并在其基础上开发改造,使其能对接用户课题管理系统、数据采集系统、科学数据存储系统和在线数据处理系统,让联网用户能随时访问、查询实验元数据。存放实验数据文件的科学数据存储系统使用分布式存储,并提供冗余与备份。实验数据文件从实验站上传至存储服务器后会自动生成每个文件的校验和,用户登录后可以在任意联网环境下载数据文件,且所有在互联网上传输的数据都由传输层安全性协议(TLS)保护,有效保障了数据安全性。 三、在线数据处理平台: 在线数据处理系统采用基于Docker部署的数据处理平台JupyterHub,通过SciCat进行认证授权,且可以直接从科学数据存储系统进行数据只读访问,为用户提供了方便灵活、功能丰富的远程科学数据处理环境。由于软X射线成像站需要进行大量计算机断层成像(CT)重构运算,我们在Docker中启用了图形处理器(GPU)加速,有效满足了用户处理科学数据的需求。 【结论】 通过开发半自动数据采集程序、改造SciCat元数据目录以及搭建在线数据处理平台,基于封闭性商业软件的软X射线成像站可以有效地采集科学数据、对科学数据统一管理并实现数据的在线处理。
        Speaker: Dr DaDi Zhang (USTC)
      • 11:20 AM
        自由电子激光装置科研数据管理和共享模式探索与实践 20m
        **征文范围:科学数据存储和管理技术** **摘要**   张江实验室已经形成了以上海同步辐射光源、上海光源二期、软X射线自由电子激光装置、硬X射线自由电子激光装置(Shanghai HIgh repetitioN rate XFEL and Extreme light facility,简称SHINE)、超强超短激光装置的光子大科学装置集群。与高能物理领域、天文学领域、空间科学领域、对地观测领域、生物学领域类似,先进光子科学实验所产生的数据量巨大,以大型同步辐射和自由电子激光光源为代表的现代光子科学研究已步入大数据时代,传统的IT系统已经无法满足数据密集型科学研究范式的需要,这不仅意味着现代光子大科学装置面临着数据采集、传输、存储、管理、分析和可视化等各个方面的挑战,更意味着重要的数据思维转变。面向以自由电子激光等先进光源为代表的大科学装置,本文在全生命周期数据管理、广义元数据模型、装置内部数据资源共享和科研数据对外开放共享等方面进行了探索,并且在SHINE振动测试数据和束线站工程设计数据的管理与共享上积累了一定的实战经验。   本文提出基于全生命周期的闭环数据管理系统的建设思路,针对实验前(Pre-Experiment)、实验过程中(Experiment Duration)、实验后(Post-Experiment)的数据流程展开设计,实现实验前的实验提案、机时预约、实验安排,实验中的数据采集与在线分析,实验后的离线分析与实验结果的发表,最终又进入新的生命周期阶段这一完整科研链服务,实现科研数据的“能量循环”。   区别于当前大科学装置中普遍使用的科学元数据模型,广义元数据不再仅仅是HDF5这类数据存储文件里层次化组织的元数据信息,而更像是全生命周期数据管理系统的一种抽象模型,影响到最终科研成果(文章或数据)产出的都在此范畴。该模型不仅可以用来描述科研成果产出的各个关联项,还可以用来指导全生命周期数据管理系统的建设。通过全面收集所有元数据信息,形成科研活动流程的全局数据视图,为科研数据的有序组织、规范控制和高效检索提供更为有力的支撑,从而实现大科学工程产出的高质量稀缺性数据的可溯源、可重现、可重用。   数据价值得以充分发挥的关键在于其“流动性”和“可获取性”。实施科研数据开放共享,是最大化科研数据价值的有效途径。本文通过基于开源软件Owncloud的装置内部共享系统和借鉴Dataverse思路自主研发建设的数据开放共享系统的对比和关联,探索适合光子大科学装置的数据共享模式,同时总结了在装置建设过程中的实践情况。 **关键字**:全生命周期;数据管理;元数据;数据共享
        Speaker: Ms Lei Lei (ShanghaiTech)
      • 11:40 AM
        HEPS科学数据管理软件研发及框架设计 20m
        Speaker: Mrs 皓 胡 (高能所)
      • 12:00 PM
        科学数据数据长期保存技术 30m
    • 2:00 PM 3:45 PM
      核电子学与探测技术: II
      • 2:00 PM
        北京同步辐射装置QXAFS数据获取软件的设计与实现 15m
        在同步辐射装置中,X射线吸收精细结构(X-ray Absorption Fine Structure,XAFS)实验系统被广泛应用于物质结构的分析和研究,是诸多同步辐射实验方法中最常用的分析方法之一。快速扫描XAFS(Quick-Scanning X-ray Absorption Fine Structure,QXAFS)方法基于常规的同步辐射XAFS实验系统,以连续能量扫描模式替代常规的步进能量扫描模式,可以大大提升实验的采谱速度。 本文基于北京同步辐射装置XAFS线站上最新改进的快速扫描系统及其电子学,设计开发了相应的数据获取系统,实现了前端电子学的配置、数据读出和在线数据处理、运行控制、运行状态监测以及实验谱图的在线实时显示等功能。 该系统已在北京同步辐射装置XAFS实验站上进行了多次的用户实验,实验结果表明,本文设计实现的数据获取系统在功能和性能上均能满足实验要求,达到了课题设计指标。不仅将采谱速度从常规实验方法的单谱10分钟量级提升到单谱秒量级,而且由于新方法能够灵活配置电子学,进而控制步进电机实现多种运行模式,大大拓展了用户实验的灵活性和实时性。通过读出电子学原始数据,使得用户可以进行更为精细的数据后处理和数据分析,提高了实验精度。
        Speaker: 红宇 章 (中国科学院高能物理研究所)
      • 2:15 PM
        散裂中子源上闪烁体中子探测器研制进展 15m
        作为研究物质结构和动力学性质的理想探针,中子散射技术已在凝聚态物理、化学、生命科学、材料科学等多学科领域的研究中被广泛采用。先进的中子源是中子科学研究的基础。作为发展中国家拥有的第一台散裂中子源,中国散裂中子源(CSNS)项目于2008年开始在广东东莞动工,2018年11月顺利打靶并出束,未来其脉冲中子通量将位居世界前列,可以很好满足我国在多学科领域内对散射中子的强劲需求。 位置灵敏型中子探测器是中子散射实验中的关键设备,通过入射中子与探测器内核素的相互作用来实现中子探测。由于3He气体具有探测效率高、n/gamma抑制比好等优点,截至2007年国际上70%以上的中子探测器都是以3He气体作为中子探测材料。但随着3He气体资源短缺、价格飞涨,3He气体探测器已经无法满足中子探测的需求。基于6LiF /ZnS(Ag)闪烁体和波移光纤结构的大面积位敏中子探测器,具有高的中子探测效率、高位置分辨率和可大面积拼接等优点,可以很好的满足中国散裂中子源(CSNS)上多个中子谱仪对大面积中子探测的需求。 CSNS一期建成的三台谱仪中,通用衍射谱仪(General Purpose Power Diffractometer,GPPD)主探测器采用自主研发的大面积闪烁体探测器阵列(NSDA),该探测器单元由双层闪烁屏、波移光纤阵列、多阳极光电倍增管及其读出电子学构成,实现了4mm*4mm的位置分辨和好于45%的热中子探测效率,各项参数指标满足谱仪的物理需求。GPPD谱仪散射室内的探测器阵列目前由48台探测器单元构成,覆盖了底角、90度和高角区域6m2的空间。该探测器阵列在2017年底已经完成现场安装及调试。2018年底第一次谱仪在束调试时,探测器阵列就配合谱仪,在线得到标准硅粉末样品的衍射数据,并得到的0.184%的谱仪分辨率。 基于闪烁体探测器在工程上的成功应用,散裂中子源项目目前在建的7台合作合作谱仪中,工程材料谱仪和成像谱仪也计划才采用自主研制的闪烁体探测器,但两个谱仪在中子探测效率和位置分辨上,对探测器提出更高的要求。基于此,项目组研发了基于硅光电倍增管读出的高探测效率型闪烁体中子探测器,该探测器利用斜入射结构的闪烁屏实现1Å波长中子40%以上的探测效率,位置分辨为3mm*(50~200mm可调)。该探测器计划2021年初完成在谱仪上的安装。
        Speaker: Mrs 彬 唐 (高能所)
      • 2:30 PM
        CSNS注入区H0CT研制 15m
        中国散裂中子源环注入过程是将H-剥离两个电子使其变成H+,注入到快循环同步环加速。剥离膜的使用寿命有限,为了精确测量剥离膜的剥离效率、判断剥离膜的使用寿命、判断注入废束站能承受多大的连续束,I-Dump束线上增加一个束流流强探测器(CT),用于测量未完全剥离的H-和H0粒子,流强的测量范围为10uA~10mA。本文阐述微安级束流流强测量系统的研制过程,主要探头、线缆及电子学相互配合的低抗干扰设计,将环境噪声影响降至最低,从而提高信噪比。
        Speakers: QIU Ruiyang (高能所) , Ms Weiling 黄蔚玲 (高能所)
      • 2:45 PM
        CSNS反角白光中子源探测器的信号分析处理程序 15m
        反角白光中子源(Back-n)是基于中国散裂中子源(CSNS)建设的一台实验装置,它能够提供0.5 eV-200 MeV能区范围内的中子,具有中子能谱宽、通量高、能量分辨率好等特点。Back-n非常适合开展核数据测量研究,同时在探测器标定、中子辐照和单粒子效应以及中子共振分析方面有重要应用。CSNS Back-n装置在建成至今三年多的时间内,已经开展了一系列用户实验,发表了一系列论文,取得了引人注目的成果。 Back-n的绝大多数探测器,都会直接连接进入到共用电子学系统。该系统主要由12-bit、1 GHz采样率的flash ADC组成,它会对超过设定阈值的探测器信号进行全波形采集,记录下探测器的每一个完整信号。这种信号采集方式不同于传统的核物理实验电子学系统。传统的电子学系统中常含有多个电子学插件(比如恒比定时、时幅转换、符合单元等),探测器信号被这些插件实时在线处理后才被记录下来。而Back-n共用电子学系统只含有数据采集卡(不含其他信号处理单元),它不对探测器信号进行任何在线处理,只是对标准的探测器原始波形信号进行完整采集。这种电子学系统更为普适,它适用于Back-n的绝大多数探测器。更为重要的是,这种采集方式完整地记录了探测器在整个实验测量过程中的响应,数据可靠且具有重要参考意义。信号的分析处理(比如定时、符合等)可以通过离线数据分析的方式完成,更为灵活。 由于这种特殊的采集方式,Back-n的数据量很大。平均一次实验测量大概会产生几个TB的原始数据,Back-n每年的数据总量大概为几十TB。因此,我们需要开发一套专用的分析处理程序,能够对Back-n庞大的原始数据进行高效地读取、分析和处理。在2018年Back-n刚开始正式运行时,我们就基于C++编写出了原始数据处理程序的一个版本:WNSRaw2RootV0。后来随着加速器、探测器以及数据获取系统(DAQ)的升级,我们不断更新和升级程序,目前已经有了一个比较完备的原始数据处理程序包。该程序包有三个主要功能:1)对原始数据的解码运算(decode);2)对探测器信号进行分析处理,提取信号的特征信息(比如定时、幅度等);3)建立tree结构用于保存提取到的信息并将处理后的数据以Root格式保存。其中,最核心的部分是对信号波形的分析处理。我们基于傅里叶变换和卷积原理,设计了一套滤波算法,实现了对信号的平滑滤波:通过微分可以消除由基线晃动带来的低频振荡,高频噪声和毛刺则可通过与滤波函数的卷积去除。该套滤波算法的效果很好,适用范围较广。目前已经成功应用到了FIXM、Si、CsI、MWPC、MCP、TPC等探测器的信号分析处理中,取得了很好的效果。本工作将介绍Back-n原始数据处理程序的整体框架,其次将重点介绍滤波分析算法,并展示滤波效果。最后,会简要介绍一下基于这套数据处理程序而得到的一些物理测量结果。
        Speaker: 永浩 陈 (高能所)
      • 3:00 PM
        抗辐照半导体探测器在白光中子实验终端的测试与应用 15m
        目前,半导体探测器的探测材料主要以硅、锗等材料的使用为主。硅、锗探测器具有工艺成熟、能量分辨率高、探测效率高等诸多优点,因此被广泛应用于高能物理研究、核技术、空间探测等领域。然而,由于硅、锗探测器辐射硬度低、不稳定,不能在高温、强辐射等环境下工作。碳化硅和金刚石为第三代半导体材料,因为其载流子迁移率高、禁带宽度大、位移阈能高,相比于第一代半导体,具有更低的暗电流、更快的响应速度和更高的抗辐照能力,更适合在强辐射环境中的测试。 我们制备了碳化硅探测器和金刚石探测器,测试其在不同条件下对α粒子、白光中子的响应情况。碳化硅探测器在-10V以上的偏压下可以区分出239Pu与241Am混合标准源中5.15MeV和5.48MeV的α粒子,最佳分辨率分别为5.15 MeV:4.25%@-20 V和5.48 MeV:3.30%@-10 V。同时器件具有较高的能量线性度,在-10 V的反向偏压及以上,能谱的线性度基本都可以保持在0.9999以上。使用所制备的碳化硅探测器在白光中子实验终端进行实验,更换不同的靶材,将碳化硅探测器放置于靶材正面与背面分别探测,通过对反应信号的分析处理,对不同能量下中子的6Li(n, t) α、63Ni(n, α)60Fe、17O(n, α)14C的反应截面进行测量。 基于国产金刚石单晶与元素六金刚石单晶,采取相同工艺制备金刚石辐射探测器,观察金刚石单晶对探测器性能的影响。使用α源对金刚石探测器的性能进行测试,改变探测器两端施加偏压、光照情况等,探究金刚石探测器的最佳工作条件,同时得到探测器的电荷收集效率、迁移率和载流子寿命的乘积、能量分辨率、能量线性度等关键信息。利用白光中子实验装置中子能量范围宽的优势,采用飞行时间法分析中子辐照下金刚石探测器的响应数据,得到金刚石对不同能量中子的反应截面。另外,使用6LiF转换层,探测中子的6Li(n, t) α反应产生的α粒子与氚,观察金刚石对α粒子与氚的粒子鉴别情况。
        Speaker: 牛梦臣
      • 3:15 PM
        干式涡旋真空泵故障监测系统的设计 15m
        **1 研究背景** 干式涡旋真空泵是近年工业市场上新兴的产品,以其密封性好,返油率低的特性被应用于半导体、薄膜制造、等多个行业。目前国内的干式涡旋真空泵可靠性不高,平均寿命短[1],比较常见的故障是由转子与腔体剐蹭造成的轴承磨损,导致泵体卡死[2-3],在涡旋泵的故障检测方面,传统方法一般使用人工检查的方法来对涡旋泵的运转状态进行判断,因此会经常出现漏检、错检等问题,造成误工误产[4];另一方面,传统的工业也面临着在智能制造浪潮中转型的需求;因此,本设计以机器学习算法为核心,编写了一套干式涡旋真空泵的故障监测系统,实现数据采集,故障监测,数据保存,状态报警等功能,维护人员可以通过开发的软件,监控设备的运转状态,接收设备报警信息,从而有效降低劳动成本,提高设备运转的稳定性,达到提高连续运转周期和减少停机维修时间和成本的效果。 **2 研究内容** 本设计主要包括系统的设计和算法的实现。 需求分析与系统设计: 本系统的目的是设计实现一个干事涡旋真空泵的故障监测系统,来满足用户实时监测涡旋泵运行状态的需求,因此主要包括采集与处理数据,数据清洗与故障诊断,状态显示与数据保存和状态报警。 算法实现 算法实现包括数据处理、特征筛选、模型训练、交叉验证、模型评估五步。 数据处理与特征筛选: 对于涡旋泵,其主要的故障大多发生在轴承上,因此选择轴承的振动信号作为源数据,而振动信号为3轴数据,维数较少,因此首先要对数据进行升维,获取更多的特征,获取到特征之后,还需要对特征进行筛选,得到维数较低,关联性更高的特征子集,然后实施故障判断。 故障判断是一个分类问题,在机器学习中随机森林由于其基于集成学习理论的特性,准确率更高、且由于随机性更不容易过拟合,有很好的抗噪声能力等特点,在分类问题中往往有更好的表现,因此,本设计选用随机森林来进行多分类。在选定模型和特征维度后,需要对模型进行调参,得到最佳的模型。 交叉验证与模型评估: 在使用训练集训练与测试集测试后, 需要在验证集上对当前模型进行验证评估,经多轮调整后,得到适用的模型,在验证集上的总体的判断率为 正常:95.496% 轻微磨损:96.721% 轴承故障:88%。 **3 系统测试** 系统测试在实验室的测试平台上进行,测试对象为正常泵,轴承轻微磨损的泵以及明确轴承磨损的泵。对三台泵分别进行了长时间的采样,在每一个泵上的准确率都在90%左右,基本达到了应用水平。
        Speaker: Mr 晓旭 李 (中国科学院合肥物质科学研究院等离子体所计算机应用研究室)
    • 2:00 PM 3:30 PM
      科学计算技术与平台: II
      • 2:00 PM
        Afs集群账号与统一认证融合实现 15m
        近年来,随着高能所信息化建设的不断发展,越来越多的应用体系被建立。其中afs计算集群使用Kerberos认证方式,其他信息化应用使用统一认证系统,它们各自拥有自己的用户认证以及用户信息,每次用户使用应用系统都要进行独立的身份认证,对用户而言需要记住每个应用系统的用户名和口令,不便于记忆,提高了认证复杂度,用户帐号管理起来工作量大而且复杂。因此,在高能所内融合两大系统是很有必要的,采用单点登录身份认证能实现一次登录、单体访问,这样能很好的降低认证复杂性,用户只需要记 住一个用户名和口令,提高高能所身份认证系统的效率,也便于对用户管理。并且,随着近几年的快速发展,afs与统一认证用户飞速增长,其中大量用户重复,邮箱重复,不仅为账号管理增加了工作量和难度,而且对用户也是一巨大的负担。因此afs账户好统一认证融合势在必行。 高能所计算集群afs使用Kerberos集群认证。它主要是用户在使用过程中对认证服务器(AS)发送请求,AS会对用户生成随机密码和两个票据(Ticket),用户在收到AS返回值后,使用密码解开Ticket生成认证因子,使用认证因子再次发送请求到应用,实现应用认证。Kerberos能够在保证用户信息和数据安全的情况下,使用计算集群实现科研活动。 统一认证系统(SSO)采用Oauth2.0协议,实现了多种方式的接入,如Rest接口、Oauth、LDAP等。高能所现有注册人数超过30000人,合作组74个,接入应用系统100+,可以说统一认证系统是高能所不可或缺的一环。统一认证采用三层树形结构为用户分配权限,实现用户之间数据私密和数据安全。 Kerberos与sso账号关联通过LDAP方式实现。由于Afs集群账号使用短账号形式,sso账号使用邮箱作为唯一标识,所以在融合的方案上,需要对afs集群账号和sso账号进行长短账号关联绑定,并在LDAP中实现长期保存。其中,LDAP中还需要继承用户本身所拥有访问权限、隶属组别等,最终形成一个同一入口,权限统一分配,自动化读取权限的整体。在整个过程中,除了技术上的难题,实施上也存在巨大的难题,因为afs集群存在时间长,其账号数量大于sso账号数量,为了保证账号不重复,人员一一对应,所以在afs集群账号和sso账号之间也坐了大量而且复杂的工作。 至今为止,sso与afs集群账号已经基本完成融合。整个集群从申请、分配、查看结果都可以从sso系统中完成。
        Speaker: LUO Qi
      • 2:15 PM
        格点量子色动力学模拟软件架构现状及其国产化研究 15m
        本文分析了格点量子色动力学(Lattice Quantum Chromodynamics,LQCD)软件架构的现状,并探索了面向国产超算体系结构的软件设计方案。 LQCD是在粒子物理“标准模型”理论框架下,研究强相互作用力的一种第一性计算的非微扰方法,也是在低能标度下唯一有效的数值模拟方法。LQCD将闵可夫斯基时空上的量子场论问题转变为欧几里得时空上的统计问题,将时间和空间等同对待,将四维时空切分为有限的四维晶格。LQCD模拟过程实质为统计系综抽样过程:先产生规范场组态(样本)、基于组态计算费米子的传播子、再利用传播子构建各种关联函数,再从关联函数中拟合目标物理量。LQCD动力学算符Dslash函数计算为计算热点,需要高性能并行计算优化技术支撑。 LQCD研究在全球形成了各种合作组,按国家区分有美国USQCD、英国UKQCD、日本JLQCD、中国CLQCD、QCDSF等,以合作组为主要研发力量发展了各种软件程序包,如USQCD合作组研发Chroma软件包。各类软件程序包大致趋向于分层架构设计:应用层、中间层和代码库三个层次(图1)。 ![图1. LQCD常见软件及代码库分类](http://image.sciencenet.cn/album/202107/15/000039hewpx6iz9d9lalwf.png) - **代码库**,该层次的软件包提供基本的运行模块,如数据结构定义QDP和QDP++、消息传递QMP、文件数据处理QIO和Lime、超算体系结构依赖优化库QSunway和QWS。代码库一般不能直接解决物理问题,而是服务于上层应用设计,需要上层应用以库的形式调用。 - **中间层**,该层次的软件包提供较为完善的LQCD相关的功能模块,如以GPU加速为特点的QUDA软件包、以矢量化优化为特点的Grid,以机器相关的汇编优化为特点的CPS。中间层提供少量独立可运行程序,但通常需要上层应用以库的形式调用才能形成足够的生产力。 - **应用层**,该层次的软件包提供LQCD应用相关软件顶层框架,相关子模块可以调用中间层或底层库实现,也可以不依赖外部相关库。Chroma是一个典型的应用层LQCD软件包,核心数据结构依赖QDP++,而GPU加速模块可调用QUDA软件包实现。 现有的LQCD软件主要呈现以下特征 1. 软件模块化的典型设计,如USQCD提供多层次的LQCD软件包,实现了不少共性软件包的共享。 2. 并行计算优化方式差异大,如QUDA基于CUDA和HIP、CL2QCD使用OpenCL、Grid和QWS使用SIMD来并行加速。 3. 缺乏面向国产超算的LQCD软件,当前仅有QSunway基于国产神威从核进行了计算加速探索。 国产化研究的目标在于构建一套LQCD软件框架适配我国神威、天河和曙光为代表的三大国产超级计算机,研发国产异构计算体系下的LQCD并行算法和编程库,服务于我国格点计算组CLQCD的高能物理基础研究,充分发挥LQCD计算应用在国产超算中的计算效用。基于以上目标的设定,我们提出国产化的LQCD软件框架研究方案主要内容包括 - **可扩展模块化设计**,提炼模拟过程应用层主要模块,实现可扩展性以适应模拟算法的多样性和体系结构的复杂性的需求。 - **国产异构计算适配**,构建主从核计算和类GPU计算的统一编程模式,实现线程并行与矢量化计算加速。 - **内存数据管理**,规范软件架构层与异构计算库数据交换管理,统一费米子场和规范场数据结构的表示与交互。 - **大规模通信优化**,设计大规模并行计算节点间与节点内的数据通信优化模块,实现并行计算区域动态划分,适应Multigrid多尺度等先进模拟算法,提升关联函数分析的并行计算效率。 - **组态IO存储管理**,管理组态数据大文件迁移,设计数据压缩算法,实现组态文件的并行IO访问。
        Speaker: Xu Shun (中国科学院计算机网络信息中心)
      • 2:30 PM
        基于REST API的slurm workbench原型系统开发 15m
        Slurm自20.02版本提供了REST API,可实现以HTTP协议方式与slurm daemons交互。slurm workbench基于Slurm REST API开发,可为管理员提供集群管理信息系统,也可为普通用户提供可视化集群界面。
        Speaker: Ms Ran 杜然 (高能所)
      • 2:45 PM
        国家高性能计算环境运行状态诊断系统 15m
        中国国家高性能计算环境(中国国家网格,CNGrid)是由国内众多国家级和地区级计算中心、高校、科研单位的计算资源汇聚而成的大规模超级计算环境。为保障环境的稳定运行,我们通过对日志等环境数据进行分析来获取环境状态侧写并发现异常来辅助环境运行维护工作。然而这种数据分析的结果通常是文本和数字形式,对人类来说缺乏直观印象,不利于快速理解。 为此我们建设了高性能计算环境运行状态诊断系统,它是一种对于目标计算环境的运行状态进行量化和可视化评判的系统,通过对于目标环境的信息收集、整理,进行不同角度的分项分析,并最终将各分析结果集成为统一的环境运行状态分值,采用可视化方法将各类分析结果立体的表现出来,以便相关运维人员能够直观的获取环境信息和快速定位问题。由于整个环节绝大部分处理分析工作是由程序自动完成,环境运行状态诊断框架极大较少了人工操作量,为运维工作起到有效的支撑作用。 环境运行状态诊断系统主要通过量化和可视化的方法对单项分析方法的结果进行转化和集成。针对目前环境中已经存在的日志流量异常检测、日志关联性异常分析和用户行为特征判别等分析方法,我们根据其分析结果种类分别转化为数值,再进行标准化和归一化等转换,形成单项分析分值,之后将单项分值合成为环境总体状态分值。总体分值的合成原则包括:1) 合成后的总体分值要保持在取值区间[0, 100]以内;2) 总体分值需要能够比较明显的感知单项分值的变化,即当某一单项发生较明显的升高或降低时,总体分值也会相应表现出可观测的升高或降低。同时,根据分析结果的实际含义,环境运行状态诊断系统采用可视化图表的形式将结果表现出来,利用色彩和空间来辅助环境运维人员更好的理解环境运行状态。我们使用了包括热力图、关系图、散点图、雷达图等形式对分析结果进行表述,并采用网页形式将各图表集成成为诊断系统。 环境运行状态诊断系统已经在国家高性能计算环境中实际运行,并有效的支持了环境的稳定运行。由于该系统采用了框架式结构,可以方便的集成更多分析方法以实现更多角度的状态信息获取。此外该运行状态诊断系统可以适用于各种分布式系统,具有比较好的普适性。
        Speaker: Dr 一宁 赵 (中国科学院计算机网络信息中心)
      • 3:00 PM
        高性能计算环境多源用户认证方法研究 15m
        高性能计算环境,又称中国国家网格(China National Grid,简称CNGrid),在国家科技发展中具有重要推动作用。目前高性能计算环境已经接入包括中国科学院计算机网络信息中心结点、6家国家超级计算中心结点等在内的22个结点;提供涉及量子化学、分子模拟、高能物理、生物科学等领域的开源软件、商业软件和自主研发软件。高性能计算环境屏蔽了作业管理系统、接入方式、管理制度等方面的异构性,为科研人员提供了具有统一访问入口、统一使用方法和用户技术支持的高水平高性能计算应用服务。 随着环境的发展,接入的超算中心以及应用社区和业务平台越来越多,希望超算中心以及社区和业务平台用户能够以原有账号登录高性能计算环境使用资源。现有的高性能计算环境仅支持通过LDAP认证的网格账号登录,应用社区和业务平台都有自己的用户且认证方式各不相同。当前的跨域、跨组织机构基于域内已有的统一认证中心,然后采用OAuth2、OIDC等协议来实现跨域认证与授权。目前高性能计算环境并没有统一的认证中心,针对采用超算中心账号方式登录的用户在不改变基础设施前提下无法直接实现接入环境认证系统。为使环境提供一个统一的认证中心,更好地支持超算中心账号的登录以及应用社区和业务平台,我们研究了多源用户认证技术并开发了多源用户认证系统。在多源用户认证技术中,重点引入了认证模块实现对接底层不同超算集群的认证。具体实现流程:1)用户通过登录页面选择自己的认证中心;2)认证模块根据所选认证中心采用的认证机制进行认证:LDAP协议认证方式需传输用户名由认证模块给出认证结果;SSH协议需传输用户名和密码并由集群给出认证结果。3)返回认证结果。为保证认证过程中的安全问题我们采取了多种措施,如登录页面添加随机字符串;限制登录失败次数;数据采用加密传输等。 高性能计算环境通过多源用户认证系统实现了支持超算中心已有账号的直接登录、验证通过的账号并标记来源和身份以及支持应用社区和业务平台。目前,“元”超级计算系统已经接入到了高性能计算环境;“高性能计算”专项中的各大社区和业务平台通过多源用户认证技术也实现了与国家高性能计算环境的对接,且对接后社区和平台用户与环境网格用户可互登录并使用相关资源。
        Speaker: Mrs Rong HE (Computer Network Information Center, CAS)
      • 3:15 PM
        东莞大科学智能计算数据中心的高性能计算环境平台建设 15m
        “东莞大科学智能计算数据中心”(下称东莞大科学数据中心)是以重大科研平台为基础,为物理学、化学、生命科学、材料科学等多学科提供高质高量服务的科学数据运行平台。随着中国散裂中子源的持续稳定运行及合作谱仪与二期谱仪建设的不断推进、南方先进光源启动预研、其他科研单位和企业的科学课题研究需求不断提高,东莞大科学数据中心通过科学实验云分析平台、高性能计算平台和数据存储资源池的建设为各科研单位提供了科学数据中心基础运行环境升级和整合。 东莞大科学数据中心的高性能计算环境(下称HPC环境)由250台X86架构服务器、20台GPU服务器、100台ARM架构鲲鹏服务器组成,前端使用25GE交换机(两两部署M-lag增加可靠性)提供外部通信服务,后端使用100GE交换机组建内部高速通信网络。共提供22560核CPU、100TB内存和80块GPU存储卡资源,同时通过文件系统挂载提供3PB存储资源池服务。 运行与维护方面,东莞大科学数据中心HPC环境通过Foreman+Puppet服务,进行操作系统与支撑软件等基础环境的统一部署与维护,保证所有服务器统一的运行环境,提高运维效率。通过Ganglia+Zabbix+Logstash+个性化bash脚本进行资源使用统计、运行状态监控和日志分析,保障系统持续稳定运行。 软件使用方面,东莞大科学数据中心HPC环境整体通过SLURM进行作业调度管理,散裂中子源统一认证系统集成OPENLDAP进行用户认证与授权,CVMFS进行用户初始化环境检查与科学软件管理。环境中存在的x86与ARM两种架构服务器对资源利用和管理提出了更高的要求,通过对SLURM设置双架构登录节点、CVMFS部署双架构软件源,实现了用户登录指定架构环境时自动加载对应软件与资源环境。 东莞大科学数据中心HPC环境已经完成建设开放使用,目前超过100个用户运行超过五万条作业,使用超八千万核时,主要进行散裂中子源的实验研究与用户模拟研究。用户使用包括FLUKA、VASP、G4Beamline、Quantum Espresso和Material Studio等软件,开展了缪子束线模拟分析、散裂中子源辐射安全评估、白光中子源数据模拟和用户实验数据分析等工作。东莞大科学智能计算数据中心HPC环境的建设,将为散裂中子源的一期谱仪、合作谱仪和二期谱仪相关计算任务提供更多计算资源支持,提高科学服务水平,提升用户产出成果的能力。 本文将就以上各方面,系统全面介绍东莞大科学智能计算数据中心HPC环境的建设与使用情况,展示系统运行测试结果,同时对相应支撑环境的技术进行介绍。
        Speaker: 剑书 洪 (高能所)
    • 3:30 PM 4:00 PM
      茶歇
    • 4:00 PM 5:30 PM
      数据处理与机器学习
      • 4:00 PM
        面向人工智能模型的异构数据融合和容器化工作流系统 15m
        针对人工智能模型应用场景下,数据多源化和异构化导致的数据融合效率较低,各种模型间难以流程化地组合运行等问题,提出了面向人工智能模型的异构数据融合和容器化工作流系统。该系统主要包括异构数据融与持续化、容器化模型部署与运行、工作流定制等3个部分。通过综合运用异构数据融、容器化模型部署、工作流定制等相关技术,面向人工智能模型的异构数据融合和容器化工作流系统,具有人工智能应用场景的普适性,包括工业图像识别、医疗影像和生态数据分析等,能够极大的提升了不同人工智能模型间组合运行的效率。本文以陆地生态系统碳循环预测过程为例,通过容器化技术构建深度学习和数据同化等模型,在无需人工干预的情况下,使用工作流引擎和定时任务调度器可以实现每天自动化地预测未来7 天的气象数据和生态数据,验证了本系统的可用性和易用性。
        Speaker: 萌 万 (cnic)
      • 4:15 PM
        基于机器学习的x射线吸收谱数据处理软件框架 15m
        同步辐射具有高亮度、高准直、高偏振、能量连续可调等优点,广泛应用于材料科学、化学、生命科学、资源环境及微电子等交叉学科的研究,其中X射线吸收谱(XAS)能够给出研究样品局域的三维结构和电子结构信息,且不受样品形态的限制,历来是同步辐射实验中应用最广的技术之一。但是XAFS的数据解析需要经验知识较多,解析时间较长, 对用户要求较高,这对XAS的应用带来不利的影响。 近年来随着机器学习方法的发展,越来越多的领域与机器学习方法相结合。同步辐射装置海量的数据积累为机器学习提供了天然容器,这为XAS的数据解析开辟新的思路,研究机器学习在同步辐射中的应用成为了必然趋势。 本文探究了将机器学习引入到同步辐射领域中有关XAS的数据处理中,旨在构建基于机器学习的XAS数据处理的软件框架,大幅度提高XAS的数据处理效率,助力用户的科学研究。目前,我们完成了从材料结构到机器学习预测材料结构信息流程的框架搭建。通过利用X射线吸收精细结构(XAFS)谱和人工神经网络,对Au、Cu材料进行了配位数的结构信息的验证,得出了良好的预测效果。 如图所示,框架流程由构建数据集和训练神经网络两部分组成。由于实验上往往很难获得足够数量的吸收谱,且这些吸收谱的结构大多未知,无法直接用于神经网络的训练,因此普遍的做法是通过理论计算构建模型训练所需的吸收谱数据集。实验数据通过平移、缩放等处理过程之后再应用于我们使用模拟数据训练得到的模型。 我们通过动力学模拟,计算EXAFS谱等步骤完成神经网络训练数据集的准备工作。具体的,首先我们选取Au、Cu材料,通过分子动力学模拟得到大量的结构并计算该结构对应的配位数或配位键长以作为数据集的label。然后,我们使用FEFF程序计算这些结构所对应的XAFS谱。接着,我们使用小波变换等方法对得到的谱进行处理以作为数据集的feature。最后,我们得到了一个feature(小波变换数据、Chi谱等)与label(配位数或配位键长)存在对应关系的数据集。其中,我们不仅对于每个模块编写了代码来实现它的功能,还对于每个模块之间都写了代码做衔接处理。 在得到构建的数据集之后,我们使用tesorflow(keras)框架进行神经网络的训练。按照程序模块化的方式,我们对数据集进行网络的构造和训练,具体包括:规范数据集的格式;对数据集的分布进行预统计分析;训练网络模型;训练超参数;模型性能评估与结果分析。最终,我们得到了一个性能良好的通过EXAFS谱预测配位数和配位键长的数据处理软件框架。 框架流程图如图示: ![enter image description here][1] [1]: https://sm.ms/image/2GBw8fuVc6gEhQ1
        Speaker: 赵海峰
        Paper
      • 4:30 PM
        CEPC上基于DeepSets模型的喷注标记算法研究 15m
        背景介绍 2012年在大型强子对撞机(LHC)上发现希格斯(Higgs)玻色子是粒子物理学界的大事件,该发现不仅补全了标准模型缺失的最后一角,而且开启了粒子物理探索的新篇章。由于*WZH*三种玻色子(尤其是希格斯玻色子)与新物理现象及新物理规律的联系十分密切,因此精确测量他们的性质,是探索新物理现象和新物理规律的关键手段。强子喷注是*WZH*三种玻色子最主要的衰变末态,因此喷注的重建(Clustering)和标记(Tagging)算法对实现*WZH*三种玻色子的精确测量至关重要。本文主要介绍喷注的标记算法。传统喷注标记算法有两种,第一种是基于选择条件和人工变量,第二种是基于传统机器学习算法,比如决策树(Boost Decision Tree, BDT)和神经网络(MLP)。近年来,随着深度学习的发展及其性能的进一步提升,越来越多的深度学习算法应用于粒子物理实验中,例如依旧基于人工提取变量方法的DNN算法、基于图像识别的CNN算法和序列处理的RNN算法,以及本文在正负电子对撞机(CEPC)上采取的基于DeepSets模型的神经网络方法对夸克喷注标记进行分析。 数据、模型和性能 本研究采用了新提出的、基于DeepSets的能量流深度学习算法以及*Z*玻色子强衰变末态产生的喷注模拟数据集,尝试对重味夸克喷注的标记进行研究。其中*Z*玻色子衰变为*bb\bar*, *cc\bar*,(*ss\bar*, *uu\bar*,*dd\bar*) 等5种不同强子末态。所有数据通过Whizard 1.9.5 产生,再用Pythia进行强子化模拟,最后再采取CEPC CDR的基准探测器对蒙特卡洛样本进行探测器模拟和重建。DeepSets模型有以下三个特点:第一,喷注中末态粒子的顺序交换不影响喷注的性质,因此DeepSets模型必须考虑粒子顺序交换不变性这一对称性;第二,在顺序交换不变性的基础上采用多个的过滤器充分提取喷注的关键物理特征;第三,把提取出的特征作为DNN的输入进行标记。以上的数据集和模型在采用GPU进行充分训练后,与传统的决策树和XGboost算法相比,其性能提高约6%,使平均精度从80%提高到85%左右。
        Speaker: 立波 廖 (wuzhou univercity)
      • 4:45 PM
        基于深度学习的EAST托卡马克等离子体破裂预测 15m
        磁约束托卡马克是有希望实现可控核聚变的装置之一。目前,托卡马克仍存在许多问题需要攻克,等离子破裂就是其中之一。等离子体破裂是由于 MHD 不稳定性事件快速发展到不可控,等离子体约束性能下降导致的。等离子体破裂时,大量的热能和磁能在极短的时间内通过热沉积、晕电流和逃逸电子等形式沉积到装置第一壁材料或其他部件,一定情况下会直接造成装置的损伤。随着聚变装置尺寸的增大和运行参数的提高,如:ITER 和 CFETR,等离子体破裂对装置的危害会被放大。因此,对等离子体破裂进行有效的避免或缓解破裂带来的危害就尤为重要。但对于这些安全保护措施来说,需要足够的时间进行响应并有效的控制等离子体,因此对等离子体破裂进行提前预警也是尤为重要的。提前进行等离子体破裂预警是后续安全保护的前提。 本研究在EAST托卡马克大型破裂预警数据库中训练长短时记忆(LSTM)模型,以预测EAST托卡马克的破裂。为了比较LSTM模型与之前报道的全卷积神经网络(CNN)的性能(Guo et al. 2021 Plasma Phys.。控制。Fusion 63, 025008),使用相同的数据集和诊断信号。基于测试集,接收机工作特征曲线下的面积,即LSTM模型的AUC值为0.87,真阳性率(TPR)为约87.5%,假阳性率(FPR)为约15.1%。由于LSTM模型比CNN对辐射波动更敏感,所以LSTM模型的预测性能不如CNN模型(对于CNN, AUC~0.92, TPR~87.5%,FPR~6.1%)。而LSTM模型的预警时间比CNN早14ms。为了降低FPR,提高模型的性能,增加了更多的快速辐射热计通道作为LSTM模型的输入信号,包括来自上、下边缘和等离子体核心的辐射。因此,对于相同的测试集,AUC值增加到0.89,FPR下降到约9.4%,但TPR也下降到约83.9%。此外,模型对杂质行为引起的辐射波动的敏感性显著降低,预警时间比原模型提前8.7 ms。 两种深度学习算法(CNN和LSTM)在EAST托卡马克上都进行了破裂预测研究,研究表明由于两种算法结构的不同,它们在EAST破裂预测上的性能有所不同。对于CNN算法,其卷积层的特征提取的性能,可以从原始信号中提取所修的特征,降低信号一些无关变化对模型的影响,使得CNN模型的破裂预测准确性优于LSTM;而LSTM算法,其时间相关性的学习使得LSTM模型可以更早的对破裂进行预警。结果表明,深度学习算法在长脉冲融合器件中断预测方面具有巨大的应用潜力,可以结合两种深度学习算法的优点设计出更适合与等离子体破裂预测的模型。
        Speaker: 笔豪 郭 (中国科学院合肥物质科学研究院)
      • 5:00 PM
        一种基于时频图和预训练模型的旋转机械故障预测深度迁移算法 15m
        在统计学习理论框架下的机器学习算法遵循一个基本假设,即训练数据和测试数据是从同一分布中提取的。如果不成立该假设,则这些方法的泛化性能可能会急剧下降。然而,在实际故障诊断工程应用中,不同的工作条件,负载,传感器的位置以及机器尺寸等可能引起振动信号发散,并导致特征空间中的分布差异。其次,由于旋转机械故障情况下可能不允许其连续工作,导致获取带标签的故障数据量较少,并且对于一些罕见故障,需要花费大量的时间等待故障发生,以获取相关特殊故障数据。同时为了获取某些旋转机械的故障数据,往往需要搭建对应的故障测试台,对设备进行破坏性实验,以获得珍贵的故障数据。这些现状都使得旋转机械故障诊断的数据集难以获取且成本昂贵,并且在实际应用中导致数据分布存在差异性,从而引起故障预测模型性能的急剧下降。如何通过已有的同类型的故障数据,指导其他工况下的设备利用其少量带标签数据和大量无标签数据进行模型自适应学习,以实现较好的故障预测性能,仍然是一个严峻的挑战。为了对原始时域数据进行高效的特征提取和对模型进行跨域迁移自适应,以及对分类预测进行优化改进,从而提高分类预测准确性,因此本文所提方法通过将原始时序数据进行时频处理获取时频图作为输入,利用Resnet50残差神经网络的预训练模型作为特征提取的主体网络,并设计了多个损失函数,用来减小数据类别的差异性和自适应迁移的损失,同时对多个超参数进行优化,既提高了故障预测模型的准确率,又大大减少了训练时间。为了验证所提方法的故障预测分类性能和模型迁移自适应的能力,利用凯斯西储大学轴承数据集,设计了包括故障预测实验、不同负载迁移自适应实验、不同传感器位置迁移自适应实验进行评估。考虑到真实场景下噪声的干扰,在数据预处理时在原始信息中添加了高斯白噪声。针对损失函数权重进行参数评估,选择最优超参数。同时为了直观的展示所设计的残差神经网络的特征提取能力,基于t-SNE算法进行了特征可视化。
        Speaker: Mr Shaoqing Liu (Institute of Plasma Physics Chinese Academy of Sciences)
      • 5:15 PM
        时间投影室数据分析及可视化的实现 15m
        时间投影室(Time Projection Chamber,简称TPC)是一种三维粒子径迹探测器,可对核反应带电粒子的径迹进行三维重建,从而得到完整的核反应信息,对反应过程进行全面而细致的研究。TPC已在粒子物理与核物理领域得到了较为广泛的应用。在高能重离子碰撞实验中,TPC用于对重离子碰撞产生的多条粒子进行重建从而获得核物质的状态信息;在稀有放射性同位素束流线实验中,TPC用于测量远离平衡态的原子核与气体靶核反应的产物以对原子核结构进行更新更全面的研究;在极深地下实验中,TPC用于测量稀有衰变道以探索超出标准模型的新物理过程。 在中子核数据测量领域,TPC的应用也已得到越来越多的关注。随着对核数据的精度和信息量要求越来越高,传统的测量方法已无法解决诸如高效粒子鉴别、低能量阈值测量、精确角度和空间分布测量、多体反应测量等问题。为提高我国中子核数据测量的研究水平,满足未来基础研究和中子技术发展对高精度核数据的需要,本研究组已经开始了多用途TPC的研制工作,目前已经完成了原型探测器的研制并进行了测试,取得了初步的测量结果。 多用途TPC的读出通道多、数据量大,对数据处理系统有很高的要求,研制难点主要包括:高速数据传输和存储系统、探测器和核反应过程模拟程序、多功能波形甄别程序、粒子径迹寻找和拟合程序、粒子甄别程序、反应道甄别程序等等。本文将主要介绍多用途TPC的离线数据分析方法及可视化的实现,以轻量化和便捷化的数据处理程序架构为基础,同时使程序架构可满足中子核反应的复杂性和多样性的数据分析需求,实现各程序模块统一配置和调用、数据流的有效传输及便捷的用户交互功能,使多用途TPC成为一个性能良好的中子核数据测量平台,为国内高水平的实验工作开展提供有力的支撑。 数据分析方面,将主要介绍波形处理和信息提取方法,以及径迹重建算法的研究情况。 1. 波形处理方面,采用了傅里叶变换滤波方法,通过设计合适的滤波函数,将滤波函数与探测器波形进行卷积和反演,有效对波形中的噪声成分进行滤波。而针对饱和信号波形,则根据读出电子学芯片内部电路的特点,使用准高斯函数对波形进行拟合分析,提取信号幅度和起始时间等信息。 2. 径迹重建主要包括径迹寻找和径迹拟合两个方面,分别采用了三维霍夫变换和主成分分析的方法,并加入各击中的信号幅度作为权值,对寻迹和拟合过程分别进行了加权处理。 可视化方面,将主要介绍多用途TPC事例显示程序(Event Display)的开发情况,以及结合数据获取系统实现在线事例显示的工作进展和计划。
        Speaker: Dr Yang Li (高能所)
    • 4:00 PM 5:30 PM
      科研信息化系统: II
      • 4:00 PM
        面向国家重大科技基础设施的网络安全运维平台 15m
        国家重大科技基础设施是为探索未知世界、发现自然规律、实现技术变革提供极限研究手段的大型复杂科学研究装置(系统),是突破科学前沿、解决经济社会发展和国家安全重大科技问题的物质技术基础。由于大多数重大科技基础设施必须对国内外用户高度开放,使得依托重大科技基础设施开展的科研活动、应用研发等工作面临着包括工业控制安全、互联网安全以及数据安全等在内的多方面安全威胁。为了应对日益严重的网络安全威胁,保障重大科技基础设施及其科研活动的网络安全,建设面向重大科技基础设施的网络安全技术平台已经迫在眉睫。 本报告介绍一种面向国家重大科技基础设施的网络安全运维平台,该平台构建持续的重大科技基础设施威胁态势感知、安全监测分析、安全事件预警和安全事件协同响应能力,形成安全监测、分析、预警、处置的安全工作闭环,实现面向重大科技基础设施安全运维工作的自动化,确保重大科技基础设施及其科研活动的主动安全防御能力和安全体系建设的有效性。 面向国家重大科技基础设施的网络安全运维平台系统逻辑架构可划分为六个层次:安全数据采集层、安全数据预处理层、安全数据存储层、安全数据分析层、安全数据应用层和威胁情报层。 安全数据采集层实现复杂多源异构安全类数据的采集,包含重大科技基础设施网络流量数据、日志数据、脆弱性数据以及资产数据等;安全数据预处理层实现数据的实时处理,包括安全数据解析、富化等;安全数据存储层利用大数据存储、关系数据库等平台实现多源异构安全类数据的存储;安全数据分析基于多源异构安全类数据,利用规则分析、统计分析、机器学习、深度学习、图学习等智能检测算法实现威胁建模、监测和发现;安全数据应用层利用可视化技术、自动化工作流程等方式,实现态势感知、事件处置响应、资产和漏洞管理等能力;威胁情报层通过自动采集、人工事件调查等方法和途径,实现威胁情报收集、应用和共享。以上的不同逻辑层之间通过联动协作,形成了安全威胁建模、安全信息感知、安全事件分析、安全事件预警及安全事件应急处置的一体化的面向国家重大科技基础设施的网络安全技术平台,有效保障依托重大科技基础设施开展的科研活动、应用研发等业务可持续发展。
        Speaker: Dr 佳荣 王 (中国科学院高能物理研究所)
      • 4:15 PM
        网络边界安全威胁IP阻断技术 15m
        伴随Internet网络的高速发展和不断扩大的网络应用,网络安全威胁屡见不鲜,只要是对外网开放服务的系统,每天都可能承受着成千上万次的尝试攻击,这些攻击可以造成网络性能下降,影响业务系统正常工作,甚至会成功地入侵,给系统造成破坏或损失。如何快速阻断和减少这类攻击,成为网络安全管理的一个重要问题。本文结合高能所网络安全管理的应用讲述了基于边界的安全威胁IP封锁方案和相关技术。 通过在网络数据通讯边界设备(防火墙或路由器)上配置访问策略,动态封锁或解封存在安全威胁的IP通讯;与网络安全监测系统和日志分析系统通过消息传递,相互关联实时拦阻来自网络的攻击行为;提供IP白名单过滤和判别功能,避免误封有重要业务关联的IP地址。 本系统部署在高能所网络运行,通过接收来自SOC威胁监测系统,Bro入侵检测平台以及人工监测或情报收集发现的黑IP资源,快速封堵存在安全威胁的IP地址,给来自网络的黑客攻击增加了阻力。封锁过程中收集积累了大量IP地址,可作为网络安全威胁的情报资源。 基于边界路由器的有害IP地址封锁是局域网络安全的重要部分,利用静态路由表的封锁技术应用简单可靠,与在防火墙上封锁IP地址相比,性能开销要小的多,以高能所使用的华为路由器为例,可以封锁百万数量级的IP地址。
        Speaker: Mr 德海 安 (高能所)
      • 4:30 PM
        基于滑窗多头注意力的低剂量计算机断层扫描图像重建伪影去除算法 15m
        在同步辐射线站实验中,低剂量计算机断层扫描(LDCT)越来越受到重视。图像重建对实验结果分析至关重要。传统算法在LDCT的实际应用中面临着各种各样的挑战。如对于稀疏投影视图,采用经典的解析方法-滤波反投影算法(FBP)会产生严重的条纹伪影,采用迭代算法会带来高计算成本以及超参数选择等困难。对于低辐照实验,低的X射线曝光会带严重的噪声。最近U-net等使用大型感受野神经网络的深度学习方法在稀疏视图CT重建以及低曝光噪声去除中表现出卓越的性能。但是现存算法,如U-net,都是基于卷积神经网络(CNNs),由于卷积运算的感受野限制,无法建立长程依赖以及全局上下文连接。近期刚被提出的Transformer算法,其自注意力机制具有强大的长程上下文信息建模能力,被广泛应用于图像分割等领域。基于Transformer的算法往往使用块划分的方法处理图像问题。然而这种方法往往忽略了块中像素级的内部结构特征。在本文中,我们提出了一种新的低剂量计算机断层扫描图像重建伪影去除框架,尝试解决上述问题。在该框架中,Swin Transformer 模块用于对图像中的伪影进行编码,卷积运算以及上采样运算用于对提取的特征进行解码,再从稀疏重建图像中减去学习得到的伪影,最后恢复出清晰的校正图像。结果表明,该方法在伪影去除和保持重建图像质量方面是切实有效的。
        Speaker: Mr 誉 胡 (高能所)
      • 4:45 PM
        硬X射线自由电子激光电子档案库初期建设与运行 15m
        1 引言 随着云计算、大数据、移动网络等信息技术的飞速发展和广泛应用,科研和管理信息化程度不断加深,充分借助信息技术,尤其是数字网络技术对档案内容信息以及相关衍生信息资源进行有效的组织、管理、存储和利用,已经成为新时期档案工作突破传统、创新发展的必经之路。2021年起正式实施的《中华人民共和国档案法》,明确要求推动档案信息化建设,开辟档案管理现代化新路径。同时,肯定了电子档案的效力与凭证价值,对电子档案管理信息系统、数字档案馆、档案信息资源共享服务平台建设提出了更高要求。 硬X射线自由电子激光(Shanghai HIgh repetitioN rate XFEL and Extreme light facility,SHINE)项目是“十三五”国家重大科技基础设施建设规划优先启动项目,是上海建设张江综合性国家科学中心的核心项目,总投资近百亿。该项目档案具有责任主体多、专业门类广、时间跨度大、载体复杂等特点,在项目建设过程已有电子文档、音像文件等大量的电子文件产生。单纯的纸质文件保管已无法覆盖项目建设全部内容,且利用不方便,还易导致有价值文件的流失,亟需建设电子档案管理系统。 SHINE电子档案库遵守国家有关电子档案管理系统规定,依据先进、实用、安全、发展的原则,第一阶段开发任务设置了档案收集、档案整理、档案保存、档案利用、档案鉴定与处置、档案统计以及系统管理等基本功能。以期满足SHINE建设、调试与运行期间全部电子档案的存储需求,推动电子档案科学管理。 本文结合档案的安全性对SHINE电子档案库软硬件部署进行了整体设计,已建成的档案库运行情况良好。 2 系统设计 SHINE电子档案库系统总体上基于集中式部署分布式利用的原则,主要由电子档案库后端管理软件、电子档案库前端管理软件、服务器、主存储、在线备份存储、光盘离线备份存储等组成。 电子档案库后端管理软件实现电子档案的统一采集,具有数据共享和在线编辑功能,共享后的文件交由各总体档案员按档案归档规范与要求,核查文件真实性、完整性、有效性。该后端管理软件基于owncloud技术搭建文件共享平台,实现多个单位的文件实时共享和在线编辑。 电子档案库前端软件主要由南京轩恩软件开发有限公司基于国家颁布的档案管理主要法规指导下进行开发,主要包括电子档案标准入库、档案整理、档案管理、档案利用和档案长期保存。 为系统数据安全考虑,前后端系统都具备每日备份机制,后端系统还具备每三个月离线备份机制。 3 电子档案库后端系统 3.1 后端系统架构 电子档案库后端系统基于owncloud技术开发,包括运行owncloud的主服务器和主存储、用于自动备份的备份服务器和备份存储、以及能够连接手机、电脑、高拍仪等设备的电子文件输入端。电子档案库后端系统具体部署如下图所示,整个系统服务器硬件位于上科大图信中心机房,客户端依赖于各用户具体位置,在上科大可直接接入,在上科大外需先接入上科大VPN后再接入。电子文件可通过手机、电脑直接传入电子档案库后端系统,针对已有纸质档案,档案管理人员可调用本地的高拍仪对纸质档案进行扫描,在扫描的同时可进行旋转、缩放、纠偏、合并等处理后上传到服务器。 3.2 后端软件目录结构及权限 为实现档案安全采集,设计了以下目录结构:第一级目录为SHINE电子档案,SHINE项目档案员可查看SHINE采集的所有电子档案;第二级目录为总体级档案,分为PM(综合管理)电子档案、AC(加速器总体)电子档案、BE(束线站总体)电子档案、EL(极端光物理总体)电子档案和CE(建安总体)电子档案,各总体档案员只拥有各总体档案的管理权限;第三级目录为SHINE各个工程设计人员,各工程设计人员只可查看自己输出的电子档案。 4 电子档案库前端系统 4.1 前端系统架构 电子档案库前端系统由应用和数据库服务器及主存储、在线备份服务器及备份存储、离线刻录光盘以及运行在服务器硬件上的电子档案库前端软件组成。为系统性能考虑,将应用服务器和数据库服务器二合一,集中部署在SHINE工程办服务器上,主存储可用空间为44TB,最高可扩容至216TB;在线备份服务器及备份存储部署在上科大图信中心机房,与其他系统共用144TB备份存储空间。 4.2 权限管理 为了保证档案安全,不易被篡改、删减,将电子档案管理员权限分为4个层级,分别为Admin、软件配置管理员、用户配置管理员和档案移除管理员。Admin拥有所有的权限,Admin账户用户名和密码封存保管,紧急场景再使用。档案员按管理文件范围分别项目档案员和各分总体档案员,项目工程人员只具备查看电子文件的权限。 a) Admin 拥有最高权限,所有档案收集/整理/管理/利用、档案目录调整及配置、用户增加/删除/权限配置 b) 软件配置管理员 档案目录调整及配置 c) 用户配置管理员 用户增加/删除/权限配置 d) 档案移除管理员 档案管理阶段的档案移除和删除权限 e) 项目档案员 所有档案的编辑/利用,档案收集/整理阶段的档案移除和删除权限 f) 各总体档案员 相应总体档案的编辑/利用,档案收集/整理阶段的档案移除和删除权限 g) 项目工程人员 查看已申请权限的电子档案
        Speaker: Dr Congcong Yin (Shanghai Advanced Research Institute, Chinese Academy of Sciences)
        Paper
      • 5:00 PM
        基于Docker封装的Django信息管理系统 15m
        ## 摘要 ##     **背景:**目前CAFe的信息管理系统主要基于Epics Archiver数据归档系统和CSS软件搭建,其人机交互页面存在显示不清晰,操作繁琐的问题;并且数据库没有采用分表分库的方式,随着数据量大幅增加,数据安全及数据检索速度缓慢的问题日益凸显。     **目标:**为此,本文设计了基于Django框架的前后端交互,MongoDB数据库作为数据存储以及Nginx服务器提供反向代理和负载均衡服务的新型信息管理系统。同时,为保证软件系统的运行环境统一以及在新旧服务器上的平稳运行过渡,采用Docker技术将设计完成的新型信息管理系统打包为镜像,实现便捷快速迁移。     **方法:**(1) 以Django为Web框架,通过模型与后台数据库交互,当接收到http请求后由URL匹配视图,视图实现业务逻辑后反馈给模板,最后通过预先定义的模板在前端显示,模板使用了easy UI设计布局及美化页面,用户可以通过form表单进行交互,所输入的信息以post的方式传回视图函数验证处理,验证通过后使用ajax方法使网页部分重载,避免全部重载引起服务器负担过重问题。 (2)数据存储引擎选取了非关系型数据库MongoDB,相较于传统的MySQL数据库,MongoDB的集合更为灵活,具有更快的读写速度也可以提高存储容量,同时它还兼具了关系型数据库索引功能和表视图,MongoDB大大降低了数据迁移的成本。 (3)Web服务器使用了Nginx服务器,因其出色的处理并行请求的能力,通常作为负载均衡器,与Apache相比其使用的内存要少很多。同时Nginx的反向代理服务可以重新解析域名,隐藏真正服务器地址,提供对新系统基于web攻击的防护。 (4)使用Docker技术将开发的信息管理系统以及其依赖包打包到一个可移植的容器中,将容器封装为镜像推送到远程仓库,然后可以在任何流行的Linux和Windows服务器上发布应用。Docker对应用容器的高效创建、部署与复制,实现不同服务器和研发及生产环境之间无差别迁移为今后针对云来优化应用奠定了坚实的基础。     **结果:**利用Django框架的视图函数可以实现用户前端对后端数据库的读写操作,MongoDB数据库在使用Django框架下修改数据速率可以达到10ms/条,约为MySQL的14倍。在针对Nginx服务器的压力测试中,当请求量为100并发数为10时,吞吐量为每秒323.25个请求。Docker封装新型系统各个组成部分后,通过docker-compose文件将其组成一个微服务,可以在任何机器上拉起服务。   **总结:**本文使用Django+MongoDB+Nginx设计了一套信息管理系统,目前新型系统已经实现对束流运行模式和配置数据,设备调试和运行历史数据,关键腔体加工工艺和测试数据,设备电缆信息,各设备生命周期数据等信息的归档,观测到的PV数据量约为11Gb/天。信息管理系统设计目标是使加速器运行过程中所有重要数据分类分表显示,并允许在前端页面上可视的操作数据库。用户在可视化界面进行数据的查询、修改、回滚、锁存以及添加备注操作,满足了用户对便捷查看所需数据,降低数据库操作门槛的需求。Docker强大的应用迁移及服务快速部署能力,使得非开发人员能够在其他设备上简易部署新型系统。最终测试结果表明,本系统可以在美化前端界面简化操作的同时使服务器提供稳定的服务并解决了应用迁移的问题,为将来应用的大规模部署提供了技术支持。 **关键词:**信息化系统,Django,MongoDB,Nginx,Docker容器技术
        Speaker: 睿 王 (中国科学院近代物理研究所)
      • 5:15 PM
        基于组件化的海洋大数据可视化系统 15m
        随着各类海洋定点观测设备、卫星遥感技术以及计算机模拟技术的不断发展,现代海洋科学研究正逐步迈向大数据时代,许多新兴技术和手段被应用于海洋科学数据分析,对大量海洋数据分析所面临的主要挑战来自于海洋数据本身的复杂性以及其很强的时空关联性。交互式可视化有助于从整体把握数据的时空变化趋势,还可辅助发现不同变量之间的内在关系,对辅助海洋要素分析、环境变化规律展现、海洋信息交流与传递具有重要意义。本文提出了一种面向海洋大数据分析的组件化交互式可视化平台,首先介绍了海洋大数据的基本组成和分类,并对各类数据的存储方式和数据处理方法进行介绍,同时基于后处理数据形成统一的海洋大数据可视化数据资源服务,为其他应用提供基础的海洋可视化数据资源。其次,基于已有的数据资源构建海洋可视化功能组件,提供一个交互式多元多尺度的海洋可视化工具池,并以海洋环境保护、海洋科学发现为目标,组建可视化应用服务,为科学家、工程师、普通公众提供海洋知识发现的平台,最终为海洋资源的可持续利用以及防灾减灾。最后,对基于组件的海洋大数据交互式可视化的发展方向和应用前景进行探讨。
        Speaker: Mr Yanjun Wang (中国科学院海洋研究所)
    • 9:00 AM 10:30 AM
      大会报告III
      • 9:00 AM
        高能物理实验中的触发与数据获取 30m
        Speaker: Mr Kejun ZHU (高能所)
      • 9:30 AM
        硅像素探测器技术及研究进展 30m
        Speaker: Dr Liang ZHANG (Shandong University, CHINA)
      • 10:00 AM
        高性能科学计算与HEPS光束线光学设计 30m
        北京高能同步辐射光源HEPS是中国第一台高能光源,储存环的发射度远远低于现有的同步辐射光源,先进的加速器设计极大提升了X射线光束的品质。在众多关键的技术中,光束线的设计工作极具有挑战性。由于同步辐射光源是一类大型科学装置,传统的实验研究方法非常受限。同时,相当多的问题是无法在第三代同步辐射光源上研究的,当然这里还有机时的问题。在这种情况下,仿真实验平台是HEPS开展技术研究和光束线设计的重要途径。相比于第三代的同步辐射光源,光学相干性是HEPS光源的优势,也是造成HEPS光束线设计的困难的关键因素,传统的几何光学仿真方法已经无法正确描述光束线的行为,衍射极限应用下波动光学方法成为必要工具。 在一定的硬件条件下,平衡波动光学仿真的精度和速度是一个重要研究方向。在第四代同步辐射光源上,该工作的负担更为严重。光束线设计是一个系统工程,光束线设计的核心内容是误差的处理,包括器件误差、稳定性等。这些多变量的优化意味着需要开展多轮迭代计算。在已有的软件中,例如SRW,通过算法的优化,降低计算对硬件的要求。但这无疑提升了软件使用者的门槛。随着GPU硬件性能的提升,XRT应用OPENCL并行计算方法很好地解决这一问题。在过去的三年中,HEPS光源在高能所计算中心的支持下,广泛开展光束线仿真计算,解决很多之前无法用理论回答的问题。但是如何降低计算硬件需求,仍然是一个重要的研究方向。例如GPU显卡的单精度与双精度计算的差异,从NVIDIA的Tesla V100降低到RTX 3080Ti。 HEPS的光束线设计工作目前还主要聚焦于样品处光斑的特征优化。然而,对于未来的HEPS光束质量对实验效果的影响,特别是定量的情况,仍有待于开展大量的研究。面对机时有限的问题,开展在线实验的方法效率将非常低。为了支撑未来HEPS光源的发展和运行,我们认为开展Front-to-End的仿真是重要的,即可以仿真从光源发光到最终数据收集的整个过程。目前,主要的问题是如何有效地将实验站数据处理和光束线的仿真有效结合,对于每种实验方法建立特征的实验模型。这项系统工程即需要物理的基础,也需要软件的整体架构。本文将简单介绍我们在这些问题上的考虑。
        Speaker: Fugui Yang
    • 10:30 AM 11:00 AM
      茶歇
    • 11:00 AM 12:30 PM
      大会报告IV
      • 11:45 AM
        RDTM介绍 15m
        Speaker: Dr Wenli 郑文莉 (高能所)
      • 12:00 PM
        先进网络技术 30m
    • 2:00 PM 3:30 PM
      核电子学与探测技术: III
      • 2:00 PM
        JUNO数据获取系统集群部署与性能调试 15m
        JUNO(江门地下中微子实验站)是一个高能物理研究领域的大型基础科学项目,其首要物理目标是确定中微子质量顺序和精确测量振荡参数。从JUNO中心探测器、水池切伦科夫探测器、顶部径迹探测器三个探测器系统获取的电子学原始数据量预估为40GB/s,数据获取系统需要完成全部数据的读出、组装、在线处理、存储、管理和展示等复杂任务,所使用的服务器的数量超过100台。 整个数据获取系统(DAQ)的服务器节点通过xcat、cobbler、ansible等工具实现了操作系统的自动化安装和集群环境的统一化配置,为整个DAQ系统的软件开发测试以及后续的长时间稳定运行提供了保障。xcat和cobbler利用kickstart配置CentOS系统安装参数,批量快速完成系统的安装。cobbler则利用大量python模块和剧本完成系统环境配置和服务启动,从而保证DAQ系统的节点运行环境完全一致,以及损坏和新增节点的快速处理,减少对数据流和在线软件的干扰。 同时针对DAQ系统的核心数据流任务,进行了网络性能、计算性能、存储性能等方面的综合调试。利用模拟电子学数据源生成PMT数据,通过TCP连接读出模块完成数据读出,组装模块再将全部通道的数据组装在一起,发给处理模块通过在线顶点能量重建算法完成事例筛选,最后将有意义的物理事例发给存储模块等待后续的离线处理分析。由于各个模块的正常运行依赖于前后模块的状态和性能,需要调整系统参数和软件运行参数,通过长时间运行测试,找出数据流软件的性能瓶颈和程序bug,并及时反馈给相关开发人员,共同优化代码逻辑,提高运行能力和稳定性。
        Speakers: Mr Fei Li (IHEP, CAS, China) , Mr 代斌 罗 (中国科学院高能物理研究所)
      • 2:15 PM
        基于差分流强测量的束流损失实时监测系统的研究 15m
        摘要:高功率强流质子加速器的设计目标是严格控制束流损失。束流损失监测系统对加速器的机器保护、残留活化剂量控制和机器调试非常重要。目前国内外强流加速器多采用专用束损探测器如电离室、闪烁、PIN二极管等来实现束流损失监测及机器保护。但当粒子能量较低时,束损探测器很难探测到有效信号。本课题提出基于束流流强测量的束流损失监测系统,深入研究流强测量系统的响应,采用现代电子学的FPGA技术,在硬件基础上实现低能段的束流损失监测,高效的完成低能段的加速器的保护。
        Speaker: Mr zeng lei (ihep)
      • 2:30 PM
        Speeding up deep learning inference on proton-proton collision data by initializing with Hadamard matrices 15m
        Recent research by CERN has revealed machine learning-driven capabilities for the identification of proton-proton collisions at LHC for reanalysis. While this work and other previous works also work on speeding up inference via the machine learning algorithm, in this work we propose harnessing Hadamard matrices for faster inference at the model level. Machine learning algorithms for classification tasks have a variety of use cases and applications. One model type, the artificial neural network, has become increasingly popularized over the last decades, with fascinating applications in computer vision and elsewhere. Such classifier algorithms have a number of parameters and yield a per-class value. In this work, we discuss the use of a Hadamard matrix to initialize the classifier, which in turn speeds up inference. The aforementioned matrix is positioned at the final classification transform, which yields two primary benefits. Firstly, it is a deterministic, low-memory, and easily generated matrix that can be used to classify. Secondly, it removes the need to perform matrix-matrix multiplication. By speeding up performance, we can enable further state-of-the-art results on many tasks that have immense applicability in Hadron physics at LHC.
        Speaker: Thomas Chen (A)
      • 2:45 PM
        JUNO/LHAASO 读出模块升级的实现 15m
        ![enter image description here][1]摘要:本文介绍了对LHAASO DAQ软件的读出模块进行升级的相关工作。LHAASO和JUNO采取的是开发一套通用DAQ软件的研发策略。在LHAASO原来读出模块的基础上,对读出和预处理过程进行了解耦合,并采用了epoll IO多路复用的读出方式。以增加读出线程的响应实时性,并增加对不同吞吐情况的适配性,提高并行度,更合理的使用CPU资源,以便将来复用于其他大型高能物理实验取数中。 读出模块是数据流软件的重要组成模块,主要负责读出电子学数据,将读出的数据进行时间分片(预处理)产生一个时间片TFID, 并根据TFID将各个通道的数据进行一级组装。读出模块由于直接与电子学接口,且电子学通道数多,其响应和吞吐性能都是非常重要的关注指标。 LHAASO 目前的读出模块对每个通道采用1个线程读出, 并且在同一个线程里完成读出、预处理和一级组装。这样的读出方式可能存在潜在的问题,如果电子学通道数很多,仍然需要给每个通道开一个线程来进行读出,这样每个线程的利用率不高,且会增加调度的开销。读出和预处理共用一个线程,可能会增加读出的响应时间,在网络抖动大时,可能会造成电子学丢数。并且随着服务器硬件核数的增加,软件的设计也应该提高并行度,来更好的利用CPU资源。因此,读出模块需要进行升级。在原来读出模块的基础上,将读出和预处理过程进行了解耦合,读出、预处理和一级组装设计成三个并行的子模块,采用数据驱动的方式工作。读出模块使用了更加高效的epoll IO多路复用的读出方式,一个线程可以读出多个通道的数据。读出和预处理解耦合,各自工作在不同的线程,使得读出线程不受干扰,响应更加及时。 针对江门波形数据开发了读出子模块和数据源。 目前,升级读出模块的设计和实现已经基本完成,还在继续进行调试和部署多节点运行中。目前的测试中,单个读出节点的测试表明,读出性能可达到2.9GB/s.同时,位于江门现场机房的大规模部署和测试正在进行中。 关键词:JUNO/LHAASO实验;数据获取;读出模块; 并行; 响应
        Speaker: Dr Tingxuan zeng (Dr)
      • 3:00 PM
        基于神经网络与探测数据的辐射场分布快速反演方法 15m
        $\qquad$随着核能与核技术利用的快速发展,辐射防护愈发重要,尤其是从事辐射作业人员的辐射安全。为降低辐射场中作业人员的累积剂量,可通过预先模拟计算、辐射剂量仪探测等方法,评估作业过程中人员累积剂量,为优化作业方案提供参考。为了得到准确的辐射场分布,传统方法中常用的是蒙特卡罗模拟方法,但是蒙卡计算耗时长,无法快速获得结果,因此在一些应急场景下无法使用。点核积分法计算速度快,但需要对放射源系统的结构信息较为清楚,对于放射源内部结构未知的情况不适用且偏差较大。使用辐射剂量仪进行实地探测是最为贴近真实情况,但多次探测会增加额外的剂量,因此,快速预先反演作业区域的辐射分布对作业方案设计具有重要意义。 $\qquad$本文发展了基于神经网络与探测数据的作业区域辐射场分布快速反演算法,实现在固定空间屏蔽条件下,基于少量辐射探测点数据,通过神经网络快速反演整个作业区域的辐射场分布。该方法首先针对作业环境及屏蔽结构进行三维建模,使用蒙特卡罗粒子输运软件SuperMC,针对不同源项的情况,进行蒙特卡罗计算得到多个不同的辐射场分布结果,其中不同源项可包括放射源强度、位置的不同。然后将计算结果以8:2的比例构建训练集和测试集,以训练集中部分计算结果数据作为输入,以作业区域整个辐射场分布数据作为输出,训练神经网络,并在测试集上进行测试。通过将反演的辐射场分布结果与蒙卡计算的整体结果对比优化,研究确定了神经网络不同参数以及层数结构和检测点位置个数对结果的影响。最后取实际场景中少量的探测数据,使用辐射探测仪在部分关键位置点进行探测,通过该方法快速反演整个区域辐射分布。 $\qquad$本文在简单场景和复杂场景下做多次测试,该方法反演结果误差在可接受范围内,耗费时间大幅降低,神经网络所需时间达到秒级,远小于蒙特卡罗模拟时间。该方法实现固定场所的辐射分布快速反演,能够为辐射作业方案设计优化提供参考,优化人员作业时间,对保障人员辐射安全具有重要意义。
        Speaker: 然 张 (安徽大学)
        Paper
      • 3:15 PM
        The environmental monitoring system of instrument based on EPICS 15m
        中国散裂中子源(CSNS)是利用中子研究物质微观结构和运动的重要科学设施,主要由质子加速器、中子靶站和中子散射谱仪等三大部分组成。中子散射谱仪是中子散射的实验装置,通过探测器电子学等精密设备获取实验数据从而分析得出实验结果,保证设备良好的运行状态对于实验结果至关重要。精密设备对运行环境要求较高,为保证设备的运行状态需要实时监测其运行环境。 本文设计并实现了基于EPICS的谱仪运行环境监测系统,能够在实验过程中实时监测散射室和机房的设备运行环境。将谱仪运行环境监测接入散裂中子源靶站谱仪的全局控制系统中,可及时避免环境变化对设备运行的影响,保证实验结果的准确性。 基于EPICS的谱仪运行环境监测系统结构如图1所示,多个环境监测传感器通过RS485总线连接至环境监测盒,环境监测盒读取传感器数据,然后将其以PV量的形式传递至EPICS网络中,环境信息经过处理后以曲线形式展示其实时变化,并将数据保存至数据库,用于分析长时间内整体环境的变化情况。环境数据可选择的显示方式包括:谱仪本地控制室界面显示和远程综合报警平台显示。 图1环境监测系统结构图 环境监测盒内部结构如图2所示,用于接收传感器信息,并通过将环境数据作为PV量发送至EPICS网络,同时显示在前面板的显示屏上。 图2 环境监测盒外观 环境监测系统部署的重点在于传感器的布点及走线,需要根据被测环境的实际情况结合工程需求进行设计。该系统可选的环境监测内容包括:温度、湿度、氧气含量、烟雾、灰尘、噪音等。目前该系统已部署应用在多物理谱仪上,以此为例对环境监测系统的实现进行简要说明。 多物理谱仪的散射室和机房属于密闭空间,除了要保证各类精密设备运行在合适的温湿度环境下,还需要考虑到工作人员在散射室正门和顶部换样门操作时的安全问题,故需要布置温度、湿度、氧含量传感器对环境进行监测。图3是多物理谱仪的传感器布点及走线示意图。 图3 多物理谱仪的传感器布点及走线示意图 传感器通过弱电桥架走线接入机房,再从静电地板下接入机柜中的环境监测盒。通过铸铝接线盒将RVV4*0.5规格电缆连接并用螺丝固定于墙面,墙面使用PVC线槽固定电缆至弱电桥架,电缆末端通过环形公制连接器接入环境监测盒。 环境监测系统部署完成后,环境信息进入靶站实验全局控制系统,实现本地显示报警、远程显示报警并将数据保存至靶站数据库。图4是多物理谱仪环境监测系统的远程显示。 图4 多物理谱仪环境监测显示 目前基于EPICS的谱仪运行环境监测系统已经成功应用在散裂中子源的多物理谱仪上,实现了该谱仪运行环境的远程实时监测及环境异常报警。下一步计划将该环境监测系统推广使用到散裂中子源其他谱仪及靶站大厅中,实现对靶站谱仪的全局环境监测,保证设备的良好运行环境。
        Speaker: Mrs 晓庄 王 (中国科学院高能物理研究所东莞研究部)
        Paper
    • 2:00 PM 3:30 PM
      科学数据存储与管理
      • 2:00 PM
        备份系统在高能物理中的应用和发展 15m
        高能物理实验每年产生大量的数据,其中有些特别重要的数据,比如用户处理数据的作业脚本,数据分析后的结果和记录数据信息的mysql数据库等都需要定期进行备份,以避免发生软硬件故障时导致的损失。高能物理实验数据量的快速增长也意味着重要数据的数据量也越来越大,从之前的KB、MB到现在的GB、TB数据级。为了有效完成这些重要数据的备份和恢复,备份系统也从Amanda备份系统转换到Restic备份软件,并基于Restic备份开发了并行备份的方式,有效地减少备份总时间和备份占用空间,提高了数据备份和恢复的效率。
        Speaker: Mrs qiuling yao (ihep)
      • 2:15 PM
        基于Rucio的JUNO数据管理系统的应用和研究 15m
        Rucio是一个可由用户自定义策略以实现组织、管理和访问大规模科学数据功能的软件框架。整合来自不同存储技术和网络连接技术的数据成一个整体,Rucio可以管理分布式的、多存储类型的数据站点。相比于传统分布式数据管理系统,Rucio提供了一些高级特性如:分布式数据恢复、自适应的数据复制以及高度量化、模块化和可扩展性的数据管理。Rucio最先在ATLAS实验上开发和应用,后来也逐渐应用在LHC的其他实验和各种其他科学数据管理中。 江门中微子实验(JUNO)计划使用DIRAC作为分布式计算平台,DIRAC是一个整合分布式计算资源和存储资源的“中间层”软件框架。考虑到Rucio在数据管理系统上的优秀特性,我们计划将Rucio作为数据管理组件整合进JUNO-DIRAC中。为此我们设计了松结合和紧结合的两步整合计划。松结合将DIRAC作为Rucio的用户,DIRAC将数据传输任务提交给Rucio,这样的整合能够利用Rucio高效的自适应数据复制功能应对原始数据和生产数据的大批量传输和监控任务;紧结合将Rucio作为数据管理组件整合进DIRAC替代原数据管理组件,从而利用Rucio的模块化和高扩展性的优势使之成为DIRAC数据管理的主要工具。
        Speaker: 玄同 ZHANG (IHEP)
      • 2:30 PM
        高带宽高通量数据中心网络的流量分析方法研究 15m
        中国科学院高能物理所计算中心,承担了高能物理海量数据的处理工作。本地计算系统是一个批作业系统。该计算系统采用HTCondor实现计算资源的调度和管理、采用EOS/Lustre实现数据存储和访问。数据中心网络是采用机框式双核心加10G/25GToR构成星型拓扑的大二层网络。骨干链路聚合带宽为8*100G。在高能所数据中心网络环境中,批作业在骨干链路上产生的流量峰值已经达到了350Gbps。高带宽、高通量数据中心网络中的超大流量给流量获取和分析带来了挑战,传统的基于SNMP、gRPC等技术实现的流量监测,只能基于网络设备的端口计数器,进行总体流量的监控,无法对流量构成进行分析和研究。基于镜像、sflow等方法实现数据采集,虽然可以实现对流量构成的分析,但是要实现全拓扑的流量监控,设备能力、数据分析能力面临很大的挑战。为实现全拓扑流量采集和分析,掌握数据中心网络的流量构成、分布和运行特征,本文提出一种实现方法,该方法通过在操作系统层面部署软件采集每个socket的流量;通过网络扫描发现主机的流量路径;并将二者相结合实现从主机、应用、网络拓扑以及时序等多维度的分析网络流量的构成、分布和运行动态,揭示高能物理计算系统在数据中心网络中产生的流量的运行规律,为数据中心网络的运行和优化提供决策依据。该方法解决了高带宽高通量数据中心网络的全拓扑流量获取的难题,并且能够在一定粒度上实现了对流量构成的分析和基于应用的流量运行动态展示。
        Speaker: Mr Tao 崔涛 (高能所)
      • 2:45 PM
        高能物理通用数据传输系统设计与实现 15m
        近年来,高能所主导建设的大科学装置越来越多,这些大科学装置有异地建设的特点,所产生的的原始数据需要传输到高能所计算中心进行离线分析和处理,为了满足这些实验的数据传输需求,设计并实现了通用的高能物理数据传输系统。介绍了系统的总体设计架构、各模块功能以及详细设计方案,同时介绍了与其他系统之间的接口设计与方案。最后对系统原型进行了测试与性能分析。
        Speaker: Ms 珊 曾 (高能所)
      • 3:00 PM
        同步辐射光源图像智能压缩方法 15m
        在建的高能同步光源装置预计每天产生的数据量可达到200TB,峰值可达500TB,其中占比最高的部分为硬X射线成像线站产生的图像数据,这些图像具有高分辨率和高帧率的特点。海量图像数据的产生给存储和传输系统带来极大压力,而传统图像无损压缩方法如JPEG2000、JPEG-LS等对于光源图像压缩结果不佳,仅能节省30%左右的存储空间。因此本文提出一种面向同步辐射光源图像的智能无损压缩方法,通过挖掘图像序列的线性相关性与非线性相关性,进一步提升光源图像的压缩效果,节省存储空间。首先通过差分减少图像序列内部线性相关性,其次,本文提出一种可逆的截断映射有效缩小像素值分布范围,然后通过神经网络学习图像序列内部的非线性相关性,最后本文提出概率距离概念以排名作为最终压缩流,代替概率分布结合算数编码的压缩方式,达到加速编码的目的。基于上海同步辐射光源图像的实验结果表明,本方法相较于JPEG2000、JPEG-LS以及lstm-compress等无损压缩方法能够达到20%以上的压缩效果提升。
        Speaker: Ms Shiyuan Fu (IHEP)
      • 3:15 PM
        中国散裂中子源存储系统的现状及规划 15m
        中国散裂中子源(CSNS)是中子散射研究和应用的平台。中国散裂中子源主要由质子加速器、中子靶站和中子散射谱仪等三大部分组成,用经加速器加速的高能质子穿过质子束窗进入钨靶,重金属原子核在高能质子的轰击下发生散裂,释放出中子,形成中子束流,经慢化器慢化的热中子穿过生物屏蔽体内的中子孔道到达中子散射谱仪。多学科用户可利用中子谱仪研究探索物质的微观结构。CSNS已开放通用粉末谱仪、多功能反射仪及小角中子散射仪三台谱仪。前端CTRL、DAQ、SE、T0数据经过kafka最终转存为Nexus文件存至中央存储。当前中央存储的实验数据量约为每年百TB级别,随着能量分辨中子成像谱仪等多台谱仪的建成使用,计算和存储需求不断增长,2023年中央存储的实验数据量将增长数十倍,预计超过4PB/年。当前CSNS的实验数据、模拟数据、用户home目录及云平台的后端存储均为同一套gluster系统,此套系统存在耦合度较高,写性能较差等问题。为解决现有存储存在的问题及满足后续的需求,进行了中央存储系统的整体规划和建设。为降低存储系统的耦合度,针对各业务特征分别进行技术选型和系统建设。除CSNS建设的存储资源外,目前东莞大科学数据中心提供了6PB的文件系统存储资源及1PB的块存储资源。整合所有的存储资源,实验数据、模拟数据的存储规划使用分布式文件系统lustre,用户home目录数据规划使用华为oceanstore全闪存系列文件系统。为降低云平台的耦合度,规划将数据分析服务和公共信息服务分离开,两套云平台的后端存储分别使用Fusion storage和ceph。另外,东莞大科学数据中心文件系统o9000将存储模拟数据并作为各重要数据的备份。为进行数据的长期保存和读取,采用基于磁盘-磁带模式的分级存储系统,规划基于castor进行分级存储系统的开发。本文将具体介绍各系统的选型原因、测试结果及现状,并介绍和存储系统相关的用户权限控制和系统监控。
        Speaker: 陈娟
    • 3:30 PM 4:00 PM
      茶歇
    • 4:00 PM 5:30 PM
      核电子学与探测技术: IV
      • 4:00 PM
        江门中微子实验高压控制系统GCU的数据采集实现 15m
        摘要:江门中微子实验(JUNO)是由我国提出、设计、主导的新一代中微子实验,目的是确定中微子的质量顺序,精确测量中微子振荡参数,以及其他多项科学任务。该实验探测器主体包括:有效靶质量为2万吨的液体闪烁体中心探测器,含有17612个20英寸PMT(Photomultiplier tube)和25600个3英寸PMT;在中心探测器外围还有水切伦科夫探测器,以及顶部径迹探测器。PMT用于探测液闪中产生的光子,并将光信号转换为电信号传递给前端电子学。GCU(Global Control Unit)作为前端读出电子学的核心控制器,可以控制嵌入在前端电子学中的高压模块监控每一个PMT的高压。此外,GCU上所部署的IPBus协议,使软件可以通过以太网直接进行访问。由于PMT上所施加的高压是影响探测器性能的因素之一,需要对上万个PMT的高压状态进行长期监测和控制,记录数据,当有异常时能够及时发出警告。本文调研了高压模块的读出方法,测试了GCU通过IPBus的传输性能,构建了基于高压模块的输入输出控制器(IOC),在单机上实现了监控高压和记录数据的功能,探索了大规模监控的技术路线,为后期大批量的系统测试联调提供了必要的参考。
        Speaker: 小川 谢 (广西大学)
      • 4:15 PM
        EAST上光学等离子体边界成像系统的设计实现及初步测试 15m
        托卡马克是目前的使用磁约束实现可控热核聚变的装置中最有希望的。等离子体位置和形状的测量与控制是托卡马克装置运行的关键。目前托卡马克装置形位控制主要使用电磁测量方法,而在电磁测量方法中,积分器的缺陷(运放的偏置、电容器的漏电流等造成长时间积分数值的漂移)和真空室复杂的内部结构引起的局部磁场变化(如涡流)会对磁探针信号产生一定的影响。随着托卡马克放电时间的延长,引起的电磁测量方法误差越来越明显。因此,有必要探索新的诊断方法来重建等离子体边界。光学信号不受托卡马克复杂的电磁环境影响,也避免了积分器造成的信号飘移,因此具有很好的应用前景。 本研究设计并实现了一个光等离子体边界重建系统,通过光学方法独立地重建等离子体边界。设计了一套折叠式光学系统,此光学系统在制作和组装之后,图像径向畸变小于10%,在全视场中实现了4mm的分辨率,在安装$H_ \alpha$滤光片后,在此波段的能量透过率约为32%。在系统安装到EAST装置后,通过标定得到摄像机内部参数和摄像机与托卡马克的相对位置。经过$H_ \alpha$滤光片滤波之后,在放电过程中可以清晰地看到等离子体边界周围的发光特征。 基于前期标定数据探索了等离子体边界重建算法,并在等离子体控制点rin(高场边z=0的等离子体边界位置)处进行了验证。在2021年EAST实验中连续多次放电实验中,rin随时间的变化图像与EFIT结果吻合良好,变化趋势一致,坐标值差距稳定在1-2cm之间。实验结果表明,该系统在长时间放电的形位控制中显示出良好的潜力。
        Speaker: 明 陈 (中国科学院合肥物质科学研究院)
      • 4:30 PM
        一种适用于高通道数和高事例率下的高能物理实验软件触发算法 15m
        在高能物理实验中,数据获取系统(DAQ,Data Acquisition)是获取物理数据的重要一环。实验中所有数据,包括探测器产生的物理信号数据和运行控制的监控数据,都可能需要汇集在DAQ系统中。随着高能物理实验规模的扩大,实验中使用的探测器和相应的电子学通道数目都在增加,DAQ系统的数据处理压力也不断增大。同时,为了增加实验效率,增大事例率,越来越多的实验开始考虑 triggerless 的实验装置。无触发系统移除了物理硬件实现的触发系统,直接在数据获取系统中使用软件和触发算法的方式实现触发系统筛选满足物理条件的好事例,压缩本底事例的功能。这无疑进一步增加了数据获取系统的数据处理压力,降低了数据处理的实时性,增加了数据处理的时间和中途故障丢数的风险。故此,对triggerless 的实验装置来说,好的软件触发算法将极大的提升数据获取系统的数据处理时间,能够更快的将数据存盘而降低有效物理数据丢失的风险。同时,系统资源使用少的算法,也能降低整个DAQ服务器节点的使用数目,降低实验的硬件成本。 本文介绍了目前无触发数据获取系统(以LHAASO为例)常用的 N-hit 软件触发算法,分析了算法的时间复杂度。研究了 N-hit 算法在处理大通道数和高事例率场景下性能下降的原因,并提出了一种在大通道数和高事例率场景下仍有优势的 Fill-table 算法。Fill-table算法的核心思想是通过使用一个触发表,以空间换时间的方式节省下N-hit算法需要对数据排序的时间,从而更加高效的处理大通道和高事例率情况下的软件触发速度。不过面对通道数少,事例率低的条件,Fill-table算法的优势并不明显。除此之外,Fill-table算法解决了 N-hit 算法不易于并行计算的缺点,可以通过通道级别的并行计算减少算法处理的总时间,对于有高实时性要求的实验系统很有帮助。
        Speaker: 宇 彭 (中科院高能物理研究所)
      • 4:45 PM
        GECAM卫星溴化镧晶体性能研究 15m
        引力波暴高能电磁对应体全天监测器(Gravitational wave high-energy Electromagnetic Counterpart All-sky Monitor, 简称GECAM)卫星是专门探测引力波高能电磁对应体(简称引力波伽马暴)的小型空间科学探测项目。GECAM项目由两颗微小卫星组成,两颗卫星运行于相同轨道面内,且轨道相位相反,从而两颗卫星形成对全天的完整覆盖监测,每颗卫星的有效载荷包括25个伽马射线探测器(GRD)。GRD设计使用3英寸直接的溴化镧晶体作为伽马射线探测灵敏材料,后端耦合硅光电倍增管进行读出。 溴化镧(LaBr3)闪烁晶体具有高光产额、高密度以及发光衰减时间短的优点,同时溴化镧晶体极易潮解需要封装使用。使用放射源对GECAM卫星所有的溴化镧晶体进行了性能测试,并根据晶体的掺杂类型进行了分类,对65个交付的溴化镧晶体本底类型进行了初步分类,包括以下4个类型,1.低本底型,2.中本底类型3.中本底类型2,4.高本底。 对溴化镧晶体的辐照性能进行了测试研究。测试结果表明,溴化镧晶体的性能符合设计要求,能量分辨<6@662keV,满足设计使用要求。在晶体的抗辐方面,使用Co60放射源对晶体进行了辐照性能测试,从测试结果看,160krad累积辐照后,经过较长时间的退激发,溴化镧晶体对662keV(用Cs137源进行测试)的试验前后峰值变化小于20%,符合空间环境条件下(在轨三年)的使用要求。不同晶体的性能衰退显示出不同的结果,表明溴化镧晶体不同组成成分及掺杂比例,对晶体抗辐照性能有不同的影响。从辐照试验前后的测试看,溴化镧晶体辐照后,晶体短期内(几天至十几天内)存在活化激发的问题,辐照后晶体自发荧光,主要会导致低能端x射线探测存在问题。在轨运行后,由于晶体平均每天的辐照剂量约150rad,是目前辐照试验最小辐照剂量的1/60,因此一般情况下在轨不存在晶体活化激发的问题,但仍然需要控制晶体的组分及掺杂等晶体生长工艺,对项目使用的晶体进行抽样辐照检测,符合空间应用要求。
        Speaker: 正华 安 (高能所)
      • 5:00 PM
        白光MTPC原型数据获取软件的实现 15m
        **摘要** 精确的中子核反应数据对核天体物理大爆炸核合成模型研究、新一代快堆和加速器驱动嬗变研究装置等核工程、新一代半导体抗辐照设计及中子治疗等领域都具有重要意义。国际上对核数据测量的研究已经开展了八十余年,从最开始的ORELA、GELINA等基于电子束的白光中子源,到LANL、CERN等基于高能质子束的白光中子源,基于强流高能量质子加速器的白光中子源逐步取代了基于电子束的白光中子源。中国散裂中子源(CSNS)白光中子束线的建成,以及具有高位置分辨、高能量分辨等特点的微结构气体探测器的发展,为解决我国的高精度核数据匮乏问题带来了曙光。 本实验中,利用6Li与中子发生带电粒子出射反应,采用MTPC进行出射粒子的径迹测量和种类鉴别,以获得相关核素的反应截面数据。这个实验是国内首次在核数据领域使用高性能TPC探测器。针对白光中子束线高通量、宽能量范围的特点,项目团队提出了原型MTPC读出电子学的全新方案。这将大大开拓我国核数据领域的测量手段并提高数据测量精度,并为后续更大规模的MTPC系统开发打下良好基础。 原型多用途时间投影室探测器(MTPC)数据采集系统主要包括:MTPC探测器、读出电子学及数据获取系统(DAQ)软件。本课题面向原型MTPC探测器和电子学开发数据获取系统软件,实现基本数据获取功能、在线数据处理,同时提供云端运行信息管理与图形化显示功能。未来,为了减少重复的工作,数据获取系统将会变得更加通用,那么功能的模块化将不可避免;随着越来越多国际合作的展开,更多的需求将会在线上展开,对于数据获取系统云端的设计与部署也是需要研究的方向。云端系统希望能为小型高能物理提供通用化控制、运行状态监测、报警与信息存储功能,缩短DAQ软件开发与部署周期。 关键词:白光中子束、MTPC探测器、原型数据获取软件、云端显示与控制
        Speaker: 张墨涵
    • 9:00 AM 10:00 AM
      会议总结
      Convener: Dr Gang Chen (IHEP)
    • 10:00 AM 11:00 AM
      闭幕式
    • 11:00 AM 5:00 PM
      返程