近几年,量子计算已经从实验室内的科研工作部分转向了产业应用。如今已经可以通过互联网渠道直接使用到最先进型号的量子计算机。
本文从量子计算的发展讲起,并对现阶段量子计算机的组成,尤其是超导量子计算的实现进行介绍,并展示互联网上的量子计算机的使用方式以及经典与量子计算的融合计算形式。
最终,展望未来的量子计算形式,以及量子计算实现过程的设备需求、与现今各学科的交叉等。
Plasma disruption is a very dangerous event for future tokamaks and fusion reactors. Therefore, predicting disruption is crucial for ensuring the safety and performance of reactors. In this study, the features of two deep learning algorithms are integrated to establish a multi-scale hybrid network disruption predictor. Firstly, 43 diagnostic signals are extracted by a convolutional neural...
背景介绍 2012年在大型强子对撞机(LHC)上发现希格斯(Higgs)玻色子是粒子物理学界的大事件,该发现不仅补全了标准模型缺失的最后一角,而且开启了粒子物理探索的新篇章。由于WZH三种玻色子(尤其是希格斯玻色子)与新物理现象及新物理规律的联系十分密切,因此精确测量他们的性质,是探索新物理现象和新物理规律的关键手段。强子喷注是WZH三种玻色子最主要的衰变末态,因此喷注的重建(Clustering)和标记(Tagging)算法对实现WZH三种玻色子的精确测量至关重要。本文主要介绍喷注的标记算法。传统喷注标记算法有两种,第一种是基于选择条件和人工变量,第二种是基于传统机器学习算法,比如决策树(Boost Decision Tree,...
中国散裂中子源的二期工程项目中,使用了一套基于数据流的通用化框架作为所有束线谱仪的技术方案。这套全新规划的设计根植于中子谱仪的运行模式和数据特征,内容上涵盖了从底层硬件规范到上层应用拓扑的各个环节,旨在解决传统中子谱仪由子系统耦合复杂造成的低效状况,同时提供灵活多样的部署配置和便捷高效的运维管理。针对未来中子束流通量将大幅提升的趋势,新设计利用业界优秀开源工具,结合对硬件接口的规范和软件适配,实现了基于分布式消息网络的数据流处理平台,并进一步扩展EPICS控制、监测报警与显示服务等标准化接口,在确保系统稳定性和冗余性的基础上实现了全链条的数据处理服务,并达到了极高吞吐压力的承载性能。新的通用化设计框架大幅提升了中子谱仪的建设和运行效率,同时亦可有效降低部署和运行维护阶段的人力成本,其将是推动材料分析等相关学科和应用产业进一步繁荣发展的重要因素。
The rapid development of X-ray free electron laser (EFEL) facilities has opened a new paradigm of X-ray measurement. They can deliver ultra-short and coherent x-ray pulses with extremely high brilliance, thus enabling the observation of the physical and chemical behaviors in condensed matters and biomaterials, at high spatial and temporal resolution simultaneously. Shanghai HIgh repetitioN...
高能同步辐射光源(High Energy Photon Source,HEPS)是国内建设的首个第四代同步辐射光源,为我国材料科学、化学工程、能源环境、生物医学等众多领域提供了先进的实验平台。一期建设的十五条线站在运行期间预计每天总共会产生200TB至500TB的原始数据。HEPS所产生的数据具有数据量大、通量高、结构复杂等特点。因此,为了高效地利用数据,需要对这些海量数据从数据获取、存储、传输、利用到共享的全生命周期过程进行跟踪和管理。本文将着重介绍当前HEPS数据管理的关键技术实现以及相关进展,并讨论后续的发展方向。
随着容器应用范围越来越广泛普遍,成为高能物理实验中不可缺少的一部分,随之对容器镜像的管理要求越来越高,安全也更加严格。本文主要介绍实现高能物理容器镜像管理的方法、架构、安全以及典型的应用场景等。
1 引言
随着云计算、大数据、移动网络等信息技术的飞速发展和广泛应用,科研和管理信息化程度不断加深,充分借助信息技术,尤其是数字网络技术对档案内容信息以及相关衍生信息资源进行有效的组织、管理、存储和利用,已经成为新时期档案工作突破传统、创新发展的必经之路。2021年起正式实施的《中华人民共和国档案法》,明确要求推动档案信息化建设,开辟档案管理现代化新路径。同时,肯定了电子档案的效力与凭证价值,对电子档案管理信息系统、数字档案馆、档案信息资源共享服务平台建设提出了更高要求。
硬X射线自由电子激光(Shanghai HIgh repetitioN rate XFEL and Extreme light...
新一代同步辐射光源装置在X射线亮度与相干性、光学元件与探测器效率上获得了极大提升,所开展的成像实验向跨尺度、多模态、高通量与原位动态化表征模式转变,实验数据的年底通量将正式步入“Exascale”时代,对实验控制、数据采集、在线重建和特征分割等方面的软件技术与算法需求发生了革命性的变化。在建的北京同步辐射(HEPS)光束线软件团队在高通量多模态成像实验数据采集与分析中结合了大型软件框架、大数据技术、AI工作流等方法的优势,以应对未来光源实验海量数据带来的挑战。
高能所计算集群长期为高能物理实验提供计算服务,拥有着大量的实验用户。随着实验规模的不断扩大以及用户量的增加,集群现有队列排队情况愈发严重。
为了解决本地集群资源紧张,排队久的情况,东莞大科学数据中心提供了18000个CPU核用于拓展高能所集群规模。考虑到高能所实验用户长期保持着使用集群提交计算作业的习惯,采用网格计算的方式很难在各个实验得以推广,因此本文设计并实现了基于集群的分布式计算。
...
江门中微子实验旨在测量中微子的质量顺序和精确测量中微子的振荡参数。该实验主要有探测器,电子学,数据获取,离线分析等系统的参与。读出模块是JUNO...
通过机器学习理解X 射线吸收谱:实验结果到理论计算的自动匹配
王可心,卢项尉,王天阳,陈留国,刘功发, 陈凯*
中国科学技术大学国家同步辐射实验室
Email: kaichen2021@ustc.edu.cn
过去十年,材料信息学显著加快了新材料性能的发现和分析。加速相关材料发现的关键因素之一是高通量实验中的动态数据分析,引发了对材料特性快速而准确的自动估计的需求。X 射线吸收光谱 (XAS) 是一种广泛使用的材料表征技术,用于确定氧化态、配位环境和其他局部原子结构信息。XAS 分析依赖于测量光谱与可靠参考光谱的比较。然而,现有的 XAS...
JUNO江门中微子实验是一项位于中国广东省江门市的大型中微子探测器项目。该项目旨在通过探测中微子的性质和行为,深入研究中微子的物理学和天文学问题,包括中微子的质量、振荡、CP对称性破缺等。江门中微子实验的运行离不开探测器,电子学,数据获取,物理分析等环节。
其中数据获取系统除了需要完成基本的取数功能以外,还必须对各个探测器以及其读出电子学的工作状态进行监测,快速识别和告知实验中可能的异常,值班人员可以随时随地监控DAQ系统的运行状态,及时处理运行过程中出现的问题。但当前各类数据信息分布在不同的平台,信息显示不全面,出现故障发现问题并不及时,因此为了减轻值班人员工作压力,提高远程工作效率,需要建立JUNO-DAQ的远程监控系统。
...
米清茹 陈广花 缪海峰 丁建国 阎映炳
(中国科学院上海高等研究院光源科学中心,上海 201204)
在当前中科院上海高等研究院光源科学中心已建和正在建设中的多个加速器工程中,运行环境是控制系统的运行平台和调试操作平台,运行环境的可靠性和稳定性是保证控制系统可靠稳定运行的必要手段,也是运行调试人员顺畅和安全操作的前提。为了满足7X24小时长期稳定运行的要求,主要采用虚拟系统来建立控制系统运行的平台。当前虚拟系统主要是商用的vmWare vsphere系统和开源的PROXMOX系统。本文主要介绍在硬X射线自由电子激光装置2号测试大厅中基于开源PROXMOX虚拟系统建立的加速器控制系统运行环境平台,包括虚拟网络、超融合存储系统、虚拟服务器和虚拟IOC的建立等,并探讨在加速器控制系统运行环境中两种虚拟系统的优劣势和未来应用。
江门中微子实验(Jiangmen Underground Neutrino Observatory,JUNO)位于阳江核电站和台山核站的中垂线上,实验使用的中心探测器位于地下700米,内部装有2万吨的液体闪烁体,能量精度到达3%。JUNO将通过实验获得的数据确定中微子质量顺序和中微子混合参数,并在其它交叉领域展开研究,为研究超出标准模型的物理学提供了机会。探测超新星中微子事件是JUNO实验的物理目标之一,由于超新星中微子事件30~40年才会发生一次,超新星中微子事件到来时数据获取(Data Acquisition,DAQ)系统在线软件稳定运行对获取超新星中微子数据十分重要,这对JUNO在线软件的可用性提出了较高要求。
在线软件要为JUNO...
作为我国第四代同步辐射光源装置高能同步辐射光源(High Energy Photon Source HEPS) 开展的实验将向高 数据通量 、 多模态 、 超快频率 、 跨尺度形式转变 所产生的年数据通量预计将迈入 「 Exascale 」 时代 。 另外 复杂多样的数据实验导致不同线站数据产生速率差异较大 。 面对如此高通量 、 容量
多样化的实验数据 数据处理软件需要能够调用可伸缩的分布式异构计算资源 提供不同规模的计算分析服务 。
随着我国空间项目的不断增多,科学应用部分的工作任务不断扩展,接口界面也不断增多,需要梳理各项功能和工作流程,在此基础上为建立比较综合的空间应用平台开展前期规划。
本报告对空间应用平台进行了需求分析,提出集中建设方案提供讨论。
Rucio是一个可由用户自定义策略以实现组织、管理和访问大规模科学数据功能的软件框架。整合来自不同存储技术和网络连接技术的数据成一个整体,Rucio可以管理分布式的、多存储类型的数据站点。相比于传统网格数据管理系统,Rucio提供了一些高级特性如:分布式数据恢复、自适应的数据复制以及高度量化、模块化和可扩展性的数据管理。Rucio最先在高能物理实验ATLAS上开发和应用,后来也逐渐应用在其他高能物理实验的科学数据管理中。
在使用网格框架分布式计算系统的国内高能物理实验中,JUNO、HERD、CEPC等实验都已经使用或有计划使用Rucio系统对实验数据进行管理。我们基于不同类型的实验对数据管理的不同需求,设计并开发不同的基于Rucio系统数据管理解决方案,实现了分布式数据统一命名、数据增删改查基础管理功能、多站点数据副本管理、原始数据分发管理、实验软件数据管理接口嵌入等功能或相关服务。
高能物理实验每年产生大量的数据,其中有些特别重要的数据,比如用户处理数据的作业脚本,数据分析后的结果和记录数据信息的mysql数据库等都需要定期进行备份,以避免发生软硬件故障时导致的损失。高能物理实验数据量的快速增长也意味着重要数据的数据量也越来越大,从之前的KB、MB到现在的GB、TB数据级。为了有效完成这些重要数据的备份和恢复,经过调研和对比,将开源备份软件Restic加入到高能所集群的备份系统中,用于解决TB级别的大容量文件目录的备份。基于Restic开发了策略初始化、定期备份、并行备份、镜像文件校验、日志采集、用户自主恢复数据等功能,有效地减少备份总时间和备份文件占用空间,提高了数据备份和恢复的效率。
环形正负电子对撞机(Circular Electron Positron Collider , CEPC)的实验计划包括在质心能量240...
磁带存储是目前高能物理数据长期保存的存储技术之一。随着磁带制造技术以及高能物理存储架构的不断发展,在高能物理中长期使用的 Castor 技术已经被新的磁带库存储系统 CTA 取代。为了满足不同实验对数据备份的需要,针对 CTA 系统,设计开发了通用的高能物理磁带库传输系统 CTS。本系统支持 LHAASO、BESIII、JUNO等实验的不同应用场景,结合 EOS 系统的WFE,自动化数据的归档和迁出,提高了数据迁移效率,有效保证了数据存储安全。
上海光源是中国大陆第一台中能第三代同步辐射光源,目前共有27条光束线39个实验站投入运行,至2025年将有35条光束线约50个实验站投入运行,已接待学界、产业界用户超过3.5万人。国家“十二五”重大科学基础设施建设项目上海光源线站工程配套建设的用户数据中心可提供超过20PB的统一存储空间,提供超900Tfloops的多节点CPU/GPU混合集群算力支持。上海光源同步辐射科学数据管理分析系统依托上海光源用户数据中心基础设施,从全装置层面布局核心数据库系统设计研发、高通量数据快速分析系统研发、数据自动处理流水线研发,以实现海量实验数据的全生命周期高效组织管理、高通量数据在线处理以及计算资源的高效利用,为上海光源用户提供“一站式”的数据服务,实现科学数据的长期价值与战略价值,加速装置和用户的科学产出。
随着第四代同步辐射光源的出现,以及高分辨探测器的发展,科学数据无论是在容量还是通量上都出现了数量级的增长。先进的数据处理和分析方法需要从底层技术进行革新,跟上数据增长的速度,并提供实时的快反馈和实验指导能力。同时随着新型先进实验方法的不断涌现,方法学算法及软件的发展需要底层软件框架的支持。为满足新一代光源实验的需求,HEPS计算与通信系统开发了面向先进光源实验的数据处理软件框架Daisy。本次报告将介绍Daisy项目的设计理念、开发进展及未来发展计划。
北京在建的同步辐射光源装置预计每天产生数百TB的数据量,每年的数据量达到PB量级,对IO、存储和科学计算带来极大压力。实验过程中需要在线处理用于快速判断数据采集质量,目前从磁盘读取海量实验数据读取存在严重的IO瓶颈,因此HEPS亟需稳定高效的IO方法克服以上困难,首先分析光源下计算任务的读取模式,结合HDF5分块存储特性,减少数据跳读,结合并行异步策略加速读写,减少IO在计算过程中的占比;其次通过压缩的方式减少数据体积,为保证数据完整性,压缩采用无损的方式,引入压缩会带来额外的时间和资源消耗,而不同的数据压缩效果也有所不同,所以,以加速整个科学计算为目标,综合评价引入压缩的提升,自动触发压缩过程及压缩方法。因此本文拟通过以上方法优化HDF5在HEPS科学计算过程中的IO速度,加速科学结果产出。未来以流处理的方式可以规避海量数据落盘再读取导致的IO瓶颈问题,因此最后本文首先介绍了未来H...
随着计算机技术、卫星导航技术的迅速发展,通过卫星传感器产生的数据已经达到TB级甚至PB级。目前,高能所参与了多颗天文卫星的研制和建设,包括硬X射线调制望远镜(Hard X-ray Modulation Telescope,HXMT)、引力波暴高能电磁对应体全天监测器卫星(Gravitational wave high-energy Electromagnetic Counterpart All-sky Monitor,GECAM)、增强型X射线时变与偏振空间天文台(enhanced X-ray Timing and Polarimetry...
中国科学院高能物理研究所是中国从事高能物理研究、先进加速器物理与技术研发与利用、先进射线技术与应用的综合性研究基地。
High Energy Institute(IHEP)的SSO (Sing sign on)系统用户超过2.2万,AFS (calculation cluster)用户3.2万,Web应用超过150个,客户端应用超过10个。随着高能研究所的发展,国际合作越来越频繁,高能研究所SSO系统应运而生。
IHEP的SSO系统联通了高能所所有应用和AFS用户帐户。并实现了中国认证联盟CARSI与国际认证联合会EduGain的接入,不仅实现了异地多园区统一账户管理,还逐步实现了国内高校与国际组织的认证。
格点QCD是在粒子物理“标准模型”理论框架下,研究强相互作用力的一种第一性计算的非微扰方法,也是在低能标度下唯一有效的数值模拟方法。格点QCD将闵可夫斯基时空上的量子场论问题转变为欧几里得时空上的统计问题,将时间和空间等同对待,将四维时空切分为有限的四维晶格。格点QCD计算应用中的热点模块集中于循环边界条件的四维超立方格子中的一个稀疏线性系统求解。该线性系统表现为四维八点的协变差分运算,即在任意点上,是该点以及与之相邻的8个点到该点的9个$12\times12$稠密复数矩阵计算。
本文介绍了一种基于结构网格数据结构的矢量化方案。在格点QCD计算过程中,涉及大量、同构、小型复矩阵的计算:大量是指要遍历所有网格点;同构是指每个网格点的数据结构和计算是相同的;小型复矩阵具体到格点QCD则为SU(3)矩阵。在这些计算中有的矢量化难以实现或效果较差,有的则是对较宽的矢量单元难以适用。...
像高海拔宇宙线观测站(LHAASO)、江门中微子实验(JUNO)的大型科学实验为了观测宇宙线或中微子等物理对象,以及伽马射电暴或超新星爆发等物理现象需要系统不间断运行。为了保障实验的长期稳定运行,需要在系统出现故障的时候,实验运行人员快速分析故障原因,修复故障并恢复实验运行。这些大型科学实验一般由数量庞大的探测器及电子学系统、复杂的交换机网络、多达百台计算集群组成的数据获取系统、离线存储系统组成。为了快速检测故障并对故障原因进行分析,设计了大型科学实验运行故障诊断系统。该系统通过收集来自探测器、电子学、数据获取系统的运行状态信息,实时检测链路状态,在发生故障时检测并快速分析故障原因,并及时提供给实验运行人员。此外,还可以按需分析指定时间段的历史数据,生成数据报表。
该系统的设计要求包含高吞吐、实时性、拓展性和可靠性。为了满足这些要求,该系统采用了分布式架构,将数据收集、数据处理、数...