Speaker
FU Shiyuan
Description
在建的同步辐射光源装置预计每年将产生高达数百PB的海量实验数据,其中占比最高的是硬X射线成像实验线站产生的图像数据。庞大的数据量为存储和传输带来极大压力,而压缩是降低数据量的有效手段,同时,为保证科学数据的完整性,压缩过程不可造成信息损失。通用图像无损压缩方法对该类图像压缩效果不佳,因此针对光源图像特性,提出一种面向同步辐射光源图像的智能无损压缩方法。首先,通过分区量化方法自适应确定像素值量化参数,提取对压缩结果影响较大的关键数据,有效降低像素值所占比特位数,同时设置占位符保证量化过程无损;其次,设计基于CNN的C-zip网络,作为高效的智能概率预测器,结合合理的训练及预测方法,有效缓解模型存储带来的数据膨胀问题;最后,提出概率距离的概念,进一步挖掘深度学习输出中有益于数据压缩的信息,提高编码并行度。基于上海同步辐射光源图像的测试表明,相较于通用图像无损压缩方法PNG/JPEG2000/JPEG-LS/FLIF,本算法可进一步将压缩比提升0.23-0.58。