近日,国家超级计算济南中心(以下简称“济南超算”)与齐鲁师范学院联合科研团队借助被誉为“中国天眼”的500米口径球面射电望远镜(FAST)合作发现一颗新的毫秒脉冲星,并被命名为PSRJ1810-0622。该毫秒脉冲星自转周期为4.55m s,根据银河系电子密度模型(YMW 16)估算,这颗脉冲星距离地球约208p c。该项研究由济南超算FAST联合研究中心科研团队在山河超级计算平台上计算筛选,是国家天文台-齐鲁师范学院-济南超算联合研究团队的首个重大成果,同时也是FAST基于山东省完全自有科研资源发现的首颗毫秒脉冲星。
脉冲星被称为20世纪60年代的四大发现之一
脉冲星被称为20世纪60年代的四大发现之一,是一种快速旋转的中子星,源于8-25倍太阳质量的恒星演化到末期经历超新星爆发而形成。中心的物质大约是一个太阳质量塌缩成中子星,其物质密度大约是水的密度千万亿倍。脉冲星的辐射来自其强大磁场的极冠区,每当中子星极冠转到地球视线方向,我们便看到其辐射信号。通过观测脉冲星的辐射信号,可以探测银河系中星际介质的分布和密度以及银河系的磁场分布与强度。此外,科学家们也在探索将脉冲星用于建立标准时间系统、检验爱因斯坦广义相对论和探测低频引力波信号等。在不到20年的时间里,脉冲星领域在1974年与1993年接连两次获得“诺贝尔物理学奖”。
在浩渺的宇宙中搜寻脉冲星并非易事。中国天眼FAST夜以继日地巡视着浩瀚星空,19路同时工作的超宽带接收机每秒接收到的宇宙电磁信号数据规模约为1.6GB,一天的数据量高达144TB,而每年则新产生约20PB的数据量,脉冲星的微弱信号便隐藏其中。传统的搜寻方法要求科研人员首先需要对这些数据进行消色散、匹配滤波等处理后,生成脉冲星候选体数据结果图,再通过肉眼辨识出隐藏在其中的真实脉冲星信号。而这样的传统搜寻算法存储吞吐和计算规模很大,得到的候选体数量庞大,搜寻效率相对较低。
济南超算支撑!关键算法加速比达22倍
现在虽然有国外开发的PRESTO等进行辅助预筛选脉冲星候选体的软件,但面对如此庞大数据量,这类软件也难以实时生成脉冲星候选体,同时随之而来的便是对算力需求的急剧增加。举例来说,PRESTO利用最常见的粗浅搜寻方法处理单个观测数据文件需要近几十个小时,若要进行更精细的搜索,那么所需的时间将会是数倍之多,且得到的候选体数量也有成千上万个。因此,如何有效地提高脉冲星数据筛选的速度和效率,使科研人员更快地找到真正的脉冲星信号,是一项极具挑战性的任务。
针对以上挑战,济南超算FAST联合研究中心的研究人员,对PRESTO脉冲星搜索软件基于山河超级计算平台移植进行算法改进和并行优化,利用多线程技术同时执行多个计算任务,充分利用多核资源提高计算效率,通过数据并行的方式将不同计算节点上的数据进行并行读取和处理,避免了数据瓶颈,提高数据访问速度,将计算过程划分为多个阶段,并通过流水线技术使数据在各阶段之间流动,提高整体计算的吞吐量和效率,使关键算法加速比达22倍,大大加速了数据分析的进程。同时,该研究团队将目标识别、图像分类等A I算法与天文射电信号处理知识相结合,利用ResNet模型筛选脉冲星候选体信息,通过对A I模型的一系列深度学习训练,有效实现全自动的基于A I的判别模型,准确率可达86.17%。A I初步筛选后脉冲星候选体观测量可降低到原来的29.07%,很大程度上降低了依赖人眼大量识图的数量。
济南超算正筹建国际领先的脉冲星数据库
新黄河记者了解到,济南超算科研团队还创新性研究开发了FAST脉冲星及快速射电暴筛图平台,并正在筹建国际领先的脉冲星数据库。该筛图平台利用投票池技术,解决了FAST脉冲星及快速射电暴在线筛选、候选体认证的存储和归档问题,实现了FAST信号图在线筛选、候选体存储、认证、归档管理。与传统筛选流程相比,该平台在w eb上即可登录使用,增加了更多用户交互,实现了多人筛选投票,提高了筛选正确率,降低了脉冲星的筛选流程繁琐程度,且系统提供了对投票池任务列表的数据统计分析,无需人工再进行复杂的数据分析统计工作。
利用FAST脉冲星及快速射电暴筛图平台,济南超算对“中国天眼FAST多科学目标同时扫描巡天项目(CRAFTS)”脉冲星做认证的后随格网观测的约500TB存档数据,利用A I算法对产生的海量图片进行智能筛选,历经一年的攻关,最终找到219个候选体,并在这些候选体中首个认证了这颗新脉冲星PSRJ1810-0622。