天文学科研进展反复探究时序数据模型创造出多时标光变曲线生成工具

  • 天文图吧
  • 2025年05月13日
  • 近期,国家天文科学数据中心的研究团队由张震、许允飞、崔辰州和樊东卫等人主导,在光变曲线数据管理领域取得了重大进展。他们开发了一款名为“自定义时标光变曲线生成工具”(LCGCT)的软件,这项工作基于国家天文科学数据中心归档的MAXI、Fermi、TESS和EP等多个空间观测项目的数据,并引入了工业界新兴的时序数据库技术。相比于传统方法,无论是在存储空间占用还是检索速度方面

天文学科研进展反复探究时序数据模型创造出多时标光变曲线生成工具

近期,国家天文科学数据中心的研究团队由张震、许允飞、崔辰州和樊东卫等人主导,在光变曲线数据管理领域取得了重大进展。他们开发了一款名为“自定义时标光变曲线生成工具”(LCGCT)的软件,这项工作基于国家天文科学数据中心归档的MAXI、Fermi、TESS和EP等多个空间观测项目的数据,并引入了工业界新兴的时序数据库技术。相比于传统方法,无论是在存储空间占用还是检索速度方面,LCGCT都显著提升了性能。这项成果以“LCGCT: A light curve generator in customisable-time-bin based on time-series database”为题发表在国际顶级学术期刊《Astronomy and Computing》上,并且已经将该工具部署在NADC网站上供科研人员使用。

随着天文学从静态宇宙向动态宇宙转型,我们正进入一个时域天文学时代。在这个时代中,对光变曲线进行重采样操作是分析算法如flux-flux-plot (FFP) 和傅里叶分析的一部分。时间窗口(time-bin)的大小对于结果至关重要:若太小会导致信噪比不足;若太大则会淹没短时标暂现源信号。因此,有必要一种能够根据目标星体在特定时间尺度内自定义采样率的光变曲线生成工具,以优化暂现信号搜索、周期提取以及数据可视化。

面对海量数据时代,“检索-下载-分析”的传统模式已不再适用。为了减少数据传输,新一代科研平台正在采用“计算向数据靠拢”的策略。在处理大量多时标光变数据时,这种思想体现在需要在数据库模型层面实现重采样的功能,以提高计算效率。本次研究通过对InfluxDB、Timescale和TDEngine等多种工业界产品进行对比,最终选择TDEngine作为底层存储解决方案,并针对天文学中的光变曲线设计了特殊存储方案。

实验结果显示,该方案可以达到75%的压缩率,对于像MAXI这样的长时间轴光变曲线集表现尤其出色。此外,该方案也显著提高了查询效率,对于MAXI和EP探测器LEIA星系中的不同时间范围查询显示三倍以上提升。

这项研究为高分辨率光变曲线的大规模存储与快速检索提供了解决方案,将来LSST和其他类似望远镜投入使用后产生的大量时序资料也将受益于此。此外,该研究还为未来更先进科技,如AI驱动自动编码器,为日后的高效管理提供参考思路。