近年来,随着天文观测技术的进步,我们对系外行星的认识不断深化。系外行星探索已从单纯的发现转变为深入探究其大气和内部结构,以寻找可能适宜人类居住的行星,这涉及到“地球是否唯一”以及“行星如何成为生命摇篮”等重大科学问题。然而,如何准确快速地推断这些遥远世界的内部结构,依然是一个重大挑战。我们利用机器学习技术,在这一领域取得了重要突破。我们发表的系列研究成果展现了混合密度网络(Mixture Density Network, MDN)在预测岩石系外行星和气态巨行星内部结构中的强大潜力,并为系外行星研究带来了全新视角。
图1. 机器学习模型(系外行星的质量、半径、水冰壳层含量)在测试集上的预测表现,深色区域越靠近对角线,表明机器学习模型的预测效果越好。
从岩石行星到气态巨行星:机器学习应用的初探
了解岩石系外行星的内部结构是研究其宜居性的重要目标之一。行星的核心热状态以及表面的水含量等因素直接决定其宜居条件,这些信息对于寻找潜在的宜居行星至关重要。传统上,研究人员使用质量-半径曲线来推断行星的内部结构。然而,这种方法反演得到的内部结构存在很大的简并性,并且计算复杂、耗时,通常需要几个小时来得到一条曲线。在此背景下,我们提出了一种基于MDN的机器学习模型,旨在快速预测岩石系外行星的内部结构。我们利用行星的质量、半径和水含量,成功实现了对行星径向结构和核心热状态的高效预测(图 1),对于单颗系外行星,MDN模型只需几毫秒就能得出预测结果。
与岩石行星不同,气态巨行星在内部热状态方面表现出巨大的多样性,其内部性质变化范围广泛。举例来说,气态巨行星的核心包层边界压力值范围从10-2到104 Mbar不等。因此,相比岩石系外行星,对气态巨行星内部进行前向建模时存在更大的不确定性。面对这些挑战,我们仍然利用两层内部结构模型产生的数据集训练了MDN模型,可以很好的通过质量、半径和表面温度预测0.1到10个木星质量的气态巨行星的总重元素质量、固有有效温度以及核心包层边界的压力和温度(图2)。这一成果不仅扩展了MDN机器学习模型在不同类型行星中的应用范围,也为理解气态巨行星的形成过程和内部结构提供了新的视角。
图2. 左:气态巨行星内部结构示意图。右:MDN模型在测试集上的预测结果。
图3. MDN模型(系外行星的质量、半径、耐热元素丰度比Fe/(Mg + Si)、以及潮汐洛夫数作为输入)在测试集上的预测结果。
图4. 左:岩石行星内部结构模型、MDN模型和MCMC方法示意图。右:MDN模型和MCMC方法对Kepler-78 b内部结构反演结果对比图。
综合观测数据:多参数约束下的内部结构推断
随着研究的深入,为了减小内部结构的简并程度,我们探讨了其他重要观测量(如恒星耐热元素丰度比和潮汐效应)作为机器学习模型输入特征的可能性,并进一步完善了MDN模型。在新的研究中,我们利用新的内部结构数据集上训练了多个机器学习模型,来推断成分迥异的岩石系外行星内部结构。从图3可以看到,将行星质量、半径、耐热元素丰度比Fe/(Mg + Si)、以及潮汐洛夫数作为MDN模型输入,极大地提高了预测行星核心所处的热力学环境、幔层厚度和可能的水冰含量的精度。
机器学习与贝叶斯推断对比:效率与准确性的平衡
近几年,贝叶斯反演算法在推断系外行星内部结构方面取得了成功,通过提供模型参数(如层厚度和核心特性)的完整概率分布,并结合一些已知约束条件,实现了准确的内部结构推断。然而,这些贝叶斯计算通常使用计算密集且耗时的马尔可夫链蒙特卡洛(MCMC)方法进行。因此,必须计算成千上万个内部结构模型,导致单个系外行星的推断时间可能从数小时到数天不等。此外,将物理内部模型与MCMC反演方案结合需要算法和行星内部建模等相关的专业知识,这可能阻碍贝叶斯技术在系外行星内部研究中的广泛应用。鉴于系外行星观测数量的快速扩增,开发和实施更高效、更强大的推断方法变得至关重要。
我们之前的研究成果表明,MDN机器学习模型在预测系外行星内部结构方面表现优异,因此将MDN模型和MCMC的反演结果进行对比显得尤为重要。研究结果显示,MDN模型不仅能够快速提供内部结构的预测,而且在多数情况下,其精度与MCMC方法相当(图4)。尤其在处理大数据集时,MDN模型展示出其高效的计算优势,对于单个行星的结构推断可在1秒内完成,远快于MCMC方法需要的数小时或数天。此外,MDN模型表现出比MCMC方法更强的适应性。一旦MDN模型训练完毕,它就能成为一个易用的工具,即使面对显著改进的观测量,也能高效准确地表征行星内部结构。随着空间探测技术和任务的发展,大量观测数据将不断涌现,在这种情况下,MDN模型能够在面对更新的观测数据时高效地提供修正后的行星内部预测。
我们的系列研究表明,机器学习技术在系外行星内部结构预测中的应用前景广阔。詹姆斯·韦伯太空望远镜(JWST)的成功运行,不仅有望提高系外行星的探测精度、更新已有的观测数据(如质量和半径),还将帮助我们发现新的系外行星。在此背景下,机器学习技术因其能够快速解读JWST的新数据,而具有非常大的潜力。这将有助于我们更好地理解系外行星的形成过程和演化历史,从而进一步揭示宇宙中潜在的宜居世界。
以上研究得到澳门科学技术发展基金(0005/2019/A1、0002/2019/APD和0048/2020/A1)、澳门科技大学教师科研基金(FRG-23-005-SSI)、国家自然科学基金(12022517)和中国国家航天局民用航天技术预研究项目(D020308和D020303)的资助。
参考文献:
- Yong Zhao et al., Comparison of machine-learning and bayesian inferences for the interior of rocky exoplanets with large compositional diversity, ApJS, 2024.
- Yong Zhao et al., Machine-learning Inferences of the Interior Structure of Rocky Exoplanets from Bulk Observational Constraints, ApJS, 2023.
- Yong Zhao and Dongdong Ni, Understanding the interior structure of gaseous giant exoplanets with machine learning techniques, A&A, 2022.
- Yong Zhao and Dongdong Ni, Machine learning techniques in studies of the interior structure of rocky exoplanets, A&A, 2021.