AI 找星星,发现了50颗

尽管取得了突破,但是,该算法仍处于早期阶段。在陈旧数据中找到错失的金子,提高了人类探索未知宇宙世界的效率。

图片来源@unsplash

图片来源@unsplash

文丨《亲爱的数据》出品,作者丨谭婧

找到”成千上万的候选行星,天文学家必须有能力将“真行星”与“假行星”分开。

考虑到许多天文学数据库的规模都大得惊人,区分并不是一件简单的事,但是,人工智能算法给此事带来前所未有的希望。

近日,英国华威大学的大卫·阿姆斯特朗博士(David Armstrong)领导的研究团队开发了一项新的机器学习算法,从美国航空航天局(NASA)的陈旧数据中,识别出太阳系外的行星。他们确认了50颗系外行星的存在,从海王星大小的气体巨行星到比地球还小的岩石世界,无所不包。

方法是,计算出每个行星的成为候选星球的概率。

历史上天文学家一般相信在太阳系以外存在着其它行星,然而它们的普遍程度和性质则是一个谜。直至1990年代人类才首次确认系外行星的存在,而自2002年起每年都有超过20个新发现的系外行星。

许多太阳系外行星调查都通过望远镜中的大量数据来搜索行星在望远镜与恒星之间通过的迹象,这就是所谓的过境。这会导致望远镜探测到的恒星发出明显的光线下降,但这也可能是由于来自背景物体的干扰,甚至相机中的微小误差所致。这些误报可以在行星验证过程中筛选出来。

华威大学(Warwick U)物理系和计算机科学系以及艾伦·图灵学院的研究人员建立了一种基于机器学习的算法,该算法可以在NASA的开普勒和TESS等望远镜任务发现的数千个候选行星的大样本中区分出真实的行星和虚假的行星。

AI算法接受了识别真实行星的训练,使用了两大已确认的行星样本和现已退役的开普勒任务的误报。

然后,研究人员在开普勒尚未确认的候选行星数据集上使用了该算法,产生了50个新的确认行星,其中第一个将通过机器学习进行验证。以前的机器学习技术只对候选行星进行排序,但从未自行确定候选行星是否是真正行星的概率,而这是行星验证的必要步骤。

通过确认这50颗行星是真实存在的,天文学家现在可以优先利用专门的望远镜对它们进行进一步的观察。

《亲爱的数据》出品

英国华威大学物理系的大卫·阿姆斯特朗博士说:“我们开发的算法可以让我们挑选50个候选行星进行行星验证,并将它们升级为真正的行星。”我们希望将这项技术应用于当前和未来的TESS和PLATO等任务中的大量候选样本。

天文学家有两种方法探测太阳系外的行星。一种是径向速度方法,它用来监测恒星是否有行星引力引起的小反运动。第二种是更敏感的技术, 也是凌日系外行星巡天卫星和开普勒采用的技术, 它主要依靠宿主星的亮度变化。

问题是,第二种方法产生了大量恒星的亮度数据,其中许多恒星不会有可见的系外行星。

于是,人工智能上场了。

阿姆斯特朗博士的学校个人网页上介绍:“我的兴趣之一是将机器学习技术应用于天体物理学问题。与计算机科学部门合作,将最新的机器学习技术应用于太阳系外行星。”

论文中也强调:“我们的算法模型只要短短几秒就能对数千个肉眼看不见的候选行星进行识别,确认其是否真的是行星。我们现在不仅能说哪些候选行星‘更可能’是行星,而是可以用确切的数据说明这种可能性有多大:如果候选天体是‘假行星’的可能性小于1%,就可以被确认为是真正的行星。”

《亲爱的数据》出品

阿姆斯特朗博士,谈道:“就行星验证而言,之前没有人使用过机器学习技术。机器学习已经被用于对候选行星进行排名,但从来没有在概率框架中使用过,而概率框架是你真正验证一颗行星所需要的。我们现在可以说出精确的统计可能性,而不是说哪些候选者更有可能是行星。如果一个候选行星的假阳性概率小于1%,它就被认为是经过验证的行星。”

华威大学的计算机科学系副主任、阿兰·图灵研究所(Alan Turing Institute)研究员Theo Damoulas博士说:

《亲爱的数据》出品

“机器学习,尤其适合这样一个激动人心的问题。

在天体物理学中,需要整合先验知识-阿姆斯特朗博士等专家和量化预测的不确定性。一个典型的例子,当额外的计算复杂性的概率方法取得显著的回报。一旦建立和训练好,该算法比现有的技术更快,而且可以完全自动化,这使得它非常适合分析在当前调查中观察到的潜在的数千个候选行星。

阿姆斯特朗博士补充说:“到目前为止,几乎30%的已知行星仅用一种方法就被验证了,这并不理想。仅仅因为这个原因,开发新的验证方法是可取的。但机器学习也能让我们做得非常快,更快地确定候选人的优先级。”

《亲爱的数据》出品

研究人员认为,它应该是未来用来验证行星的工具之一。​

根据新的研究,在所有确认的系外行星中,大约有三分之一是用单一的分析方法确认的,这并不理想。科学家们用已确认身份的系外行星数据和“假行星”的数据来训练神经网络(一种人工智能算法),这样能在新的数据中识别出那些明显的迹象(信号)。

新技术比以前的技术更快,可以自动化,并且可以通过进一步的"训练”加以改进效果。

阿姆斯特朗博士说:“我们仍然需要花时间训练算法,但一旦训练完成,在未来的候选人中应用它就会变得容易得多。你也可以结合新的发现来逐步改进它。像TESS这样的调查预计会有成千上万的行星候选行星,能够一致地分析它们是很理想的。像这样快速、自动化的系统可以让我们用更少的步骤验证行星,让我们做得更有效率。”

论文《利用机器学习验证系外行星:50颗新验证的开普勒行星》发表在《皇家天文学会月刊》上。阿姆斯特朗博士的研究得到了英国研究与创新部门科学技术设施委员会(STFC)通过Ernest Rutherford奖学金的支持。

GitHub上也有不少天文学软件包,比如,allesfitter,用于对光度和RV数据进行建模。它可以容纳多个系外行星,多星系统、星点、恒星耀斑和各种噪声模型。

《亲爱的数据》出品

尽管取得了突破,但是,该算法仍处于早期阶段。在陈旧数据中找到错失的金子,提高了人类探索未知宇宙世界的效率。验证行星的新工具问世了,新老方法共同为系外行星探索出力。

本文系作者 亲爱的数据 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2024-12-13 17:14

快报测试,定制专栏下的带图快报同步到微态度

2024-12-09 14:16

风清扬终下思过崖

2024-11-15 14:36

领克Z20开启先享预订,将于年内在国内上市

2024-11-15 14:33

广汽发布三年“番禺行动”:挑战 2027 年自主品牌销量 200 万辆,陆续推出 22 款新车

2024-11-15 14:31

日本央行行长下周一将发表公开讲话,市场关注是否暗藏加息线索

2024-11-15 14:31

日本央行行长下周一将发表公开讲话,市场关注是否暗藏加息线索

2024-11-15 14:27

《再见爱人4》成为了网络热议的焦点

2024-11-15 14:25

美团500万美元在烟台成立科技公司,含AI基础软件开发业务

2024-11-15 14:24

银行间现券午后多数走强,超长端回调

2024-11-15 14:24

纳斯达克100指数期货跌幅扩大至0.7%

2024-11-15 14:23

燃气股逆势拉升,凯添燃气涨超20%

2024-11-15 14:19

中央组织部从代中央管理党费中划拨2700万元支持四川、陕西防汛救灾抢险工作

2024-11-14 15:36

(每经)美国美国第三季度实际GDP年化季率初值为2.8%,预期3%,前值3%

2024-11-13 15:16

(每日经济)每日经济快报信息RSS屏蔽

2024-11-05 12:01

韩称已有10000名朝鲜士兵进入俄罗斯

2024-10-22 15:45

恒瑞医药公告,公司

2024-10-15 15:36

(每日经济新闻)恒瑞医药:海曲泊帕乙醇胺片药品上市许可申请获受理

2024-10-14 11:42

钛媒体App 9月25日消息

2024-10-14 11:19

钛媒体

2024-10-11 15:38

沪深两市今日成交额合计15720亿元,东方财富成交额连续3个交易日居首

扫描下载App