首页 科技周边 人工智能 新的「AI科学家」结合理论和数据来发现科学方程

新的「AI科学家」结合理论和数据来发现科学方程

May 18, 2023 am 10:49 AM
ai 科学

科学家们的目标是发现能够准确描述实验数据的有意义的公式。自然现象的数学模型可以根据领域知识手动创建,或者也可以使用机器学习算法从大型数据集自动创建。学界已经研究了表示相关先验知识与相关函数模型合并的问题,认为寻找与一般逻辑公理先验知识一致的模型,是一个悬而未决的问题。

IBM 研究团队以及三星 AI 团队的研究人员开发了一种方法「AI-Descartes」,通过将逻辑推理与符号回归相结合,能够从公理知识和实验数据中对自然现象模型进行原则性推导。

该研究以「Combining data and theory for derivable scientific discovery with AI-Descartes」为题,于 2023 年 4 月 12 日发布在《Nature Communications》。

新的「AI科学家」结合理论和数据来发现科学方程

人工神经网络 (NN) 和统计回归通常用于自动发现数据中的模式和关系。NN 返回「黑盒」模型,其中底层函数通常仅用于预测。在标准回归中,函数形式是预先确定的,因此模型发现相当于参数拟合。在符号回归(SR)中,函数形式不是预先确定的,而是由给定列表中的运算符(例如, 、-、× 和 ÷)组成,并根据数据计算得出。

SR 模型通常比 NN 模型更「可解释」,并且需要的数据更少。因此,为了从实验数据中以符号形式发现自然法则,SR 可能比 NN 或固定形式回归更有效;NN 与 SR 的集成一直是神经符号 AI 近期研究的主题。SR 的一个主要挑战是从许多适合数据的模型中识别出具有科学意义的模型。科学家将有意义的函数定义为平衡准确性和复杂性的函数。然而,对于给定的数据集存在许多这样的表达式,并且并非所有表达式都与已知的背景理论一致。

另一种方法是从已知的背景理论开始,但目前还没有实用的推理工具可以从一组已知的公理中生成与实验数据一致的定理。自动定理证明器(ATP)是使用最广泛的推理工具,它可以为给定逻辑理论证明猜想。计算复杂性是 ATP 面临的主要挑战;对于某些类型的逻辑,证明猜想是不可判定的。

此外,当涉及算术和微积分运算符时,使用形式推理工具从逻辑理论推导模型尤其困难。机器学习技术已被用于提高 ATP 的性能,例如,通过使用强化学习来指导搜索过程。

可推导的模型不仅要在经验上准确,而且它们应该是可预测的、有洞察力的。

IBM 研究团队以及三星 AI 团队的研究人员,试图通过将一种新颖的基于数学优化的 SR 方法与推理系统相结合,来获得此类模型。这产生了一个端到端的发现系统「AI-Descartes」,它通过 SR 从数据中提取公式,然后从一组公理中提供公式的可推导性的证明,或提供不一致的证明。当模型可证明不可推导时,研究人员提出了表明公式与可推导公式的接近程度的新度量,并且使用他们的推理系统计算这些度量的值。

新的「AI科学家」结合理论和数据来发现科学方程

图示:系统概述。(来源:论文)

在早期将机器学习与推理相结合的工作中,科学家使用基于逻辑的描述来约束生成图像的 GAN 神经架构的输出。也有团队结合机器学习工具和推理引擎,来搜索满足预先指定约束的函数形式。这是用新点扩充初始数据集,从而提高学习方法的效率和最终模型的准确性。也有团队还利用先验知识来创建额外的数据点。然而,这些研究仅考虑对要学习的函数形式的约束,并没有包含一般背景理论公理(描述现象中涉及的其他定律和未测量变量的逻辑约束)。

该论文的第一作者,三星AI 的研究科学家Cristina Cornelio 表示,AI-Descartes 提供了一些优于其他系统的优势,但它最显着的特点是它的逻辑推理能力。如果有多个候选方程可以很好地拟合数据,系统会识别哪些方程最适合背景科学理论。推理能力也使该系统有别于 ChatGPT 等「生成式 AI」程序,后者的大型语言模型逻辑能力有限,有时还会搞乱基础数学。

「在我们的工作中,我们正在将第一性原理方法与机器学习时代更常见的数据驱动方法相结合,这种方法几个世纪以来一直被科学家用来从现有背景理论中推导出新公式。」Cornelio 说, 「这种结合使我们能够利用这两种方法,并为广泛的应用创建更准确和有意义的模型。」

AI-Descartes 这个名字是对17 世纪数学家和哲学家René Descartes 的致敬,他认为自然世界可以用一些基本的物理定律来描述,逻辑推论在科学发现中发挥了关键作用。

新的「AI科学家」结合理论和数据来发现科学方程

图示:对系统实施的科学方法的解释。 (来源:论文)

该团队的研究人员已经证明,将逻辑推理与符号回归相结合,在获得有意义的物理现象符号模型方面有重要价值;因为它们与背景理论一致,并且在明显大于实验数据的领域中具有很好的概括性。回归和推理的综合产生了比单独通过 SR 或逻辑推理更好的模型。

单个系统组件的改进或替换以及新模块的引入,例如溯因推理或实验设计将扩展整个系统的功能。推理和回归的更深入集成可以帮助合成数据驱动和基于第一性原理的模型,并导致科学发现过程的革命。发现与先验知识一致的模型将加速科学发现,并超越现有的发现范式。

该团队使用模型对开普勒行星运动第三定律、爱因斯坦相对论时间膨胀定律和朗缪尔吸附理论进行了推导;研究表明,当使用逻辑推理来区分在数据上具有相似误差的候选公式时,模型可以从少量数据点中发现支配规律。

新的「AI科学家」结合理论和数据来发现科学方程

图示:相关集合及其距离的可视化。 (来源:论文)

「在这项工作中,我们需要人类专家以正式的、计算机可读的方式写下背景理论的公理是什么,如果人类遗漏了任何或弄错了其中的任何一个,系统将无法工作。」UMBC 化学、生物化学和环境工程助理教授Tyler Josephson 说,「在未来,我们也希望将这部分工作自动化,这样我们就可以探索更多的科学和工程领域。」

最终,该团队希望他们的AI-Descartes 能够像真人科学家一样激发一种富有成效的新科学方法。 「我们工作中最令人兴奋的方面之一是更够在科学研究方面获得重大进展的潜力。」Cornelio 说。

论文链接:https://www.nature.com/articles/s41467-023-37236-y

相关报道:https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html

以上是新的「AI科学家」结合理论和数据来发现科学方程的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1663
14
CakePHP 教程
1420
52
Laravel 教程
1313
25
PHP教程
1266
29
C# 教程
1239
24
全球币圈十大交易所有哪些 排名前十的货币交易平台2025 全球币圈十大交易所有哪些 排名前十的货币交易平台2025 Apr 28, 2025 pm 08:12 PM

2025年全球十大加密货币交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性着称。

比特币值多少美金 比特币值多少美金 Apr 28, 2025 pm 07:42 PM

比特币的价格在20,000到30,000美元之间。1. 比特币自2009年以来价格波动剧烈,2017年达到近20,000美元,2021年达到近60,000美元。2. 价格受市场需求、供应量、宏观经济环境等因素影响。3. 通过交易所、移动应用和网站可获取实时价格。4. 比特币价格波动性大,受市场情绪和外部因素驱动。5. 与传统金融市场有一定关系,受全球股市、美元强弱等影响。6. 长期趋势看涨,但需谨慎评估风险。

排名靠前的货币交易平台有哪些 最新虚拟币交易所排名榜前10 排名靠前的货币交易平台有哪些 最新虚拟币交易所排名榜前10 Apr 28, 2025 pm 08:06 PM

目前排名前十的虚拟币交易所:1.币安,2. OKX,3. Gate.io,4。币库,5。海妖,6。火币全球站,7.拜比特,8.库币,9.比特币,10。比特戳。

全球币圈十大交易所有哪些 排名前十的货币交易平台最新版 全球币圈十大交易所有哪些 排名前十的货币交易平台最新版 Apr 28, 2025 pm 08:09 PM

全球十大加密货币交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多种交易方式和强大的安全措施。

解密Gate.io战略升级:MeMebox 2.0如何重新定义加密资产管理? 解密Gate.io战略升级:MeMebox 2.0如何重新定义加密资产管理? Apr 28, 2025 pm 03:33 PM

MeMebox 2.0通过创新架构和性能突破重新定义了加密资产管理。1) 它解决了资产孤岛、收益衰减和安全与便利悖论三大痛点。2) 通过智能资产枢纽、动态风险管理和收益增强引擎,提升了跨链转账速度、平均收益率和安全事件响应速度。3) 为用户提供资产可视化、策略自动化和治理一体化,实现了用户价值重构。4) 通过生态协同和合规化创新,增强了平台的整体效能。5) 未来将推出智能合约保险池、预测市场集成和AI驱动资产配置,继续引领行业发展。

排名前十的虚拟币交易app有哪 最新数字货币交易所排行榜 排名前十的虚拟币交易app有哪 最新数字货币交易所排行榜 Apr 28, 2025 pm 08:03 PM

Binance、OKX、gate.io等十大数字货币交易所完善系统、高效多元化交易和严密安全措施严重推崇。

C  中的chrono库如何使用? C 中的chrono库如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono库可以让你更加精确地控制时间和时间间隔,让我们来探讨一下这个库的魅力所在吧。C 的chrono库是标准库的一部分,它提供了一种现代化的方式来处理时间和时间间隔。对于那些曾经饱受time.h和ctime折磨的程序员来说,chrono无疑是一个福音。它不仅提高了代码的可读性和可维护性,还提供了更高的精度和灵活性。让我们从基础开始,chrono库主要包括以下几个关键组件:std::chrono::system_clock:表示系统时钟,用于获取当前时间。std::chron

怎样在C  中处理高DPI显示? 怎样在C 中处理高DPI显示? Apr 28, 2025 pm 09:57 PM

在C 中处理高DPI显示可以通过以下步骤实现:1)理解DPI和缩放,使用操作系统API获取DPI信息并调整图形输出;2)处理跨平台兼容性,使用如SDL或Qt的跨平台图形库;3)进行性能优化,通过缓存、硬件加速和动态调整细节级别来提升性能;4)解决常见问题,如模糊文本和界面元素过小,通过正确应用DPI缩放来解决。

See all articles