可跨學科理解、多尺度建模,MIT LAMM發布微調的大語言模型 MechGPT
編輯 | 蘿蔔皮
在過去的幾個世紀中,研究人員一直在尋找將不同領域知識聯繫起來的方法。隨著人工智慧的出現,我們現在有機會去探索跨領域(例如力學和生物學)或不同領域(例如失效力學和藝術)之間的關係
為了達到這個目標,麻省理工學院(MIT)原子與分子力學實驗室(Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人員利用經過微調的大型語言模型(LLM)來獲得多尺度材料失效的相關知識分子集
這種方法的步驟是先使用通用的LLM從原始來源中提取問答對,然後再對LLM進行微調。利用這個微調後的MechGPT LLM基礎模型進行一系列計算實驗,以探索其在知識檢索、各種語言任務、假設生成以及跨不同領域連接知識方面的能力
儘管該模型具有一定的能力來回憶訓練中的知識,但研究人員發現LLM 對於透過本體知識圖提取結構見解更有意義。這些可解釋的圖形結構提供了解釋性見解、新研究問題的框架以及知識的視覺表示,這些知識也可用於檢索增強生成。
研究以「MechGPT, a Language-Based Strategy for Mechanics and Materials Modeling That Connects Knowledge Across Scales, Disciplines and Modalities」為題,於2023 年10 月19 日發佈在《Applied Mechanics Reviews》。
對物理、生物和形上學概念進行建模一直是許多學科研究人員關注的焦點。早期的科學家和工程師往往深深紮根於從科學到哲學、物理到數學以及藝術的多個領域(例如伽利略·伽利萊、列奧納多·達·芬奇、約翰·沃爾夫岡·馮·歌德),但是隨著科學的發展,專業化在如今已經佔據主導地位。部分原因是跨領域累積了大量知識,這需要人類花費大量的精力去研究實踐。
現在,大型語言模型(LLM)的出現對科學研究的典範提出了挑戰。它不僅帶來了基於人工智慧/機器學習的新建模策略,還為跨領域連接知識、想法和概念提供了機會。這些模型可以補充傳統的多尺度建模,用於分析和設計分層材料以及力學中的許多其他應用
圖:工作流程示意圖。 (資料來源:論文)
在這裡,LAMM 的研究人員以最近提出的LLM 在力學和材料研究和開發中的用途為基礎,並且基於Llama-2 based OpenOrca-Platypus2-13B 的通用LLM ,開發了一個經過微調的MechGPT 模型,該模型專注於模型材料失效、多尺度建模以及相關學科。
選擇OpenOrca-Platypus2-13B 模型的原因是因為它在推理、邏輯、數學/科學和其他學科等關鍵任務上表現出色,能夠以適中的模型大小提供豐富的、可應用於多學科的知識和通用概念,並且具備高效的計算能力
LLM 在科學領域有著強大的應用。除了能夠分析大量數據和複雜系統之外,在力學和材料科學領域,LLM 用於模擬和預測材料在不同條件下的行為,例如機械應力、溫度和化學相互作用等。如早期工作所示,透過在分子動力學模擬的大型資料集上訓練 LLM,研究人員可以開發能夠預測新情況下材料行為的模型,從而加速發現過程並減少實驗測試的需要。
此類模型對於分析書籍和出版物等科學文本也非常有效,使研究人員能夠從大量資料中快速提取關鍵資訊和見解。這可以幫助科學家識別趨勢、模式以及不同概念和想法之間的關係,並為進一步研究產生新的假設和想法。
請看下圖,這是用於建立MechGPT的自回歸解碼器transformer架構概述。 (來源:論文)
在這裡,該團隊將重點放在後者的開發上,並探索MechGPT 的使用,這是基於Transformer 的LLM 系列中的一種生成人工智慧工具,專門針對材料失效和相關的多尺度方法進行了訓練,從而評估這些策略的潛力。
該研究提出的策略包括幾個步驟。首先是蒸餾步驟,研究人員使用LLM從原始資料區塊中提取的文字(例如一個或多個PDF檔案)產生問答對。接下來,在第二步驟中利用這些數據來微調模型。這項研究也特別訓練了初始的MechGPT模型,在材料失效的原子建模領域展示了其在知識檢索、通用語言任務和假設生成等方面的有用性
圖:所使用的建模策略概述。 (資料來源:論文)
這篇論文介紹了一個總體的建模策略,研究人員採用特定的語言建模策略來產生資料集,以從來源中提取知識,並利用新穎的力學和材料資料集對模型進行訓練。研究人員對MechGPT的三個版本進行了分析和討論,這些版本的參數大小從130億到700億不等,上下文長度超過10,000個token
在對模型、提示以及訓練方式進行一些一般性評論之後,研究人員應用該模型並在各種設置中測試其性能,包括使用LLM 進行本體圖生成和開發有關跨學科複雜主題的見解,以及代理建模,其中多個LLM 以協作或對抗的方式交互,以產生對主題領域或問題回答的更深入的見解。
圖:發展本體知識圖表示,以在超音速斷裂和蛋白質展開機制的背景下關聯超彈性。 (資料來源:論文)
同時,該團隊進一步提供了不同抽象層級的語言模型和多粒子系統之間的概念比較,並解釋瞭如何將新框架視為提取管理複雜系統的普遍關係的手段。
重寫內容:上圖展示了LLM和多粒子模擬之間的概念類比。 (圖源:論文)
總體而言,該研究提出的工作有助於開發更強大、更通用的人工智慧模型,這些模型可以幫助推進科學研究並解決特定應用領域的複雜問題,從而可以深入評估模型的性能。與所有模型一樣,它們必須經過仔細驗證,它們的有用性存在於所提出的問題的背景、其優點和缺點以及幫助科學家推進科學和工程的更廣泛的工具中。
而且,人工智慧工具作為科學探究的工具,必須被視為理解、建模和設計我們周圍世界的工具集合。隨著人工智慧工具的快速發展,它們在科學背景下的應用才剛開始帶來新的機會
論文連結:https://arxiv.org/ftp/arxiv/papers/ 2310/2310.10445.pdf
相關報告:https://twitter.com/llama_index/status/1723379654550245719
#以上是可跨學科理解、多尺度建模,MIT LAMM發布微調的大語言模型 MechGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au
