學而思研發面向全球數學愛好者大模型MathGPT
近日,在各家大廠打得如火如荼的「ChatGPT大戰」中,學而思也加入其中。
不過,學而思另闢蹊徑選擇的是自研數學大模型“MathGPT”,以數學領域的解題和講題演算法為核心,並且已經取得了階段性成果。
對此學而思表示,基於此自研大模型的產品級應用預計會在年內推出,將面向全球數學愛好者和科研機構。
作為公司的核心項目,學而思早在今年春節之前就啟動了相應的團隊建設、數據、算力準備和技術研發,並直接交由CTO田密負責。
此外,位於美國矽谷的團隊建設目前也已經啟動,計劃成立一支海外演算法和工程團隊,在全球招募優秀的人工智慧專家加入。
MathGPT與大語言模型(LLM)的差異
#今年三月,OpenAI正式發表大語言模型GPT-4。隨後,國內百度、阿里也推出了各自的大模型產品。
然而,通用語言模型更像一個「文科生」,在語言翻譯、摘要、理解和生成等任務上有出色表現,但在數學問題的解決、講解、問答與推薦方面則有明顯不足-
「解答數學問題常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結構和認知層次做適配。」
對此,學而思AI團隊負責人表示,這種不足是由LLM模型的自身特徵決定的。 LLM大模型來自於海量語言文本的訓練,因此最擅長語言處理。
業界偏向基於LLM大模型做閱讀、寫作類別應用,但如果想要在數學能力上有突破,就需要研發新的大模型。
因此,學而思決心組建團隊專研MathGPT——數學領域大模型,用自己在數學和AI上的多年積累,面向全球範圍內的數學愛好者和科研機構,做好AI大模型時代的數學基礎工作。
學而思希望透過MathGPT來彌補和攻克大語言模型的三個問題:
第一,題目要解對,現在GPT結果常出現錯誤;
第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗餘;
第三,解題要講的有趣、個人化,現在GPT的解釋過於「學術」和機械,對孩子的學習經驗很不友善。
做MathGPT,學而思憑什麼
學而思作為獲國家科技部批准的「智慧教育國家新一代人工智慧開放創新平台」建設單位,也是教育界唯一一家人工智慧「國家隊」成員,在人工智慧領域有著多年的深入研究,早在2017年,學而思便成立了AI lab人工智慧實驗室。
據公開資訊顯示,基於智慧教育人工智慧開放創新平台助力,學而思AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項;發表國際期刊和會議高層次學術論文31篇,包含光學字元辨識、圖像、自然語言處理、語音以及多模態等多領域的學術研究,在電腦視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利220餘項,授權專利150餘項,軟體著作權60餘項。
學而思AI lab在各類頂尖學術會議中獲獎情況
「以數學起家」的學而思至今已有20年的數學教學經驗,累積了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。
另外,學而思的海外業務Think Academy在全球若干國家和地區深受數學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。
所以,學而思選擇在MathGPT方向發力也順理成章。
另據了解,學而思學習機近期將會上線一款「AI助理」,涵蓋作文助理、口語助理、閱讀助手、數學助理等相關功能,該AI產品將於5月11日開啟內測。
MathGPT的挑戰與技術難題
如何運用大語言模式服務各行各業是當下社會的焦點問題。
例如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和介面調用,增強原有的產品體驗。
但也有一些領域如數學、醫學等,對AI的需求是準確、清晰、具備強大的邏輯推理能力,且容錯率低,通用LLM目前的表現表現還無法在上述領域取得突破,未來是否可能取得突破尚不清楚。
以數學領域為例,目前市場上有幾個主要流派。
例如Google收購的Photomath、微軟數學、Mathway、專注數學運算的WolframAlpha等產品,主要利用非LLM的傳統AI技術加上資料庫的方式解決數學問題。
走AGI路線的公司則嘗試讓通用LLM「更懂數學」,例如GPT-4在數學任務上比之前的3.5版本表現更好,Google旗下的Minerva模型也專門針對數學問題進行調優。
學而思選擇了另一條少有人走的路,不基於現有LLM做微調和介面呼叫、不做通用LLM,而是自研基於專業領域的“數學大模型」MathGPT,致力於打造自主、穩定、永續、高品質的學習解決方案。
在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待討論與驗證。
學而思自研獨立的MathGPT大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。
隨著整個產業的深化發展和越來越多人才參與這個領域,相信不久的將來就能看到更成熟的解決方案。
以上是學而思研發面向全球數學愛好者大模型MathGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

數字虛擬幣交易平台top10分別是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,這些平台均提供高安全性和多種交易選項,適用於不同用戶需求。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

這種開創性的開發將使金融機構能夠利用全球認可的ISO20022標準來自動化不同區塊鏈生態系統的銀行業務流程。 Ease協議是一個企業級區塊鏈平台,旨在通過易用的方式促進廣泛採用,今日宣布已成功集成ISO20022消息傳遞標準,直接將其納入區塊鏈智能合約。這一開發將使金融機構能夠使用全球認可的ISO20022標準,輕鬆自動化不同區塊鏈生態系統的銀行業務流程,該標準正在取代Swift消息傳遞系統。這些功能將很快在“EaseTestnet”上進行試用。 EaseProtocolArchitectDou

數字貨幣App的前景廣闊,具體體現在:1. 技術創新驅動功能升級,通過DeFi與NFT融合及AI與大數據應用提升用戶體驗;2. 監管合規化趨勢,全球框架完善及AML、KYC要求趨嚴;3. 功能多元化與服務拓展,整合借貸、理財等服務並優化用戶體驗;4. 用戶基數與全球化擴張,預計2025年用戶規模突破10億。

在其最新嘗試中,已解決的加密交易所FTX採取了法律行動,以收回債務並償還客戶。在收回債務和償還客戶的最新努力中,已解決的加密交易所FTX已對特定發行人提起法律訴訟。 FTX交易和FTX恢復信託基金已針對未能履行其協議的某些代幣發行人提起訴訟,以將約定的硬幣匯出到交易所。具體來說,重組團隊在周一就合規性問題起訴了NFTStarsLimited和OrosemiInc.。 FTX正在起訴令牌發行人,以收回到期硬幣。 FTX曾經是美國最傑出的加密貨幣交易平台之一。該銀行在2022年11月因報導稱其創始人山姆·

在幣圈中,所謂的三巨頭通常指的是三種最具影響力和廣泛使用的加密貨幣。這些加密貨幣在市場上佔據了重要的地位,並在交易量和市值方面都表現出色。同時,虛擬幣主流交易所APP也是投資者和交易者進行加密貨幣交易的重要工具。本文將詳細介紹幣圈中的三巨頭以及推薦前十名的虛擬幣主流交易所APP。

排名前十的數字貨幣交易所分別是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,這些平台均提供高安全性和多種交易選項,適用於不同用戶需求。

AI在Composer中主要通過依賴推薦、依賴衝突解決和代碼質量提升來提高開發效率和代碼質量。 1.AI可以根據項目需求推薦合適的依賴包。 2.AI提供智能解決方案來處理依賴衝突。 3.AI審查代碼並提供優化建議,提升代碼質量。通過這些功能,開發者可以更專注於業務邏輯的實現。
