新加坡发布AI算数模型Goat,能力居于GPT-4之上
DoNews6月7日消息,当下 GPT-4 模型最大的短板主要是算术能力,由于模型的逻辑推理能力尚待提升,因此即使是许多人认为相对简单的计算问题,GPT-4 却无法得出正确的结果。
新加坡国立大学的研究人员近日推出了一种名为Goat的模型,旨在解决算术问题。这一消息被IT之家报道。研究人员表示“在对 LLaMA 模型进行微调后,Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。
研究人员提出了一种新办法,将任务根据算数的可学习型进行分类,然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务(IT之家注:把复杂的计算过程分点拆解成简单的步骤)后导入 AI 模型。
这种新方法可以令模型学习答题模式,并将过程泛化为看不见的数据,而非仅仅依靠纯粹的“权重记忆计算”,因此能够有效地提高算数性能,可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。
研究人员在具备 24 GB 显存的 GPU 上进行训练,并将最终得到的模型使用 BIG-bench 算数子任务进行测试,准确率结果较为出众,领先于业内的 Bloom、GPT-NeoX、OPT 等模型。
其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型,在大数计算方面远超 GPT-4。
以上是新加坡发布AI算数模型Goat,能力居于GPT-4之上的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

号称世界最强AI芯片英伟达H200亮相后,业内开始期待英伟达更强大的B100芯片,与此同时,今年以来最红的初创AI公司OpenAI已经开始研发更强大、更复杂的GPT-5模型。国泰君安在最新的研报中指出,性能无边的B100与GPT5预计在2024年发布,重磅升级或释放前所未有的生产力。该机构表示,看好AI进入快速发展的成长期,能见度持续至2024年。相较于前几代产品,B100和GPT-5究竟有多强大?英伟达和OpenAI已经给出了预告:B100速度可能是H100的4倍以上,而GPT-5可能会实现超

【环球网科技综合报道】10月30日消息,据外媒,由两位离职的苹果员工共同创立的智能软件和消费设备研发商Humane,将于11月9日发布其研发了数年的首款产品AiPin,这款设备大小与饼干差不多,配备了摄像头、麦克风和扬声器、传感器和激光投影仪,但没有屏幕,可以通过磁性固定在衣服上,是一款“基于服装的可穿戴设备”。据Humane官网,AiPin无需与智能手机或其他辅助设备配对,是一款无屏幕的独立设备和软件平台,并通过专有软件和OpenAI的GPT-4的组合来支持设备功能。此外,其人工智能驱动的光学

AI究竟还能完成什么出乎人类意料的工作?最近,Nvidia公司的人工智能研究员把语言模型GPT-4引入到了沙盒游戏《我的世界》中,试图从中发掘出AI更复杂的能力。5月25日,英伟达团队与加州理工学院等诸多高校在内的研究者们发布了Voyager,按照他们在论文中下的定义,Voyager是一个具有大型语言模型的开放式具象化智能体,被接入到自由度较高的电子游戏《我的世界》中。AI在游戏中实现的各种操作Voyager被赋予的任务是完成游戏中存在的各种目标,包括了生存、战斗以及建造,并且随着游戏时间和经验

DoNews6月7日消息,当下GPT-4模型最大的短板主要是算术能力,由于模型的逻辑推理能力尚待提升,因此即使是许多人认为相对简单的计算问题,GPT-4却无法得出正确的结果。据IT之家报道,近日,新加坡国立大学研究者推出了Goat模型,称该模型“专门用于算术问题”。研究人员表示“在对LLaMA模型进行微调后,Goat在算数上实现了比GPT-4更高的准确度与更出色的性能”。研究人员提出了一种新办法,将任务根据算数的可学习型进行分类,然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务(I

在今年,人工智能技术在机器学习、深度学习、自然语言处理和计算机视觉等领域取得了显着进展,尤其是深度学习技术在图像识别、语音识别和自然语言处理等方面表现出色通过对全球产业链发展的动态进行紧密追踪,前瞻为用户每周精选全球产业核心资讯,以《前瞻产业趋势周报》——人工智能篇的形式,旨在帮助用户抓住产业发展的新趋势

华为昇腾计算业务CTO周斌“昇腾AI基础软硬件平台已孵化和适配了30多个主流大模型,我国一半以上的原生大模型是基于昇腾AI基础软硬件平台打造,从底层软硬件技术来看,昇腾AI已经过大规模验证,承载ChatGPT或GPT-4的算力需求完全没问题。”5月26日,在2023中关村论坛上,华为昇腾计算业务CTO周斌在接受澎湃新闻等媒体采访时作出上述表述。一路“狂飙”的大模型,已成为国内科技圈的关注焦点。或受大模型算力增长影响,近期云厂商出现首次集体性降价,包括阿里、腾讯、京东等云厂商均宣布大规模降价。对此

在pump.fun上推出的人工智能(AI)驱动的meme币goatseus maximus(GOAT)的市场估值已达到4.18亿美元

Marc Andreessen 决定向这个半自主人工智能代理提供 50,000 美元的比特币,用于资助硬件升级并推出名为 GOAT 的加密货币代币
