目录
> reft - 表示finetuning
参考
首页 科技周边 人工智能 我们需要的一切吗?

我们需要的一切吗?

Feb 25, 2025 pm 07:49 PM

> reft:一种革命性的微调LLMS

> 在斯坦福(Stanford)2024年5月的论文中引入的REFT(表示命名)提供了一种开创性的方法,可有效地微调大型语言模型(LLMS)。 它的潜力立即显现出来,由Oxen.AI于2024年7月的2024年7月在短短14分钟内的单个NVIDIA A10 GPU上进行了微调Llama3(8b)。 与现有的参数效率微调(PEFT)方法(如Lora)不同,lora修改模型权重或输入,REFT利用分布式互换干预(DII)方法。 DII项目将嵌入较低维的子空间嵌入,从而通过此子空间进行微调。

>本文首先回顾了流行的PEFT算法(LORA,提示调整,前缀调整),然后解释DII,然后再研究REFT及其实验结果。

>参数有效的微调(PEFT)技术

Is ReFT All We Needed?拥抱脸提供了PEFT技术的全面概述。 让我们简要总结关键方法:

lora(低级适应):

在2021年推出,洛拉(Lora)的简单性和概括性使其成为微调LLMS和扩散模型的领先技术。 Lora没有调整所有层重量,而是增加了低级矩阵,大大降低了可训练的参数(通常小于0.3%),加速训练并最大程度地减少GPU内存使用。

提示调整:此方法使用“软提示” - 可检验的特定任务特定嵌入 - 作为前缀,启用有效的多任务预测,而无需重复每个任务的模型。

Is ReFT All We Needed?

>

前缀调整(p-tuning v2):Is ReFT All We Needed?解决迅速调整的限制,前缀调整将可训练的及时嵌入到各种层中,从而允许在不同级别上进行特定于任务的学习。>

>

洛拉的鲁棒性和效率使其成为LLMS最广泛使用的PEFT方法。 可以在Is ReFT All We Needed?>中找到详细的经验比较。

>分布式互换干预(DII)

DII植根于因果抽象中,这是一种使用高级(因果)模型和低级(神经网络)模型之间的干预框架来评估一致性的框架。 DII通过正交预测将这两个模型投入到子空间中,从而通过旋转操作创建了介入的模型。 一个详细的视觉示例>。

DII过程可以用数学表示为:

>

Is ReFT All We Needed?

其中R代表正交投影,分布式对齐搜索(DAS)优化了子空间,以最大程度地提高预期后预期的反事实输出的概率。

>

> reft - 表示finetuning

REFT在较低维空间内介入模型的隐藏表示形式。 下图显示了应用于L层和位置P的干预措施(PHI)

Loreft(低率线性子空间REFT)引入了一个学识渊博的投影来源:Is ReFT All We Needed?

其中Is ReFT All We Needed?是隐藏的表示,而在由

>>的低维空间中进行了

编辑h。 Loreft集成到神经网络层中如下所示:Rs hR

在LLM微调期间,LLM参数保留冷冻,并且仅训练投影参数(

)。 Is ReFT All We Needed?实验结果

原始的REFT纸提出了对全面微调(FT),Lora和前缀调整的比较实验。 REFT技术始终优于现有方法,在达到卓越的性能的同时,将参数降低至少90%。phi={R, W, b}

讨论

REFT的吸引力源于其在各种基准的羊驼家庭模型及其在因果抽象中的基础上的出色表现,这有助于模型可解释性。 REFT表明,分布在神经元中的线性子空间可以有效地控制许多任务,从而为LLM提供宝贵的见解。

参考

以上是我们需要的一切吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

最佳AI艺术生成器(免费付款)创意项目 最佳AI艺术生成器(免费付款)创意项目 Apr 02, 2025 pm 06:10 PM

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

开始使用Meta Llama 3.2 -Analytics Vidhya 开始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) 最佳AI聊天机器人比较(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

顶级AI写作助理来增强您的内容创建 顶级AI写作助理来增强您的内容创建 Apr 02, 2025 pm 06:11 PM

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

选择最佳的AI语音生成器:评论的顶级选项 选择最佳的AI语音生成器:评论的顶级选项 Apr 02, 2025 pm 06:12 PM

本文评论了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高级AI语音生成器,重点介绍其功能,语音质量和满足不同需求的适用性。

构建AI代理的前7个代理抹布系统 构建AI代理的前7个代理抹布系统 Mar 31, 2025 pm 04:25 PM

2024年见证了从简单地使用LLM进行内容生成的转变,转变为了解其内部工作。 这种探索导致了AI代理的发现 - 自主系统处理任务和最少人工干预的决策。 Buildin

如何访问猎鹰3? - 分析Vidhya 如何访问猎鹰3? - 分析Vidhya Mar 31, 2025 pm 04:41 PM

猎鹰3:革命性的开源大语模型 Falcon 3是著名的猎鹰系列LLMS系列中的最新迭代,代表了AI技术的重大进步。由技术创新研究所(TII)开发

See all articles