我们需要的一切吗?
> reft:一种革命性的微调LLMS
> 在斯坦福(Stanford)2024年5月的论文中引入的REFT(表示命名)提供了一种开创性的方法,可有效地微调大型语言模型(LLMS)。 它的潜力立即显现出来,由Oxen.AI于2024年7月的2024年7月在短短14分钟内的单个NVIDIA A10 GPU上进行了微调Llama3(8b)。 与现有的参数效率微调(PEFT)方法(如Lora)不同,lora修改模型权重或输入,REFT利用分布式互换干预(DII)方法。 DII项目将嵌入较低维的子空间嵌入,从而通过此子空间进行微调。>本文首先回顾了流行的PEFT算法(LORA,提示调整,前缀调整),然后解释DII,然后再研究REFT及其实验结果。
>参数有效的微调(PEFT)技术
拥抱脸提供了PEFT技术的全面概述。 让我们简要总结关键方法:
在2021年推出,洛拉(Lora)的简单性和概括性使其成为微调LLMS和扩散模型的领先技术。 Lora没有调整所有层重量,而是增加了低级矩阵,大大降低了可训练的参数(通常小于0.3%),加速训练并最大程度地减少GPU内存使用。
提示调整:
>
前缀调整(p-tuning v2):解决迅速调整的限制,前缀调整将可训练的及时嵌入到各种层中,从而允许在不同级别上进行特定于任务的学习。
洛拉的鲁棒性和效率使其成为LLMS最广泛使用的PEFT方法。 可以在>中找到详细的经验比较。
DII植根于因果抽象中,这是一种使用高级(因果)模型和低级(神经网络)模型之间的干预框架来评估一致性的框架。 DII通过正交预测将这两个模型投入到子空间中,从而通过旋转操作创建了介入的模型。 一个详细的视觉示例>。 DII过程可以用数学表示为: 其中
Loreft(低率线性子空间REFT)引入了一个学识渊博的投影来源: 其中 编辑 )。
原始的REFT纸提出了对全面微调(FT),Lora和前缀调整的比较实验。 REFT技术始终优于现有方法,在达到卓越的性能的同时,将参数降低至少90%。 讨论
R
代表正交投影,分布式对齐搜索(DAS)优化了子空间,以最大程度地提高预期后预期的反事实输出的概率。> reft - 表示finetuning
REFT在较低维空间内介入模型的隐藏表示形式。 下图显示了应用于L层和位置P的干预措施(PHI)
是隐藏的表示,而在由
h
。 Loreft集成到神经网络层中如下所示:Rs
h
R
实验结果
phi={R, W, b}
参考
以上是我们需要的一切吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

本文评论了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高级AI语音生成器,重点介绍其功能,语音质量和满足不同需求的适用性。

2024年见证了从简单地使用LLM进行内容生成的转变,转变为了解其内部工作。 这种探索导致了AI代理的发现 - 自主系统处理任务和最少人工干预的决策。 Buildin

猎鹰3:革命性的开源大语模型 Falcon 3是著名的猎鹰系列LLMS系列中的最新迭代,代表了AI技术的重大进步。由技术创新研究所(TII)开发
