为什么在长篇小说模型的时代仍然有意义
>让我们探索在越来越强大的大型语言模型(LLMS)的背景下,检索增强生成(RAG)的演变。 我们将研究LLM中的进步如何影响抹布的必要性。 > rag
的简短历史参数内存:
LLM固有的知识,在其在庞大的文本数据集上培训期间获得的知识。- >
- 非参数存储器:在提示中提供的外部上下文。
- >原始纸张利用文本嵌入用于语义搜索来检索相关文档,尽管这不是抹布中文档检索的唯一方法。 他们的研究表明,与单独使用LLM相比,RAG产生了更精确和事实的反应。 > chatgpt影响
Chatgpt的2022年11月发布的发布可能会出现LLM的查询答案的潜力,但也突出了限制:
- >幻觉:
- 抹布的上升和完善 >虽然抹布预先较早的chatgpt,但其广泛采用在2023年就大大增加了。核心概念很简单:而不是直接查询llm,而是在提示中提供相关的
,并指示LLM回答基于该上下文中的
>
该提示是LLM的答案生成的起点。 这种方法大大降低了幻觉,启用了对最新数据的访问,并促进了特定于业务的数据的使用。
rag的早期限制
>以有限上下文窗口大小为中心的初始挑战。 Chatgpt-3.5的4K令牌限制(大约3000个英语单词)限制了上下文和答案长度的数量。 需要保持平衡,以避免过度漫长的上下文(限制答案的长度)或不足的上下文(有遗漏关键信息的风险)。
>上下文窗口的作用就像有限的黑板;更多的说明空间留下了更少的答案。
当前景观
从那时起,已经发生了重大变化,主要是关于上下文窗口大小的。 诸如GPT-4O(2024年5月发行)之类的型号具有128K令牌上下文窗口,而Google的Gemini 1.5(自2024年2月以来可用)提供了一个巨大的100万个令牌窗口。>
rag的转移作用上下文窗口大小的这种增加引发了争论。有人认为,有能力将整本书包括在提示中,因此对精心选择的上下文的需求减少了。 一项研究(2024年7月)甚至建议在某些情况下长期提示可能要优于抹布。
>
在长篇小说语言模型的时代,>检索增强发电或长篇小写LLM?全面的研究和混合方法
但是,一项最新的研究(2024年9月)对此进行了反对,强调了抹布的重要性,并表明先前的限制源于提示中的上下文要素的顺序。
在中间丢失:语言模型如何使用长上下文>>另一项相关研究(2023年7月)强调了信息在长提示中的位置影响。
在提示开始时的>>>信息比中间的信息更容易使用。 rag
的未来 尽管上下文窗口大小的进步,但抹布仍然至关重要,这主要是由于成本考虑。 更长的提示需要更多的处理能力。 抹布,通过将及时尺寸限制为基本信息,大大降低了计算成本。 破布的未来可能涉及从大型数据集中过滤无关的信息,以优化成本和回答质量。 使用针对特定任务量身定制的较小专业模型也可能发挥重要作用。
以上是为什么在长篇小说模型的时代仍然有意义的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

本文比较了诸如Chatgpt,Gemini和Claude之类的顶级AI聊天机器人,重点介绍了其独特功能,自定义选项以及自然语言处理和可靠性的性能。

文章讨论了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的写作助手,重点介绍了其独特的内容创建功能。它认为Jasper在SEO优化方面表现出色,而AI工具有助于保持音调的组成

本文评论了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高级AI语音生成器,重点介绍其功能,语音质量和满足不同需求的适用性。

2024年见证了从简单地使用LLM进行内容生成的转变,转变为了解其内部工作。 这种探索导致了AI代理的发现 - 自主系统处理任务和最少人工干预的决策。 Buildin

猎鹰3:革命性的开源大语模型 Falcon 3是著名的猎鹰系列LLMS系列中的最新迭代,代表了AI技术的重大进步。由技术创新研究所(TII)开发
