首页 科技周边 IT业界 Genai:如何通过迅速的压缩技术降低成本

Genai:如何通过迅速的压缩技术降低成本

Feb 08, 2025 am 11:07 AM

>本文探讨了迅速的压缩技术,以降低Genai应用程序的运营成本。 Generative AI经常使用检索功能(RAG)和及时的工程,但这可能会变得昂贵。 提示压缩最大程度地减少了发送给模型提供商(例如OpenAI或Google Gemini)的数据。

GenAI: How to Reduce Cost with Prompt Compression Techniques

钥匙要点:

  • 及时的压缩大大降低了Genai的运营成本。
  • 有效的提示工程提高了产出质量,同时降低成本。
  • 压缩简化了通信,降低了计算负载和部署成本。
  • > Microsoft Llmlingua和选择性上下文等工具优化和压缩提示,以节省大量。
  • 挑战包括潜在的上下文损失,任务复杂性,特定于领域的知识需求以及平衡压缩与性能。 强大的定制策略至关重要。
  • 基于抹布的genai应用程序成本挑战:
  • >
  • 抹布,使用矢量数据库来增强LLM上下文,意外增加了生产成本。 为每个用户与OpenAI的互动发送大量数据(例如,整个聊天历史记录)证明很昂贵。 这在生成个性化内容的问答聊天和应用程序中尤为明显(健身计划,食谱建议)。 挑战在于使足够的背景与成本控制平衡。

解决上升的抹布管道成本:>

及时工程,制作精确的查询以获得最佳的LLM响应,这是关键。 迅速压缩,提示提示到基本要素,进一步降低了成本。 这种简化的通信,降低了计算负担和部署成本。 使用工具和重写提示可节省大量成本(最高75%)。 Openai的Tokenizer工具有助于微调及时的长度。

提示示例:>

>原始:

>“计划意大利旅行,参观历史景点并享受当地美食。列出了顶级历史景点和传统菜肴。”>

  • 压缩:

    “意大利旅行:顶级历史景点和传统菜肴。”>

  • >原始:

    “需要一个健康的素食晚餐食谱,西红柿,菠菜,鹰嘴豆,在一个小时内准备就绪。建议?

  • 压缩:
  • “快速,健康的素食食谱(西红柿,菠菜,鹰嘴豆)。建议?”

  • 理解提示压缩:>

    有效提示对于企业应用程序至关重要,但是冗长的提示增加了成本。 迅速压缩可以通过删除不必要的信息,降低计算负载和每个查询成本来降低输入大小。 它涉及识别关键要素(关键字,实体,短语)并仅保留这些要素。 收益包括减少计算负载,提高成本效益,提高效率和更好的可扩展性。 提示压缩的

    • 潜在上下文损失
    • 任务复杂性
    • >领域特定的知识要求
    • >平衡压缩和性能

    提示压缩的工具:>

      >
    • > Microsoft llmlingua:​​工具包优化LLM输出,包括提示压缩。它使用较小的语言模型来识别和删除不必要的单词,从而实现了显着的压缩,而性能损失最少。>

    GenAI: How to Reduce Cost with Prompt Compression Techniques

    • 选择性上下文:>

      > OpenAI的GPT模型:
    • 手动摘要或选择性上下文之类的工具可以压缩OpenAI模型的提示,在减少令牌计数的同时保持准确性。 提供了GPT模型的压缩提示的示例。
    • 结论:

    • 及时压缩可显着提高LLM的应用效率和成本效益。 Microsoft llmlingua和选择性上下文提供强大的优化工具。 选择正确的工具取决于应用程序需求。 及时压缩对于高效有效的LLM相互作用至关重要,从而节省成本并改善了基于抹布的Genai应用程序性能。 对于OpenAI模型,简单的NLP技术与这些工具相结合。

以上是Genai:如何通过迅速的压缩技术降低成本的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1665
14
CakePHP 教程
1424
52
Laravel 教程
1322
25
PHP教程
1269
29
C# 教程
1249
24
CNCF ARM64飞行员:影响和见解 CNCF ARM64飞行员:影响和见解 Apr 15, 2025 am 08:27 AM

该试点程序是CNCF(云本机计算基础),安培计算,Equinix金属和驱动的合作,简化了CNCF GitHub项目的ARM64 CI/CD。 该计划解决了安全问题和绩效

使用AWS ECS和LAMBDA的无服务器图像处理管道 使用AWS ECS和LAMBDA的无服务器图像处理管道 Apr 18, 2025 am 08:28 AM

该教程通过使用AWS服务来指导您通过构建无服务器图像处理管道。 我们将创建一个部署在ECS Fargate群集上的next.js前端,与API网关,Lambda函数,S3桶和DynamoDB进行交互。 Th

21个开发人员新闻通讯将在2025年订阅 21个开发人员新闻通讯将在2025年订阅 Apr 24, 2025 am 08:28 AM

与这些顶级开发人员新闻通讯有关最新技术趋势的了解! 这个精选的清单为每个人提供了一些东西,从AI爱好者到经验丰富的后端和前端开发人员。 选择您的收藏夹并节省时间搜索REL

定制电信软件的好处 定制电信软件的好处 May 11, 2025 am 08:28 AM

定制电信软件开发无疑是一项相当大的投资。然而,从长远来看,您可能会意识到,这样的项目可能更具成本效益,因为它可以像市场上任何现成的解决方案一样提高您的生产力。了解构建定制电信系统的最重要优势。 获取您所需的确切功能 您可以购买的现成电信软件有两个潜在问题。有些缺乏可能显着改善您工作效率的有用功能。有时您可以通过一些外部集成来增强它们,但这并不总是足以使它们变得出色。 其他软件功能过多,使用起来过于复杂。您可能不会使用其中的一些(永远不会!)。大量的功能通常还会增加价格。 基于您的需求

CNCF触发了ARM64和X86的平台平等突破 CNCF触发了ARM64和X86的平台平等突破 May 11, 2025 am 08:27 AM

Arm64 架构开源软件的 CI/CD 难题与解决方案 在 Arm64 架构上部署开源软件需要一个强大的 CI/CD 环境。然而,Arm64 和传统 x86 处理器架构的支持水平之间存在差异,Arm64 通常处于劣势。面向多种架构的基础设施组件开发人员对工作环境有一定的期望: 一致性:跨平台使用的工具和方法保持一致,避免因采用不太流行的平台而需要改变开发流程。 性能:平台和支持机制具有良好的性能,确保在支持多个平台时部署方案不会因速度不足而受影响。 测试覆盖率:对所有平台同时进行效率、合规性和

See all articles