GPT-4O和Langgraph教程:构建TNT-LLM应用程序
Microsoft的TNT-LLM:革命性的分类学生成和文本分类
Microsoft揭开了TNT-LLM的揭幕,这是一种开创性的系统自动化分类法创建和文本分类,以速度和准确性超过传统方法。 这种创新的方法利用大型语言模型(LLM)的力量简化和扩展分类法和分类器的产生,从而最大程度地减少手动干预。 这对于像Bing Copilot这样的应用程序特别有益,在该应用程序中,管理动态和多样化的文本数据至关重要。
本文使用GPT-4O和Langgraph来演示TNT-LLM的实现,以进行有效的新闻文章集群。 有关GPT-4O和Langgraph的更多信息,请咨询以下资源:>
什么是OpenAi的GPT-4O?
- > GPT-4O API教程:开始使用OpenAI的API
- langgraph教程:什么是langgraph,如何使用它?
- >
- >原始的TNT-LLM研究论文,“ TNT-LLM:大规模使用大语言模型的文本挖掘”,提供了有关系统的全面细节。 理解TNT-LLM
> tnt-llm(使用大语言模型的分类学和文本分类)是一个两阶段框架,旨在从文本数据中生成和分类分类法。
阶段1:分类学生成
>
这个初始阶段利用了文本文档的样本和特定的指令(例如,“生成分类法对新闻新闻文章产生分类法”)。 LLM总结了每个文档,提取关键信息。 通过迭代精致,LLM构建,修改和完善分类法,从而产生了有效新闻文章分类的标签和描述的结构化层次结构。来源:Mengting Wan等人。
阶段2:文本分类
>第二阶段采用生成的分类法来标记较大的数据集。 LLM应用了这些标签,为轻量级分类器(例如逻辑回归)创建培训数据。该训练有素的分类器有效地标记了整个数据集或执行实时分类。
来源:Mengting Wan等人。
> tnt-llm的适应性使其适用于各种文本分类任务,包括意图检测和主题分类。
>> TNT-LLM 的优势
-
>自动分类法生成:
自动从原始文本中创建详细且可解释的分类法,从而消除了对大量手动工作和域专业知识的需求。 > - 可扩展的分类:>使用轻巧模型有效地处理大型数据集和实时分类的可扩展文本分类。>
- 成本效益:>通过分层LLM利用率优化资源使用(例如,GPT-4用于分类学生成,GPT-3.5-Turbo用于摘要以及最终分类的逻辑回归)。 >高质量输出:
- > >最小的人类干预: 减少了手动输入,最大程度地减少潜在偏见和不一致。
- 灵活性: 适应各种文本分类任务和域,支持与各种LLM的集成,嵌入方法和分类器。
- 实施TNT-LLM 逐步实施指南如下:
安装必要的软件包:
设置API键和模型名称的环境变量:
pip install langgraph langchain langchain_openai
核心概念:
export AZURE_OPENAI_API_KEY='your_api_key_here' export AZURE_OPENAI_MODEL='your_deployment_name_here' export AZURE_OPENAI_ENDPOINT='deployment_endpoint'
>文档:
原始文本数据(文章,聊天日志),使用- > class。
-
分类法:分类或主题的簇,由
Doc
>类管理。 -
构建一个简单的TNT-LLM应用程序:
TaxonomyGenerationState
> >以下各节详细介绍了实现步骤,使用代码段来说明关键过程。 由于原始代码的长度,这里的完整再现是不切实际的。 但是,以下提供了该过程的结构化概述:
步骤0:定义图形状态类,加载数据集,并初始化GPT-4O:
这涉及定义数据结构并加载新闻文章数据集。 初始化了GPT-4O模型在整个管道中使用。
>-
>>步骤1:总结文档:使用LLM提示。
总结了每个文档 -
>>步骤2:创建MiniBatches:摘要的文档分为MINIBATCHES用于并行处理。
> - >
步骤3:生成初始分类法:
从第一个Minibatch生成初始分类法。 > - 步骤4:更新分类法:
分类法已迭代更新,随后处理了随后的小匹配。
> 步骤5:审查分类法: - 最终分类法的准确性和相关性进行了审查。
-
>步骤6:使用状态图编排TNT-LLM管道:
> > - 步骤7:群集和显示TNT-LLM的新闻文章分类法:
显示了最终的分类法,显示了新闻文章的簇。
结论
> TNT-LLM为大规模文本挖掘和分类提供了强大而有效的解决方案。它的自动化功能大大减少了分析非结构化文本数据所需的时间和资源,从而实现了跨各个领域的数据驱动决策。 跨行业进一步发展和应用的潜力是巨大的。 对于对进一步LLM应用程序开发感兴趣的人,建议使用有关“使用Langchain开发LLM申请”的课程。
以上是GPT-4O和Langgraph教程:构建TNT-LLM应用程序的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年
