GPT-4O和Langgraph教程:構建TNT-LLM應用程序
Microsoft的TNT-LLM:革命性的分類學生成和文本分類
Microsoft揭開了TNT-LLM的揭幕,這是一種開創性的系統自動化分類法創建和文本分類,以速度和準確性超過傳統方法。 這種創新的方法利用大型語言模型(LLM)的力量簡化和擴展分類法和分類器的產生,從而最大程度地減少手動干預。 這對於像Bing Copilot這樣的應用程序特別有益,在該應用程序中,管理動態和多樣化的文本數據至關重要。
本文使用GPT-4O和Langgraph來演示TNT-LLM的實現,以進行有效的新聞文章集群。 有關GPT-4O和Langgraph的更多信息,請諮詢以下資源:>
什麼是OpenAi的GPT-4O?
- > GPT-4O API教程:開始使用OpenAI的API
- langgraph教程:什麼是langgraph,如何使用它?
- >
- >原始的TNT-LLM研究論文,“ TNT-LLM:大規模使用大語言模型的文本挖掘”,提供了有關係統的全面細節。 理解TNT-LLM
> tnt-llm(使用大語言模型的分類學和文本分類)是一個兩階段框架,旨在從文本數據中生成和分類分類法。
階段1:分類學生成
>
這個初始階段利用了文本文檔的樣本和特定的指令(例如,“生成分類法對新聞新聞文章產生分類法”)。 LLM總結了每個文檔,提取關鍵信息。 通過迭代精緻,LLM構建,修改和完善分類法,從而產生了有效新聞文章分類的標籤和描述的結構化層次結構。來源:Mengting Wan等人。
階段2:文本分類
>第二階段採用生成的分類法來標記較大的數據集。 LLM應用了這些標籤,為輕量級分類器(例如邏輯回歸)創建培訓數據。該訓練有素的分類器有效地標記了整個數據集或執行實時分類。
來源:Mengting Wan等人。
> tnt-llm的適應性使其適用於各種文本分類任務,包括意圖檢測和主題分類。
>> TNT-LLM 的優勢
-
>自動分類法生成:
自動從原始文本中創建詳細且可解釋的分類法,從而消除了對大量手動工作和域專業知識的需求。 > - 可擴展的分類:>使用輕巧模型有效地處理大型數據集和實時分類的可擴展文本分類。 >
- 成本效益:>通過分層LLM利用率優化資源使用(例如,GPT-4用於分類學生成,GPT-3.5-Turbo用於摘要以及最終分類的邏輯回歸)。 >高質量輸出:
- > >最小的人類干預: 減少了手動輸入,最大程度地減少潛在偏見和不一致。
- 靈活性: 適應各種文本分類任務和域,支持與各種LLM的集成,嵌入方法和分類器。
- 實施TNT-LLM 逐步實施指南如下:
安裝必要的軟件包:
設置API鍵和模型名稱的環境變量:
pip install langgraph langchain langchain_openai
核心概念:
export AZURE_OPENAI_API_KEY='your_api_key_here' export AZURE_OPENAI_MODEL='your_deployment_name_here' export AZURE_OPENAI_ENDPOINT='deployment_endpoint'
>文檔:
原始文本數據(文章,聊天日誌),使用- > class。
-
分類法:分類或主題的簇,由
Doc
>類管理。 -
構建一個簡單的TNT-LLM應用程序:
TaxonomyGenerationState
> >以下各節詳細介紹了實現步驟,使用代碼段來說明關鍵過程。 由於原始代碼的長度,這裡的完整再現是不切實際的。 但是,以下提供了該過程的結構化概述:
步驟0:定義圖形狀態類,加載數據集,並初始化GPT-4O:
這涉及定義數據結構並加載新聞文章數據集。 初始化了GPT-4O模型在整個管道中使用。
>-
>>步驟1:總結文檔:使用LLM提示。
總結了每個文檔 -
>>步驟2:創建MiniBatches:摘要的文檔分為MINIBATCHES用於並行處理。
> - >
步驟3:生成初始分類法:
從第一個Minibatch生成初始分類法。 > - 步驟4:更新分類法:
分類法已迭代更新,隨後處理了隨後的小匹配。
> 步驟5:審查分類法: - 最終分類法的準確性和相關性進行了審查。
-
>步驟6:使用狀態圖編排TNT-LLM管道:
> > - 步驟7:群集和顯示TNT-LLM的新聞文章分類法:
顯示了最終的分類法,顯示了新聞文章的簇。
結論
> TNT-LLM為大規模文本挖掘和分類提供了強大而有效的解決方案。它的自動化功能大大減少了分析非結構化文本數據所需的時間和資源,從而實現了跨各個領域的數據驅動決策。 跨行業進一步發展和應用的潛力是巨大的。 對於對進一步LLM應用程序開發感興趣的人,建議使用有關“使用Langchain開發LLM申請”的課程。
以上是GPT-4O和Langgraph教程:構建TNT-LLM應用程序的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年
