使用llamaindex在抹布中的記憶和混合搜索-人工智慧-PHP中文網

對內存在抹布系統中的作用及其對生成上下文準確響應的影響獲得實施理解。
學習將Google的Google的Gemini LLM和QDrant快速嵌入在LlamainDex框架中，這很有用，因為OpenAI是LlamainDex中使用的默認LLM和嵌入模型。
使用Qdrant矢量存儲來開發混合搜索技術的實現，結合向量和關鍵字搜索以增強抹布應用程序中的檢索精度。
探索Qdrant作為矢量商店的功能，重點關注其內置的混合搜索功能和快速嵌入功能。

本文作為數據科學博客馬拉鬆的一部分發表。

QDRANT中的混合搜索
使用LlamainDex的記憶和混合搜索
- 步驟1：安裝要求
- 步驟2：定義LLM和嵌入模型
- 步驟3：加載數據
- 步驟4：通過混合搜索設置QDRANT
- 步驟5：索引您的文檔
- 步驟6：查詢索引查詢引擎
- 步驟7：定義內存
- 步驟8：創建帶有內存的聊天引擎
- 步驟9：測試內存
常見問題

QDRANT中的混合搜索

想像一下，您正在為大型電子商務網站構建聊天機器人。用戶問：“向我展示最新的iPhone型號。”通過傳統的矢量搜索，您可能會獲得語義上相似的結果，但是您可能會錯過確切的匹配。另一方面，關鍵字搜索可能太嚴格了。混合搜索為您提供了兩全其美的最好：

向量搜索捕獲語義含義和上下文
關鍵字搜索確保特定術語的精度

Qdrant是我們本文首選的矢量商店，也是充分的理由：

Qdrant在定義時只需啟用混合參數即可輕鬆實現混合搜索。
它帶有使用快速培訓的優化嵌入模型，其中該模型以ONNX格式加載。
QDRANT實施優先考慮保護敏感信息，提供多功能部署選項，最小化響應時間並減少運營費用。

使用LlamainDex的記憶和混合搜索

我們將深入研究LlamainDex框架內的內存和混合搜索的實際實施，展示這些功能如何增強檢索增強發電（RAG）系統的功能。通過集成這些組件，我們可以創建一個更聰明，更感知的對話代理，該代理有效地利用了歷史數據和高級搜索技術。

步驟1：安裝要求

好吧，讓我們逐步分解這一點。我們將使用LlamainDex，Qdrant矢量商店，從QDRANT進行了快進，以及Google的Gemini模型。確保已安裝這些庫：

 ！
！

登入後複製

步驟2：定義LLM和嵌入模型

首先，讓我們導入依賴關係並設置API密鑰：

導入操作系統
從GetPass Import GetPass
來自llama_index.llms.gemini Import gemini
來自llama_index.embeddings.Fastembed進口fastembedembedding

Google_api_key = getPass（“輸入您的雙子座API：”）
os.environ [“ Google_api_key”] = Google_api_key

llm = gemini（）＃gemini 1.5閃光燈
embed_model = fastembedembedding（）

登入後複製

現在，讓我們測試API當前是否是通過在示例用戶查詢上運行該LLM來定義的。

 llm_response = llm.complete（“一件開始？”）。
打印（llm_response）

登入後複製

在Llamaindex中，OpenAI是默認的LLM和嵌入模型，以覆蓋我們需要從LlamainDex Core定義設置。在這裡，我們需要覆蓋LLM和嵌入模型。

來自llama_index.core導入設置

settings.llm = llm
settings.embed_model = embed_model

登入後複製

步驟3：加載數據

在此示例中，假設我們在數據文件夾中有一個PDF，我們可以使用LlamainDex中的SimpleDirectory Reader加載數據文件夾。

來自llama_index.core導入simpledirectoryReader
documents = simpleDirectoryReader（“ ./ data/”）。 load_data（）

登入後複製

步驟4：通過混合搜索設置QDRANT

我們需要定義一個QDRANTVECTORSTORE實例，並將其設置在此示例中。我們還可以使用其云服務或Localhost來定義QDrant客戶端，但是在我們的內存文章中，具有收集名稱的定義應該可以。

確保enable_hybrid = true，因為這允許我們使用QDRANT的混合搜索功能。我們的收藏名稱是“紙”，因為數據文件夾在有關代理商的研究論文中包含PDF。

來自llama_index.core導入vectorstoreindex，StorageContext
來自llama_index.vector_stores.qdrant導入QDRANTVECTORSTORE
導入qdrant_client

客戶端= qdrant_client.qdrantclient（
    位置=“：內存：”，
）

vector_store = qdrantVectorstore（
    collection_name =“紙”，
    客戶端=客戶端，
    enable_hybrid = true，＃混合搜索將進行
    batch_size = 20，
）

登入後複製

步驟5：索引您的文檔

通過在我們的抹布系統中實現內存和混合搜索，我們創建了一個更聰明，更聰明的上下文-A

 Storage_Context = StorageContext.from_defaults（vector_store = vector_store）

index = vectorstoreIndex.from_documents（
    文件，
    storage_context = storage_context，
）

登入後複製

步驟6：查詢索引查詢引擎

索引是我們在LlamainDex中定義獵犬和發電機鏈的部分。它處理文檔集合中的每個文檔，並為每個文檔的內容生成嵌入式。然後，它將這些嵌入在我們的Qdrant矢量存儲中。它創建了一個索引結構，可有效檢索。在定義查詢引擎時，請確保在混合動力車中查詢模式。

 query_engine = index.as_query_engine（
    vector_store_query_mode =“ hybrid”
）

revertmon1 = query_engine.query（“生活的含義是什麼？”）
打印（響應1）
revertmon2 = query_engine.query（“在2個句子中給出摘要”）
打印（響應2）

登入後複製

在上面的查詢引擎中，我們運行兩個查詢，一個是在上下文中，另一個在上下文之外。這是我們得到的輸出：

輸出

＃響應1
提供的文本著重於使用大語模型（LLMS）在自主代理中計劃。 
它沒有討論生活的含義。 

＃響應2

本文檔探討了大型語言模型（LLM）作為解決複雜任務的代理。 
它專注於兩種主要方法： 
分解優先的方法， 
在執行前將任務分解為子任務，而 
交錯分解方法，該方法基於反饋動態調整分解。

登入後複製

步驟7：定義內存

雖然我們的聊天機器人表現良好並提供了改進的響應，但它仍然缺乏多個交互之間的上下文意識。這是記憶進入圖片的地方。

來自llama_index.core.memory Import ChatMemorybuffer

內存= chatmemorybuffer.from_defaults（token_limit = 3000）

登入後複製

步驟8：創建帶有內存的聊天引擎

我們將創建一個使用混合搜索和內存的聊天引擎。在LlamainDex中，當我們擁有外部或外部數據時，請確保聊天模式是上下文。

 chat_engine = index.as_chat_engine（
    chat_mode =“上下文”， 
    內存=內存，
    system_prompt =（
        “您是AI助手，他們回答用戶問題”
    ），
）

登入後複製

步驟9：測試內存

讓我們進行一些查詢，並檢查內存是否按預期工作。

從ipython.display導入降價，顯示

check1 = chat_engine.chat（“在2句中給摘要”）

check2 = chat_engine.chat（“繼續摘要，在上兩個句子中再添加一個句子”）

check3 = chat_engine.chat（“將上述抽像變成詩”）

登入後複製

使用llamaindex在抹布中的記憶和混合搜索

結論

我們探討了將內存和混合搜索集成到檢索增強發電（RAG）系統中如何顯著增強其功能。通過將LlamainDex與Qdrant用作矢量商店和Google的雙子座作為大語言模型，我們演示了混合搜索如何結合向量和基於關鍵字的檢索的優勢，以提供更精確的結果。內存的添加進一步改善了上下文理解，從而使聊天機器人能夠在多個交互之間提供連貫的響應。這些功能共同創造了一個更聰明，更智能的上下文感知系統，使破布管道對複雜的AI應用程序更有效。

關鍵要點

RAG管道中的內存組件的實現顯著增強了聊天機器人的上下文意識和在多個交互之間保持連貫對話的能力。
使用QDRANT作為矢量存儲的混合搜索集成，結合了向量和關鍵字搜索的優勢，以提高抹布系統中的檢索準確性和相關性，從而最大程度地減少了幻覺的風險。免責聲明，它並沒有完全消除幻覺，而是降低了風險。
利用Llamaindex的ChatMemoryBuffer進行對話歷史的有效管理，並具有可配置的令牌限制，以平衡上下文保留和計算資源。
將Google的雙子座模型納入Llamaindex框架中，並將其嵌入提供商嵌入，展示了LlamainDex在適應不同的AI模型和嵌入技術方面的靈活性。