如何創建由螢幕和麥克風驅動的人工智慧代理
Screenpipe:用於 24/7 螢幕和麥克風錄音、OCR、轉錄和 AI 整合的 CLI/應用程式
Screenpipe 是一個命令列介面 (CLI) 應用程序,可連續記錄您的螢幕和麥克風活動、提取光學字元辨識 (OCR) 資料、生成轉錄,並簡化將此資料輸入 AI 模型的過程。 其靈活的管道系統可讓您創建功能強大的插件,與捕獲的螢幕和音訊資訊進行互動。此範例示範了建立一個利用 Ollama 分析螢幕活動的簡單管道。
先決條件:
- Screenpipe 已安裝並正在運作。
- 小圓麵包已安裝 (
npm install -g bun
)。 - Ollama 安裝了模型(本例中使用 DeepSeek-r1:1.5b)。
1。管道創建:
使用 CLI 建立一個新的 Screenpipe 管道:
bunx @screenpipe/create-pipe@latest
依照指示命名您的管道(例如「my-activity-analyzer」)並選擇目錄。
2。項目設定:
在您喜歡的編輯器(例如,遊標、VS Code)中開啟項目:
cursor my-activity-analyzer
初始專案結構將包含多個檔案。 對於此範例,刪除不必要的檔案:
rm -rf src/app/api/intelligence src/components/obsidian-settings.tsx src/components/file-suggest-textarea.tsx
3。實施分析 Cron 作業:
使用以下程式碼建立src/app/api/analyze/route.ts
:
import { NextResponse } from "next/server"; import { pipe } from "@screenpipe/js"; import { streamText } from "ai"; import { ollama } from "ollama-ai-provider"; export async function POST(request: Request) { try { const { messages, model } = await request.json(); console.log("model:", model); const fiveMinutesAgo = new Date(Date.now() - 5 * 60 * 1000).toISOString(); const results = await pipe.queryScreenpipe({ startTime: fiveMinutesAgo, limit: 10, contentType: "all", }); const provider = ollama(model); const result = streamText({ model: provider, messages: [ ...messages, { role: "user", content: `Analyze this activity data and summarize what I've been doing: ${JSON.stringify(results)}`, }, ], }); return result.toDataStreamResponse(); } catch (error) { console.error("error:", error); return NextResponse.json({ error: "Failed to analyze activity" }, { status: 500 }); } }
4。 pipe.json
調度配置:
建立或修改 pipe.json
以包含 cron 作業:
{ "crons": [ { "path": "/api/analyze", "schedule": "*/5 * * * *" // Runs every 5 minutes } ] }
5。更新首頁 (src/app/page.tsx
):
"use client"; import { useState } from "react"; import { Button } from "@/components/ui/button"; import { OllamaModelsList } from "@/components/ollama-models-list"; import { Label } from "@/components/ui/label"; import { useChat } from "ai/react"; export default function Home() { const [selectedModel, setSelectedModel] = useState("deepseek-r1:1.5b"); const { messages, input, handleInputChange, handleSubmit } = useChat({ body: { model: selectedModel }, api: "/api/analyze", }); return ( <main className="p-4 max-w-2xl mx-auto space-y-4"> <div className="space-y-2"> <label htmlFor="model">Ollama Model</label> <OllamaModelsList defaultValue={selectedModel} onChange={setSelectedModel} /> </div> <div> {messages.map((message) => ( <div key={message.id}> <div>{message.role === "user" ? "User: " : "AI: "}</div> <div>{message.content}</div> </div> ))} </div> </main> ); }
6。本地測試:
在本地運作管道:
bun i // or npm install bun dev
存取http://localhost:3000
應用程式。
7。屏管安裝:
將管道安裝到 Screenpipe 中:
- UI:開啟 Screenpipe 應用程序,導航至“管道”部分,按一下“”,然後提供管道的本機路徑。
- CLI:
screenpipe install /path/to/my-activity-analyzer screenpipe enable my-activity-analyzer
登入後複製工作原理:
-
資料查詢:
pipe.queryScreenpipe()
擷取最近的螢幕和音訊資料。 - 人工智慧處理:Ollama 使用提示分析資料。
- UI:簡單的介面顯示分析結果。
- 調度: Screenpipe 的 cron 作業每 5 分鐘執行一次分析。
後續步驟:
- 新增配置選項。
- 與外部服務整合。
- 實作更複雜的 UI 元件。
參考文獻:
- Screenpipe 文檔。
- Screenpipe 管道範例。
- Screenpipe SDK 參考。
以上是如何創建由螢幕和麥克風驅動的人工智慧代理的詳細內容。更多資訊請關注PHP中文網其他相關文章!
-
資料查詢:

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

不同JavaScript引擎在解析和執行JavaScript代碼時,效果會有所不同,因為每個引擎的實現原理和優化策略各有差異。 1.詞法分析:將源碼轉換為詞法單元。 2.語法分析:生成抽象語法樹。 3.優化和編譯:通過JIT編譯器生成機器碼。 4.執行:運行機器碼。 V8引擎通過即時編譯和隱藏類優化,SpiderMonkey使用類型推斷系統,導致在相同代碼上的性能表現不同。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

JavaScript是現代Web開發的核心語言,因其多樣性和靈活性而廣泛應用。 1)前端開發:通過DOM操作和現代框架(如React、Vue.js、Angular)構建動態網頁和單頁面應用。 2)服務器端開發:Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發:通過ReactNative和Electron實現跨平台開發,提高開發效率。

本文展示了與許可證確保的後端的前端集成,並使用Next.js構建功能性Edtech SaaS應用程序。 前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序(一個Edtech應用程序),您可以做同樣的事情。 首先,什麼是多租戶SaaS應用程序? 多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務

從C/C 轉向JavaScript需要適應動態類型、垃圾回收和異步編程等特點。 1)C/C 是靜態類型語言,需手動管理內存,而JavaScript是動態類型,垃圾回收自動處理。 2)C/C 需編譯成機器碼,JavaScript則為解釋型語言。 3)JavaScript引入閉包、原型鍊和Promise等概念,增強了靈活性和異步編程能力。

JavaScript在Web開發中的主要用途包括客戶端交互、表單驗證和異步通信。 1)通過DOM操作實現動態內容更新和用戶交互;2)在用戶提交數據前進行客戶端驗證,提高用戶體驗;3)通過AJAX技術實現與服務器的無刷新通信。

JavaScript在現實世界中的應用包括前端和後端開發。 1)通過構建TODO列表應用展示前端應用,涉及DOM操作和事件處理。 2)通過Node.js和Express構建RESTfulAPI展示後端應用。
