首頁 科技週邊 人工智慧 使用Gemini 2.0 Pro構建多模式AI應用程序

使用Gemini 2.0 Pro構建多模式AI應用程序

Feb 28, 2025 pm 04:37 PM

Google的Gemini 2.0 Pro:深入深入了解多模式AI功能和部署

Google已揭露了Gemini 2.0 Pro,這是其最先進的AI模型。 目前處於實驗階段,開發人員的訪問是通過API訪問。 這個強大的模型在編碼和復雜的推理方面閃耀,擁有200萬個令牌上下文窗口,用於處理廣泛的信息。 它利用Google搜索和執行代碼的能力增加了其多功能性。

>

>本教程演示瞭如何使用Google的genai python軟件包訪問Gemini 2.0 Pro的功能,構建用戶友好的Gradio應用程序,並將其部署到擁抱面部空間以供公共訪問。 有關針對OpenAI和DeepSeek模型的比較分析,請參見我們關於Gemini 2.0 Flash Thinking實驗的指南。 阿德爾·尼姆(Adel Nehme)的教程提供了進一步的見解,以使用雙子座2.0:

構建多模式應用程序。

設置GEMINI 2.0 Pro > >訪問Gemini 2.0 Pro的訪問是通過Google AI Studio,需要Google帳戶。

  1. > Google AI Studio登錄:

    訪問Google AI Studio網站並登錄。 >

  2. API密鑰生成:
  3. 導航到儀表板,找到並單擊“獲取API鍵”,然後是“創建API鍵”。

Building Multimodal AI Application with Gemini 2.0 Pro 來源:Google AI Studio

>

>環境變量:
    將環境變量設置為新生成的密鑰。 >
  1. python軟件包安裝:GEMINI_API_KEY安裝所需的軟件包:

  2. 探索雙子座2.0 Pro功能

>讓我們利用Gemini Python客戶端探索其功能:文本,圖像,音頻和文檔處理以及代碼執行。
  1. >文本生成:>以下代碼段使用用於實時反饋的流響應的文本生成:
pip install google-genai gradio
登入後複製
  1. > 圖像理解:使用枕頭,我們可以處理圖像:
import os
from google import genai

API_KEY = os.environ.get("GEMINI_API_KEY")
client = genai.Client(api_key=API_KEY)

response = client.models.generate_content_stream(
    model="gemini-2.0-pro-exp-02-05",
    contents=["Explain how the Stock Market works"])
for chunk in response:
    print(chunk.text, end="")
登入後複製
  1. 音頻理解: gemini 2.0 pro直接處理音頻:
from google import genai
from google.genai import types
import PIL.Image

image = PIL.Image.open('image.png')
response = client.models.generate_content_stream(
    model="gemini-2.0-pro-exp-02-05",
    contents=["Describe this image", image])
for chunk in response:
    print(chunk.text, end="")
登入後複製
  1. 文檔理解:>直接處理沒有蘭鍊或抹布的PDF:
with open('audio.wav', 'rb') as f:
    audio_bytes = f.read()

response = client.models.generate_content_stream(
  model='gemini-2.0-pro-exp-02-05',
  contents=[
    'Describe this audio',
    types.Part.from_bytes(
      data=audio_bytes,
      mime_type='audio/wav',
    )
  ]
)

for chunk in response:
    print(chunk.text, end="")
登入後複製
  1. >代碼生成和執行: gemini 2.0 Pro的出色功能是其在API中生成和執行代碼的能力:>
(注意:Gradio應用程序,圖像顯示和詳細錯誤處理的完整代碼,都在原始文本中提到的GitHub存儲庫中可用。此響應是一個凝結版本,以供清晰。
from google import genai
from google.genai import types
import pathlib

prompt = "Summarize this document"
response = client.models.generate_content_stream(
  model="gemini-2.0-pro-exp-02-05",
  contents=[
      types.Part.from_bytes(
        data=pathlib.Path('cv.pdf').read_bytes(),
        mime_type='application/pdf',
      ),
      prompt])

for chunk in response:
    print(chunk.text, end="")
登入後複製
>

構建和部署Gradio應用程序>

提供的GitHub存儲庫(Gemini-2-Pro-Chat)包含Gradio應用程序代碼。 克隆和設置環境後,本地運行

。 部署到擁抱面積的空間涉及創建一個新的空間,克隆存儲庫,添加> file(包含),按照指示進行修改

並推動更改。 切記在擁抱的面部空間設置中添加您的

作為秘密。 python app.py> requirements.txtgoogle-genai==1.0.0結論README.mdGEMINI_API_KEY gemini 2.0 Pro簡化了高性能AI應用程序的創建。 它的多模式功能和代碼執行功能是遊戲改變者。 雖然目前有使用使用限制,但請記住遵守Google的服務條款。 本教程提供了一份綜合指南,以利用其權力並將應用程序部署到雲中。

以上是使用Gemini 2.0 Pro構建多模式AI應用程序的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

最佳AI藝術生成器(免費付款)創意項目 最佳AI藝術生成器(免費付款)創意項目 Apr 02, 2025 pm 06:10 PM

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

開始使用Meta Llama 3.2 -Analytics Vidhya 開始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) 最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比較了諸如Chatgpt,Gemini和Claude之類的頂級AI聊天機器人,重點介紹了其獨特功能,自定義選項以及自然語言處理和可靠性的性能。

頂級AI寫作助理來增強您的內容創建 頂級AI寫作助理來增強您的內容創建 Apr 02, 2025 pm 06:11 PM

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成

10個生成AI編碼擴展,在VS代碼中,您必須探索 10個生成AI編碼擴展,在VS代碼中,您必須探索 Apr 13, 2025 am 01:14 AM

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

向員工出售AI策略:Shopify首席執行官的宣言 向員工出售AI策略:Shopify首席執行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

AV字節:Meta' llama 3.2,Google的雙子座1.5等 AV字節:Meta' llama 3.2,Google的雙子座1.5等 Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

選擇最佳的AI語音生成器:評論的頂級選項 選擇最佳的AI語音生成器:評論的頂級選項 Apr 02, 2025 pm 06:12 PM

本文評論了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高級AI語音生成器,重點介紹其功能,語音質量和滿足不同需求的適用性。

See all articles