如何開始使用Google Cloud的文本到語音API-IT業界-PHP中文網

首頁

科技週邊

IT業界

如何開始使用Google Cloud的文本到語音API

Jennifer Aniston

Feb 09, 2025 am 10:24 AM

How to Get Started With Google Cloud's Text-to-Speech API

該教程指導您設置和使用Google Cloud的文本到語音API，提供代碼示例和說明。

> Google Cloud的文本到語音API的關鍵好處

Google Cloud的文本到語音API將文本轉換為自然聽起來的語音，非常適合訪問性工具，虛擬助手，電子學習平台，有聲讀物，語言學習應用程序，營銷材料和電信系統。 > 入門：先決條件和設置：> 要使用API，您需要一個Google Cloud Platform（GCP）帳戶，基本Python編程技能和文本編輯器。該過程涉及啟用API，創建API憑據，配置Python環境，編寫Python腳本，運行腳本以及可選自定義語音和音頻設置。

逐步指南：

訪問您的GCP控制台，選擇或創建項目，在API庫中找到文本對語API並啟用它。

>>創建API憑據：

在GCP憑據部分中，創建一個服務帳戶，分配“雲文本對語音API用戶”角色，然後下載JSON密鑰文件。確保此文件安全。

設置您的python環境：

>使用PIP安裝Google Cloud SDK和

庫。設置

>環境變量以指向您的JSON密鑰文件的路徑。

> google-cloud-texttospeech>GOOGLE_APPLICATION_CREDENTIALS創建一個python腳本：

使用以下代碼（或修改版本）來合成語音：

運行腳本：

from google.cloud import texttospeech

def synthesize_speech(text, output_filename):
    client = texttospeech.TextToSpeechClient()
    input_text = texttospeech.SynthesisInput(text=text)
    voice = texttospeech.VoiceSelectionParams(
        language_code="en-US", ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
    )
    audio_config = texttospeech.AudioConfig(audio_encoding=texttospeech.AudioEncoding.MP3)
    response = client.synthesize_speech(input=input_text, voice=voice, audio_config=audio_config)
    with open(output_filename, "wb") as out:
        out.write(response.audio_content)
    print(f"Audio saved to '{output_filename}'")

synthesize_speech("Hello, world!", "output.mp3")

登入後複製

從您的終端執行您的Python腳本。這將生成一個mp3文件。

customize（可選）：
修改語音參數（語言代碼，性別等）和音頻設置（編碼，採樣率），以獲取定制結果。有關可用選項，請參閱API文檔。
高級配置選項：

API提供了廣泛的自定義：

>音頻編碼：

控制輸出音頻格式（mp3，wav等）。

音頻樣本率：調整音頻質量。
指定語音綜合語言。
從各種聲音中進行選擇。 >
使用語音綜合標記語言，用於發音和語調的高級控制。
結論：
本教程為使用Google Cloud的文本到語音API提供了基礎。探索API文檔的更高級功能，以將此功能強大的工具集成到您的項目中。

常見問題（常見問題解答）：>

原始文本的常見問題部分已被總結並改寫為簡潔和清晰：

>成本： API不是免費的；定價基於字符的使用，但存在自由層。 >

商業用途：允許，遵守Google的服務條款。 >

語言支持：超過40種語言和變體。 >

語音自定義：可提供廣泛的自定義選項。 >

脫機使用：不可能;需要互聯網連接。

音頻質量：高質量，自然的演講。
>
>有聲讀物的創建：適合有聲讀物創建，但請考慮數據量和成本。記住要查閱官方的Google雲文本到語音API文檔，以獲取最新信息和詳細說明。