如何开始使用Google Cloud的文本到语音API-IT业界-PHP中文网

首页

科技周边

IT业界

如何开始使用Google Cloud的文本到语音API

Jennifer Aniston

Feb 09, 2025 am 10:24 AM

How to Get Started With Google Cloud's Text-to-Speech API

该教程指导您设置和使用Google Cloud的文本到语音API，提供代码示例和说明。

> Google Cloud的文本到语音API的关键好处

Google Cloud的文本到语音API将文本转换为自然听起来的语音，非常适合访问性工具，虚拟助手，电子学习平台，有声读物，语言学习应用程序，营销材料和电信系统。> 入门：先决条件和设置：> 要使用API，您需要一个Google Cloud Platform（GCP）帐户，基本Python编程技能和文本编辑器。该过程涉及启用API，创建API凭据，配置Python环境，编写Python脚本，运行脚本以及可选自定义语音和音频设置。

逐步指南：

访问您的GCP控制台，选择或创建项目，在API库中找到文本对语API并启用它。

>>创建API凭据：

在GCP凭据部分中，创建一个服务帐户，分配“云文本对语音API用户”角色，然后下载JSON密钥文件。确保此文件安全。

设置您的python环境：

>使用PIP安装Google Cloud SDK和

库。设置

>环境变量以指向您的JSON密钥文件的路径。

> google-cloud-texttospeech>GOOGLE_APPLICATION_CREDENTIALS创建一个python脚本：

使用以下代码（或修改版本）来合成语音：

运行脚本：

from google.cloud import texttospeech

def synthesize_speech(text, output_filename):
    client = texttospeech.TextToSpeechClient()
    input_text = texttospeech.SynthesisInput(text=text)
    voice = texttospeech.VoiceSelectionParams(
        language_code="en-US", ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
    )
    audio_config = texttospeech.AudioConfig(audio_encoding=texttospeech.AudioEncoding.MP3)
    response = client.synthesize_speech(input=input_text, voice=voice, audio_config=audio_config)
    with open(output_filename, "wb") as out:
        out.write(response.audio_content)
    print(f"Audio saved to '{output_filename}'")

synthesize_speech("Hello, world!", "output.mp3")

登录后复制

从您的终端执行您的Python脚本。这将生成一个mp3文件。

customize（可选）：
修改语音参数（语言代码，性别等）和音频设置（编码，采样率），以获取定制结果。有关可用选项，请参阅API文档。
高级配置选项：

API提供了广泛的自定义：

>音频编码：

控制输出音频格式（mp3，wav等）。

音频样本率：调整音频质量。
指定语音综合语言。
从各种声音中进行选择。>
使用语音综合标记语言，用于发音和语调的高级控制。
结论：
本教程为使用Google Cloud的文本到语音API提供了基础。探索API文档的更高级功能，以将此功能强大的工具集成到您的项目中。

常见问题（常见问题解答）：>

原始文本的常见问题部分已被总结并改写为简洁和清晰：

>成本： API不是免费的；定价基于字符的使用，但存在自由层。>

商业用途：允许，遵守Google的服务条款。>

语言支持：超过40种语言和变体。>

语音自定义：可提供广泛的自定义选项。>

脱机使用：不可能;需要互联网连接。

音频质量：高质量，自然的演讲。
>
>有声读物的创建：适合有声读物创建，但请考虑数据量和成本。记住要查阅官方的Google云文本到语音API文档，以获取最新信息和详细说明。