創建文本到語音鍍鉻擴展-js教程-PHP中文網

由於Chrome的普及和TTS的興起，我們將創建一個將文本轉換為語音的Chrome擴展程序。該擴展程序將等待用戶點擊其圖標或按下特殊熱鍵（Shift Y），然後嘗試查找用戶在其當前查看的頁面上高亮顯示的內容，或者嘗試查找複製到其剪貼板的內容。如果找到任何內容，它將首先嘗試使用HTML5語音合成API將其轉換為語音，如果該API不可用，則調用第三方API。

Chrome擴展程序基礎知識

每個Chrome擴展程序都需要一個名為manifest.json的文件。清單是一個JSON格式的文件，其中包含對應用程序至關重要的數據，從擴展程序的名稱、描述、圖標和作者等內容，到定義擴展程序需求的數據——擴展程序應該能夠在哪些網站上運行（這些將是用戶必須授予的權限）或在用戶瀏覽特定網站時運行哪些文件。

{
  "manifest_version": 2,

  "name": "Page to Speech",
  "description": "This extension will produce English speech to whatever text you highlight on a webpage. Highlight text and click the extension's icon",
  "author": "Ivan Dimov",
  "version": "1.0",
  "icons": { 
    "16": "icon16.png",
    "48": "icon48.png",
    "128": "icon128.png"
  },

登入後複製

我們的清單首先記錄了擴展程序的名稱、描述、作者、版本和圖標。您可以在icons對像中提供許多響應不同大小的圖標。

 "background": {
    "scripts": ["background.min.js"]
  },
  "content_scripts": [
    {
      "matches": ["http://*/*", "https://*/*"],
      "js": [ "polyfill.min.js", "ext.min.js"],
      "run_at": "document_end"
    }],

登入後複製

然後，我們在background對像中定義了一個名為background.min.js的後台腳本（注意我們使用的是最小化文件）。後台腳本是長期運行的腳本，將在用戶瀏覽器關閉或擴展程序禁用之前繼續運行。

之後，我們有一個content_scripts數組，它指示Chrome由於通配符“http://*/*"和“https://*/*"而在每個網站請求時加載兩個JavaScript文件。與後台腳本不同，內容腳本可以訪問用戶正在訪問的實際網站的DOM。內容腳本既可以讀取也可以修改嵌入其中的任何網頁的DOM。因此，我們的polyfill.min.js和ext.min.js將能夠讀取和修改每個網頁上的所有數據。

  "browser_action": {
    "default_icon": "speech.png"
  },
   "permissions": [
     "activeTab",
     "clipboardRead"
    ]
}

登入後複製

等等！我們還有一個名為permissions的數組，我們請求只訪問用戶當前打開的網頁（活動標籤）。我們還請求另一個名為clipboardRead的權限，這將允許我們讀取用戶的剪貼板（以便我們可以將其內容轉換為語音）。

編寫頁面轉語音Chrome擴展程序

首先，我們創建我們唯一一個後台腳本，它掛鉤一個事件監聽器，該監聽器將在用戶點擊擴展程序的圖標時觸發。發生這種情況時，我們將調用sendMessage函數，該函數使用chrome.tabs.sendMessage(tabId, message, callback)方法向我們的內容腳本發送消息（內容腳本可以讀取DOM並找出用戶高亮顯示的內容和/或用戶放在剪貼板上的內容）。我們使用chrome.tabs.query方法向當前打開的標籤頁發送消息——因為這是我們感興趣的內容，也是我們能夠訪問的內容——該方法的參數包括一個回調函數，該函數將使用包含與查詢匹配的標籤頁的參數調用。

chrome.browserAction.onClicked.addListener(function (tab) {
    //fired when the user clicks on the ext's icon
    sendMessage();
});
function sendMessage() {
  chrome.tabs.query({active: true, currentWindow: true}, function(tabs){
    chrome.tabs.sendMessage(tabs[0].id, {action: "pageToSpeech"}, function(response) {});
  });
}

登入後複製

現在，比較冗長的是我們的內容腳本。我們創建一個對象來保存與擴展程序相關的一些數據，然後定義我們的初始化方法。

initialize: function() {
    if (!pageToSpeech.hasText()) { return;}
    if (!pageToSpeech.trySpeechSynthesizer()) {
        pageToSpeech.trySpeechApi();
    }
},

登入後複製

該方法檢查用戶是否未高亮顯示文本或剪貼板中沒有任何內容，在這種情況下只返回。否則，它將嘗試使用HTML5語音合成API生成語音。如果這也失敗了，它最終將嘗試使用第三方API。

檢查文本的方法執行幾項操作。它嘗試使用內置的getSelection()方法獲取包含高亮顯示文本的對象，並使用toString()將其轉換為文本字符串。然後，如果沒有高亮顯示文本，它將嘗試在用戶的剪貼板中查找文本。它通過向頁面添加一個輸入元素、聚焦它、使用execCommand('paste')觸發粘貼事件，然後將粘貼到該輸入中的文本保存在一個屬性中來實現這一點。然後它清空輸入。無論哪種情況，它都會返回它找到的內容。

{
  "manifest_version": 2,

  "name": "Page to Speech",
  "description": "This extension will produce English speech to whatever text you highlight on a webpage. Highlight text and click the extension's icon",
  "author": "Ivan Dimov",
  "version": "1.0",
  "icons": { 
    "16": "icon16.png",
    "48": "icon48.png",
    "128": "icon128.png"
  },

登入後複製

為了使用熱鍵（硬編碼為Shift Y）啟用用戶運行文本轉語音轉換，我們初始化一個數組並為onkeydown和onkeyup事件設置一個事件監聽器。在監聽器中，我們存儲一個與按下鍵的keyCode對應的索引，該值是根據e.type事件類型與keydown的比較結果得出的，並且是一個布爾值。因此，每當一個鍵按下時，對應的鍵索引的值將設置為true，每當一個鍵釋放時，索引的值將更改為false。因此，如果索引16和84都持有真值，我們就知道用戶正在使用我們的熱鍵，因此我們將初始化文本轉語音轉換。

 "background": {
    "scripts": ["background.min.js"]
  },
  "content_scripts": [
    {
      "matches": ["http://*/*", "https://*/*"],
      "js": [ "polyfill.min.js", "ext.min.js"],
      "run_at": "document_end"
    }],

登入後複製

為了將文本轉換為語音，我們依賴於trySpeechSynthesizer()方法。如果HTML5語音合成存在於用戶的瀏覽器中（window.speechSynthesis），我們就知道用戶能夠使用它，因此我們檢查當前是否正在運行語音（我們通過pageToSpeech.data.speechInProgress布爾值知道它是否正在運行）。如果語音正在進行中，我們將停止當前語音（因為trySpeechSynthesizer將啟動一個新的語音，我們不希望同時發出兩種聲音）。然後，我們將speechInProgress設置為true，每當語音完成時，再次將該屬性設置為假值。

現在，我不想詳細說明為什麼我們使用speechUtteranceChunker，但它是一個與Chrome在發出200-300個單詞後停止語音合成相關的錯誤修復程序。基本上，它將我們的文本字符串分割成許多較小的塊（在我們的例子中是120個單詞），並使用一個塊接一個塊地調用語音合成API。

  "browser_action": {
    "default_icon": "speech.png"
  },
   "permissions": [
     "activeTab",
     "clipboardRead"
    ]
}

登入後複製

最後，如果HTML5語音合成API不可用，我們將嘗試一個API。我們有相同的屬性，用於知道是否需要停止已經運行的音頻。然後，我們直接創建一個新的Audio對象，並向其傳遞所需API端點的URL，因為我們選擇的演示API直接流式傳輸音頻。我們只需傳遞API密鑰和要轉換的文本。我們還檢查音頻是否觸發錯誤。在這種情況下，我們只需向用戶顯示一個警報，說明此時我們無法提供幫助（我們測試代碼的這個特定的API，Voice RSS，允許免費層級上300次請求）。

{
  "manifest_version": 2,

  "name": "Page to Speech",
  "description": "This extension will produce English speech to whatever text you highlight on a webpage. Highlight text and click the extension's icon",
  "author": "Ivan Dimov",
  "version": "1.0",
  "icons": { 
    "16": "icon16.png",
    "48": "icon48.png",
    "128": "icon128.png"
  },

登入後複製

最後，在任何局部作用域之外，我們調用addHotkeys方法，該方法將開始等待用戶按下正確的熱鍵，並且我們設置一個監聽器，該監聽器將等待從後台腳本接收消息。如果接收到正確的消息（speakHighlight）或按下熱鍵，我們將初始化文本轉語音轉換對象。

 "background": {
    "scripts": ["background.min.js"]
  },
  "content_scripts": [
    {
      "matches": ["http://*/*", "https://*/*"],
      "js": [ "polyfill.min.js", "ext.min.js"],
      "run_at": "document_end"
    }],

登入後複製

結論

瞧，我們有一個不錯的Chrome擴展程序，可以將文本轉換為語音。此處的概念可用於創建用於不同目的的Chrome擴展程序。您是否構建了任何有趣的Chrome擴展程序，或者您想構建一個？請在評論中告訴我！

如果您喜歡這個想法並想進一步開發它，您可以在我們的GitHub存儲庫中找到完整的代碼。如果您想測試它，可以在Chrome網上應用店中找到擴展程序的生產版本。

參考文獻：https://www.php.cn/link/b8b0e04211dce1c104dfcdb685c9b9ad https://www.php.cn/link/e417baa9cdf34202f71b55a27da899e8

文本轉語音Chrome擴展程序常見問題解答

如何安裝文本轉語音Chrome擴展程序？

安裝文本轉語音Chrome擴展程序是一個簡單的過程。首先，打開您的Google Chrome瀏覽器，然後導航到Chrome網上應用店。在搜索欄中，輸入您要安裝的擴展程序的名稱，例如“Read Aloud”或“Text-to-Speech (TTS)”。從搜索結果中點擊擴展程序，然後點擊“添加到Chrome”按鈕。將出現一個彈出窗口要求確認，點擊“添加擴展程序”。擴展程序將被安裝，並且一個圖標將出現在您的瀏覽器工具欄上。