YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔


「 Google 文件」中內建的「語音轉文字」功能,我自己常常在寫稿、採訪、開會時利用。雖然他沒辦法像是「訊飛輸入法」那樣自動加上標點符號,也不會像是「雅婷逐字稿」那樣自動分段。但是 Google 文件在網路順暢的情況下,語音辨識的速度與成功率是非常高的。

不過,我也常常收到讀者的提問:「 Google 文件的語音輸入工具,在人對著電腦麥克風講話時的辨識率很高。但是如果想要播放 YouTube 影片、錄音檔案,讓 Google 文件轉成文字檔,卻很奇怪,有些電腦可以,有些電腦卻沒辦法(在同一個影片、錄音檔的情況下)。」

這樣一來,確實有點麻煩。




首先,檢查影片、錄音檔案本身品質:


想要將 YouTube 影片,或是硬碟中的影片檔案、錄音檔案,轉成文字檔。同時想要透過免費又高準確度的 Google 文件、 Google 翻譯來語音轉文字。但卻遇到下面這個「可能」問題:

  • 在同一台電腦、同一個瀏覽器中,可以一個分頁播放影片,一個分頁用 Google 文件轉成文字嗎?為什麼有的裝置可以,有的裝置不行?
  • 如果使用兩台電腦,一台播影片或錄音檔案,一台用 Google 文件轉文字,但可能同個影片,卻有些電腦可以?有些時候不行?

首先,影片、錄音檔案本身的「品質」有沒有辦法語音辨識?是我會檢查的第一個要點。

影片、錄音檔案本身「人聲」要乾淨清楚,如果發音本身就不清楚、口音太重,或有很多環境音(即使是細細碎碎的雜音),或是演講場地空氣回聲沒有過濾。這些情況下,要用 Google 文件語音轉文字都很難成功。

在影片、錄音檔案本身有品質的情況下,下面「三個方法」,可以試試看。




方法一:同台電腦、同個瀏覽器,影片直接轉文字檔


我會先嘗試第一個方法。

如果驅動程式與硬體支援,那麼同一台筆電,同一個瀏覽器,打開 YouTube 、錄音檔,又另外打開 Google 文件,也可以直接同時語音轉文字。




在電腦中播放著影片、錄音檔語音的情況下,開啟一份新的「 Google 文件」,開啟上方[工具]中的[語音輸入],按下麥克風按鈕。

  • 確認是使用 Google Chrome 瀏覽器。
  • 確認電腦、筆電有麥克風。

那麼這時候就可以直接語音轉文字。

下圖一整篇快 4000 字的文字稿,就是我這樣從 YouTube 影片轉換過來的。




除了 Google 文件,「 Google 翻譯」的電腦網頁版也是好用的語音轉文字工具,用翻譯功能,開啟語音翻譯,就能一次輸入[5000字]的語音轉文字內容。

你甚至可以用這個方法,把外語影片轉成文字檔的同時,順便翻譯!

(附註, Google 翻譯還可以這樣利用:Google 翻譯 App 升級即時鏡頭翻譯,但 Google 智慧鏡頭明顯效果更好




以下是我用第一個方法的測試影片,可以簡單看看其效果(語音轉文字時聲音開得比較大,請注意音量)。






方法二:免裝軟體,開啟電腦喇叭的立體聲混音設定


但是,在不同的硬體裝置下,第一個方法有時候沒辦法成功。

這時候我會試試看第二個方法,直接去調整電腦喇叭的音效設定。

點擊 Windows 右下方的系統列,在[喇叭]上點擊右鍵,選擇[音效]。





打開[聲音]的控制面板,切換到[錄製]分頁。

先在清單空白處點擊右鍵,選擇[顯示已停用的裝置]。




在已停用的錄音裝置中,找找看是否有[ Stereo Mix (立體聲混音)]這個項目,在該項目上點擊右鍵,選擇[啟用],並進一步點擊[設定成預設裝置]。




就這樣設定即可。

回到電腦,播放影片、錄音,然後打開 Google 文件、翻譯的語音輸入工具,應該就可以進行語音轉文字了。

方法二要注意的就是,語音轉文字完成後,要回到[音效]設定,把錄製裝置改回系統預設的裝置,要不然其他原本可用的麥克風、語音輸入功能,會變得無法使用喔!





方法三:安裝 Virtual Audio Cable ,無聲情況下語音轉文字


如果方法二還是不行,那就來試試看方法三。

方法三需要安裝一個「 Virtual Audio Cable (虛擬音源線)」軟體。不過會帶來一個額外的好處:

  • 可以無聲轉錄,這個方法是透過虛擬音源線,直接把影片訊號,傳送到虛擬錄音裝置,過程中「不會發出聲音」:
    • 在安靜環境不會吵到別人,因為喇叭不出聲
    • 在吵雜環境也可以轉錄,因為不會收錄外界聲音
    • 在旁邊講話也沒關係,同上理由

你可以到下面網站安裝「 Virtual Audio Cable (虛擬音源線),直接安裝即可開始使用,基本需求時,不需要複雜設定。

不過「 Virtual Audio Cable (虛擬音源線)」不是完全免費的軟體,所以當使用超過一個小時時,會出現[試用版]這樣的語音干擾。




「 Virtual Audio Cable (虛擬音源線)」安裝完成後,同樣右鍵點擊 Windows 右下方系統列的喇叭,選擇[開啟音效設定]。




然後把輸出裝置、輸入裝置,兩個裝置都設定成[ Line 1 ]這條虛擬音源線即可。




這樣一來,同樣的流程,先播放 YouTube 影片、錄音檔,不過這時候因為聲音走 Line 1 這條虛擬音源線,你會發現喇叭沒有發出聲音,這是正常的。

接著來到 Google 文件、翻譯,開啟語音輸入,會發現語音開始轉成文字輸入進來。

這個方法的好處就是「無聲」,所以不會受到外界其他聲音干擾,也不會發出聲音干擾外界。無論是在咖啡館、辦公室、家裡,都可以「安靜地」完成語音轉文字。




當然,要把影片、錄音檔案的語音轉成文字,還有其他方法:

  • 用手機播放影片、錄音檔案,打開電腦的 Google 文件進行語音辨識。(不過這個方法更加要求影片、錄音的人聲品質要非常清晰)
  • 從電腦播放聲音,從手機的訊飛輸入法轉成文字
  • 等等

如果你還有什麼好辦法,也歡迎一起留言討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔


留言

  1. 回覆
    1. 第一個方法一定可以

      但是第二、第三個方法就要另外研究 Mac 上如何設定了

      刪除
  2. 來毛遂自薦一下:
    https://blog.pulipuli.info/2019/01/web-speech-to-text-speech-recognition.html

    我自己做的,可以載入錄音檔、影片檔、YouTube網址
    然後自動產生有時間戳記、分段的字幕檔

    操作起來像是這樣子
    http://4.bp.blogspot.com/-0qcbQLRg3vI/XeIHJ26g70I/AAAAAAAEbiQ/U0M1fzExEhkpVdYvOBi3RZBunCLC3s3QgCK4BGAYYCw/s1600/anime.gif

    回覆刪除

張貼留言

相關文章:

這個網誌中的熱門文章

掌中澳:免費手機版澳門觀光地圖指南,最輕便的旅遊電子書

OpenShot 免費中文版影片剪輯軟體,何必用精簡版的威力導演

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

Google Maps 我的地圖完全教學!規劃自助旅行攻略

自動化圖片去背教學!只需 Word 或 PowerPoint 搞定

用 Google 地球做簡報!新 3D 我的地圖說故事、旅行回憶教學

5分鐘快速畫一張漂亮簡單甘特圖,插入簡報吸睛報告專案進度

Google 相簿原來也能辨識「手寫中文」筆記,手寫照片轉文字

懶人快速自製 LINE 隨你填貼圖教學,一小時完成兩天上架