YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔



讀者推薦的最新「影片自動上字幕」軟體,更加厲害:pyTranscriber 影片自動上字幕免費軟體!10分鐘搞定1小時影片」。

「 Google 文件」中內建的「語音轉文字」功能,我自己常常在寫稿、採訪、開會時利用。雖然他沒辦法像是「訊飛輸入法」那樣自動加上標點符號,也不會像是「雅婷逐字稿」那樣自動分段。但是 Google 文件在網路順暢的情況下,語音辨識的速度與成功率是非常高的。

不過,我也常常收到讀者的提問:「 Google 文件的語音輸入工具,在人對著電腦麥克風講話時的辨識率很高。但是如果想要播放 YouTube 影片、錄音檔案,讓 Google 文件轉成文字檔,卻很奇怪,有些電腦可以,有些電腦卻沒辦法(在同一個影片、錄音檔的情況下)。」

這樣一來,確實有點麻煩。




首先,檢查影片、錄音檔案本身品質:


想要將 YouTube 影片,或是硬碟中的影片檔案、錄音檔案,轉成文字檔。同時想要透過免費又高準確度的 Google 文件、 Google 翻譯來語音轉文字。但卻遇到下面這個「可能」問題:

  • 在同一台電腦、同一個瀏覽器中,可以一個分頁播放影片,一個分頁用 Google 文件轉成文字嗎?為什麼有的裝置可以,有的裝置不行?
  • 如果使用兩台電腦,一台播影片或錄音檔案,一台用 Google 文件轉文字,但可能同個影片,卻有些電腦可以?有些時候不行?

首先,影片、錄音檔案本身的「品質」有沒有辦法語音辨識?是我會檢查的第一個要點。

影片、錄音檔案本身「人聲」要乾淨清楚,如果發音本身就不清楚、口音太重,或有很多環境音(即使是細細碎碎的雜音),或是演講場地空氣回聲沒有過濾。這些情況下,要用 Google 文件語音轉文字都很難成功。

在影片、錄音檔案本身有品質的情況下,下面「三個方法」,可以試試看。

或是可以看看下面這段影片,介紹三種 Google 語音轉文字相關工具的應用案例。






方法一:同台電腦、同個瀏覽器,影片直接轉文字檔


我會先嘗試第一個方法。

如果驅動程式與硬體支援,那麼同一台筆電,同一個瀏覽器,打開 YouTube 、錄音檔,又另外打開 Google 文件,也可以直接同時語音轉文字。




在電腦中播放著影片、錄音檔語音的情況下,開啟一份新的「 Google 文件」,開啟上方[工具]中的[語音輸入],按下麥克風按鈕。

  • 確認是使用 Google Chrome 瀏覽器。
  • 確認電腦、筆電有麥克風。

那麼這時候就可以直接語音轉文字。

下圖一整篇快 4000 字的文字稿,就是我這樣從 YouTube 影片轉換過來的。




除了 Google 文件,「 Google 翻譯」的電腦網頁版也是好用的語音轉文字工具,用翻譯功能,開啟語音翻譯,就能一次輸入[5000字]的語音轉文字內容。

你甚至可以用這個方法,把外語影片轉成文字檔的同時,順便翻譯!

(附註, Google 翻譯還可以這樣利用:Google 翻譯 App 升級即時鏡頭翻譯,但 Google 智慧鏡頭明顯效果更好




以下是我用第一個方法的測試影片,可以簡單看看其效果(語音轉文字時聲音開得比較大,請注意音量)。






方法二:免裝軟體,開啟電腦喇叭的立體聲混音設定


但是,在不同的硬體裝置下,第一個方法有時候沒辦法成功。

這時候我會試試看第二個方法,直接去調整電腦喇叭的音效設定。

點擊 Windows 右下方的系統列,在[喇叭]上點擊右鍵,選擇[音效]。





打開[聲音]的控制面板,切換到[錄製]分頁。

先在清單空白處點擊右鍵,選擇[顯示已停用的裝置]。




在已停用的錄音裝置中,找找看是否有[ Stereo Mix (立體聲混音)]這個項目,在該項目上點擊右鍵,選擇[啟用],並進一步點擊[設定成預設裝置]。




就這樣設定即可。

回到電腦,播放影片、錄音,然後打開 Google 文件、翻譯的語音輸入工具,應該就可以進行語音轉文字了。

方法二要注意的就是,語音轉文字完成後,要回到[音效]設定,把錄製裝置改回系統預設的裝置,要不然其他原本可用的麥克風、語音輸入功能,會變得無法使用喔!





方法三:安裝 Virtual Audio Cable ,無聲情況下語音轉文字


如果方法二還是不行,那就來試試看方法三。

方法三需要安裝一個「 Virtual Audio Cable (虛擬音源線)」軟體。不過會帶來一個額外的好處:

  • 可以無聲轉錄,這個方法是透過虛擬音源線,直接把影片訊號,傳送到虛擬錄音裝置,過程中「不會發出聲音」:
    • 在安靜環境不會吵到別人,因為喇叭不出聲
    • 在吵雜環境也可以轉錄,因為不會收錄外界聲音
    • 在旁邊講話也沒關係,同上理由

你可以到下面網站安裝「 Virtual Audio Cable (虛擬音源線),直接安裝即可開始使用,基本需求時,不需要複雜設定。

不過「 Virtual Audio Cable (虛擬音源線)」不是完全免費的軟體,所以當使用超過一個小時時,會出現[試用版]這樣的語音干擾。




「 Virtual Audio Cable (虛擬音源線)」安裝完成後,同樣右鍵點擊 Windows 右下方系統列的喇叭,選擇[開啟音效設定]。




然後把輸出裝置、輸入裝置,兩個裝置都設定成[ Line 1 ]這條虛擬音源線即可。




這樣一來,同樣的流程,先播放 YouTube 影片、錄音檔,不過這時候因為聲音走 Line 1 這條虛擬音源線,你會發現喇叭沒有發出聲音,這是正常的。

接著來到 Google 文件、翻譯,開啟語音輸入,會發現語音開始轉成文字輸入進來。

這個方法的好處就是「無聲」,所以不會受到外界其他聲音干擾,也不會發出聲音干擾外界。無論是在咖啡館、辦公室、家裡,都可以「安靜地」完成語音轉文字。




當然,要把影片、錄音檔案的語音轉成文字,還有其他方法:

  • 用手機播放影片、錄音檔案,打開電腦的 Google 文件進行語音辨識。(不過這個方法更加要求影片、錄音的人聲品質要非常清晰)
  • 從電腦播放聲音,從手機的訊飛輸入法轉成文字
  • 等等

如果你還有什麼好辦法,也歡迎一起留言討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔


留言

  1. 回覆
    1. 第一個方法一定可以

      但是第二、第三個方法就要另外研究 Mac 上如何設定了

      刪除
  2. 來毛遂自薦一下:
    https://blog.pulipuli.info/2019/01/web-speech-to-text-speech-recognition.html

    我自己做的,可以載入錄音檔、影片檔、YouTube網址
    然後自動產生有時間戳記、分段的字幕檔

    操作起來像是這樣子
    http://4.bp.blogspot.com/-0qcbQLRg3vI/XeIHJ26g70I/AAAAAAAEbiQ/U0M1fzExEhkpVdYvOBi3RZBunCLC3s3QgCK4BGAYYCw/s1600/anime.gif

    回覆刪除
    回覆
    1. 感謝分享,其實我確實也正在測試您的這個工具喔

      刪除
  3. 您好, 想請教一下,

    我使用了方案三, 可以成功的進行錄音轉換成文字, 但是GOOGLE文件必須要一直在打開的狀態, 不能跳至其他分頁, 也不能使用其他軟體,

    請問這樣是否正常?
    是否有其他方法可以背景作業, 在轉換文字時可以同時進行其他工作?

    感謝分享!

    回覆刪除
    回覆
    1. 一樣有這個問題,目前發現在 GOOGLE 翻譯使用可以背景轉逐字稿,或許您可以改使用 Google 翻譯進行逐字稿

      刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

Google Maps 我的地圖完全教學!規劃自助旅行攻略

3個 ChatGPT 輸入到輸出實驗,第二大腦筆記用 AI 生成文章報告

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

Google 表單的 10 個專業問卷調查設計秘密教學

如何為筆記命名,建立搜尋規則?我的標題、分類、標籤命名法

Draw.io 中文線上製作流程圖首選!專業水準完全免費

如何用 ChatGPT 加速生成一份有圖有文的簡報,實戰案例教學

Google 表單自動關閉回覆教學:時間人數到達就過期