YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔



讀者推薦的最新「影片自動上字幕」軟體,更加厲害:pyTranscriber 影片自動上字幕免費軟體!10分鐘搞定1小時影片」。

「 Google 文件」中內建的「語音轉文字」功能,我自己常常在寫稿、採訪、開會時利用。雖然他沒辦法像是「訊飛輸入法」那樣自動加上標點符號,也不會像是「雅婷逐字稿」那樣自動分段。但是 Google 文件在網路順暢的情況下,語音辨識的速度與成功率是非常高的。

不過,我也常常收到讀者的提問:「 Google 文件的語音輸入工具,在人對著電腦麥克風講話時的辨識率很高。但是如果想要播放 YouTube 影片、錄音檔案,讓 Google 文件轉成文字檔,卻很奇怪,有些電腦可以,有些電腦卻沒辦法(在同一個影片、錄音檔的情況下)。」

這樣一來,確實有點麻煩。




首先,檢查影片、錄音檔案本身品質:


想要將 YouTube 影片,或是硬碟中的影片檔案、錄音檔案,轉成文字檔。同時想要透過免費又高準確度的 Google 文件、 Google 翻譯來語音轉文字。但卻遇到下面這個「可能」問題:

  • 在同一台電腦、同一個瀏覽器中,可以一個分頁播放影片,一個分頁用 Google 文件轉成文字嗎?為什麼有的裝置可以,有的裝置不行?
  • 如果使用兩台電腦,一台播影片或錄音檔案,一台用 Google 文件轉文字,但可能同個影片,卻有些電腦可以?有些時候不行?

首先,影片、錄音檔案本身的「品質」有沒有辦法語音辨識?是我會檢查的第一個要點。

影片、錄音檔案本身「人聲」要乾淨清楚,如果發音本身就不清楚、口音太重,或有很多環境音(即使是細細碎碎的雜音),或是演講場地空氣回聲沒有過濾。這些情況下,要用 Google 文件語音轉文字都很難成功。

在影片、錄音檔案本身有品質的情況下,下面「三個方法」,可以試試看。

或是可以看看下面這段影片,介紹三種 Google 語音轉文字相關工具的應用案例。






方法一:同台電腦、同個瀏覽器,影片直接轉文字檔


我會先嘗試第一個方法。

如果驅動程式與硬體支援,那麼同一台筆電,同一個瀏覽器,打開 YouTube 、錄音檔,又另外打開 Google 文件,也可以直接同時語音轉文字。




在電腦中播放著影片、錄音檔語音的情況下,開啟一份新的「 Google 文件」,開啟上方[工具]中的[語音輸入],按下麥克風按鈕。

  • 確認是使用 Google Chrome 瀏覽器。
  • 確認電腦、筆電有麥克風。

那麼這時候就可以直接語音轉文字。

下圖一整篇快 4000 字的文字稿,就是我這樣從 YouTube 影片轉換過來的。




除了 Google 文件,「 Google 翻譯」的電腦網頁版也是好用的語音轉文字工具,用翻譯功能,開啟語音翻譯,就能一次輸入[5000字]的語音轉文字內容。

你甚至可以用這個方法,把外語影片轉成文字檔的同時,順便翻譯!

(附註, Google 翻譯還可以這樣利用:Google 翻譯 App 升級即時鏡頭翻譯,但 Google 智慧鏡頭明顯效果更好




以下是我用第一個方法的測試影片,可以簡單看看其效果(語音轉文字時聲音開得比較大,請注意音量)。






方法二:免裝軟體,開啟電腦喇叭的立體聲混音設定


但是,在不同的硬體裝置下,第一個方法有時候沒辦法成功。

這時候我會試試看第二個方法,直接去調整電腦喇叭的音效設定。

點擊 Windows 右下方的系統列,在[喇叭]上點擊右鍵,選擇[音效]。





打開[聲音]的控制面板,切換到[錄製]分頁。

先在清單空白處點擊右鍵,選擇[顯示已停用的裝置]。




在已停用的錄音裝置中,找找看是否有[ Stereo Mix (立體聲混音)]這個項目,在該項目上點擊右鍵,選擇[啟用],並進一步點擊[設定成預設裝置]。




就這樣設定即可。

回到電腦,播放影片、錄音,然後打開 Google 文件、翻譯的語音輸入工具,應該就可以進行語音轉文字了。

方法二要注意的就是,語音轉文字完成後,要回到[音效]設定,把錄製裝置改回系統預設的裝置,要不然其他原本可用的麥克風、語音輸入功能,會變得無法使用喔!





方法三:安裝 Virtual Audio Cable ,無聲情況下語音轉文字


如果方法二還是不行,那就來試試看方法三。

方法三需要安裝一個「 Virtual Audio Cable (虛擬音源線)」軟體。不過會帶來一個額外的好處:

  • 可以無聲轉錄,這個方法是透過虛擬音源線,直接把影片訊號,傳送到虛擬錄音裝置,過程中「不會發出聲音」:
    • 在安靜環境不會吵到別人,因為喇叭不出聲
    • 在吵雜環境也可以轉錄,因為不會收錄外界聲音
    • 在旁邊講話也沒關係,同上理由

你可以到下面網站安裝「 Virtual Audio Cable (虛擬音源線),直接安裝即可開始使用,基本需求時,不需要複雜設定。

不過「 Virtual Audio Cable (虛擬音源線)」不是完全免費的軟體,所以當使用超過一個小時時,會出現[試用版]這樣的語音干擾。




「 Virtual Audio Cable (虛擬音源線)」安裝完成後,同樣右鍵點擊 Windows 右下方系統列的喇叭,選擇[開啟音效設定]。




然後把輸出裝置、輸入裝置,兩個裝置都設定成[ Line 1 ]這條虛擬音源線即可。




這樣一來,同樣的流程,先播放 YouTube 影片、錄音檔,不過這時候因為聲音走 Line 1 這條虛擬音源線,你會發現喇叭沒有發出聲音,這是正常的。

接著來到 Google 文件、翻譯,開啟語音輸入,會發現語音開始轉成文字輸入進來。

這個方法的好處就是「無聲」,所以不會受到外界其他聲音干擾,也不會發出聲音干擾外界。無論是在咖啡館、辦公室、家裡,都可以「安靜地」完成語音轉文字。




當然,要把影片、錄音檔案的語音轉成文字,還有其他方法:

  • 用手機播放影片、錄音檔案,打開電腦的 Google 文件進行語音辨識。(不過這個方法更加要求影片、錄音的人聲品質要非常清晰)
  • 從電腦播放聲音,從手機的訊飛輸入法轉成文字
  • 等等

如果你還有什麼好辦法,也歡迎一起留言討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔


留言

  1. 回覆
    1. 第一個方法一定可以

      但是第二、第三個方法就要另外研究 Mac 上如何設定了

      刪除
  2. 來毛遂自薦一下:
    https://blog.pulipuli.info/2019/01/web-speech-to-text-speech-recognition.html

    我自己做的,可以載入錄音檔、影片檔、YouTube網址
    然後自動產生有時間戳記、分段的字幕檔

    操作起來像是這樣子
    http://4.bp.blogspot.com/-0qcbQLRg3vI/XeIHJ26g70I/AAAAAAAEbiQ/U0M1fzExEhkpVdYvOBi3RZBunCLC3s3QgCK4BGAYYCw/s1600/anime.gif

    回覆刪除
    回覆
    1. 感謝分享,其實我確實也正在測試您的這個工具喔

      刪除
  3. 您好, 想請教一下,

    我使用了方案三, 可以成功的進行錄音轉換成文字, 但是GOOGLE文件必須要一直在打開的狀態, 不能跳至其他分頁, 也不能使用其他軟體,

    請問這樣是否正常?
    是否有其他方法可以背景作業, 在轉換文字時可以同時進行其他工作?

    感謝分享!

    回覆刪除
    回覆
    1. 一樣有這個問題,目前發現在 GOOGLE 翻譯使用可以背景轉逐字稿,或許您可以改使用 Google 翻譯進行逐字稿

      刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

Google Maps 我的地圖完全教學!規劃自助旅行攻略

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

待辦清單到底有用無用?避開完成焦慮,符合人性的使用待辦清單

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

5 條「這時候,不要做」清單打破無意識行動模式的低效率循環

Readwise Reader 如何自訂 AI 中文摘要指令?我的 prompts 分享

Google 表單自動關閉回覆教學:時間人數到達就過期

Google 表單的 10 個專業問卷調查設計秘密教學

跟分心和平共處,不一定要移除干擾也能專心致志的專注力策略