YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔

作者： Esor Huang 11月 26, 2019

讀者推薦的最新「影片自動上字幕」軟體，更加厲害：「pyTranscriber 影片自動上字幕免費軟體！10分鐘搞定1小時影片」。

「 Google 文件」中內建的「語音轉文字」功能，我自己常常在寫稿、採訪、開會時利用。雖然他沒辦法像是「訊飛輸入法」那樣自動加上標點符號，也不會像是「雅婷逐字稿」那樣自動分段。但是 Google 文件在網路順暢的情況下，語音辨識的速度與成功率是非常高的。

不過，我也常常收到讀者的提問：「 Google 文件的語音輸入工具，在人對著電腦麥克風講話時的辨識率很高。但是如果想要播放 YouTube 影片、錄音檔案，讓 Google 文件轉成文字檔，卻很奇怪，有些電腦可以，有些電腦卻沒辦法（在同一個影片、錄音檔的情況下）。」

這樣一來，確實有點麻煩。

首先，檢查影片、錄音檔案本身品質：

想要將 YouTube 影片，或是硬碟中的影片檔案、錄音檔案，轉成文字檔。同時想要透過免費又高準確度的 Google 文件、 Google 翻譯來語音轉文字。但卻遇到下面這個「可能」問題：

在同一台電腦、同一個瀏覽器中，可以一個分頁播放影片，一個分頁用 Google 文件轉成文字嗎？為什麼有的裝置可以，有的裝置不行？
如果使用兩台電腦，一台播影片或錄音檔案，一台用 Google 文件轉文字，但可能同個影片，卻有些電腦可以？有些時候不行？

首先，影片、錄音檔案本身的「品質」有沒有辦法語音辨識？是我會檢查的第一個要點。

影片、錄音檔案本身「人聲」要乾淨清楚，如果發音本身就不清楚、口音太重，或有很多環境音（即使是細細碎碎的雜音），或是演講場地空氣回聲沒有過濾。這些情況下，要用 Google 文件語音轉文字都很難成功。

在影片、錄音檔案本身有品質的情況下，下面「三個方法」，可以試試看。

或是可以看看下面這段影片，介紹三種 Google 語音轉文字相關工具的應用案例。

方法一：同台電腦、同個瀏覽器，影片直接轉文字檔

我會先嘗試第一個方法。

如果驅動程式與硬體支援，那麼同一台筆電，同一個瀏覽器，打開 YouTube 、錄音檔，又另外打開 Google 文件，也可以直接同時語音轉文字。

在電腦中播放著影片、錄音檔語音的情況下，開啟一份新的「 Google 文件」，開啟上方［工具］中的［語音輸入］，按下麥克風按鈕。

確認是使用 Google Chrome 瀏覽器。
確認電腦、筆電有麥克風。

那麼這時候就可以直接語音轉文字。

下圖一整篇快 4000 字的文字稿，就是我這樣從 YouTube 影片轉換過來的。

除了 Google 文件，「 Google 翻譯」的電腦網頁版也是好用的語音轉文字工具，用翻譯功能，開啟語音翻譯，就能一次輸入［5000字］的語音轉文字內容。

你甚至可以用這個方法，把外語影片轉成文字檔的同時，順便翻譯！

（附註， Google 翻譯還可以這樣利用：Google 翻譯 App 升級即時鏡頭翻譯，但 Google 智慧鏡頭明顯效果更好）

以下是我用第一個方法的測試影片，可以簡單看看其效果（語音轉文字時聲音開得比較大，請注意音量）。

方法二：免裝軟體，開啟電腦喇叭的立體聲混音設定

但是，在不同的硬體裝置下，第一個方法有時候沒辦法成功。

這時候我會試試看第二個方法，直接去調整電腦喇叭的音效設定。

點擊 Windows 右下方的系統列，在［喇叭］上點擊右鍵，選擇［音效］。

打開［聲音］的控制面板，切換到［錄製］分頁。

先在清單空白處點擊右鍵，選擇［顯示已停用的裝置］。

在已停用的錄音裝置中，找找看是否有［ Stereo Mix （立體聲混音）］這個項目，在該項目上點擊右鍵，選擇［啟用］，並進一步點擊［設定成預設裝置］。

就這樣設定即可。

回到電腦，播放影片、錄音，然後打開 Google 文件、翻譯的語音輸入工具，應該就可以進行語音轉文字了。

方法二要注意的就是，語音轉文字完成後，要回到［音效］設定，把錄製裝置改回系統預設的裝置，要不然其他原本可用的麥克風、語音輸入功能，會變得無法使用喔！

方法三：安裝 Virtual Audio Cable ，無聲情況下語音轉文字

如果方法二還是不行，那就來試試看方法三。

方法三需要安裝一個「 Virtual Audio Cable （虛擬音源線）」軟體。不過會帶來一個額外的好處：

可以無聲轉錄，這個方法是透過虛擬音源線，直接把影片訊號，傳送到虛擬錄音裝置，過程中「不會發出聲音」：

在安靜環境不會吵到別人，因為喇叭不出聲
在吵雜環境也可以轉錄，因為不會收錄外界聲音
在旁邊講話也沒關係，同上理由

你可以到下面網站安裝「 Virtual Audio Cable （虛擬音源線）」，直接安裝即可開始使用，基本需求時，不需要複雜設定。

不過「 Virtual Audio Cable （虛擬音源線）」不是完全免費的軟體，所以當使用超過一個小時時，會出現［試用版］這樣的語音干擾。

「 Virtual Audio Cable （虛擬音源線）」安裝完成後，同樣右鍵點擊 Windows 右下方系統列的喇叭，選擇［開啟音效設定］。

然後把輸出裝置、輸入裝置，兩個裝置都設定成［ Line 1 ］這條虛擬音源線即可。

這樣一來，同樣的流程，先播放 YouTube 影片、錄音檔，不過這時候因為聲音走 Line 1 這條虛擬音源線，你會發現喇叭沒有發出聲音，這是正常的。

接著來到 Google 文件、翻譯，開啟語音輸入，會發現語音開始轉成文字輸入進來。

這個方法的好處就是「無聲」，所以不會受到外界其他聲音干擾，也不會發出聲音干擾外界。無論是在咖啡館、辦公室、家裡，都可以「安靜地」完成語音轉文字。

當然，要把影片、錄音檔案的語音轉成文字，還有其他方法：

用手機播放影片、錄音檔案，打開電腦的 Google 文件進行語音辨識。（不過這個方法更加要求影片、錄音的人聲品質要非常清晰）
從電腦播放聲音，從手機的訊飛輸入法轉成文字
等等

如果你還有什麼好辦法，也歡迎一起留言討論。

有興趣的朋友，還可參考［用手機就能把中文廣播、錄音檔轉文字：在 Evernote 做逐字稿］、［用聽書養成效率加倍的閱讀習慣：聽說讀寫合一的讀書筆記法］、［10 個免費語音轉文字工具，支援中文提升多種文書工作效率］等文章。

（歡迎社群分享。但全文轉載請來信詢問，禁止修改上述內文，禁止商業使用，並且必須註明來自電腦玩物原創作者 esor huang 異塵行者，及附上原文連結：YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔）

Esor Huang

電腦玩物站長 Esor （異塵行者），在電腦玩物上的文章有別於單純的軟體和服務介紹，而是更強調軟體和服務背後的數位工作思維及方法，並說明實際應用後帶來的生活改變。著有《電腦玩物站長的筆記思考術》、《大腦減壓的子彈筆記術：用Evernote打造快狠準系統》、《比別人快一步的Google工作術：從職場到人生的100個聰明改造提案》等暢銷書籍。

留言

yuki2136212019年11月27日下午5:56
請問MACBOOK可以使用嗎？
回覆刪除
回覆
布丁布丁吃布丁2019年11月30日下午2:08
來毛遂自薦一下：
https://blog.pulipuli.info/2019/01/web-speech-to-text-speech-recognition.html

我自己做的，可以載入錄音檔、影片檔、YouTube網址
然後自動產生有時間戳記、分段的字幕檔

操作起來像是這樣子
http://4.bp.blogspot.com/-0qcbQLRg3vI/XeIHJ26g70I/AAAAAAAEbiQ/U0M1fzExEhkpVdYvOBi3RZBunCLC3s3QgCK4BGAYYCw/s1600/anime.gif
回覆刪除
回覆
Benson2020年8月20日下午4:55
您好, 想請教一下,

我使用了方案三, 可以成功的進行錄音轉換成文字, 但是GOOGLE文件必須要一直在打開的狀態, 不能跳至其他分頁, 也不能使用其他軟體,

請問這樣是否正常?
是否有其他方法可以背景作業, 在轉換文字時可以同時進行其他工作?

感謝分享!
回覆刪除
回覆

新增留言

張貼留言

為了避免垃圾廣告留言過多，開始測試「留言管理」機制，讓我可以更容易回應讀者留言，並更簡單過濾掉廣告，但只要不是廣告留言都會通過審核。

搜尋此網誌

電腦玩物