免費!中文影片語音轉文字字幕,支援超大影片與長時間錄音


不久前在電腦玩物測試了:「YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔」,在該文底下,一位台灣開發者「布丁布丁吃什麼」留言分享自己設計的一個工具:「 Web Speech to Text 」,顧名思義,也是一個語音轉文字的線上工具,不過它的特色是:

  • 支援中文語音轉文字。
  • 可以將影片、錄音轉成有「時間軸」的「字幕檔案」。
  • 支援轉換電腦裡的影片檔、錄音檔,而且「不需上傳」。
  • 看起來對影片時間、檔案大小,都「沒限制」
  • 免費!

我實際測試了兩段影片:

  • 10分鐘左右影片,250MB大小,順利轉換出中文字幕檔。
  • 40多分鐘影片,超過2GB,也順利轉換出中文字幕檔。

影片、錄音轉換成字幕檔需要多久呢?他是一邊播放影片,一邊轉成文字檔,所以實際運作時間就是影片、錄音的播放時間。轉換速度很即時,我的測試中也都沒有出現卡住或中斷的情況。

簡而言之,如果你希望影片、錄音轉成文字檔內容,尤其需要製作影片字幕,「 Web Speech to Text 」是一個值得試試看的免費工具。




Web Speech to Text 」雖然是一個線上工具,不過並不需要註冊帳號,處理本機硬碟中的影片、錄音檔案時,甚至不需要上傳,是「直接在電腦本機中處理完成」。

因為這款工具,是利用 Google Chrome 內建的 Web Speech API ,用瀏覽器來處理語音轉文字,再加上自動轉成字幕檔的程式(加上每段文字的影片時間標記)。所以處理影片其實是用 Google Chrome 當作軟體,也就不需要上傳影片到雲端了。

使用上的幾個限制是:

  • 要使用 Google Chrome 瀏覽器處理,最好更新到最新版。
  • 需要另外安裝一個「 Virtual Audio Cable 」虛擬音源線軟體(後面會更深入介紹)。
  • 只能處理下面格式的本機影片或錄音檔案:
    • 影片格式:MP4,而且必須是以VP8、VP9、H.264編碼。
    • 聲音格式:WAV、OGG、MP3格式。
  • 當然,也可以處理線上 YouTube 的影片(直接提供網址即可處理)。

下面就讓我來試試看「 Web Speech to Text 」的操作流程吧!




首先,為了讓「同一台電腦中」可以同時播放影片,又把影片聲音輸入到麥克風。我們需要安裝一個叫做「 Virtual Audio Cable 」的虛擬音源線軟體,它在我們這個工具上的用途,簡單來說就是:「建立一個虛擬喇叭、一個虛擬麥克風,讓影片聲音直接輸入到虛擬麥克風,進行轉錄文字」。

我的前一篇文章「YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔」中,也有介紹到「 Virtual Audio Cable 」。所以我這邊直接進行操作說明。

到「 Virtual Audio Cable 」網站下載軟體,完成安裝。




接著在電腦系列列的[喇叭]圖示上點擊右鍵,選擇[開啟音效設定]。

在[音效]設定頁面,將輸出裝置改成「 Virtual Audio Cable 」的「 Line 1」,將輸入裝置也改成「 Virtual Audio Cable 」的「 Line 1」。這樣就設定完成了。

要注意幾個細節:

  • 這樣設定是把自己的喇叭、麥克風改成虛擬裝置,所以轉錄影片時不會聽到任何聲音,這是正常的。
  • 完成語音轉文字後,記得改回來,要不然你的電腦就無法正常播放聲音,或是使用麥克風。
  • 這是一款試用軟體,連續使用一個小時後,會出現女性聲音說明試用提醒,




然後來到「 Web Speech to Text 」網站,左上方有幾個載入影片的方式:

  • 讀取本機檔案:
    • 從電腦硬碟直接載入影片、錄音檔案。
    • 不需上傳,所以可以立即載入。
    • 我測試超過 2 GB 的影片檔案,都能順利載入。
  • 讀取網址:
    • 貼上一段 YouTube 影片的網址。

 載入影片後,按下[開始辨識],就會開始一邊播放影片,一邊辨識出字幕。




一個很棒的地方是,因為透過「 Virtual Audio Cable 」虛擬音源線轉錄,所以在語音轉文字的過程中:

  • 只要不關掉這個網頁分頁即可。
  • 可以切換到瀏覽器其他分頁繼續工作。
  • 可以換到其他軟體視窗繼續工作。

轉錄時,可以即時在下方看到「字幕時間」、「字幕文字」,甚至要即時修改辨識錯誤的文字也沒問題。





最後辨識完成,在[輸出格式]選擇要下載成 srt 字幕檔案,或是有包含時間標記的 TXT 檔案,按下[下載]即可。




上圖可以看到,一段 40 分鐘的影片,從頭到尾順利辨識完成。

以文字辨識效果來說:

  • 正確率可以達到實用的等級,當然還是需要回頭潤稿、修正錯誤。
  • 不會自動加上標點符號,但如果是字幕,反而不算大問題。

如果是需要為影片、錄音檔案加上字幕的朋友,推薦可以試試看這個「 Web Speech to Text 」。

而如果是單純想要語音轉文字,那麼最近我推薦的這個「Google 即時轉錄:超準確中文語音轉文字可自動加上標點符號」,則是更厲害的選擇。


(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:免費!中文影片語音轉文字字幕,支援超大影片與長時間錄音

留言

  1. 作者已經移除這則留言。

    回覆刪除
  2. 站長, 推介試用這個開源程式:
    https://github.com/raryelcostasouza/pyTranscriber/releases/tag/v1.3-stable

    這程式可直接處理 mp3或mp4檔案, 不用安裝 Virtual Audio Cable, 速度比用 "Web Speech to Text" 快得多。

    回覆刪除
  3. Thank you very much for seeing 밤알바 information.
    Thank you very much for seeing 밤알바 information.

    回覆刪除

張貼留言

相關文章:

這個網誌中的熱門文章

搜尋舊版報紙讀台灣歷史,免帳號檢索200萬筆半世紀前新聞

OpenShot 免費中文版影片剪輯軟體,何必用精簡版的威力導演

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

掌中澳:免費手機版澳門觀光地圖指南,最輕便的旅遊電子書

自己做 2020 年筆記本, 11 種行事曆、筆記範本下載列印網站

自動化圖片去背教學!只需 Word 或 PowerPoint 搞定

Google Maps 我的地圖完全教學!規劃自助旅行攻略

Glossika 線上強化台語、客家話日常聽說能力,60種語言自學

如何用 Telegram 建立 20 萬人討論群組、公開頻道教學

2020 重新整理 7 種數位工作工具與資料,我的整理心法教學