Google Gemini 支援上傳錄音檔, AI 一分鐘轉出破萬語音逐字稿
Google Gemini 最近因為升級的修圖功能 Nano Banana ,獲得許多用戶的注意,之前我也分享過這個 AI 修圖功能的教學文章:「用好 Google Gemini AI 修圖升級版教學:整合產品照,編輯人物動作,保持外觀一致性!」,確實可以讓 Gemini 不只是跟 AI 聊天,而是可以當作一個 AI 修圖工具來使用。
更進一步的,今天 Google Gemini 悄悄開放了一個功能,就是支援上傳「錄音檔案」,並且直接透過 Gemini AI 轉成逐字稿。
也就是說,還可以把 Gemini 當做一個 AI 錄音檔轉文字工具來使用。
我以前也介紹過不少錄音檔案轉文字的 AI 工具,例如「Buzz 用 AI 一鍵影音轉文字:免費準確的語音轉字幕、逐字稿軟體」,或是我自己慣用的「會議記錄不麻煩!我常用兩個 Evernote AI 功能整理錄音、手寫筆記」。
而 Google Gemini 支援上傳錄音檔案,直接 AI 轉出逐字稿的好處,就是這個工具操作更簡單,速度非常快,不需另外安裝,能透過提問自訂 AI 整理逐字稿的指令,而且免費帳戶也能使用(只是有限制,下面會實測說明)。
例如下圖,我在付費版(AI Pro)的 Gemini 中,直接上傳一個 90MB 大小,將近一個小時的錄音檔案,透過指令:「轉成台灣慣用繁體中文的逐字稿,盡量保留原文,但修正錯字、去除贅詞,並且適當分段。」
大約不到一分鐘的時間內,就轉出了大約 1 萬 5000 字的完整逐字稿。
不過 Gemini 這個功能,付費、免費帳戶之間有不同的使用限制,我實際測試後,目前的限制如下:
- 付費帳戶( AI Pro )
- 上傳檔案限制:100MB以內。
- 實測一個小時的錄音檔案,可以轉成1萬5000字逐字稿(繁體中文)。
- 免費帳戶
- 上傳檔案限制:100MB以內。(不過可以上傳大檔案,不代表就能處理裡面大量內容)
- 可以處理的文字數量有限,所以如果錄音時間太長,內容量太大,會無法處理。
- 實測:10分鐘以上錄音檔往往就會超出免費版可以處理的文字量。
- 實測:7分鐘錄音檔可以成功處理,大約轉出 1000 字逐字稿(繁體中文)。
- 可處理的語音檔案: MP3、 M4a、 WAV
- 無法處理的語音檔案:AAC(會顯示無法辨識文字內容)
下圖是免費帳戶出現限制時的訊息。
那麼如果是免費的 Google 帳號(或是沒有升級 AI Pro ),但是又想要處理長時間的錄音檔案怎麼辦?
可以試試看 Google NotebookLM(參考:Google NotebookLM 影音升級:用 AI 學習英文 YouTube 影片、 整理大量錄音檔最佳工具),就算是免費帳戶,也可以上傳一個小時的錄音檔案,並轉成逐字稿。
當然, Google NotebookLM 上傳錄音檔後第一時間轉出的逐字稿,尚未經過太多 AI 修飾。
但我們可以用 NotebookLM 的提問指令,再讓 AI 一字不漏地轉成「修飾過的」逐字稿即可。
這樣一來,我實際測試就算是免費的 Google 帳戶,也能用 NotebookLM 成功轉出前述一個小時、 1 萬 5000 字的逐字稿內容。
用 Gemini 直接上傳錄音檔案轉成逐字稿,以及用 NotebookLM 上傳錄音檔案後轉成逐字稿,都是 Google 服務,兩者的使用差別如下:
- Google Gemini
- 速度非常快,操作最簡單,整個流程 30 秒到 1 分鐘內可以完成(包含處理一小時錄音檔也是),直接上傳錄音檔,下好指令,就能輸出自己需要的完整逐字稿。
- 付費帳戶實測,一個小時錄音檔直接轉出 1 萬 5000 字逐字稿,並且內容完整,經過 AI 有效編輯。
- 免費帳戶實測,只能處理大約 10 分鐘內、 1000 字左右逐字稿。
- Google NotebookLM
- 即使是免費帳戶,也能上傳一小時以上錄音檔,並分成幾個步驟轉出需要的上萬字逐字稿。
- 操作需要分成幾個步驟,速度比較慢。例如上面同樣例子,可能需要 3~5 分鐘時間完成(但依然還是非常方便的工具)。
如果需要把錄音檔案轉成逐字稿,在沒有資安疑慮前提下,可以試試看這些工具。
大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:
- 2024/6 最新著作上市,歡迎支持:《高效人生工作法圖解》
- 「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。
- 時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」
- 著作:《防彈筆記法》
- 訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)
- 訂閱「電腦玩物電子報」,不定期出刊。
我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。
(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:Google Gemini 支援上傳錄音檔, AI 一分鐘轉出破萬語音逐字稿)
留言
張貼留言
為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。