雅婷逐字稿:台灣開發語音轉文字 App,從比較看如何變更好



2020/2/5 更新, Google 中文語音輸入法也有自動標點符號功能Google 手機語音中文輸入法加入「全自動插入標點符號功能」

這確實是一個讓人躍躍欲試的消息,這兩天新聞紛紛報導,台灣專注人工智慧的開發團隊 AILabs ,推出了一款中文語音辨識 App :「雅婷逐字稿」,在 Android 與 iOS 免費上架,提供使用者語音轉文字的辨識功能。

追蹤電腦玩物的朋友可能在這一年來,常常看我提到「語音輸出筆記」的相關經驗談。一方面我本來工作上就常常採訪與開會,語音筆記對我來說有實用性(如:實戰採訪與會議筆記: Evernote 錄音筆記最佳化心得)。另一方面當可以在電腦前打字的時間愈來愈少,語音寫作成為我一個累積想法的有效率作法(經驗總結在:用語音寫筆記實戰經驗分享:寫文章、日記、點子的不同作法)。

也因此,我試過許許多多的語音轉文字 App ,不乏支援中文的選擇,所以當看到台灣團隊自主研發中文語音辨識功能,我也馬上安裝,比較看看,也試試看能否應用到自己的工作流程中。




你也可以立刻安裝「雅婷逐字稿」的 Android 版iOS 版來試試看。

以我實際測試一天多後的心得總結,「雅婷逐字稿」雖然距離真的讓人驚豔的語音辨識工具有些距離,也沒有達到他所訴求的中英文夾雜都能辨識的要求,並且也缺乏像是標點符號自動辨識(甚至自動插入)這樣的好用功能。

不過,「雅婷逐字稿」確實具有堪用的中文辨識能力。如果從他是台灣團隊開發的中文語音辨識功能,可能會針對台灣口語在地化,或是像他訴求的「你無需有資料被傳出台灣的隱私和資安疑慮」。那麼這樣的起步,確實有讓我會繼續期許他變得更好的信心。




下圖是我讀自己最近一篇文章:「工作愈忙愈要降低決策疲勞, 6 個方法避免選擇癱瘓」,看看「雅婷逐字稿」的轉換效果。

可以看到,在 Android 版中,「雅婷逐字稿」會自動把每一句分段,雖然無法自動輸入標點符號,但這樣分段,讓未來整理逐字稿時,也還是比文字混在一起易讀。

在辨識上,雖然不是最準確的辨識工具,但整篇來說,還是轉換成一篇看得懂大概意思的逐字稿。

而「雅婷逐字稿」工作時,除了把語音轉換成文字稿,也會同時錄下錄音檔。於是當真的要回顧整理之前的採訪、會議時,可以聽聽錄音檔,或是直接編輯文字稿,雙管齊下,其實符合真實工作需求。

接下來,我會舉一些自己使用過的語音工具,來嘗試看看「雅婷逐字稿」有可能往哪個方向變得更好?





我之前嘗試過一個工具:「Wrappup 聰明手機錄音 App:免費語音轉中文與自動聽寫筆記」,雖然他後來在新版中,不再支援中文語音轉換,但這個工具的設計,卻可能是我目前最喜歡的「採訪、開會錄音工具」。

Wrappup 開始後,可以隨時記錄會議中「重要的一段」,不只把這段話錄音下來,而且同時可以轉成文字記錄。一場採訪與開會後,我就可以獲得這次會議中許多段重要錄音與逐字稿。回到辦公室,邊聽邊剪貼、修改,節省不少時間。

而目前「雅婷逐字稿」的功能設計也具有這樣的方向,他目前最大的特色,就是「兼存錄音與逐字稿」,這樣的對照在工作上是真的實用的。而且「雅婷逐字稿」也能在每段逐字稿隨時中斷、繼續錄音,只錄重點,更符合採訪開會需求。

只是有沒有可能加上更多「逐字稿」需要的關鍵功能呢?例如重點段落註記等等。






在中文語音辨識輸入上,很多朋友都會推薦「訊飛輸入法」,我自己也是這個工具的長期使用者。

其實他的語音辨識速度,可能沒有「 Google 語音輸入」那麼快、那麼準確(以我在台灣的使用情境來說),但是訊飛卻有一個真正讓我的語音筆記變得更有用的關鍵功能,就是可以「自動插入標點符號」。

這樣一來,語音辨識出來的文字稿,就是更加可讀的。

而且老實說,「訊飛輸入法」自動插入的標點符號也不是那麼準確,也常常出錯,但只要有基本的逗點、問號,讓語句可以分段,這樣事後整理真的就節省很多時間了。

而在語音轉文字的辨識準確度上,「雅婷逐字稿」除了號稱要針對台灣口音外,或許也可以在標點符號(或是更聰明的分段)下功夫,因為這是許多中文語音輸入會卡關的地方。(可參考:iPhone、訊飛中文語音輸入法比較,影片實測語音筆記效果




我不是人工智慧的專家,但我是語音轉文字筆記的長期使用者,雖然我的評價可能沒有技術性上的根據,但是身為使用者,長期使用覺得最關鍵的體驗。

我也很期待,「雅婷逐字稿」有一天可以成為我實際工作上的實用 App ,幫助我解決採訪、開會記錄難題,幫助我更快速語音筆記,期待他能愈來愈好。

甚至能夠超越我這篇文章提到的:「10 個免費語音轉文字工具,支援中文提升多種文書工作效率」,各式各樣的語音轉文字工具。

「雅婷逐字稿」 Android App
「雅婷逐字稿」 iOS App


 (歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:雅婷逐字稿:台灣開發語音轉文字 App,從比較來看如何變更好

留言

  1. 完成逐字稿後,如果您還有為影片上外掛字幕的需求時,

    推薦你一個線上語音轉文字的網站 http://eztype.cc

    速可打謄稿機作者的另一作品,也是台灣本土開發的哦!

    回覆刪除
  2. 我不是人工智能专家,但我是语音注释用户

    回覆刪除
  3. In my opinion, these advices will help you to pass exams. I had such experience so I know what I am talking about

    回覆刪除
  4. 辨識結果是由apple傳回來的,怎麼會有不會傳出台灣這種想法呢?

    回覆刪除
    回覆
    1. 雅婷逐字稿辨識用的應該是自己的server, 這些都是很珍貴的training data, 通常收集不易,故也不會輕易分享, 所以應該真的不用擔心會傳出去給Apple 或 Google.

      刪除
  5. 異塵大留著外送茶的留言是要和讀者們一起團購嗎?XD

    逐字閲讀之後,小小建議一下:
    原)「雅婷逐字稿」雖然距離真的讓人驚豔的語音辨識工具有些距離
    潤)「雅婷逐字稿」雖然 **離** 真的讓人驚豔的語音辨識工具有些 **差距**

    回覆刪除
    回覆
    1. 現在真的沒有時間管理大量留言了^^

      感謝你的潤飾

      刪除
  6. 請問錄下來的逐字稿要如何取出呢?
    好像只限制30分,而且一個月只能有3個檔

    回覆刪除
  7. 可以試試看"為什麼不"團隊開發的"家豪逐字稿" XD
    https://play.google.com/store/apps/details?id=com.whynot.jiahaotranscript

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

Google Maps 我的地圖完全教學!規劃自助旅行攻略

個人知識管理的時間平衡心法,忙碌中我如何維持高效率輸入輸出

5 條「這時候,不要做」清單打破無意識行動模式的低效率循環

Google 表單的 10 個專業問卷調查設計秘密教學

如何用 ChatGPT 加速生成一份有圖有文的簡報,實戰案例教學

ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney