雅婷逐字稿:台灣開發語音轉文字 App,從比較看如何變更好



2020/2/5 更新, Google 中文語音輸入法也有自動標點符號功能Google 手機語音中文輸入法加入「全自動插入標點符號功能」

這確實是一個讓人躍躍欲試的消息,這兩天新聞紛紛報導,台灣專注人工智慧的開發團隊 AILabs ,推出了一款中文語音辨識 App :「雅婷逐字稿」,在 Android 與 iOS 免費上架,提供使用者語音轉文字的辨識功能。

追蹤電腦玩物的朋友可能在這一年來,常常看我提到「語音輸出筆記」的相關經驗談。一方面我本來工作上就常常採訪與開會,語音筆記對我來說有實用性(如:實戰採訪與會議筆記: Evernote 錄音筆記最佳化心得)。另一方面當可以在電腦前打字的時間愈來愈少,語音寫作成為我一個累積想法的有效率作法(經驗總結在:用語音寫筆記實戰經驗分享:寫文章、日記、點子的不同作法)。

也因此,我試過許許多多的語音轉文字 App ,不乏支援中文的選擇,所以當看到台灣團隊自主研發中文語音辨識功能,我也馬上安裝,比較看看,也試試看能否應用到自己的工作流程中。




你也可以立刻安裝「雅婷逐字稿」的 Android 版iOS 版來試試看。

以我實際測試一天多後的心得總結,「雅婷逐字稿」雖然距離真的讓人驚豔的語音辨識工具有些距離,也沒有達到他所訴求的中英文夾雜都能辨識的要求,並且也缺乏像是標點符號自動辨識(甚至自動插入)這樣的好用功能。

不過,「雅婷逐字稿」確實具有堪用的中文辨識能力。如果從他是台灣團隊開發的中文語音辨識功能,可能會針對台灣口語在地化,或是像他訴求的「你無需有資料被傳出台灣的隱私和資安疑慮」。那麼這樣的起步,確實有讓我會繼續期許他變得更好的信心。




下圖是我讀自己最近一篇文章:「工作愈忙愈要降低決策疲勞, 6 個方法避免選擇癱瘓」,看看「雅婷逐字稿」的轉換效果。

可以看到,在 Android 版中,「雅婷逐字稿」會自動把每一句分段,雖然無法自動輸入標點符號,但這樣分段,讓未來整理逐字稿時,也還是比文字混在一起易讀。

在辨識上,雖然不是最準確的辨識工具,但整篇來說,還是轉換成一篇看得懂大概意思的逐字稿。

而「雅婷逐字稿」工作時,除了把語音轉換成文字稿,也會同時錄下錄音檔。於是當真的要回顧整理之前的採訪、會議時,可以聽聽錄音檔,或是直接編輯文字稿,雙管齊下,其實符合真實工作需求。

接下來,我會舉一些自己使用過的語音工具,來嘗試看看「雅婷逐字稿」有可能往哪個方向變得更好?





我之前嘗試過一個工具:「Wrappup 聰明手機錄音 App:免費語音轉中文與自動聽寫筆記」,雖然他後來在新版中,不再支援中文語音轉換,但這個工具的設計,卻可能是我目前最喜歡的「採訪、開會錄音工具」。

Wrappup 開始後,可以隨時記錄會議中「重要的一段」,不只把這段話錄音下來,而且同時可以轉成文字記錄。一場採訪與開會後,我就可以獲得這次會議中許多段重要錄音與逐字稿。回到辦公室,邊聽邊剪貼、修改,節省不少時間。

而目前「雅婷逐字稿」的功能設計也具有這樣的方向,他目前最大的特色,就是「兼存錄音與逐字稿」,這樣的對照在工作上是真的實用的。而且「雅婷逐字稿」也能在每段逐字稿隨時中斷、繼續錄音,只錄重點,更符合採訪開會需求。

只是有沒有可能加上更多「逐字稿」需要的關鍵功能呢?例如重點段落註記等等。






在中文語音辨識輸入上,很多朋友都會推薦「訊飛輸入法」,我自己也是這個工具的長期使用者。

其實他的語音辨識速度,可能沒有「 Google 語音輸入」那麼快、那麼準確(以我在台灣的使用情境來說),但是訊飛卻有一個真正讓我的語音筆記變得更有用的關鍵功能,就是可以「自動插入標點符號」。

這樣一來,語音辨識出來的文字稿,就是更加可讀的。

而且老實說,「訊飛輸入法」自動插入的標點符號也不是那麼準確,也常常出錯,但只要有基本的逗點、問號,讓語句可以分段,這樣事後整理真的就節省很多時間了。

而在語音轉文字的辨識準確度上,「雅婷逐字稿」除了號稱要針對台灣口音外,或許也可以在標點符號(或是更聰明的分段)下功夫,因為這是許多中文語音輸入會卡關的地方。(可參考:iPhone、訊飛中文語音輸入法比較,影片實測語音筆記效果




我不是人工智慧的專家,但我是語音轉文字筆記的長期使用者,雖然我的評價可能沒有技術性上的根據,但是身為使用者,長期使用覺得最關鍵的體驗。

我也很期待,「雅婷逐字稿」有一天可以成為我實際工作上的實用 App ,幫助我解決採訪、開會記錄難題,幫助我更快速語音筆記,期待他能愈來愈好。

甚至能夠超越我這篇文章提到的:「10 個免費語音轉文字工具,支援中文提升多種文書工作效率」,各式各樣的語音轉文字工具。

「雅婷逐字稿」 Android App
「雅婷逐字稿」 iOS App


 (歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:雅婷逐字稿:台灣開發語音轉文字 App,從比較來看如何變更好

留言

  1. 完成逐字稿後,如果您還有為影片上外掛字幕的需求時,

    推薦你一個線上語音轉文字的網站 http://eztype.cc

    速可打謄稿機作者的另一作品,也是台灣本土開發的哦!

    回覆刪除
  2. 我不是人工智能专家,但我是语音注释用户

    回覆刪除
  3. In my opinion, these advices will help you to pass exams. I had such experience so I know what I am talking about

    回覆刪除
  4. 辨識結果是由apple傳回來的,怎麼會有不會傳出台灣這種想法呢?

    回覆刪除
    回覆
    1. 雅婷逐字稿辨識用的應該是自己的server, 這些都是很珍貴的training data, 通常收集不易,故也不會輕易分享, 所以應該真的不用擔心會傳出去給Apple 或 Google.

      刪除
  5. 異塵大留著外送茶的留言是要和讀者們一起團購嗎?XD

    逐字閲讀之後,小小建議一下:
    原)「雅婷逐字稿」雖然距離真的讓人驚豔的語音辨識工具有些距離
    潤)「雅婷逐字稿」雖然 **離** 真的讓人驚豔的語音辨識工具有些 **差距**

    回覆刪除
    回覆
    1. 現在真的沒有時間管理大量留言了^^

      感謝你的潤飾

      刪除
  6. 請問錄下來的逐字稿要如何取出呢?
    好像只限制30分,而且一個月只能有3個檔

    回覆刪除
  7. 可以試試看"為什麼不"團隊開發的"家豪逐字稿" XD
    https://play.google.com/store/apps/details?id=com.whynot.jiahaotranscript

    回覆刪除
  8. Are you having issues when it comes to getting programming assignments drafted? IdealAssignmentHelp is here to cover all your programming assignments without any kind of glitches at all. Yes, you can get connected to their Economics Assignment Help team and make it easy for yourself to submit the respective paper within the given deadline and that too matching with the university stated instructions.

    回覆刪除

張貼留言

相關文章:

這個網誌中的熱門文章

牛津大學出版社童書免費線上閱讀,可聽有聲書、玩學習遊戲

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

OpenShot 免費中文版影片剪輯軟體,何必用精簡版的威力導演

Google 相簿的 5 種工作利用,整理簡報圖庫、活動照片更輕鬆

Zoom 超好評的視訊會議軟體:像打電話一樣快速簡單

Google 地圖 15 周年,聊聊 15 個我使用率最高的功能技巧

如何用 Google 免費工具打造快速的 OCR 無紙化工作流程?

Google 中文語音輸入法加入「全自動插入標點符號功能」

自動化圖片去背教學!只需 Word 或 PowerPoint 搞定