Google 相簿原來也能辨識「手寫中文」筆記,手寫照片轉文字


透過 Google 的 AI 辨識技術,讓 OCR 文字辨識的功能不僅提高準確率,可以更方便的應用在許多日常情境上。例如「大絕招!用 Google 翻譯 App 複製書籍講義紙上文字」。

而在「智慧鏡頭」功能開始擴大到 Google 相機、 Google 相簿等不同工具上,於是原本的相簿管理工具,也可以轉變成:「如果把 Google 相簿變成名片、海報、紙本 OCR 整理工具?

之前在電腦玩物寫過上述的應用後,我不只是介紹新奇功能,而是在自己日常工作、生活中,還真的常常拿出來使用!例如拿到開會上課講義、名片傳單,拍照儲存到 Google 相簿後,快速複製上面的重點摘要、電話地址內容。

也因為常常運用,最近開始發現,不只是印刷出來的講義、傳單可以辨識上面的中文內容,甚至連我自己的手寫筆記,也能夠辨識、複製上面的部分中文手寫文字內容!




當然,手寫中文因為每個人字跡不同,以及很容易字跡潦草的情況下,要成功辨識文字內容的機率還是有很大侷限。

不過在我的實際測試中,如果是類似下面這樣的情況:

  • 刻意寫得乾淨、整齊的中文手寫筆記,例如刻意做的讀書筆記。
  • 文字量不會太多的手寫中文便利貼。例如電話中的快速註記。
  • 寫得比較潦草的英文、數字內容,例如手寫英文公告。

那麼拍照轉存到 Google 相簿後,利用 Google 相簿的智慧鏡頭,就會有很大比例可以成功「手寫轉文字」。

像是手寫英文公告如果可以轉文字,那麼翻譯成中文也就沒有問題,又能延伸出更多利用。




下面來分享我的實際測試情況,聊聊看哪些例子容易成功,什麼例子一定會辨識失敗。

首先說明一下操作方式:


其中就包含了文字辨識。(智慧鏡頭的各種應用案例,可參考:Google 相簿「智慧鏡頭」上線,讓你用不一樣的方式回味照片

例如下圖,在 Google 相簿的一張手寫筆記照片上,按下[智慧鏡頭],分析出來的文字會出現反白框,點選反白框,就會顯示辨識出來的文字內容,可以直接「複製文字」,轉成數位筆記。

而容易成功的例子,就是刻意把筆記寫工整,版面整齊,文字筆畫清楚(草書體即使不是潦草,也不容易成功)。




當然這樣的機器辨識,很難 100% 完美,會有一些錯誤、缺漏字,但只要像是前面所說的:

  • 筆記工整
  • 版面整齊
  • 文字筆畫清楚

那麼錯誤的比例就會降低很多,達到「可用」的複製轉成數位文字的程度。




而如果筆記內容是英文、數字,那麼單獨成功辨識的機率又會大增,可以更容易複製出英文、數字(例如手寫電話號碼)的內容。




除了文字本身寫得很潦草外,有些情況下的文字辨識成功率會大幅降低。

例如在筆記上手繪了心智圖、流程圖,這時候因為版面是圖像為主,所以也會造成包含在圖像中的大多數中文文字都無法成功辨識。




如果筆記版面上用直書,或是直書、橫書錯雜,這樣也會很大程度的降低辨識成功的機率。




或許有可能 Google 相簿剛剛結合智慧鏡頭時,就可以辨識這樣的手寫中文、英文了。只是我那時候沒有想到有這樣的成功機率,所以也沒有刻意去測試。

直到最近因為常用「智慧鏡頭」來辨識照片,於是遇到了好幾次手寫筆記出現可以複製文字的選項,才讓我想要來測試研究一番。

如果有常用或研究過這個功能的朋友,也歡迎補充你們的心得。



(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:Google 相簿原來也能辨識「手寫中文」筆記,手寫照片轉文字

留言

  1. line最近也有新增這個功能唷~

    回覆刪除
  2. 請問有人知道 Gboard 如何備份學習的詞庫嗎?
    每次在一台新裝置安裝 Gboard, 開始用注音就發現又要從新學習
    注意了一下設定裡面, 沒看見備份功能及帳號選項

    Google 注音時 記得是有的

    回覆刪除
    回覆
    1. 目前似乎沒有很好的內建功能。

      Gboard 裡面是有一個字典的功能,但這部分都是要自己手動加入新詞。

      另外 Gboard 也會自動學習用戶輸入的詞彙,但這部分主要是儲存在目前的手機端(例如我目前可以在「進階」中看到記憶了 1811 個我常用的詞彙),確實在換手機後,有可能就要重新學習。

      可能是為了隱私,才做了這樣的設定,可參考:https://support.google.com/gboard/answer/9334583?hl=zh-Hant

      刪除
  3. 最近發現,雲端硬碟也有實裝這個功能!
    我可以搜尋硬碟裡照片中的文字!

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

Google Maps 我的地圖完全教學!規劃自助旅行攻略

個人知識管理的時間平衡心法,忙碌中我如何維持高效率輸入輸出

5 條「這時候,不要做」清單打破無意識行動模式的低效率循環

Google 表單的 10 個專業問卷調查設計秘密教學

如何用 ChatGPT 加速生成一份有圖有文的簡報,實戰案例教學

ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney