2016年11月16日 星期三

Google 翻譯今日全面啟動新 AI 支援英翻中多國語言更自然互譯


快兩個月前,我寫過一篇新聞,提到:「Google 翻譯宣布中翻英系統 AI 大升級,正確性更接近人類翻譯」,文章說到 Google 開發出全新的翻譯 AI 叫做:「Google Neural Machine Translation system (GNMT),( Google 神經機器翻譯系統)」,這個人工智慧翻譯系統最大的特色就是不會斷章取義,會考量整個句子的語境與通順度,翻出更流暢的文意。

只是兩個月前,這個 Google 翻譯新 AI 只開放中翻英做測試。而今天(2016/11/16), Google 正式宣布全面啟動這個新的 AI 翻譯系統,並且可以套用在英語與其他 8 國語言的互譯,8國語言包含法語,德語,西班牙語,葡萄牙語,中文,日語,韓語和土耳其語。(例如英翻中、日翻英等等)

對於台灣用戶來說,英翻中、中翻英的強化,就是很確實的幫助,你可以立刻在 Google 翻譯的網站、 App 等服務端,測試看看翻譯一整句話、一段文章的結果是否更自然,更接近人類翻譯?




下面是我利用「 Google 翻譯擴充套件」,直接翻譯網頁上英文文章的結果,這樣翻完整篇文章,雖然還是有些錯誤之處,但感覺已經是一篇可讀且通順的譯文了。




剛好我最近翻譯了一篇英文文章,可以測試看看今日開放之前與之後的翻譯效果,擷取其中部分英文原文如下

The automatic machine translation systems available today are not able to produce high-quality translations unaided: their output must be edited by a human to correct errors and improve the quality of translation. Computer-assisted translation (CAT) incorporates that manual editing stage into the software, making translation an interactive process between human and computer


之前用 Google 舊版翻譯出來的中文為

目前可用的自動機器翻譯系統無法生產出高品質的翻譯外援:他們的輸出必須由人進行編輯,以糾正錯誤,提高翻譯質量。計算機輔助翻譯(CAT)結合了手動編輯階段到軟件中,使翻譯人與計算機之間的互動過程。


而今天,我使用 Google 翻譯(理論上應該就是使用新版的 AI 翻譯系統),翻譯的結果為

當今可用的自動機器翻譯系統不能夠無輔助地產生高質量的翻譯:它們的輸出必須由人來編輯以校正錯誤提高翻譯的質量。 計算機輔助翻譯(CAT)將手動編輯階段納入軟件,使翻譯成為人與計算機之間的交互過程


可以看到,雖然還是有些用語習慣的錯誤,但在新版的 AI 翻譯中,會主動為了句子更通順,加上一些輔助詞句、連接詞,並且懂得辨別語意來做更正確的整句翻譯(例如第一句話在舊版翻譯中文意是錯的)而非真的完全照著英文單字翻譯。

剛好我昨天也介紹到了 Google 翻譯裡隱藏的工具:「提升大量翻譯文章效率 Google 譯者工具包教學:免費 CAT 工具」。

這樣一來,以後你用 Google 翻譯進行英文文章的初步翻譯,或是在網路上閱讀英文文章,都可以更通順地翻譯為中文,起碼跟之前相比有大加分,大家也可以立刻試試看,並一起來討論你的測試結果。

延伸閱讀相關文章:

轉貼本文時禁止修改,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang(異塵行者),及附上原文連結:Google 翻譯今日全面啟動新 AI 支援英翻中多國語言更自然互譯


2 則留言 :

  1. 謝謝您的介紹!我也覺得這個Google翻譯做得真好。^_^
    且容我說明一下我的想法,希望能做為小小的回饋。 ^_^
    (Google翻譯是多語互譯,以下說明主要是以英翻中為觀點,但各位完全可以自由延伸 ^_^)
    在我看來,翻譯可分成兩個層面。
    第一個層面只要根據簡單規則(查單字、查文法。。。)就能做好,
    另一個層面則是翻譯【道地】的程度。
    只要做好第一個層面,翻譯基本上就能看得懂;
    但如果能做好第二個層面,翻譯看起來就舒服多了。
    不過,之前的Google翻譯,連文法規則都沒做好,
    所以翻出來的東西根本看不懂。
    我常舉的一個例子就是:
    【I love the woman who loves me.】
    這句話就是簡單的形容詞子句。
    句子裡頭的那個who,只要是被翻譯成【誰】,這種翻譯就爛透了!
    《== 之前Google翻譯就是翻成這樣,現在很多其他翻譯引擎還是如此。
    不過,現在這句話Google翻譯成【我愛那個愛我的女人。】
    嗯,真是太好了。
    至於【I love you more than I can say.】
    現在被翻譯成【我愛你比我能說的更多。】
    字面上來說,其實也翻得沒錯,只是。。。不夠道地。
    這個【道地】,就有點屬於藝術層次的工作了。
    身為一個譯者,照理說應該要去做這個【藝術層次】的工作,
    但各位請相信我,大部分譯者過去都是做文法規則層次的翻譯(還經常做錯 ^_^),
    所以市面上一堆爛翻譯書,就是這麼來的。
    譯者不是不想做【道地】,主要是因為
    光是【文法規則】層次的翻譯,往往就耗費掉非常多譯者的精力,
    結果譯者翻到最後沒力了,很多人就不去管道不道地了。。。
    現在翻譯前段的工作,被Google用程式做掉了耶。
    這麼一來,倒不是譯者就會失業;
    應該說,譯者終於可以從文法規則中解放出來,把所有的精力用在更【道地】的翻譯了。
    這絕對是件好事。
    另一方面,大部分人看到英文就害怕,但真有想看的內容,卻又沒有好心人做好翻譯。
    以前就算用Google翻譯,連文法都不對,翻出來的東西根本就看不懂(還不如看原文)。
    現在,如果至少能把文法做對,出來的東西至少就能看懂。。。
    重點是,只要做到【能看懂】的程度,其實就滿足大部分人80%的需求了呀。。。
    我之所以認為這件事很重要,是因為全世界有大量的知識,都保存在英文這個語言裡面。
    舉個例子來說,不管哪個國家的研究生,
    就算用各自不同的母語寫論文,都一定還是會有一個英文的版本。。。
    如果這些被保存在英文中的各種知識,通俗也好、專業也好,
    如今都能被輕易地轉換成至少看得懂的中文,
    然後其中真正重要的內容,也能有更多人去把它轉換成更道地的中文,
    那絕對絕對更是件不得了的好事呀。
    而Google只要做好這件事,
    就會輕易成為中文世界進入英文世界(或是其他語言)的【入口網站】。。。
    入口網站呀好久沒聽到這個名詞了,但
    這就是當年Google強大起來的根源呀。
    我覺得這件事有點像當年唐三藏去天竺取經一樣。
    唐朝盛世人民物質生活極為滿足,於是進一步追求精神文明,
    唐三藏取經(其實還有翻譯佛經)的重要性自有其背景。
    真要說的話,唐三藏就好像唐人要進入佛教世界的入口站一樣。 ^_^
    如今只要沒有戰爭,華人世界應該就要進入盛世,
    對於蘊藏在英文世界卻還沒以中文呈現的一切,需求自然是越來越強。
    所以我認為這件事在歷史上可能也會同樣具有極其重要的地位。
    至於Google的下一步。。。他們可能在想(其實應該早就在做了),
    那個【道地】的程度,要怎麼做到呢?
    像文法規則這樣的東西,寫程式的人花20%的精力就能得到80%的效果。
    至於那個有點【藝術】的層面,如果用傳統程式思維來做的話,
    花80%的精力可能只能得到20%的效果。
    所以【道地】這部分的工作,應該還會有段時間需要靠人來做。
    但是,接下來可能會有兩種發展。
    一種是,因為Google翻譯已經把英文翻譯成至少看得懂的中文了,
    所以在【道地化】的過程中,譯者面對的已經不是只有【英文】,
    而是【英文】+【至少看得懂的中文】。
    也就是說,可能就會有一些專業很強但英文不好的人,
    他們也可以開始做一些【道地化】的工作了。
    另一種可能的發展,我還在觀察,
    Google不知道會不會繼續發展更好的平台,收集大家【道地化】翻譯的結果。。。
    (其實現在已經有但不夠好用)
    因為這種【道地化】的翻譯,可說是非常珍貴,而且。。。
    非常適合雲端化,適合用大數據的方式來產生人工智慧。
    對吼,現在有大數據,有人工智慧耶。
    而Google就是最適合做這件事的人。
    因此,總有一天程式連【道地化】也可以做得很好。
    【符合文法規則】這種層次,一般程式開發者就能做到,
    (我之前就是很想用軟體去做這件事但現在被做掉了)
    但【道地化】這個層次的工作,恐怕就是Google這種公司才能做的工作了。。。
    我只能推想,Google接著就能把這件事做好,
    然後,或許應該在這樣的發展上,想想下一步應該去做什麼好呢? ^_^
    好了,就這樣,我講完了哈哈哈。

    回覆刪除

相關文章: