網路與語言:微軟亞洲研究院的電腦對聯與人立方關係搜索

chinese-02

之前常常會和朋友討論到網路、語言之間的辨證關係。如果用一般的社會觀感來看,可能很多人會覺得現代人因為慣於使用網路,長期使用例如MSN之類的軟體,於是在語言應用上出現了許多「看起來」好像很有問題的毛病;包括我自己也常常犯的:因為注音輸入法沒有選字而出現的同音錯字。但是在這個網路時代中,我們也可以看到許許多多新的語言被創造出來,而有許多舊的語言因為新的應用而獲得生命。

網路上有豐富的語言資料,而這樣的語言現象也值得被好好的去研究、去發揮,而不要只是簡單的道聽塗說,或對於有些語言充滿偏見。回歸正題,還是有許多人針對網路時代的特性和優勢去對語言進行深入的研究或應用,例如我在「Fun New Run High」看到的「上聯由你做主, 下聯就交給電腦吧!」,由微軟亞洲研究院「自然語言計算組」所開發的「電腦對聯」,透過對於語言傳播的分析,他們開闢了一個「對聯寫作」的網頁,來實驗電腦計算是不是能做出像自然人一樣的語感表達。雖然只是一個有趣的網站實驗,但是看來對於文學系的朋友又多了一個可以偷懶的地方了!

這個「電腦對聯」使用上很簡單,你輸入上聯,然後網站的電腦就會自動幫你對出下聯,雖然大家應該試試看就會用了,不過我想介紹一下裡面幾個有趣的地方。在開始玩之前,你需要輸入「簡體字」才能比較容易配對出下聯,要輸入簡體字其實也不難,例如最新的新注音輸入法(搭配Office2007的)就可以在選項裡面切換簡體或繁體輸入,你也可以利用word來轉換簡體、繁體字,或者我常用的是「靈格斯詞霸」裡面的簡繁體互換功能。

 

電腦對聯:

來到網站後,第一步當然是輸入你的上聯,下面還會提供你一些範例,這個網站允許十個字以內的上聯。確認後按下右邊的﹝對下聯﹞。

chinese-04

 

這時進入第二步後,你就可以看到自動幫你對出來的各種下聯,基本上我覺得它結構語言的水準還不錯(或者說還真的有那個樣子)。如果你想要在特定的位置替換你喜歡的字,可以直接在下聯的相對方格中輸入字彙,然後按﹝刷新候選﹞,下方就會依據你設定的關鍵字重新組合出新的語句。實在是寫作業最好的偷懶法寶(大誤!)。

chinese-03

 

寫作這種詩詞或對句時,很多時候是一種詞彙配對的藝術,所以與其讓電腦幫你想出整個句子,不如讓電腦幫你想出各種可以搭配的詞彙。因此如果電腦自動配對出來的句子你都不喜歡,可以按下面的「換一種方式」,就能夠進入分詞單字的選擇模式。

chinese-06

 

分詞單字的選擇模式中,會列出每種可以使用的單字、單詞,然後你自己組合(圈選)出想要的句子。右上角的﹝分詞方式﹞按鈕,可以讓你選擇句子的結構應該如何拆解分詞,例如拆成「異塵/行者/遊春江」或「異/塵/行/者/遊/春/江」等等。對於寫作對聯來說這是個很實用的小功能。

chinese-07

 

在前面選出了你想要的下聯後,按下﹝題橫批﹞,系統還會依據你的語義找出相關的四字橫聯,非常有意思。而如果你很滿意自己與電腦「合作」出來的這副對聯,那麼按下右上角的﹝秀對聯﹞,就能夠進入本文最前面那張圖片所顯示的網頁,讓你可以製作一些相關的圖片(不過我覺得都有點太俗麗)。

chinese-08

 

另外,這個「電腦對聯」系統更有意思的地方在於,它對於一些中文的語法藝術也有相關的分析能針對某些特殊對聯玩法做出讓你感覺很聰明的變化。例如有時候我們會用「同音異字」的方式來寫對聯,而這時候系統也能夠製作出同樣是同音異字的下聯。

chinese-09

 

另外像是拆字對聯,也能夠被判斷出來,你輸入「日/月/故/明」(日與月合在一起就是明),系統就會配對出例如「女/子/同/好」這樣的下聯出來。

chinese-10

 

另外「電腦對聯」的說明中也提到它可以判斷人名來對出下聯,不過很明顯的,它刻意的把某些敏感的人名和諧了!

chinese-11

 

玩玩人名的對聯有時候也是滿有意思的!系統自己還建議你可以把男女朋友的名字擺上去,製作一些甜蜜的對聯。不過最重要的是,「電腦對聯」很明顯的展現了對於中文的詞性、語法、相關字,與文字藝術上的解構、建構成果,很值得玩玩看。

chinese-16

 

人立方:

另外還想特別介紹的是同樣由微軟亞洲研究院推出的「人立方關係搜索」,人立方是一個去分析網路語言中名詞關聯性的計畫它嘗試製作一個可以判斷網頁中的人名、地名、機構名之間關係的系統,而目前的人立方搜尋器就是一個成果的展現。

當然,因為是電腦智能判別,所以有時候也可以看到一些有趣的結果。不過這個人立方倒是沒有針對關鍵人名做和諧的樣子。

chinese-13

 

異塵行者確實是比較像佛教用語,所以出現這樣的關連倒不令人意外。

chinese-14

 

因為是讓電腦去判斷網路上各種名詞的關係,所以真實人物與虛擬人物之間的界線也就沒有那麼嚴格了!

chinese-15

 

  • 小結:

我一直也同時相信著,網路對於語言的發展一定還是有很大的正向作用,因為以前沒有網路時,文字語言的溝通與變化是多麼的緩慢遲鈍,但是在網路之中,這麼多語料、語系都即時的在線上被串連,許多新的語言被創造出來:這個時代,或許是古往今來「語言」顯得最有生命力的一個時代。因為網路看不到實體,不就正好是以文字符號來作為主要的交流媒介嗎?而twitter類服務也是這種趨勢最好的註腳。

留言

  1. Windows Live Messenger 9.0 beta

    http://download.live.com/messenger

    回覆刪除
  2. 想請教一下異塵兄對 Unicode補完計劃的意見...

    網上不少評論,我想我不在此多說了。

    作者:http://forums.odysseyweb.idv.tw/index.php?showtopic=401

    用了這麼久,移除了... 問題不算很大,但一向用的都看不到日文字 folder,很不方便。

    其實,Unicode補完計劃是不是為禍很大呢?有沒有其他更好的方法呢?

    我在想是否要裝回呢...

    回覆刪除
  3. ......其實,Unicode補完計劃是不是為禍很大呢?有沒有其他更好的方法呢?...

    這個問題對我來說太難了,我無法回答你。網路上的評論我也都有看過,補完計畫的好壞我也不知道。


    我只能說:我有裝。 感覺"在我的電腦和使用環境中"沒問題,但不確定是不是真的沒問題(或許有時候出現電腦問題,但我不知道是不是補完計畫引起的)-------總之就是,我有裝^^

    回覆刪除
  4. 謝謝意見。

    其實,主要的所謂為禍,說的是人家看不懂這些所謂BIG5日文,想深一層... 我也不對外寫日文的,相反我的MP3和相片 folders 現在就可能有些問題...

    畢竟 unicode 還未算全面的方便,就以看圖軟件為例,很多都還未支援。

    所以,我也傾向裝回補完,始終在我目前的狀況而言,還是麻煩多多。

    再謝謝異塵兄意見。

    回覆刪除
  5. http://messenger-9.spaces.live.com/

    詳細功能說明:
    http://messenger-9.spaces.live.com/blog/cns!B55B5F976532ACDD!183.entry?fl=cat

    動畫教學:
    http://messenger-9.spaces.live.com/blog/cns!B55B5F976532ACDD!199.entry

    回覆刪除
  6. http://www.hkepc.com/forum/redirect.php?tid=1068172&goto=lastpost#lastpost

    回覆刪除
  7. 謝謝您提供的這篇文章,其實這就是Unicode補完計畫的最大癥結所在了。

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

Google Maps 我的地圖完全教學!規劃自助旅行攻略

3個 ChatGPT 輸入到輸出實驗,第二大腦筆記用 AI 生成文章報告

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

Google 表單的 10 個專業問卷調查設計秘密教學

如何為筆記命名,建立搜尋規則?我的標題、分類、標籤命名法

Draw.io 中文線上製作流程圖首選!專業水準完全免費

如何用 ChatGPT 加速生成一份有圖有文的簡報,實戰案例教學

Google 表單自動關閉回覆教學:時間人數到達就過期