2011年3月26日 星期六

支援中文的HTML5文字雲產生器,分析部落格,微網誌的語言地圖

html5 text-01

滿久之前國外有一個文字雲產生器:「Wordle」,可以分析你輸入的文章,或是直接讀取你的部落格,經由統計常用詞彙來創作出一幅專屬於你的字頻地圖。當看到自己長時間書寫的文字內容,變成由許多關鍵字結成的某種看似無義卻又有意的新組合,一定非常有感覺。只可惜,Wordle只支援英文分析。

而上個禮拜,台灣的程式高手Timdream發佈了自己製作的「HTML5文字雲:文章詞彙分析機」,終於,中文世界的朋友現在可以玩玩看支援中文詞彙的字頻分析器了!

於是我第一時間也把自己的電腦玩物部落格,還有我自己的噗浪、Twitter帳號「倒進去」試試看--可以用Firefox 4但要「跑非常久」(所以我強烈建議使用Google Chrome來玩)--成果如本文開頭圖片所示,電腦玩物整個網站的詞彙由「google、可以、firefox」構成三大核心,很合理,也非常的有趣。

 

HTML5文字雲會自動分析中文、英文詞彙出現的頻率,然後規劃關鍵字大小與排版組合,看似隨機的統計中,常常會發現很多可以解讀出什麼的樂趣。

例如電腦玩物文字雲的這一個角落上,出現了「就可電腦(Joke電腦)?」這樣好像打中什麼要害的詞彙,而右方排列而下的興趣、各種、可能、應該、介紹,又頗有樣子的說出了我的為文風格?

html5 text-02

 

除了部落格之外,也可以玩玩看噗浪、Twitter上發表過的微網誌能夠組合出什麼有趣的文字雲。

html5 text-04

 

設計者很貼心為台灣用戶的做了一個文字雲產生器的啟動畫面,左方可以依據我們的需要,看是要填入部落格RSS,或是直接輸入痞客邦、無名小站、噗浪Twitter的帳號ID,按下〔開始〕,就能順利產生出自己的專屬文字雲。

當然,請記住,使用「Google Chrome」來跑,會順暢很多!

html5 text-05

11 則留言 :

  1. 喔喔,感謝介紹。

    補充說明一下,Firefox 因為使用的 HTML5 canvas 技術有一些效能問題,才會變成可以跑但是跑很慢。

    對於參加台灣 Mozilla 社群這麼久竟然寫出來的程式 Firefox 竟然跑不動我也覺得很無奈 ...

    回覆刪除
  2. 但是我還是很有耐心的用Firefox 4跑完了........為了第一張截圖XD

    回覆刪除
  3. 若facebook也可用就好玩多了

    回覆刪除
  4. 原本還在想我跑起來很正常啊…
    接著開了IE...不支援
    然後再開Chrome,速度一樣…
    最後把官方版Firefox4開出來,的確很慢……
    所以原本以為是因為我用蒼月的關系,但都是Firefox4應該不會有差才對,所以對照兩邊差別後關掉了硬體加速,然後就正常了…
    所以這是硬體加速的運算部分造成bug吧…

    不知道Chrome開硬體加速時會不會有這問題,畢竟我很少開這個瀏覽器,所以記憶中是沒開硬體加速的

    回覆刪除
  5. 補充…看來真的只是Firefox的硬體加速問題
    因為手邊的Chrome10的確是有開啟硬體加速的
    只能看會不會早點修正了吧(雖然我是要用GDI++,所以一直沒開這功能…)

    回覆刪除
  6. 怪 噗浪不行耶!

    回覆刪除
  7. 可能是因為我私密帳號吧

    回覆刪除
  8. 我試了一下twitter賬戶,好像呈現的結果是最近的詞語在文字云顯得更大一些

    回覆刪除
  9. 如果你用Blogger的話
    不一定是Blogger帳號ID
    像我的
    http://r809.blogspot.com/
    我就要取"r809"才會正常
    那是要取網址的http://[這個地方].blogspot.com/

    回覆刪除
  10. 我試著使用這個標籤雲工具,利用我們公司的斷詞系統,替電腦玩物跑了一個搜尋標籤雲 + 搜尋結果
    http://goo.gl/utdSm
    請惠賜意見

    回覆刪除
  11. 我試著用這標籤雲工具,搭配另一種斷詞系統,用電腦玩物的資料跑了標籤雲。請給我一些意見 http://goo.gl/w4Fft
    感謝

    回覆刪除

相關文章: