2015年6月30日 星期二

如何為每個研究專案建立一個 Google 自訂搜尋引擎?


一般網站經營者會使用「 Google 自訂搜尋」(註1)來架設站內、企業內的搜尋引擎,但這個免費工具對任何人「進行資料研究」都很有幫助。有時候進行一個新的專案,接觸自己沒有觸碰過的領域,會需要學習很多新的知識、新的名詞、查詢新的資料,這時候除了閱讀專書、請教專家外,相信很多工作者也會開始在 Google 上進行資料搜尋。

雖然 Google 的資料搜尋可以幫我們找到最熱門、最重要的資料,卻不一定可以挖掘出對專業研究來說「更需要深入探索的專門但冷門的資料」,例如在 Google 搜尋裡同一個網站如果對應搜尋關鍵字有多筆資料時, Google 通常只會顯示出這個網站最熱門的那一筆。

於是在專案或論文的資料研究中,要如何做,才能深入挖掘出更具體的資料內容呢?

或許一個值得試試看的辦法,就是幫每一個專案建立「 Google 自訂搜尋引擎」,用自建搜尋引擎來搜尋這個領域中幾個專門網站的所有內容,等於建立一個自動化的專案知識庫,花最少的時間收集,但是就能更深入的挖出更多需要的資訊。

(註1:回顧留存我在 2008 年就推薦這個服務時的舊文章:Google自訂搜尋引擎 - 打造個人資訊檢索系統,這樣做才叫強大




這時候,我們要做的步驟就是先在一般的 Google 搜尋中,找到幾個跟研究主題有關的專門網站,例如我想研究「數位工作方法」,我先用一些基本的關鍵字在一般 Google 搜尋中找出談相關方法的部落格與網站,然後把他們加入我的自訂搜尋引擎中,這個階段只是先收集網站的名單。

把這些網站名單建立到 Google 自訂搜尋引擎的索引清單中,這樣一個便利的知識庫就完成了(註2)。

當沒有這樣做的時候,我們可能每一次找資料就只能在 Google 找到熱門的淺層資料,若要深入每個專業網站去找深層的資料,就要一個一個網站分別搜尋。

但是如果建立了這些專業網站的聯合搜尋引擎,那麼我們只要進入這個統一的搜尋引擎找,就能一次聯合挖掘這些網站裡所有相關的深層資料。這個自訂搜尋引擎索引了這些專業網站的所有內容,實質上也就好像是一個自動剪貼完成的知識庫一樣了。

(註2:歡迎參考我自建的數位工作方法研究搜尋引擎




  • 1. 加入想要搜尋的特定網站

下面,就讓我用目前版本的 Google 自訂搜尋介面,加上我自己長期使用下覺得最重要、最精簡的流程,來分享如何快速幫你的論文研究、專案研究建立 Google 自訂搜尋引擎的方法。

首先,進入「 Google 自訂搜尋」,然後按下〔 Add 〕就可以進入增加 Google 自訂搜尋的設定畫面,而第一步就是把目前需要研究的相關網站網址,一個一個的加入。

進入「 Google 自訂搜尋」網頁






  • 2. 建立搜尋引擎名稱,完成!

我的經驗是一開始不用想說等到找齊網站才開始建立自訂搜尋引擎,通常我找到幾個值得研究的專業網站,我就先加入自訂搜尋引擎中,以後一邊搜尋研究時,一邊自然就會發現更多相關網站,到時候再陸續加入也不遲。

當把目前掌握的研究對象都加入後,只要輸入自訂搜尋引擎的名稱,按下建立,就完成啦!


就這麼簡單,最基本的 Google 自訂搜尋引擎,就只需要這兩個步驟就可以建立,並且就能在專案、論文研究時幫我們深入挖掘資料了!

記得這時候到[公開網址]處取得你的自訂搜尋引擎的網址,以後就能透過這個自訂搜尋網頁完成更深入的搜尋需要。





  • 3. 進階設定:搜尋整個網路,但特別強調收錄網站的搜尋引擎

那第三步驟之後是要做什麼呢?接下來我要分享的是我自己使用經驗裡,覺得對挖掘資料又更有幫助的幾個設定方式,提供進階使用者一些參考。

首先我想做的是,雖然我加入了 10 個網站在自訂搜尋引擎中,但我希望 Google 搜尋時還是可以同時去找其他我沒有加入的網站資料,只是幫我把加入的 10 個網站的資料權重提高,一方面深入找出專業網站內容,一方面也不錯失 Google 一般性搜尋裡的熱門資料。

這時候,進入這個自訂搜尋引擎的「設定」中。


拉到頁面下方,把網站清單右上角的選項改成「搜尋整個網路,但特別強調收錄的網站」。


這樣一來,這個自訂搜尋引擎的結果可能就長得像是下面這樣,我搜尋一個關鍵字,會找到其他我沒有加入的一般性熱門資料,但是我特別加入的網站結果也會浮現出來。

這種設定幫助我在一開始建立自訂搜尋引擎時,一邊可以同時找出其他還沒加入的專業網站與資料來源,一邊補充到我的搜尋引擎。





  • 4. 進階設定:標籤分頁,只搜尋特定網站

但是上述的做法,就會伴隨有時候「我只想搜尋已經加入自訂搜尋清單的網站」的情況,這時候可以用分頁搜尋的方式來解決。

同樣進入自訂搜尋引擎的編輯畫面,這時候選擇「搜尋功能」,在「限制條件」頁面按下[新增],先輸入一個你自己決定名稱的標籤,例如我這裡設定為[收錄網站]。


然後回到[設定]頁面,把所有清單裡的網站都加上[收錄網站]這個標籤。


回到自訂搜尋引擎的搜尋畫面,可以看到搜尋結果中多了一個[收錄網站]的分頁,當我切換到這個分頁時,呈現的結果就是已經收錄在搜尋引擎清單裡並且加上[收錄網站]標籤的網站內容。

通常全部搜尋、收錄網站搜尋這兩個分頁,就可以很有效率的滿足我的研究需求。





  • 5. 進階設定:搜尋中本地內容加權

如果你常常搜尋英文關鍵字,但是你希望在自訂搜尋引擎中更多的出現中文的資料怎麼辦?

我自己測試一個比較好的做法是,在編輯自訂搜尋引擎的[搜尋功能]中,切換到[進階]頁面,在[ Boost Results By Locale ]中選擇[台灣]。


這樣一來,在全部的混合搜尋中,不只會突顯我已經收錄的網站,還會特別突顯來自台灣的網站內容,增加我們搜尋到更多本地資料的機會。





  • 6. 進階設定:版面完整寬度

最後,我還會進入[外觀與風格]設定中,把網頁搜尋的樣式改成「完整寬度」,因為這樣就會在同一頁完成搜尋並呈現搜尋結果,速度最快。

以上,就是我自己在進行一個新的企劃、新的專案時,會利用「 Google 自訂搜尋」來建立研究需要的知識庫(註2),幫助自己後續更容易深入挖掘相關資料的方法(註3),希望對大家有所幫助,好好利用這個免費的工具。

(註3:跟過去的自己取經:用第二大腦高效率思考的系統方法
(註4:活用資料庫的資料收集法:試試加上這四個關鍵步驟!

進入「 Google 自訂搜尋」網頁

轉貼本文時禁止修改,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang(異塵行者),及附上原文連結:如何為每個研究專案建立一個 Google 自訂搜尋引擎?



4 則留言 :

  1. 好文推,不管你寫論文,跑專案,應該把 google 自訂搜索列為你的夥伴。
    同場加映 Google 學術搜尋 https://scholar.google.com.tw/schhp?hl=zh-TW

    回覆刪除
  2. 6.進階設定:版面完整寬度

    這個有沒有適用手機的版面呢?目前每個版面在手機上顯示的搜尋框都太小,搜尋結果的呈現樣式也很不OK,可惜了這麼一個好工具。

    回覆刪除
  3. 小弟想請教一下,搜尋引擎是否可以設定成將搜尋結果與標題愈符合的排在前面?
    因為覺得很奇怪~明明標題一樣,有些搜尋結果都不會排在前面或搜不到
    但明明關鍵字跟標題是相同的...orz

    回覆刪除

相關文章: