AntiDupl.NET 比對相似圖片內容、移除重複圖片的免安裝軟體

antidupl-02

我很喜歡到網路上尋找電影、遊戲、風景或獨特設計的桌布圖片檔案,下載後可以當做收藏,也可以拿到桌面隨時替換,只是長期下載而疏於整理的情況下(其實還真的很難每次看到好看的圖片時,就先去找找之前有沒有下載過XD),硬碟中累積了大量重複的圖片檔案而不自知。加上平常移動管理時,也可能不小心在不同資料夾保存了重複圖檔。這時候,要如何快速找出這些重複的圖片呢?

最近在「[分享] AntiDupl.Net - 支援 Unicode 的重複圖片搜尋器」一文中看到了AntiDupl.NET」這款優秀的小工具,AntiDupl.NET不是去比對檔案名稱、大小、日期或屬性資料,而是真的去掃描比對「圖像內容的相似程度」,幫你找出那些看起來很像的圖片,還能自動提供適當的刪除建議,然後你就可以快速把自己硬碟裡的重複圖片檔案清理乾淨。

類似的工具還有很知名的「VisiPics」,後面這款工具雖然很久沒更新了,不過在穩定度、速度與支援度上仍然很優秀(VisiPics甚至可以比對RAW檔),下次有機會再和讀者介紹推薦。

  • AntiDupl.NET:http://antidupl.narod.ru/english/index.html
  • AntiDupl.NET下載點:http://antidupl.narod.ru/english/download.html
  • Windows XP以上作業系統用戶,請下載「AntiDupl.NET」系列,目前最新版本為1.4.0.0(下載頁面下方的其它檔案看起來版本號比較高,但那是給舊版Windows使用的)
  • Windows XP用戶需要先安裝.NET Framework 2.0
  • 支援比對JPEG, GIF, TIFF, BMP,PNG
  • 支援Unicode,可以比對日文、簡體中文檔名的圖檔。
  • 特別說明:AntiDupl.NET一般使用下搜尋比對速度很快,但是如果遭遇大量檔案比對時,有可能因為記憶體不足而出錯。我在擁有2GB記憶體的XP系統測試,比對一萬多張圖檔,全部圖檔大小約8GB,這時候就發生在搜尋結束後出錯的情況。

 

  • 01.自動解壓免安裝

下載AntiDupl.NET(XP以上用戶請下載AntiDupl.NET系列,目前最新版本為1.4.0.0),這是一個自動解壓縮檔案,執行後將AntiDupl.NET解壓到任何資料夾,接著你可以隨意移動、攜帶。要使用時直接執行裡面的AntiDupl.NET.exe即可(Windows XP用戶需要先安裝.NET Framework 2.0)。

antidupl-10

 

  • 02.簡單易用的操作介面

軟體的操作非常簡單直覺,啟動AntiDupl.NET後,可以在左上方工具列看到三個按鈕,分別是「執行搜索比對(Start Search)」、「設定比對資料夾(Paths)」、「選項設定(Options)」

antidupl-08

 

  • 03.設定需要比對的資料夾

首先我們要「設定比對資料夾(Paths)」,你要在這邊決定哪些資料夾要加入搜索,預設檢索值會包含在內的子資料夾。我們可以透過:

  • 「Search」頁面加入要搜尋比對的資料夾。
  • 「Ignore」設定要忽略的資料夾或檔案。
  • 「Valid」可以設定「直接讀取」前次已經檢查並記錄過的資料夾結果(AntiDupl.NET會自動記錄檢查結果),這樣可以節省搜尋比對時間。
  • 「Delete」頁面讓你添加「優先刪除的資料夾」,AntiDupl.NET在搜尋比對後會自動建議你應該刪除哪個重複檔案,而如果你在這邊優先設定要刪除的資料夾,那麼在該資料夾裡的重複圖檔就會優先被自動建議刪除。

另外特別再說明一次的是,AntiDupl.NET目前支援比對JPEG, GIF, TIFF, BMP,PNG等圖檔,雖然沒有像VisiPics還可以比對RAW,但是VisiPics不支援Unicode,而AntiDupl.NET可以支援Unicode,讓你(針對繁體用戶來說的話)比對日文、簡體中文檔名的圖檔。

antidupl-05

 

  • 04.等待產生搜尋結果

決定這次要搜尋比對的資料夾後,回到主介面按下〔Start Search〕,就可以開始搜尋了,依據你的檔案數量和大小可能需要等待一段時間(如果你是多核心的CPU處理器,AntiDupl.NET可以自動幫你開啟多線程的檢查,讓結果更快產生)。

antidupl-01

 

  • 05.利用預覽視窗刪除重複圖片

搜尋比對結束後,會自動返回AntiDupl.NET主介面,這時候你可以在右方欄位看到所有的搜尋結果,選擇某一項結果後,就可以在左方欄位看到兩張重複圖片的對比預覽圖。

如果你確認兩張圖片確實是重複圖檔,這時候你就可以透過左方欄位中的功能按鈕進行相關移除動作,按鈕的圖示很直覺,打叉表示要刪除那個欄位的圖片,所以這裡由左到右的功能分別是:

刪除上方圖片、刪除下方圖片、刪除兩張圖片、用上方圖片取代下方圖片、用下方圖片取代上方圖片、將這項結果標示為錯誤判斷

如果你將該項結果標示為錯誤判斷,這個動作會被記錄下來,以後你進行其它搜尋比對時就不會再把這兩張圖片視為重複。

antidupl-03

 

  • 06.利用結果清單大量刪除重複圖片

我們也可以在右方結果清單欄位中,選取大量圖片進行一次性的刪除、取代動作(按住〔Shift〕或〔Ctrl〕後,用滑鼠同時選取多項結果)。這裡的按鈕功能和前面相同,我就不重複解釋了。

值得注意的是,在結果清單中有幾個很有幫助的說明欄位:

  • group:這個欄位會把重複圖片編組,例如找到的重複圖片可能不只兩張,而是有3張,這時候這3張圖片就會被分成2組,每組2張重複圖片,你可以透過group分組來處理超過2張的重複圖檔。
  • Different:顯示這項結果中兩張圖片的差異程度,數值愈低表示差異愈少。
  • Transformation:因為AntiDupl.NET可以比對旋轉過的圖片,而這項說明欄位可以告訴你這兩張圖片是否有不同的旋轉角度(綠色打勾表示兩圖方向相同,沒有旋轉過)。
  • Recommendation:推薦動作,AntiDupl.NET會自動推薦你應該刪除哪一張圖檔比較好。你還可以點選上方工具列的〔Process selected results automatically〕,將選取項目全部依據建議動作刪除。

antidupl-04

 

  • 07.儲存這次的搜尋結果

透過前面的預覽視窗、結果清單,你應該可以很清楚直覺的把自己硬碟中的重複圖檔好好清理一番。而如果你這次掃描過後暫時沒有時間馬上執行清理(可能找到的圖片數量很多,一項一項檢查很花時間,你又不想利用自動推薦功能大量清理),你可以透過左上方的【Save results】將這次搜尋結果儲存起來,下次可以重新【Load】以進行後續動作。

antidupl-09

 

  • 08.設定AntiDupl.NET的比對強度

上面幾個步驟,大概就是AntiDupl.NET的基本操作流程,基本上這個軟體不需要設定就能夠符合大多數人的需求,所以最後我們才稍微看看設定裡有哪些可以調整的項目。首先,在〔Check〕頁面我們保留預設勾選的項目,其它項目的功能分別是:

  • 「search rotated and mirror image dupls」:搜尋旋轉過的重複圖檔,可以讓你把方向不同但內容相同的圖片找出來。
  • 「Control image size」:大小不同(解析度,例如1024*768和800*600)的圖片視為不同圖片,預設值是大小不同但內容相同的圖片也視為重複圖片。
  • 「Control image type」:格式不同(例如jpg、png、bmp’、gif)的圖片視為不同圖片,,預設值是格式不同但內容相同的圖片也視為重複圖片。
  • 「Threshold difference」:多少程度以內的不同內容將會被忽略,並視兩者為重複圖片。例如預設值5%,那麼兩張圖片只要不同處少於5%,就會被視為重複圖檔。

antidupl-06

 

  • 09.設定AntiDupl.NET的搜尋範圍

最後再設定〔Search〕項目,你可以決定要掃描哪些格式的圖檔,以及掃描時是否要包含子資料夾等等。

antidupl-07

 

  • 小結:

AntiDupl.NET是一款簡單易用、免費免安裝的重複圖片搜索器,幫你快速掃描硬碟中的相似圖片,找出重複圖檔後讓你方便的進行移除和管理。AntiDupl.NET支援BMP、GIF、JPG、PNG、TIF等常見圖片格式,並且是真正的去比對兩張圖片的「圖像內容」,即使兩張圖片大小不同、格式不同,但是只要圖像內容相同,AntiDupl.NET就可以幫你抓出來!對於用戶整理硬碟圖檔來說是個實用的小工具,推薦給讀者們試用看看。

留言

  1. 我覺得VisiPics對我來說並沒有特別好用
    尤其在差異細微的圖檔之間他會分不出來
    。常發生兩張遊戲的CG圖(差異在於表情的不同)VisiPics判定為同一張圖的情形之後我就還是以ACDSee的尋找複檔來做找尋重複圖檔的動作了(可能是保守地以檔案大小來判定)

    回覆刪除
  2. 我覺得這類尋找重複圖片的軟體是那種平常都用不到,偶爾想用又很需要的。這真是有在蒐集圖片的人之福音~

    以前第一次想到要找VisiPics來用的時候真是感動,比自己處理快多了...

    不過偶爾誤判的情形有點麻煩是真的。如果軟體可以將比對結果以相似度進行排序說不定會更好,比較方便自己去過濾那些可能誤判的圖片。

    回覆刪除
  3. AntiDupl.NET剛好有相關設定可以滿足上面兩位朋友的需求,我文章裡都有提到:

    1.可以設定相似度的底限,例如調整到1%以內,讓細微差別的圖片可以不被判定為重複圖檔

    2.在搜尋結果清單中,可以針對誤差值來排序,讓你優先看看兩張圖誤差值比較大,可能是誤判的檔案

    回覆刪除
  4. 另外理解這兩個軟體的原理,其實也就可以理解它們共同的侷限:

    兩者都是幫你找出「內容相似」的圖片,

    既然技術如此,如果你的兩張圖片真的內容相似,那麼被判定為可能是重複,這應該也無可厚非,倒也不需要說是誤判^^

    回覆刪除
  5. 好像不能直接選擇一顆硬碟掃描
    我想掃描整顆硬碟的內容,結果一按開始才閃一下就沒了..

    回覆刪除
  6. 我沒有試過掃描整顆硬碟

    感謝您的回饋提醒^^

    回覆刪除
  7. XnView(看圖軟體,免費,支援超過400種圖片格式)就有內建這個功能了.......
    只要是他能開啟的格式都能比對(我試過把大型繪圖軟體通用的PSD格式丟進去比對,他照樣能比對.......)
    所以也沒有圖片格式不支援的問題,因為它能開啟超過400種圖片格式

    回覆刪除
  8. 感謝您的推薦

    下次我也會來比對看看兩者功能的優劣異同^^

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

微軟 Bing AI 繪圖工具 Image Creator 免費開放,30秒輕鬆生成圖片

Arc 瀏覽器 windows 版測試心得,用四大介面改造升級專注工作流

Google Maps 我的地圖完全教學!規劃自助旅行攻略

個人知識管理的時間平衡心法,忙碌中我如何維持高效率輸入輸出

5 條「這時候,不要做」清單打破無意識行動模式的低效率循環

Google 表單的 10 個專業問卷調查設計秘密教學

如何用 ChatGPT 加速生成一份有圖有文的簡報,實戰案例教學

ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney