Linux用戶寶典:借助dupeGuru刪除重復文件
譯文最近,我接到了任務:清理我父親的文件和文件夾。可是面臨的難題是,里面有大量名稱不正確的重復文件。由于外部驅動器上有備份,同時編輯同一個文件的多個版本,或者甚至改變目錄結構,同一個文件會復制多次、更換名稱、更換位置,完全占用磁盤空間。查明每一個文件成了異常困難的問題。幸好,有一款小巧的軟件可以找到并刪除你系統上的重復文件,從而幫助節省寶貴的時間,那就是dupeGuru。這個重復文件刪除軟件用Python編寫而成,年初換成了GPLv3許可證。所以是時候用它來清理你的系統了!
dupeGuru的安裝
在Ubuntu上,你可以添加Hardcoded Software個人程序包存檔(PPA):
- $ sudo apt-add-repository ppa:hsoft/ppa
- $ sudo apt-get update
然后用下列命令安裝:
- $ sudo apt-get install dupeguru-se
在Arch Linux上,該程序在在AUR中(https://aur.archlinux.org/packages/dupeguru-se/)。
如果你喜歡自己編譯,源代碼在GitHub上(https://github.com/hsoft/dupeguru)。
dupeGuru的基本用法
DupeGuru的初衷是既快速又安全。這意味著該程序在系統上運行時不會亂套。它刪除你不想要刪除的文件的可能性很小。然而,既然我們仍在討論文件刪除,謹小慎微總歸是好主意:做好備份始終必不可少。
一旦你采取了防范措施,就可以通過這個命令來啟動duprGuru了:
- $ dupeguru_se
你應該會看到文件夾選擇畫面,你可以在這里添加想要掃描、以刪除重復文件的文件夾。
一旦你選擇了目錄并啟動掃描,dupeFuru就會顯示結果:以列表的形式顯示重復文件。
請注意:默認情況下,dupeGuru根據文件內容、而不是根據文件名稱來匹配文件。為了確保你沒有誤刪除重要文件,匹配列為你顯示了匹配算法的準確性。你可以從這里選擇想要執行操作的重復文件,點擊“Action”(操作)按鈕,就可以看到可用的操作。
可以選擇的操作相當廣泛。簡而言之,你可以刪除重復文件、將重復文件移到另一個位置、忽略重復文件、打開重復文件、重命名重復文件,或者甚至對它們執行自定義命令。如果你選擇刪除重復文件,可能會驚喜地發現可用的刪除選項。
你不僅可以將重復文件發送到垃圾箱或***刪除,還可以選擇留下指向原始文件的鏈接(使用符號鏈接或硬鏈接)。換句話說,重復文件會被刪除,留下的只是原始文件的鏈接,這能省下大量磁盤空間。如果你將那些文件導入到工作空間,或者有基于它們的依賴項,這項功能特別有用。
還有一個奇特的選項:你可以將結果導出到HTML或CSV文件。我并不確信你為什么會這么做,但我想如果你想要追查重復文件,而不是對重復文件執行dupeGuru的任何操作,這很有用。
***但并非最不重要的是,參數選擇菜單可以讓刪除重復文件的美夢成真。
這里你可以選擇掃描的標準,或基于內容,或基于名稱,還有控制結果數量的重復文件閾值。還可以定義你在操作中所能選擇的自定義命令。在眾多的其他小選項當中,我們注意到:默認情況下,dupeGuru忽略小于10KB的文件。
想了解更多信息,建議訪問官方網站(http://www.hardcoded.net/dupeguru/),那里有許多說明文檔、支持論壇及其他好東西。
總結一下,只要我要準備備份數據或者釋放部分硬件空間,就會使用dupeGuru這款可靠的軟件。我發覺它對高級用戶來說功能足夠強大,對新手來說又界面直觀、易于使用。錦上添花的是:dupeGuru跨平臺,這意味著你還可以在Mac或Windows PC上使用它。如果你有特定的要求,想清理音樂或圖像文件,也不用擔心,因為它有兩個變種:dupeguru-me(http://www.hardcoded.net/dupeguru_me/)和 dupeguru-pe(http://www.hardcoded.net/dupeguru_pe/),它們分別能找到重復的音軌和圖片。與常規版本的區別主要在于,它不僅僅比較文件格式,還考慮到了特定的媒體元數據,比如質量和比特率。
你覺得dupeGuru怎么樣?會考慮用它嗎?還是說你建議使用什么另外的重復文件刪除軟件?歡迎留言交流。
原文標題:How to deduplicate files on Linux with dupeGuru