成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python查找重復文件相關操作方式分享

開發 后端
Python查找重復文件的實現,可以輕松的幫助我們處理硬件中重復文件出現的問題。我們將會在這里針對這一技術做一個詳細介紹。

當我們在使用硬盤存放資料的時候,通常情況下,時間一久,就會出現一些垃圾文件以及重復文件的出現,那么該怎樣才能很好的處理這一問題呢?今天我們就可以利用Python來編寫一個工具幫助我們解決。那么,就讓我們一起看看Python查找重復文件的相關實現方法吧。#t#

Python查找重復文件主要思路如下:

1. 查找同命文件

2. 利用了crc32,先檢查出同樣尺寸的文件,再計算crc32,得出相同的文件名列表。

下面是轉載的一個Python查找重復文件的代碼,雖然可以滿足要求,但是在查找大量文件時候,速度很慢,我抽空把它調優。

  1. #!/usr/bin/env python  
  2. #coding=utf-8  
  3. import binascii, os  
  4. filesizes = {}  
  5. samefiles = []  
  6. def filesize(path):  
  7. if os.path.isdir(path):  
  8. files = os.listdir(path)  
  9. for file in files:  
  10. filesize(path + "/" + file)  
  11. else:  
  12. size = os.path.getsize(path)  
  13. if not filesizes.has_key(size):  
  14. filesizes[size] = []  
  15. filesizes[size].append(path)  
  16. def filecrc(files):  
  17. filecrcs = {}  
  18. for file in files:  
  19. f = open(file, "r")  
  20. 23 crc = binascii.crc32(f.read())  
  21. 24 f.close()  
  22. if not filecrcs.has_key(crc):  
  23. filecrcs[crc] = []  
  24. filecrcs[crc].append(file)  
  25. for filecrclist in filecrcs.values():  
  26. if len(filecrclist) > 1:  
  27. samefiles.append(filecrclist)  
  28. if __name__ == '__main__':  
  29. path = r"J:\My Work" 
  30. filesize(path)  
  31. for sizesamefilelist in filesizes.values():  
  32. if len(sizesamefilelist) > 1:  
  33. filecrc(sizesamefilelist)  
  34. for samfile in samefiles:  
  35. print "****** same file group ******"  
  36. for file in samefile:  
  37. print file 

以上就是對Python查找重復文件的相關介紹。

責任編輯:曹凱 來源: 博客園
相關推薦

2010-03-04 15:57:23

Python實現ini

2010-03-05 09:33:05

Python實現tab

2010-03-04 10:50:45

windows ser

2021-09-13 12:15:57

Linux文件命令

2009-12-10 17:27:39

PHP操作Cookie

2010-01-25 18:33:35

Android鍵盤操作

2010-01-13 10:25:30

VB.NET文件夾操作

2010-01-28 14:12:20

Android Act

2010-01-06 17:02:28

.Net Framew

2009-12-10 16:35:08

PHP操作文章列表

2011-03-21 17:25:08

SQL Server數重復記錄

2010-03-23 16:30:47

Python文件復制

2024-10-11 12:00:00

Python批量文件操作

2009-12-16 11:04:51

Ruby操作文件權限

2010-01-13 15:33:40

VB.NET菜單項目

2010-03-04 14:39:52

Python讀取輸入值

2010-03-03 16:57:28

Python字符

2009-12-21 11:19:50

WCF配置文件

2010-01-15 19:04:09

2009-12-22 16:03:03

WCF異常
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91精品久久久久久久久久 | 成人欧美一区二区三区黑人孕妇 | 久久久久99 | 国产免费让你躁在线视频 | 国产精品视频一区二区三区四区国 | 免费av在线网站 | 久久久999成人 | 免费在线日韩 | 男女啪啪高潮无遮挡免费动态 | 欧美视频三区 | 久久久久久国产精品三区 | 免费国产一区二区 | 91精品久久久久久久久久 | 日本福利片| 一级黄色绿像片 | 成人免费在线视频 | 日本超碰 | 亚洲欧美中文日韩在线v日本 | 欧美a级网站| 久草免费在线视频 | h视频在线观看免费 | 色婷婷综合久久久中文字幕 | 成人av电影免费在线观看 | 亚洲国产精品99久久久久久久久 | 日韩欧美国产一区二区 | 国产精品久久久久久久久免费 | 日韩一区二区av | 天天综合日日夜夜 | 午夜影院免费体验区 | 国产亚洲精品精品国产亚洲综合 | av免费网站在线观看 | 久久人体视频 | 国产成人综合在线 | 91社区在线观看高清 | 免费成人高清 | 亚洲 成人 av | 亚洲 精品 综合 精品 自拍 | 男人的天堂久久 | 欧美精品成人一区二区三区四区 | 亚州无限乱码 | 中文字幕视频三区 |