使用Python3清理电脑内的重复文件

文章目录

1. 按

判断两个文件是否相同需要用到filecmp模块:

filecmp.cmp(f1, f2, shallow=True)
比较名为f1和f2的文件,如果它们似乎相等则返回True,否则返回False
如果shallow为真,那么具有相同os.stat()签名的文件将会被认为是相等的。否则,将比较文件的内容。

遍历获取所有文件的绝对路径,我们可以利用glob模块的通配符结合recursive参数即可完成,框架如下:

for file in glob.glob(path + '/**/*', recursive=True):
    pass

2. 代码

from os import remove
from os.path import isfile
from glob import glob
import filecmp

dir_path = r'E:\OneDrive - office 365 students and teachers\视频教程\MATLAB&数学建模\matlab教程\视频教程\MATLAB高等数学教学视频'
exeRemove = True
exeRemove = False

file_lst = []

for i in glob(dir_path + '/**/*', recursive=True):
    if isfile(i):
        file_lst.append(i)

cnt = 0

for x in file_lst:
    for y in file_lst:
        if x == y:
            continue
        elif filecmp.cmp(x, y):
            file_lst.remove(x)
            cnt += 1
            if exeRemove:
                print(cnt, "removing", x)
                remove(x)
            else:
                print(cnt, "should remove", x)
            break
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页