首页 > 解决方案 > filecmp 是否进行精确比较?

问题描述

filecmp.cmp文件状态(强调我的)

比较名为f1f2True的文件,如果它们看起来相等则返回,False否则返回。
如果shallow为真,则具有相同os.stat()签名的文件被视为相等。否则,将比较文件的内容。

是什么意思?我的理解是,对于shallow=False文件的内容进行比较,因此文件明确地要么相同,要么不同。

标签: pythonpython-3.xfilecompare

解决方案


源代码相当简单;在模块的文档页面中有一个指向它的链接filecmp,在顶部:

def cmp(f1, f2, shallow=True):
    """Compare two files.
    Arguments:
    f1 -- First file name
    f2 -- Second file name
    shallow -- Just check stat signature (do not read the files).
               defaults to True.
    Return value:
    True if the files are the same, False otherwise.
    This function uses a cache for past comparisons and the results,
    with cache entries invalidated if their stat information
    changes.  The cache may be cleared by calling clear_cache().
    """

    s1 = _sig(os.stat(f1))
    s2 = _sig(os.stat(f2))
    if s1[0] != stat.S_IFREG or s2[0] != stat.S_IFREG:
        return False
    if shallow and s1 == s2:
        return True
    if s1[1] != s2[1]:
        return False

    outcome = _cache.get((f1, f2, s1, s2))
    if outcome is None:
        outcome = _do_cmp(f1, f2)
        if len(_cache) > 100:      # limit the maximum size of the cache
            clear_cache()
        _cache[f1, f2, s1, s2] = outcome
    return outcome

def _sig(st):
    return (stat.S_IFMT(st.st_mode),
            st.st_size,
            st.st_mtime)

def _do_cmp(f1, f2):
    bufsize = BUFSIZE
    with open(f1, 'rb') as fp1, open(f2, 'rb') as fp2:
        while True:
            b1 = fp1.read(bufsize)
            b2 = fp2.read(bufsize)
            if b1 != b2:
                return False
            if not b1:
                return True

所以是的,它会比较文件内容。


推荐阅读