首页 > 解决方案 > 如何从某个日期之前的 .tar 存档中删除文件

问题描述

我有一个每天用新文件更新的 .tar 文件。但是,超过 60 天的文件将失去价值,不再需要存档。如何从 .t​​ar 存档中删除超过 60 天的文件?

我知道有一个--delete选项,但我不确定如何在档案中搜索符合该条件的文件。

标签: bashshellgziptar

解决方案


最好使用一种构建在您需要的设施中的语言。例如,Python 有一个tarfile模块,下面显示了如何将 Python 脚本嵌入到用 bash 编写的更大脚本中:

#!/usr/bin/env bash

tarfilter_script=$(cat <<'EOF'
import sys
import tarfile
from datetime import datetime, timedelta

delete_older_than = (datetime.now() - timedelta(days=60)).timestamp()

with tarfile.open(fileobj=sys.stdin.buffer) as tar_in, \
     tarfile.open(fileobj=sys.stdout.buffer, mode="w") as tar_out:
    for tarinfo in tar_in:
        if tarinfo.mtime >= delete_older_than:
            tar_out.addfile(tarinfo)
        else:
            sys.stderr.write(f"Skipping file: {tarinfo}\n")
EOF
)

python3 -c "$tarfilter_script" <in.tar >out.tar

推荐阅读