find-occurrences - Linux:递归查找所有没有匹配 .tif 的 .txt 文件
问题描述
我正在使用 Debian Linux。我是新手。我会尽量用我知道的最简单的方式问。
我的驱动器上有一个非常深的目录树,其中包含数千个 .tif 文件和 .txt 文件。我想递归地查找(列出)所有没有匹配 .tif 文件(基本名称)的 .txt 文件。.tif 文件和 .txt 文件也位于整个树的不同目录中。
简单来说,它可能看起来像这样......
目录1:hf-770.tif、hf-771.tif、hf-772.tif
目录2:hf-770.txt、hf-771.txt、hf-771.txt、hr-001.txt、tb-789.txt
我需要找到(列出)hr-001.txt 和 tb-789.txt,因为它们没有匹配的 .tif 文件。同样,目录树非常深,其中包含多个子目录。
我研究并尝试了以下命令的变体,但似乎无法使其工作。非常感谢。
find -name "*.tif" -name "*.txt" | ls -1 | sed 's/\([^.]*\).*/\1/' | uniq
解决方案
您可以为此编写一个 shell 脚本:
#!/bin/bash
set -ue
while IFS= read -r -d '' txt
do
tif=$(basename "$txt" | sed s/\.txt$/.tif/)
found=$(find . -name "$tif")
if [ -z "$found" ]
then
echo "$txt has no tif"
fi
done < <(find . -name \*.txt -print0)
.txt
这对它在当前目录或以下目录中找到的所有文件都有一个循环。对于每个找到的文件,它将.txt
扩展名替换为.tif
,然后尝试查找该文件。如果找不到它(返回的文本为空),它会打印.txt
文件名。
robert@saaz:$ tree
.
├── bar
│ └── a.txt
├── foo
│ ├── a.tif
│ ├── b.tif
│ ├── c.tif
│ └── d.txt
└── txt-without-tif
2 directories, 6 files
robert@saaz:$ bash txt-without-tif
./foo/d.txt has no tif
推荐阅读
- ramda.js - 如何使用 Ramda 将数组拆分为子列表?
- javascript - Django项目中的jQuery Ajax问题
- python - 将列表转换为字典,其中包含 Python 中重复键的值列表
- javascript - 每10升价格上涨
- embedded - 使用 STM32F042F6 产生 0-5V 输出
- spring-boot - 使 Zuul 使用与 Spring Boot 应用程序不同的上下文路径
- laravel - 使用 select2 字段类型传递的空值
- javascript - 从另一个数组中的数组中查找第一次出现的元素
- java - 从 cmd 运行 jar 会导致异常
- c# - Azure 队列中的消息文本已编码,如何删除此编码?