bash - 使用更多时产生神秘的冒号字符串的 Slurm 工作
问题描述
我正在尝试在一组文件上运行一些生物信息学软件,但是当我使用 slurm 提交它时,该工具意外失败,显然是由于输入文件列表的传递不正确。如果我在命令行上运行它,它似乎可以工作。我在下面替换了一些玩具文件名,因为实际名称很长。该工具称为 rMATs,但该工具本身与我的问题无关。
我使用 .sbatch 文件从命令行将作业提交到集群,如下所示:
sbatch job.sbatch group1.txt group2.txt
其中两个文本文件包含逗号分隔的数据文件列表。在 .sbatch 文件中,我将变量传递给生物信息学工具,如下所示:
#!/bin/bash
#SBATCH --time=00:00:20
#SBATCH --nodes=1
#SBATCH --ntasks=1
#SBATCH -o ./o.%j
#SBATCH --err ./e.%j
#SBATCH --account=owner-guest
#SBATCH --partition=server-guest
bioinfotool.py -arg1 `more group1.txt` -arg2 `more group2.txt`
我这样做是因为生物信息学工具显然无法直接解析文本文件。
但是,它仍然不起作用,我认为这是由于我使用了反引号和 more 命令。我尝试通过添加 echo 语句进行调试
echo `more group1.txt`
输出应该是
sample1.bam,sample2.bam,sample3.bam
但是,实际输出是
:::::::::::::: group1.txt :::::::::::::: sample1.bam,sample2.bam,sample3.bam
因此,在我看来,这个莫名其妙的逗号字符串 + 文件名 + 逗号字符串在传递给生物信息学工具之前被添加到我的文件列表中。
谷歌搜索诸如“逗号字符串”+ slurm之类的东西没有结果,所以我求助于发布我自己的问题。
这些逗号是从哪里来的?有没有更好的方法从 txt 文件中提取文件名字符串?
谢谢
编辑:使用 'cat' 而不是 'more' 可以解决问题。
解决方案
more
是一个交互式程序,您看到的冒号很可能是冒号more
用来表明它需要用户输入的。
如果您只想转储文件内容,cat
您需要的是:。
bioinfotool.py -arg1 `cat group1.txt` -arg2 `cat group2.txt`
你也可以直接从终端运行它cat group1.txt
,看看你得到了你所期望的。
请注意,在像 Bash 这样的 Bourne shell 中,您可以使用 `$(cat group1.txt) 而不是使用反引号,这允许嵌套和更多选项,但这在您的用例中并不重要。
推荐阅读
- c - 函数返回时文件是否在 c 中关闭?
- python - 如何在 Anaconda 中安装 PyQt6?
- r - 如何将重复的行与缺少的字段结合起来R
- exception - 工作表中的 AVPlayer:“CALayer 位置包含 NaN:[nan nan]”(包括 MRE)
- r - 无法分配给不存在的列——使用 ARTool 包
- python - 返回 n 叉树中从根到叶的所有路径
- artificial-intelligence - 使用 Amazon 人脸识别 NodeJS 找到最合适的图像
- java - Java 程序在调用 Thread#join() 方法时冻结
- flutter - 文本小部件溢出选项似乎不起作用
- python - 计算字典中项目的出现次数?