首页 > 解决方案 > vsearch - 多线程集群

问题描述

我有几个要使用 vsearch ( https://github.com/torognes/vsearch ) 集群的 fasta 文件,并为每个 fasta 文件保存一个“质心文件”“集群结果文件” 。

因为我有很多文件,我打算利用 vsearch 的多线程功能,我写了下面的循环:

#!/bin/bash
# input fasta files
fastaFile=*.fasta

# vsearch cluster_fast loop
for f in $fastaFile
do
    vsearch --cluster_fast \
    $f \
    --id 1 \
    --qmask none \
    --centroids $f.$centroids.txt \
    --uc $f.uc.txt
done

不幸的是,似乎一次在每个fasta文件上都使用了多线程,我无法弄清楚如何在vsearch之外组织并行化。

标签: bashbioinformatics

解决方案


推荐阅读