首页 > 解决方案 > Snakemake 如何通过 kubernetes 使用 git 存储库?

问题描述

此处的 Snakemake 文档:

https://snakemake.readthedocs.io/en/stable/executing/cloud.html

在标题“通过 kubernetes 执行 Snakemake 工作流”部分下声明以下内容:

目前,此模式要求 Snakemake 工作流程存储在 git 存储库中。Snakemake 使用 git 查询工作流执行所需的源文件(Snakefile、脚本、配置……)并将它们编码到 kubernetes 作业中。

这让我很困惑。查看给出的示例命令行:

snakemake --kubernetes --use-conda --default-remote-provider $REMOTE --default-remote-prefix $PREFIX

我没有看到对 git 存储库的任何引用。在我看来,Snakemake 会在本地主机上查找蛇文件,在发出此命令的工作目录中。关于 git 存储库的业务是什么?

标签: kubernetessnakemake

解决方案


好吧,我想我想通了。在文档中包含的教程中,他们克隆了一个包含蛇文件和其他相关文件的 github 存储库。例如,在本教程中:

https://snakemake.readthedocs.io/en/stable/executor_tutorial/google_lifesciences.html

命令是:

git clone https://github.com/snakemake/snakemake-lsh-tutorial-data

如果您ls -a在创建的目录中执行命令,您将看到 .git 和 .github 子目录,以及一个文件 .gitpod.yml。显然snakemake --kubernetes使用了这些,如果蛇文件中没有它们,则命令将失败。


推荐阅读