首页 > 解决方案 > 如何从 git 存储库克隆、获取或稀疏检出单个目录或目录列表?

问题描述

如何从 git 存储库克隆、获取或稀疏检出单个文件或目录或文件或目录列表,避免下载整个历史记录或至少将历史记录下载保持在最低限度?

为了人们登陆这里的利益,这些是对其他类似问题的参考:

很久以前就提出了这些类似的问题,并且 git 从那时起就不断发展,最终导致了大量不同的答案,有些更好,有些更糟,具体取决于所考虑的 git 版本。问题在于,上述问题中没有一个答案可以满足所有这些问题的所有要求,这意味着您必须阅读所有答案并在脑海中编制自己的答案,最终满足所有要求。

这里的这个问题扩展了前面提到的问题,比所有其他问题的总和提出了更灵活和更严格的要求。所以,再一次:

如何从 git 存储库克隆、获取或稀疏检出单个文件或目录或文件或目录列表,避免下载整个历史记录或至少将历史记录下载保持在最低限度?

标签: gitgit-checkoutgit-fetchrevision-historygit-sparse-checkout

解决方案


下面的这个bash函数可以解决问题。

function git_sparse_checkout {
    # git repository, e.g.: http://github.com/frgomes/bash-scripts
    local url=$1
    # directory where the repository will be downloaded, e.g.: ./build/sources
    local dir=$2
    # repository name, in general taken from the url, e.g.: bash-scripts
    local prj=$3
    # tag, e.g.: master
    local tag=$4
    [[ ( -z "$url" ) || ( -z "$dir" ) || ( -z "$prj" ) || ( -z "$tag" ) ]] && \
        echo "ERROR: git_sparse_checkout: invalid arguments" && \
        return 1
    shift; shift; shift; shift

    # Note: any remaining arguments after these above are considered as a
    # list of files or directories to be downloaded.
    
    mkdir -p ${dir}
    if [ ! -d ${dir}/${prj} ] ;then
        mkdir -p ${dir}/${prj}
        pushd ${dir}/${prj}
        git init
        git config core.sparseCheckout true
        local path="" # local scope
        for path in $* ;do
            echo "${path}" >> .git/info/sparse-checkout
        done
        git remote add origin ${url}
        git fetch --depth=1 origin ${tag}
        git checkout ${tag}
        popd
    fi
}

这是如何使用它的示例:

function example_download_scripts {
  url=http://github.com/frgomes/bash-scripts
  dir=$(pwd)/sources
  prj=bash-scripts
  tag=master
  git_sparse_checkout $url $dir $prj $tag "user-install/*" sysadmin-install/install-emacs.sh
}

在上面的示例中,请注意目录必须跟在/*并且必须在单引号或双引号之间。

更新:可以在以下位置找到改进的版本:https ://github.com/frgomes/bash-scripts/blob/master/bin/git_sparse_checkout


推荐阅读