首页 > 解决方案 > 在 python 项目中保存非代码相关文件(参考文件/测试资产)的正确方法是什么?

问题描述

快速环顾四周;大多数用户都在他们最喜欢的存储库系统中拥有一切,通常是 git。尽管如果您有大文件(想象一下用于验证代码的机器学习数据集或测试文件,例如电影文件、图像或音频文件,例如用于使用它们的应用程序),这不是一个选择。

是否有一个标准可以将那些“非代码相关”文件保存在某个地方,并且仍然保持与主 git repo 的连接?由于您仍然需要对这些文件的更改进行版本控制,因此您需要一些允许您创建签入列表的东西,并且可能还需要一种通过这些提交保存评论的方法,就像您对 git 所做的那样。添加与您签入的文件相关的元数据列表可能是有意义的,因此您可以检索有关它们的信息。

我看到有些使用 3rd 方应用程序将资产压缩保存在某处,例如在 AWS 或 Dropbox 上,但这对于可追溯性和签入历史记录是不可行的,所以我认为有更好的方法来跟踪项目中不存在的文件与代码完全相关,所以它们并不真正属于 git?

标签: git

解决方案


虽然如果你有大文件 [...] 这不是一个选项。

这不再是真的,现在有可用的 Git 大文件存储,请参阅:

https://docs.gitlab.com/ee/topics/git/lfs/

有关适用于免费 github 帐户的限制,请参阅:

https://docs.github.com/en/github/managing-large-files/about-storage-and-bandwidth-usage


推荐阅读