首页 > 解决方案 > 拆分文件夹 Python 用于文件数量不平衡的问题,以保持固定数量的文件用于训练集

问题描述

首先,让我钦佩您为https://github.com/jfilter/split-folders开发人员所做的努力,通过开发这个非常方便的工具让我们的生活变得如此轻松。但是,文件夹中的文件数量不平衡存在问题。就我而言,我想保留 200 个文件用于训练和休息以进行测试/验证,而不管剩下多少文件用于测试/验证。如果我按照您的代码指南这样做;

要仅拆分为训练集和验证集,请使用单个数字来fixed,即10

我收到以下断言错误。你能帮我解决这个问题吗?

TypeError Traceback (most recent call last) in () 7 8 #no_files ----> 9 sp.fixed(data_dir, output=output_dir, seed=13, fixed=200, oversample=False, group_prefix=None) # 默认值

/usr/local/lib/python3.6/dist-packages/splitfolders/split.py 固定(输入、输出、种子、固定、过采样、组前缀)96 固定 = 固定 97 ---> 98 断言 len(固定)如果 tqdm_is_installed 在 (1, 2) 99 100 中:

TypeError:“int”类型的对象没有 len()

我的代码如下:

splitfolders.fixed(data_dir, output=output_dir, seed=13, fixed=200, oversample=False, group_prefix=None) # default values

标签: pythonsplitdirectorysubdirectory

解决方案


推荐阅读