python - 拆分文件夹 Python 用于文件数量不平衡的问题,以保持固定数量的文件用于训练集
问题描述
首先,让我钦佩您为https://github.com/jfilter/split-folders开发人员所做的努力,通过开发这个非常方便的工具让我们的生活变得如此轻松。但是,文件夹中的文件数量不平衡存在问题。就我而言,我想保留 200 个文件用于训练和休息以进行测试/验证,而不管剩下多少文件用于测试/验证。如果我按照您的代码指南这样做;
要仅拆分为训练集和验证集,请使用单个数字来fixed
,即10
。
我收到以下断言错误。你能帮我解决这个问题吗?
TypeError Traceback (most recent call last) in () 7 8 #no_files ----> 9 sp.fixed(data_dir, output=output_dir, seed=13, fixed=200, oversample=False, group_prefix=None) # 默认值
/usr/local/lib/python3.6/dist-packages/splitfolders/split.py 固定(输入、输出、种子、固定、过采样、组前缀)96 固定 = 固定 97 ---> 98 断言 len(固定)如果 tqdm_is_installed 在 (1, 2) 99 100 中:
TypeError:“int”类型的对象没有 len()
我的代码如下:
splitfolders.fixed(data_dir, output=output_dir, seed=13, fixed=200, oversample=False, group_prefix=None) # default values
解决方案
推荐阅读
- javascript - 无法使用 jquery 访问 ajax 加载数据中的表单数据
- python - 如何在 matplotlib 中绘制时间戳(毫秒)
- c# - 如何使用 WMIC 获取 c# 控制台应用程序的命令行参数
- azure - 通过 IPSEC VPN 连接 AKS 群集,只有 1 个专用 IP
- android - 如何使用 Retrofit 2.0 (Kotlin) 正确解析嵌套的 JSON 对象?
- javascript - 如何从 csv 文件中提取特定对象?
- java - 尽管被重置,变量不会改变它的值
- python - Python ADAL acquire_token_with_client_credentials 刷新令牌?
- php - 在php中将word doc转换为pdf时出错
- sql - 当 WHERE 子句依赖于旧值时,Oracle 中同时更新的一致性