python - 如何合并两个(或更多)TensorFlow 数据集?
问题描述
我已经获取了具有 3 个分区的 CelebA 数据集,如下所示
>>> celeba_bldr = tfds.builder('celeb_a')
>>> datasets = celeba_bldr.as_dataset()
>>> datasets.keys()
dict_keys(['test', 'train', 'validation'])
ds_train = datasets['train']
ds_test = datasets['test']
ds_valid = datasets['validation']
现在,我想将它们全部合并到一个数据集中。例如,我需要将训练和验证组合在一起,或者可能将它们合并在一起,然后根据我自己的不同主题不相交标准将它们拆分。有没有办法做到这一点?
我在文档https://www.tensorflow.org/versions/r2.0/api_docs/python/tf/data/Dataset中找不到任何选项来执行此操作
解决方案
查看您链接的文档,数据集似乎有concatenate
方法,所以我认为您可以获得一个联合数据集:
ds_train = datasets['train']
ds_test = datasets['test']
ds_valid = datasets['validation']
ds = ds_train.concatenate(ds_test).concatenate(ds_valid)
请参阅:https ://www.tensorflow.org/versions/r2.0/api_docs/python/tf/data/Dataset#concatenate
推荐阅读
- java - JTable中的双行标题
- amazon-web-services - 在哪里可以找到我的 AWS EC2 扩展组的 URL?
- php - PHP多维数组排序问题
- magento2 - 以编程方式过滤产品集合(可配置、分组、捆绑)
- database - 使用 databricks 在 S3 存储桶中创建配置单元表
- html - 按钮背景图像过渡
- javascript - 如何将经纬度从 Knex 种子数据播种到 PSQL?
- javascript - 如何选择开放日期选择器?querySelector("#datepicker-container .open .datepicker-date-display") 不起作用
- r - 如何增加情节的日期范围以在系列结束时为 geom_text 腾出空间?
- php - hCaptcha:即使我在 Ubuntu 主机文件中添加了本地 DN,也会出现 CORS 错误