pandas - 读取 EMNIST 数据集
问题描述
我正在使用 python 中的 tensorflow 构建 CNN,但是从 EMNIST 数据集中加载数据时遇到问题。谁能给我看一个批量检索每个图像并在培训期间通过的示例代码?
解决方案
EMNIST 数据集有几种格式……我发现最容易理解的是 Kaggle 上的 CSV 版本:https ://www.kaggle.com/crawford/emnist ,其中每一行都是单独的图像,有 785 列,其中第一列 = class_label,之后的每一列代表一个像素值(28 x 28 图像总共有 784 个)。
您可以查看我使用 Keras 的 EMNIST CNN 实现之一,您的数据集加载可能类似:
import pandas as pd
raw_data = pd.read_csv("data/emnist-balanced-train.csv")
train, validate = train_test_split(raw_data, test_size=0.1) # change this split however you want
x_train = train.values[:,1:]
y_train = train.values[:,0]
x_validate = validate.values[:,1:]
y_validate = validate.values[:,0]
来自https://github.com/Josh-Payne/cs230/blob/master/Alphanumeric-Augmented-CNN/augmented-cnn.py
推荐阅读
- mysql - 试图选择最大列学年
- python - 如何让一个大字符串(又名 str 图片)一个接一个打印?
- python - 在分配“默认”值时检查是否存在非顺序列表索引
- ruby-on-rails - Fresh Rails 6.0.0 在执行“捆绑安装”后中断
- java - java将json发送到php并插入mysql,但返回null
- sql - 在sql中的case语句中设置多个变量值
- java - Spring RequestMapping Regex 排除字符串
- jmeter - 将 java 代码转换为 beanshell 采样器 (JMETER)
- r - 通过 NoData 拆分数值向量
- amazon-web-services - AWS 转录 | 无法通过 SDK 使用表格创建自定义词汇表