首页 > 解决方案 > 读取 EMNIST 数据集

问题描述

我正在使用 python 中的 tensorflow 构建 CNN,但是从 EMNIST 数据集中加载数据时遇到问题。谁能给我看一个批量检索每个图像并在培训期间通过的示例代码?

标签: pandastensorflowdeep-learningcomputer-visionconv-neural-network

解决方案


EMNIST 数据集有几种格式……我发现最容易理解的是 Kaggle 上的 CSV 版本:https ://www.kaggle.com/crawford/emnist ,其中每一行都是单独的图像,有 785 列,其中第一列 = class_label,之后的每一列代表一个像素值(28 x 28 图像总共有 784 个)。

您可以查看我使用 Keras 的 EMNIST CNN 实现之一,您的数据集加载可能类似:

import pandas as pd

raw_data = pd.read_csv("data/emnist-balanced-train.csv")

train, validate = train_test_split(raw_data, test_size=0.1) # change this split however you want

x_train = train.values[:,1:]
y_train = train.values[:,0]

x_validate = validate.values[:,1:]
y_validate = validate.values[:,0]

来自https://github.com/Josh-Payne/cs230/blob/master/Alphanumeric-Augmented-CNN/augmented-cnn.py


推荐阅读