首页 > 解决方案 > 如何在 Python 中从数据框中加载特征和标签?

问题描述

我正在尝试使用带有 tensorflow 的 keras 来训练网络。我有自己的缅甸语数字数据集。我正在尝试使用使用 python 的神经网络开发缅甸数字识别。我有 train.csv 文件和 test.csv 文件,它们的标题带有格式标签、pixel0、...、pixel783。我使用熊猫加载数据框。但我想将数据框拆分为特征和标签。

import pandas as pd
dataframe = pd.read_csv("mmdigitstrain.csv")
dataframe2 = pd.read_csv("mmdigitstest.csv")

(X_train, y_train) = splitfeaturesandlabelfromdataframe
(X_test, y_test) = splitfeaturesandlabelfromdataframe2

标签: python

解决方案


您必须将数据放在 numpy 数组中

import pandas as pd
import numpy as np
df_train = pd.read_csv("mmdigitstrain.csv")
df_test = pd.read_csv("mmdigitstest.csv")

y_train=df_train['label'].to_numpy() 
#check the shape should bd nbofitem x 1 in train dataset
print(y_train.shape)
X_train=df_train.drop(columns=['label']).to_numpy()
check the shape should bd nbofitem x  780 in train dataset
print(X_train.shape)

y_test=df_test['label'].to_numpy() 
#check the shape should bd nbofitem x 1 in test dataset
print(y_test.shape)
X_test=df_test.drop(columns=['label']).to_numpy()
check the shape should bd nbofitem x  780 in test dataset
print(X_test.shape)

推荐阅读