python - 如何在 Python 中从数据框中加载特征和标签?
问题描述
我正在尝试使用带有 tensorflow 的 keras 来训练网络。我有自己的缅甸语数字数据集。我正在尝试使用使用 python 的神经网络开发缅甸数字识别。我有 train.csv 文件和 test.csv 文件,它们的标题带有格式标签、pixel0、...、pixel783。我使用熊猫加载数据框。但我想将数据框拆分为特征和标签。
import pandas as pd
dataframe = pd.read_csv("mmdigitstrain.csv")
dataframe2 = pd.read_csv("mmdigitstest.csv")
(X_train, y_train) = splitfeaturesandlabelfromdataframe
(X_test, y_test) = splitfeaturesandlabelfromdataframe2
解决方案
您必须将数据放在 numpy 数组中
import pandas as pd
import numpy as np
df_train = pd.read_csv("mmdigitstrain.csv")
df_test = pd.read_csv("mmdigitstest.csv")
y_train=df_train['label'].to_numpy()
#check the shape should bd nbofitem x 1 in train dataset
print(y_train.shape)
X_train=df_train.drop(columns=['label']).to_numpy()
check the shape should bd nbofitem x 780 in train dataset
print(X_train.shape)
y_test=df_test['label'].to_numpy()
#check the shape should bd nbofitem x 1 in test dataset
print(y_test.shape)
X_test=df_test.drop(columns=['label']).to_numpy()
check the shape should bd nbofitem x 780 in test dataset
print(X_test.shape)
推荐阅读
- python - 尝试使用过滤外键进行查询
- oracle-apex - 是否有一种标准方法可以访问 interactiveGrid 小部件和子小部件的方法?
- c# - 为老式地牢爬行者创造运动
- java - RabbitMQ 的负载模拟器
- python - 如何标记 10 个 csv 文件中的异常值/异常并将标记的数据帧导出到 1 个 xlsx 文件,其中包含 10 张纸
- php - 向 amphp/parallel 添加新任务
- python - 如何在python中用1替换“#”?
- javascript - 我想编写一个可以生成电话号码的程序(9位数字)
- postgresql - 使用 pgadmin4 将 csv 文件从本地机器导入到 postgresql docker 容器
- javascript - .then() 方法如何在 JavaScript 中实际工作?