首页 > 解决方案 > 用 csv 数据集替换虚拟合成数据集的问题

问题描述

我正在尝试运行从 Github 下载的代码。代码工作的数据集如下:

data = np.concatenate(([1] * 8000, [2] * 4000, [3] * 1000, [4] * 500, [5] * 1000, [6] * 1800, [7] * 2000, [8] * 300))

如果我保持这样,代码可以正常工作,但如果我改为读取 csv,它会给我带来很多错误。我以两种方式阅读 csv(都不工作):

使用熊猫:

data = pd.read_csv(data_path, header=None)

使用 csv

with open(data_path, 'r') as f:
    reader = csv.reader(f, delimiter=',')
    next(reader)
    data = np.array(list(reader)).astype(float)

我也尝试了其他一些方法,但没有一个奏效。 是我尝试使用我拥有的 csv 文件运行的代码。

为了使用 csv 文件执行此操作,我如何读取 csv 以便获取/读取的数据与原始代码中给出的示例数据一致?还是有其他解决方案?

标签: pythonlistnumpydataset

解决方案


如果您使用的是 csv 文件,则无法遵循此代码,您应该编写代码,首先将 csv 读取为数据框,然后对其进行处理。这是两种不同的方法,您不能将这两种方法合并在一起。


推荐阅读