python - 用 csv 数据集替换虚拟合成数据集的问题
问题描述
我正在尝试运行从 Github 下载的代码。代码工作的数据集如下:
data = np.concatenate(([1] * 8000, [2] * 4000, [3] * 1000, [4] * 500, [5] * 1000, [6] * 1800, [7] * 2000, [8] * 300))
如果我保持这样,代码可以正常工作,但如果我改为读取 csv,它会给我带来很多错误。我以两种方式阅读 csv(都不工作):
使用熊猫:
data = pd.read_csv(data_path, header=None)
使用 csv
with open(data_path, 'r') as f:
reader = csv.reader(f, delimiter=',')
next(reader)
data = np.array(list(reader)).astype(float)
我也尝试了其他一些方法,但没有一个奏效。 这是我尝试使用我拥有的 csv 文件运行的代码。
为了使用 csv 文件执行此操作,我如何读取 csv 以便获取/读取的数据与原始代码中给出的示例数据一致?还是有其他解决方案?
解决方案
如果您使用的是 csv 文件,则无法遵循此代码,您应该编写代码,首先将 csv 读取为数据框,然后对其进行处理。这是两种不同的方法,您不能将这两种方法合并在一起。
推荐阅读
- firebase - 如何将 Firebase 云功能代码升级到 1.0 或更高版本
- r - data.table - 通过比较列列表和值列表进行选择
- linux - Linux bjobs+bj1 -l:在单个 linux 命令中列出列出的每个作业的日志
- c# - 如何使用 TSS.net 从 TPM 导出公钥?
- sass - 使用带有 lit-element / web-components 的引导模式
- javascript - 基于名称的复选框选择正在提示其他复选框选项
- linux - 无法将 C++ 扩展上传到 Colab
- laravel - 如何根据key获取数据数组?
- unity3d - 有没有更好的方法来写这个自上而下的汽车 mdoel
- ruby - 在Ruby中将字符串解析为时间(Time.parse)时如何忽略DST