python - 将数据拆分成块
问题描述
也许这个问题很简单,但我试图找到一种方法如何以自动方式完成它,假设我有一个数据框,我想将它分成块并使用基于块的名称保存它们。我管理了如何拆分,但是如何使用名称 data_1、data_2 等将其保存在 .cvs 中...... PS。我只需要块,所以我没有在这里使用 sklearn 方法。
import numpy as np
import pandas as pd
df = pd.DataFrame({
'x_values':np.random.randn(400),
'y_values':np.random.randn(400),
})
sample = 100
N = int(len(df)/sample)
frames = [df.iloc[i*sample:(i+1)*sample] for i in range(N+1) ]
解决方案
您可以使用to_csv
内置方法:
[df.iloc[i*sample:(i+1)*sample].to_csv('data_'+str(i)+'.csv') for i in range(N+1) ]
这将创建名为 data_0.csv、data_1.csv 等的单独数据框...
推荐阅读
- azure - 如何在复制活动(NoSQL 到 SQL)中过滤 ADF(Azure 数据工厂)V2 中上次成功触发器运行的数据?
- unit-testing - 如何通过 io.mockk 测试使用不同参数多次调用的方法?
- angular - Angular 7 风格不同层次的垫子树
- javascript - 在 Extjs 3.4 中渲染之前格式化加载数据
- .net-core - 如何首先从表数据库更新模型
- c# - 我想获取两个日期之间的记录,但日期列在数据库中是字符串格式。使用 linq 查询
- javascript - How to create an array from object which has specific properties in child objects
- python - 如何从python中找到dll函数?
- javascript - 如何同时处理保存多对多关系?
- amazon-web-services - 在分区中插入带有特殊字符的 Hive 表