python - 熊猫如何创建随机虚拟数据
问题描述
我经常发现自己处于一种情况,我想在示例数据帧上测试某些功能。
创建带有数字的随机数据框非常容易,如下所示:
pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
或者
pd.DataFrame(np.random.randint(2,10,(5,3)), columns=list('ABC'))
,如果您想对虚拟数据中的值进行更多控制。
我想知道是否有一个更通用的库,可以帮助您创建各种类型的虚拟数据(例如日期时间、分类......)?
解决方案
看,你会发现
我稍微改变了它以摆脱 numpy 警告:
import pandas as pd
import numpy as np
import datetime
dft = pd.DataFrame({
'A' : ['spam', 'eggs', 'spam', 'eggs'] * 6,
'B' : ['alpha', 'beta', 'gamma'] * 8,
'C' : [np.random.choice(pd.date_range(datetime.datetime(2013,1,1),datetime.datetime(2013,1,3))) for i in range(24)],
'D' : np.random.randn(24),
'E' : np.random.randint(2,10,24),
'F' : [np.random.choice(['rand_1', 'rand_2', 'rand_4', 'rand_6']) for i in range(24)],
})
dft
推荐阅读
- css - css类中的垂直线
- python - 使用 Beautifulsoup 查找特定 ID 下的文章
- flutter - 为什么 Navigator.pop 无法传回参数?
- python - matplotlib 中 yticks/xticks 函数的刻度参数到底是什么?
- xml - 如何使用selenium java同时打开两个浏览器
- dictionary - Dart Map.removeWhere 不删除所有匹配删除条件的键
- c - 在 Visual Studio 代码中将“{”设置为接近结尾的“)”
- javascript - JavaScript使用For循环加载多个图像不起作用
- android - 协助 android studio gradle
- arrays - 在 vuejs 数据数组中推送数据 .push 不是函数