python - 如何使用一个数据集来模拟另一个使用 Python 的数据集?
问题描述
我有以下示例df:
import pandas as pd
cars = {'Brand': ['Honda Civic','Toyota Corolla','Ford Focus','Audi A4'],
'Price': [22000,25000,27000,35000]
}
df = pd.DataFrame(cars, columns = ['Brand','Price'], index=['Car_1','Car_2','Car_3','Car_4'])
有没有办法用第一个参数生成一个新的数据集?我希望“品牌”值相同,但“价格”值是通过使用“价格”中原始值的最小值、最大值和平均值随机生成的。
我可以手动编写代码,但想知道是否有办法让 python 检测数据框的参数并使用这些参数创建一个新的。
注意:我提供的示例数据框很小,但这些概念适用于更大的数据。
解决方案
您可以使用 np.random.randint。前两个参数设置界限,第三个参数给出值的数量。
import pandas as pd
import numpy as np
df2 = pd.DataFrame({'Brand': df['Brand'],
'Price': np.random.randint(df['Price'].min(),
df['Price'].max(), df.shape[0])})
print(df2)
Brand Price
Car_1 Honda Civic 29797
Car_2 Toyota Corolla 33306
Car_3 Ford Focus 26237
Car_4 Audi A4 23580
推荐阅读
- python - 如何对不同的迭代值求和?
- swift - RealmSwift:如何将多个对象添加到多对一关系?
- python - SoupStrainer 根本不提高速度
- c++ - 我的 IF 语句中的问题,Else 无法正常工作
- html-lists - QTextBrowser 显示带有多余空格的嵌套 HTML 列表
- java - 如何修复“volte_imsvt1 无法连接”错误
- python - 张量操作python中的内存和时间
- c# - 在 UWP 应用程序中检测睡眠事件或唤醒事件
- ios - iOS requestStateForRegion 在 didStartMonitoringFor 之后返回 .unknown
- pytorch - 使用固定嵌入时 Seq2Seq 翻译模型中的问题