python - 基于单列在熊猫中创建一系列数字
问题描述
我有一个熊猫数据框:
df2 = pd.DataFrame({'ID':['A','B','C','D','E'], 'loc':['Lon','Tok','Ber','Ams','Rom'], 'start':[20,10,30,40,43]})
ID loc start
0 A Lon 20
1 B Tok 10
2 C Ber 30
3 D Ams 40
4 E Rom 43
我希望添加一个名为 range 的列,该列采用“start”中的值并生成一个值范围,这些值(包括初始值)比初始值小 10,都在同一行中。
所需的输出:
ID loc start range
0 A Lon 20 20,19,18,17,16,15,14,13,12,11,10
1 B Tok 10 10,9,8,7,6,5,4,3,2,1,0
2 C Ber 30 30,29,28,27,26,25,24,23,22,21,20
3 D Ams 40 40,39,38,37,36,35,34,33,32,31,30
4 E Rom 43 43,42,41,40,39,38,37,36,35,34,33
我努力了:
df2['range'] = [i for i in range(df2.start, df2.start -10)]
和
def create_range2(row):
return df2['start'].between(df2.start, df2.start - 10)
df2.loc[:, 'range'] = df2.apply(create_range2, axis = 1)
但是我似乎无法获得所需的输出。我打算将此解决方案应用于多个数据帧,其中一个具有 > 2,000,000 行。
谢谢
解决方案
您可以准备范围创建功能,.apply
并以下列方式开始列:
import pandas as pd
df2 = pd.DataFrame({'ID':['A','B','C','D','E'], 'loc':['Lon','Tok','Ber','Ams','Rom'], 'start':[20,10,30,40,43]})
def make_10(x):
return list(range(x, x-10-1, -1))
df2["range"] = df2["start"].apply(make_10)
print(df2)
输出
ID loc start range
0 A Lon 20 [20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10]
1 B Tok 10 [10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
2 C Ber 30 [30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20]
3 D Ams 40 [40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30]
4 E Rom 43 [43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33]
说明:按元素应用.apply
的pandas.Series
(列)接受函数的方法。pandas.DataFrame
请注意,-1
它range
具有包容性和排斥性,并且-1
您希望具有递减值的步长。
推荐阅读
- sql - 在同一个表中选择两次时,BigQuery 中的列名重复
- javascript - 我如何从对象中过滤未定义
- java - Java DES/ECB/PKCS5Padding 加密值不相同
- python - 调试“猜词”游戏
- mysql - 我想用 auth 在 laravel 中创建另一个用户表
- ios - 如何快速将刺痛转换为日期,然后再返回?
- javascript - 如何清除 net request electronjs 中缓存的 statusCode?
- firefox - K8s + Istio + Firefox 硬刷新。在另一个服务上访问服务原因 404,直到其他服务访问
- django - 我可以在 django 中设置多个静态根吗?
- elasticsearch - 无痛访问 ArrayList 中的值