python - 想要找到与熊猫数据框相对应的元素的列表索引(np.where with .index())
问题描述
我想找到满足条件的字典或列表项的索引,并将其写入数据框中的新列。
我从以下设置开始:
import pandas as pd
import numpy as np
df = pd.DataFrame(data = {'col1': ['2018_08', '2008_02','2019_01','2017_04']})
dates = {0: ['2019-01-15 00:00:00', '2019_01', 1, 2019, 0],
-1: ['2018-12-15 00:00:00', '2018_12', 12, 2018, -1],
-2: ['2018-11-15 00:00:00', '2018_11', 11, 2018, -2],
-3: ['2018-10-15 00:00:00', '2018_10', 10, 2018, -3],
-4: ['2018-09-15 00:00:00', '2018_09', 9, 2018, -4],
-5: ['2018-08-15 00:00:00', '2018_08', 8, 2018, -5]}
我想检查数据框中列的值是否col1
包含df
在字典中dates
。如果是,则返回字典中相应列表的键或最后一个条目。如果不是,则返回 NaT 或 NaN。我试过了:
df['month_seq'] = np.where(df.col1.isin([dates[i][1] for i in range(0,-6,-1)]), '?' ,pd.NaT)
它标识正确的条目但不返回相应的负数。输出内容如下:
col1 month_seq
0 2018_08 ?
1 2008_02 NaT
2 2019_01 ?
3 2017_04 NaT
如果尝试过
[dates[i][1] for i in range(0,-6,-1)].index(df.col1)
返回错误。
在此先感谢您的帮助。
解决方案
map
与字典理解创建的字典一起使用:
df = pd.DataFrame(data = {'col1': ['2018_08', '2008_02','2019_01','2017_04']})
dates = {0: ['2019-01-15 00:00:00', '2019_01', 1, 2019, 0],
-1: ['2018-12-15 00:00:00', '2018_12', 12, 2018, -1],
-2: ['2018-11-15 00:00:00', '2018_11', 11, 2018, -2],
-3: ['2018-10-15 00:00:00', '2018_10', 10, 2018, -3],
-4: ['2018-09-15 00:00:00', '2018_09', 9, 2018, -4],
-5: ['2018-08-15 00:00:00', '2018_08', 8, 2018, -5]}
d = {v[1]:k for k, v in dates.items()}
print (d)
{'2019_01': 0, '2018_12': -1, '2018_11': -2, '2018_10': -3, '2018_09': -4, '2018_08': -5}
df['new'] = df['col1'].map(d)
print (df)
col1 new
0 2018_08 -5.0
1 2008_02 NaN
2 2019_01 0.0
3 2017_04 NaN
推荐阅读
- c# - 从gridview内部的datatemplate访问控制
- cygwin - 在 cygwin32 中使用 mingw32 glfw3 和 glew32s 二进制文件,而不将 cygwin X11 GLX 与 WGL 混合
- azure-cloud-services - 是否有每隔一段时间重新启动一个 Azure 经典云服务角色?
- javascript - SweetAlert 不等待
- java - 当我在其 ViewPort 中绘制 JPanel 时,JScrollPane 不滚动
- python - 将文本写入单行字符串之间
- javascript - 将字符串解释为转义字符串
- spring-integration - 基于当前日期的spring集成动态过滤器
- ios - 为什么 webkit 视图无法连接到 App Store
- android - 在“expo publish”之后,React Native Expo 应用程序不会在其他设备上打开