python - Pandas Dataframe .loc + 更新非唯一日期时间索引?
问题描述
有一个带有时间戳 (%Y-%m-%d) 索引的 DataFrame,我希望能够使用 .loc 在知道日期时间索引值的情况下更新单行。
我知道索引是非唯一的,这意味着有时我会得到的不仅仅是我想要更新的行。所以我在第二列上对 DataFrame 进行了排序,这样我要更新的行将始终是该索引值的最后一行。
有问题的 DataFrame 是一个更大的 DataFrame 的子集副本,并且在不使用的情况下设置一个值.loc
是行不通的——因此我对 using 的限制.loc
。
我的问题:有没有办法可以引用索引值的最后一行并更新它,纯粹基于索引?
显然,仅使用索引值将使用该索引更新所有行,argmax 似乎不适用于时间戳,虽然我可以临时重新创建索引以使用我排序的另一列,但我宁愿不使用这三步如果有直接的方法可以解决。
请参阅下面的代码以获取示例 DataFrame - 我所追求的是一种仅使用 更新行的方法df['sort']=='d'
,我知道这将是索引的最后一个,如果可能的话,仅基于索引值。
l1 = [datetime.today().date()] * 4
l2 = list(range(1,5))
l3 = ['a','b','c','d']
df= pd.DataFrame(list(zip(l1,l2,l3)),columns=['datetime','value','sort'])
df.set_index('datetime',inplace=True)
df
Out[1317]:
value sort
datetime
2021-10-22 1 a
2021-10-22 2 b
2021-10-22 3 c
2021-10-22 4 d
df.loc[df.index[-1].argmax()]
Traceback (most recent call last):
File "<ipython-input-1318-e1758b122814>", line 1, in <module>
df.loc[df.index[-1].argmax()]
AttributeError: 'datetime.date' object has no attribute 'argmax'
df.loc[df.index[-1],'value'] = 5
df
Out[1320]:
value sort
datetime
2021-10-22 5 a
2021-10-22 5 b
2021-10-22 5 c
2021-10-22 5 d
解决方案
如果要更改数据框最后一行中特定列的值,可以尝试以下代码
df.iloc[-1,0] = 5
-1 -> 数据框的最后一行
0 -> 列“值”的索引
推荐阅读
- python - 如何使用 Folium 在“鼠标悬停”上突出显示世界国家边界?
- java - 如何在 Java 中同时录制麦克风和扬声器的音频?
- html - 服务器返回 HTML 而不是预期的 JSON 响应
- c# - 迁移到 Visual Studio 2017 后,在 ASP.NET MVC 项目中出现构建错误
- javascript - JS 'body.forEach 不是函数' 上的错误
- python - 聚类后从 k-means 聚类中获取值
- javascript - 使用对象的 Jquery 表单验证
- deployment - 谁批准了 VSTS 中的部署?
- java - How to resolve Invalid header signature; read 0x6576206C6D783F3C, expected 0xE11AB1A1E011CFD0 error java?
- angular - 为什么会生成 .vscode 文件夹