首页 > 解决方案 > Pandas Dataframe .loc + 更新非唯一日期时间索引?

问题描述

有一个带有时间戳 (%Y-%m-%d) 索引的 DataFrame,我希望能够使用 .loc 在知道日期时间索引值的情况下更新单行。

我知道索引是非唯一的,这意味着有时我会得到的不仅仅是我想要更新的行。所以我在第二列上对 DataFrame 进行了排序,这样我要更新的行将始终是该索引值的最后一行。

有问题的 DataFrame 是一个更大的 DataFrame 的子集副本,并且在不使用的情况下设置一个值.loc是行不通的——因此我对 using 的限制.loc

我的问题:有没有办法可以引用索引值的最后一行并更新它,纯粹基于索引?

显然,仅使用索引值将使用该索引更新所有行,argmax 似乎不适用于时间戳,虽然我可以临时重新创建索引以使用我排序的另一列,但我宁愿不使用这三步如果有直接的方法可以解决。

请参阅下面的代码以获取示例 DataFrame - 我所追求的是一种仅使用 更新行的方法df['sort']=='d',我知道这将是索引的最后一个,如果可能的话,仅基于索引值。

l1 = [datetime.today().date()] * 4
l2 = list(range(1,5))
l3 = ['a','b','c','d']
df= pd.DataFrame(list(zip(l1,l2,l3)),columns=['datetime','value','sort'])
df.set_index('datetime',inplace=True)

df
Out[1317]: 
            value sort
datetime              
2021-10-22      1    a
2021-10-22      2    b
2021-10-22      3    c
2021-10-22      4    d

df.loc[df.index[-1].argmax()]
Traceback (most recent call last):

  File "<ipython-input-1318-e1758b122814>", line 1, in <module>
    df.loc[df.index[-1].argmax()]

AttributeError: 'datetime.date' object has no attribute 'argmax'

df.loc[df.index[-1],'value'] = 5

df
Out[1320]: 
            value sort
datetime              
2021-10-22      5    a
2021-10-22      5    b
2021-10-22      5    c
2021-10-22      5    d

标签: pythonpandasdataframeindexingpandas-loc

解决方案


如果要更改数据框最后一行中特定列的值,可以尝试以下代码

df.iloc[-1,0] = 5

-1 -> 数据框的最后一行

0 -> 列“值”的索引


推荐阅读