首页 > 解决方案 > 在迭代时引用下一个索引时避免索引错误

问题描述

所以我有一个 pandas 数据框,我正在使用 iterrows() 来迭代每一行,对它做一些复杂的事情。其中一部分涉及从下一行的坐标中减去当前行的坐标,所以我这样做

sqrt(((row[5] - df.iloc[index+1, 5])**2) + ((row[4] - df.iloc[index+1, 4])**2)) < .1

问题是当我完成对所有行的迭代时,最后一行会给我一个索引错误,因为我将引用下一个不存在的索引。我正在考虑在数据框的末尾添加一个虚拟行。有没有更优雅的解决方案来解决这个问题?

编辑:

for index, row in df.iterrows():
    if row[8] < 10 and sqrt(((row[5] - df.iloc[index+1, 5])**2) + ((row[4] - df.iloc[index+1, 4])**2)) < .1
        #do stuff

标签: pythonpandasindexing

解决方案


当行是最后一行时,您的代码尝试访问不存在的 (row+1),这就是您收到索引错误的原因。

运行循环以遍历除最后一行以外的所有行,然后当您的代码到达倒数第二行时,它将访问最后一行。

试试这个代码

for i in range(len(df.index)-1):           #runs from row 0 to n-2 rows if total rows are n
    # your code
    sqrt(((row[5] - df.iloc[index+1, 5])**2) + ((row[4] - df.iloc[index+1, 4])**2)) < .1

推荐阅读