首页 > 解决方案 > 掩码数据帧上的就地操作

问题描述

我有一个场景,我在某处存储了一个父数据帧,并且根据要求,我只想处理该数据帧的某些行,但是,我只想循环该数据帧子集进行处理,而不是整个数据帧,因为 df.loc[mask, col] = value 操作在通用代码中处理起来更麻烦。问题是对子集执行的操作未在原始数据帧中更新。例如:

def get_subset(row_indices):
   return self.dataframe.loc[self.dataframe[index_column].isin(row_indices)]

sub_df = get_subset([1,2,3])
sub_df['text'] = sub_df['text'].str.lower()

此代码片段更新 sub_df 中的文本列,但不在类内的主数据框中。有没有办法屏蔽数据框,以便这些操作到位?谢谢!

标签: pythonpandasdataframe

解决方案


推荐阅读