python - 掩码数据帧上的就地操作
问题描述
我有一个场景,我在某处存储了一个父数据帧,并且根据要求,我只想处理该数据帧的某些行,但是,我只想循环该数据帧子集进行处理,而不是整个数据帧,因为 df.loc[mask, col] = value 操作在通用代码中处理起来更麻烦。问题是对子集执行的操作未在原始数据帧中更新。例如:
def get_subset(row_indices):
return self.dataframe.loc[self.dataframe[index_column].isin(row_indices)]
sub_df = get_subset([1,2,3])
sub_df['text'] = sub_df['text'].str.lower()
此代码片段更新 sub_df 中的文本列,但不在类内的主数据框中。有没有办法屏蔽数据框,以便这些操作到位?谢谢!
解决方案
推荐阅读
- python - Python 数据透视表 groupby 或 transpose/unstack
- java - 二叉搜索树搜索功能的错误实现
- selenium - 从 instagram 抓取数据是否合法?
- java - 单击按钮时移动卡住
- java - 我是否犯了一个错误,因为在声明变量时?
- kotlin - 如果初始化了其中的lateinit var,如何检查伴随对象的外部
- ruby-on-rails - 如何为 ActiveStorage 磁盘服务设置缓存控制?
- laravel - 按特色 DESC 和 Rand() 排序 - Laravel
- java - 如何在没有副本的情况下将 MappedByteBuffer 写入套接字输出流(服务器到客户端)
- c# - 如何将函数调用到使用存在函数的 Linq 列表查询