pandas - python pandas动态查询传入函数
问题描述
我有带有字符串列的数据框。我想在某些功能中使用它的一部分。要使用的部分由传递给函数的条件定义。
def myfunc(condition):
tmp_df = df[condition].copy()
#doing something else wit tmp_df
return some_result
我的问题是:
如何传递字符串列的条件?例如:
df.str_column.str.len()>10
当我需要使用所有数据框时,如何传递空条件?
我找到了数字列的解决方案,但是如何使用字符串?
解决方案
我认为有必要创建布尔掩码:
#boolean mask
cond = df.str_column.str.len()>10
#return all values
cond = [True] * len(df)
myfunc(cond)
推荐阅读
- vhdl - VHDL 等效于 Verilog "10'h234"
- sql - spark sql中百分位函数中频率参数的使用
- android - 引起:java.lang.NullPointerException:
- html - 子元素的阴影被剪裁
- python - 为什么读取.mat文件并处理它的时间成本越来越大
- css - 更改字体时谷歌图表重绘速度很慢
- google-cloud-platform - 直接从url下载大数据到google云存储Bucket
- css - 站点布局分为行和列 - 对齐问题
- python - 在 python 中从 JSON 创建可逆 YAML
- c# - 失去互联网连接后,单声道上的 Webrequest 无法恢复