pyspark - 在 PySpark 数据框中创建的二进制列不能用作过滤器?
问题描述
我正在使用 PySpark 在我的数据框中创建一个额外的 BinaryColumn,然后使用它来过滤数据框。此过程显示错误。
- 数据:
- 创建二进制列:
- 过滤器和错误:
解决方案
尝试使用filter
功能
df_filter = df_bc.filter(col('binary_col') == 'false')
df_filter.show()
推荐阅读
- javascript - 无法通过 AngularJS 激活 Bootstrap 弹出窗口
- c++ - 最后一个命令的输出加倍(尝试打印堆栈元素)
- haskell - 关于 Haskell 运算符优先级和函数组合的说明
- c++ - 空悬空指针c ++
- raspberry-pi - LXSession 上的 Qt4 WindowsStayOnTop
- angular - 如何使用具有依赖于另一个选择器的参数的ngrx选择器
- elm - 在 ELM 中显示返回数组的总数
- javascript - Mongodb:如何从数据库中获取第一个文档然后将其删除
- redux - 带有动态路由配置的 TabNavigator / redux
- firebase - Firebase 函数未在 Flutter 中返回响应