首页 > 解决方案 > 在 PySpark 数据框中创建的二进制列不能用作过滤器?

问题描述

我正在使用 PySpark 在我的数据框中创建一个额外的 BinaryColumn,然后使用它来过滤数据框。此过程显示错误。

  1. 数据:

点击这里查看数据

  1. 创建二进制列:

单击此处查看二进制列

点击这里查看架构

  1. 过滤器和错误:

点击这里查看错误

标签: pysparkpyspark-sqlpyspark-dataframes

解决方案


尝试使用filter功能

df_filter = df_bc.filter(col('binary_col') == 'false')
df_filter.show()

推荐阅读