sql - 为什么我在 sparkSQL 中得到错误的 count() 值
问题描述
我正在使用 sparkSQL,有一列,其总数为 1252226。
spark.sql("""select col1 from employee """).count()
output: 1252226
spark.sql("""select distinct col1 from employee """).count()
output: null
X
count for X = 288149
IS NULL = 964077
spark.sql("""select col1 from employee where col1 != 'a' """).count()
output: 0
在最后一个查询中( where !- 'a' ),为什么它显示 0 条记录,它应该显示 1252226。
解决方案
推荐阅读
- arrays - 为什么使用 ARGV 的 gvpr 不起作用?
- c++ - 部分专业化时基于 C++ 模板的“覆盖”等价物?
- spring - 使用 Hibernate + Spring + C3P0 + 多线程打开连接
- r - 从预测 stl 分解继续时间序列的季节性
- design-patterns - 在 DDD 中哪里实现聚合级权限?
- liferay - 如何从 liferay 7.1 中网站的公共和私人页面 url 中删除 /group 和 /web 字词?
- java - Selenium 与 BrowserMob - 404 错误
- javascript - 电子错误“找不到安装的好路径”
- cron - 调度程序和 cron 表达式
- django - 带有 python 3.7 和 Apache 的 Python 虚拟环境:我必须编译 mod_wsgi 吗?