pyspark - Pyspark,TypeError:“列”对象不可调用
问题描述
如何打印出执行以下操作的列的内容?我正在尝试abcd
在正常的df中打印出列的内容,我可以做到df.show()
。
但是如何显示列对象?
>>> df = spark.createDataFrame([
... ('a', 1.0, 1.0), ('a',1.0, 0.2), ('b', 1.0, 1.0),
... ('c' ,1.0, 0.5), ('d', 0.55, 1.0),('e', 1.0, 1.0)
... ])
>>> df.show()
+---+----+---+
| _1| _2| _3|
+---+----+---+
| a| 1.0|1.0|
| a| 1.0|0.2|
| b| 1.0|1.0|
| c| 1.0|0.5|
| d|0.55|1.0|
| e| 1.0|1.0|
+---+----+---+
>>> abcd = spark_sum(
... when(
... spark_abs(
... df['_2'] -
... df['_3']
... ) < 0.05,
... "odt"
... ).otherwise(0)
... ).alias(
... 'yo,man'
... )
如何打印 abcd 的内容?
>>> abcd
Column<sum(CASE WHEN (abs((_2 - _3)) < 0.05) THEN odt ELSE 0 END) AS `yo,man`>
解决方案
如何打印 abcd 的内容?
很简单。选择并显示:
df.select(abcd).show()
推荐阅读
- jestjs - 在 Vue3 中使用 Jest 测试 ApolloClient API(组合 API)
- python - 通过贪心方法根据相交值的总数迭代地配对两个数据帧的列
- python - Python 中的 HackerRank Mark 和 Toys 问题
- c++ - 缺少 minGW 文件
- python - 具有多个元素的数组的真值是不明确的。在对象检测中使用 a.any() 或 a.all() 错误
- git - 在 Git 的一次提交中进行多项更改?
- opencv - 将 numpy ndarray 转换为 PIL 并将其转换为张量
- node.js - 如何减少 TypeScript 中的二维数组以返回唯一子数组的二维数组?
- mysql - 如何根据like删除行,但不是针对每个like语句
- django - AWS S3 存储的图像链接在 Gmail 简报中不起作用