apache-spark - 如何使用 pyspark 对 spark 数据框中新添加的列执行功能
问题描述
我试图使用文字在 pyspark 中创建一个新列,但是当我尝试使用该列执行一些功能时,它显示这样的错误
AttributeError: 'NoneType' object has no attribute 'show'
我的代码是
autodata1=autodata.withColumn('pricePerMPG',(col('PRICE')/(col('MPG-CITY')+col('MPG-HWY')/2))).show(truncate=False)`
autodata1.show()
from pyspark.sql.functions import max
max = autodata1.agg({"pricePerMPG": "max"}).collect()[0]
print(max)
谁能帮我解决这个问题?
解决方案
您show()
触发一个动作并返回一个非对象。
autodata1=autodata.withColumn('pricePerMPG',(col('PRICE')/(col('MPG-CITY')+col('MPG-HWY')/2)))
autodata1.show(truncate=False)
from pyspark.sql.functions import max
max = autodata1.agg({"pricePerMPG": "max"}).collect()[0]
print(max)
推荐阅读
- r - taskscheduler_create() 多天 - 每月 - R
- c++ - 为什么非专业模板胜过部分专业模板?
- javascript - Uncaught TypeError: Object(...) is not a function at handleChange
- julia - 数据框在excel文件中的空行之前被剪切
- git - 您的分支和 'origin/integration/phone_number_change' 已经分道扬镳
- encryption - TLS 1.2 密码套件错误,Schannel 事件 ID 36874 和 36888
- excel - Excel。1 个特定列的特殊数字分隔符格式,整个文档没有
- r - R rowSums() 正在生成一个奇怪的输出。我究竟做错了什么?
- amazon-web-services - 为什么我无法在 Tableau Server 上刷新我的雪花数据提取?
- sql-server - 查询保留最新的非零值