pyspark - 有没有办法可以在pyspark中用空格重命名或别名列
问题描述
重命名列时出现错误,无论如何我可以重命名它,因为列名中有空格
df=df.withColumnRenamed("std deviation","stdDeviation")
Error:AnalysisException: Attribute name "std deviation" contains invalid character(s) among " ,;{}()\n\t=". Please use alias to rename it.
我尝试了另一种使用别名的方法,但没有成功。
df=df.select(col("std deviation").alias("stdDeviation"))
有没有办法可以重命名包含空格的列?
Error:AnalysisException: Attribute name "std deviation" contains invalid character(s) among " ,;{}()\n\t=". Please use alias to rename it.
解决方案
不,根据源代码,Spark 无法做到这一点。另一种方法是使用pandas.read_parquet
, 它应该可以工作。但是,我不确定您的文件有多大,以及您的本地计算机(或集群驱动程序)是否可以处理它。
推荐阅读
- powershell - 将 PSCustomObjects 拆分为字符串/数组
- html - Bootstrap 5 - 在保持行的同时具有自动宽度的列
- asp.net - 如何在 ASP.NET 中构建 JavaScript uglify 文件并将其打包到 Docker 映像中
- typescript - 我如何自定义 VS Code 悬停智能感知/推断包装功能
- python - Python:你能用存储在变量中的值命名一个对象吗?
- java - Spring Boot 2.5.0 生成 plain.jar 文件。我可以删除它吗?
- python - Pandas - 绘制 P1D 时间间隔
- c# - 带有 Uno 平台应用程序的 Socket Err 10013
- python - 球碰撞代码不起作用,球粘在一起
- gcc - 为什么在尝试配置 make 时出现此错误?