sql - 在 pyspark 中使用 col 函数查看所有列
问题描述
我有一个包含多列的数据框,但是当我尝试使用 col 函数迭代这些列时,它会抛出错误
input: df.columns
output: ['Serial No.',
'GRE Score',
'TOEFL Score',
'University Rating',
'SOP',
'LOR ',
'CGPA',
'Research',
'Chance of Admit ']
我得到了这些列的名称,但我需要对这些列进行一些更改,我试图对其进行迭代
解决方案
只需使用普通的 for 循环
df = ...
for c in df.columns:
df = df.withColumn(c + '__new', F.col(c) + 1)
推荐阅读
- reactjs - 如何从 ftp 编辑翻译文件
- python - 尝试在 python 中安装 Wordcloud 时出错
- java - 小部件 ListView 加载视图
- javascript - 使用 React Stack Grid 出现错误“无法读取未定义的属性 'grid'”
- javascript - 为odoo 13中的表单添加上下文。使用js
- r - install.packages 中的警告:将 NULL 指针转换为 R NULL
- authentication - 使用 OAuth2 在 Flutter 应用程序中获取 Web 应用程序登录令牌
- command - 将命令行参数值传递给字符串
- javascript - 如何检查单元格是否在 Javascript 循环中具有选择元素?
- c# - 是否可以在没有 SetForegroundWindow 的情况下将 SendKeys 用于特定应用程序?