pyspark - 如何从火花数据框中获取单个值
问题描述
我有一个数据框,如下所示:
Col1 Col2
1.2 9.8
3.4 8.8
我想从列中检索单个值的值 Col2[2]
我将如何在火花中实现这一目标
我尝试了以下代码:
t = df[0].__getitem__("Col2")
Column<b'Col1[Col2]'>
解决方案
我们可以使用.rdd
将 df 转换为 rdd 然后使用lambda function
我们只能Col2
从行对象中获取!
df.show()
+----+----+
|Col1|Col2|
+----+----+
| 1.2| 9.8|
| 3.4| 8.8|
+----+----+
#to get col2 second row
df.collect()[1][1]
#8.8
#to get col2
df.rdd.map(lambda x:x.Col2).collect()
[9.8, 8.8]
推荐阅读
- flutter - Flutter 无法让资产在我的 pupspec.yaml 上工作
- python - 在 Python 中传递类的内部函数
- reactjs - 使用@apollo/react-hoc 在客户端渲染的服务器端渲染页面中获取陈旧数据
- c - Arduino代码问题,代码没有进入while循环
- javascript - 剑道网格中的 JavaScript 日期
- terraform - 带有lookap函数的terraform问题中的变量继承
- sql - 如何计算涉及多个连接的总和
- angular - Angular 9 应用程序未在 IE11 上运行
- javascript - localStorage 不在 chrome 扩展中存储数据
- python - Pandas 行迭代查询