python - 在 Pyspark 中获取 pandas Dataframe.to_numpy() 的另一种方法
问题描述
我使用 Pandas Dataframe 完成了以下代码片段,我必须将其转换为 Pyspark DataFrame 代码:
import numpy as np
import pandas as pd
corr = np.corrcoef(df.to_numpy().T) #df is a Pandas Dataframe
我找到了一种从此链接转置 Spark Dataframe 的方法。
但我基本上需要 Pandas dataframe.to_numpy() 的 Pyspark 实现(类似于 Pandas dataframe.values。
任何线索都会有所帮助。另外,如果您希望我通过任何示例来澄清我的问题,请务必询问。
解决方案
推荐阅读
- powershell - 使用powershell将diskpart输出到变量或屏幕上
- reactjs - 在 React App 中访问 redux 存储状态属性时获取未定义
- java - 如果 servlet 上下文初始化失败,则跳过部署或停止 Web 应用程序
- azure - Azure DevOps 是 PaaS 还是 IaaS?
- c# - 当我死时,一颗心不会被移走,但不会有错误
- laravel - Laravel 输入循环
- vue.js - 如何将其他组件应用到 Vue Router 的一个路径
- javascript - 使用Javascript的Json中特定属性的总和
- airflow - 气流调度程序如何配置检查新文件的间隔?
- wordpress - 如何在管理员中使用复选框在 dropdwon 中显示 wp 标签