python - 在 zeppelin 中使用从 %pyspark 到 %python 的 Dataframe
问题描述
我在 %pyspark 中有一个 pandas 数据框,我想在 zeppelin 的 %python 单元中使用它。我做不到。知道怎么做吗?
解决方案
你可以直接使用,毕竟都是python,%pyspark只是一个python的API,用python语言使用spark,你也可以在pandas DataFrames和pyspark DataFrames之间切换:
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('app_name').getOrCreate()
your_pyspark_df = spark.createDataFrame(your_pd_df)
此外,您可以使用 .toPandas() 方法返回 pandas DataFrame。
推荐阅读
- android - 如何在 sqlite 数据库中插入图像
- android - Proguard 构建失败并添加了外部库
- ios - NSAttributedString 的初始化使应用程序崩溃
- html - 为什么更改背景颜色会阻止此 CSS 切换按钮正常工作
- android - 如何在 Android 中使用动画更改操作栏的内容?
- javascript - 如何将值从一个 javascript 函数传递到 html.erb 中的另一个
- asp.net-core - Asp.net Core Api 自定义路由
- c - 为什么我们在套接字编程c中使用memset将结构填充为0?
- android - searchActivity 的 setContentView 时 App 崩溃
- laravel - 使用消息'SQLSTATE [42S22] 照亮/数据库/查询异常:找不到列:1054