pyspark - 如何在 PySpark 中读取检查点数据帧
问题描述
如果我检查点如下所示的 DataFrame。我怎样才能读回来?
df1 = spark.createDataFrame([('Abraham','Lincoln')], ['first_name', 'last_name'])
df1.checkpoint()
就像是....
reload = spark.read.something('checkpoints/87b411a8-19e3-402a-86a7-cfac0a4a6d14/rdd-40/*')
我看到写入检查点文件夹的检查点文件已分区,但无法分辨文件类型是什么。
解决方案
推荐阅读
- javascript - 如何从 React Native 中的三个不同选项有条件地渲染?
- python - 如何使用 AWS Lamda@Edge 将 node.js 代码转换为 python
- android - 颤振重复的网页浏览小部件
- core-audio - Web Audio API audioctx.destination AudioNode 可以是虚拟音频设备吗?
- swiftui - 在 \.colorScheme 上使用 Apple 按钮登录错误
- laravel - 按周和天对数据进行分组
- javascript - 无法将数组添加到 div
- c++ - 带有 std::span 的 C++ Ranges-v3:从函数返回范围视图时的中间对象的所有权
- android - 在kotlin android中完成长时间运行的任务后如何返回参数?
- python-3.x - Groupby,值计数和计算熊猫中的百分比