pyspark - 集成调试 pyspark 数据帧有时会输出到终端而不是调试控制台
问题描述
在调试 pyspark 程序时,我在加载数据帧 ( ch
) 之后放置了一个断点。然后,使用调试控制台单命令行我执行以下操作:
ch.count()
32489
计数正确显示在ch.count()
. 但是,如果我尝试显示数据框内容,则会得到以下信息:
ch.show()
None
即便如此,数据框的输出确实正确显示在终端窗口中!因此,如果我单击查看终端窗口,我会看到 ch.show() 的输出。我查看了其他看似相关的问题,但没有成功。例如,我尝试了以下但没有成功。
"console": "None"
和 :
"console": "integratedTerminal"
还 :
"debugOptions": ["RedirectOutput"]
谢谢
解决方案
df.show
内部打印为stdout
not stderr
,如果您想打印到 stderr 使用df.take
并根据需要自行打印。None 是该df.show
方法返回的内容。
推荐阅读
- javascript - 如何在具有箭头的 li 元素上的两个类之间切换?(只是 JavaScript 和 CSS)
- symfony - 如何测试依赖于 API 的 Symfony 应用程序
- html - mac邮件上电子邮件签名中的背景颜色
- networking - 是否可以将 Openvswitch 网桥与两个不同的接口绑定?
- node.js - heroku 的 typescript 部署失败
- html - Angular - 从焦点中排除 div
- sql-server - 排除意义相同但值不同的行
- python - loc[ ] 是 Pandas 中的一个函数吗
- django - Django Microsoft AD 身份验证
- node.js - Node.js 多个请求同时返回一个结果