pyspark - PySpark 结构化流测试支持
问题描述
我进行了很多调查,但在如何测试我的 pyspark 结构化流管道作业(从 Kafka 主题到 S3)以及如何构建持续集成 (CI)/持续部署 (CD) 方面无法获得任何帮助或资源。
是否可以测试(单元测试、集成测试)pyspark 结构化流?
如何构建持续集成(CI)/持续部署(CD)?
解决方案
- 请参阅https://bartoszgajda.com/2020/04/13/testing-spark-structured-streaming-using-memorystream/ - 代码在 Scala 中,但您应该能够转换为 PySpark
- 从詹金斯开始(https://www.jenkins.io/)
推荐阅读
- php-carbon - Carbon::today()->toDateString() 不等于今天的日期
- javascript - 如何在 chrome 扩展中关闭 iframe
- javascript - 如何减少我的功能?我收到以下错误:期望使用解构赋值 - {balance}
- javascript - `for(key in obj) BREAK` 的复杂度为 O(N) 而不是 O(1)。有没有办法克服这个
- java - 无法通过 JDBC 连接到 Teradata 数据库(连接断开)
- flutter - 另一个动画生成器 Flutter 下的幻灯片小部件
- javascript - 如何在下一页显示我的风格车牌
- java - 如何使用 AJAX 获取表格
- php - 如何获取应用程序中可用邮件传输的列表?
- apache-spark - 我希望 Spark 在保存到数据库时忽略不良记录