apache-spark - 日期无效:使用 pySpark 将 CSV 导入 Cassandra 时出错
问题描述
我正在使用 Jupyter NoteBook 运行 pySpark 代码以将 CSV 文件导入 Cassandra v3.11.3。低于错误。
... 1 more[![enter image description here][1]][1]
-------------------------------------------------- -------------------------
我附上图片的pySpark代码:
[![pyspark_code][1]][1]
任何输入...
解决方案
如果没有完整的跟踪,很难确切知道失败的地方。您粘贴的方法只是 p4yj 包装器方法,我们确实需要查看底层 Java 异常。
据我所知,您似乎还试图在 C* 写入上使用一些不受支持的选项。例如,“MODE”-“DROPMALFORMED”不是有效的 C* 连接器选项。DataFrame Writer 和 Reader 选项是特定于源的,因此很遗憾您无法混合和匹配。
这让我认为正在写入的数据实际上有一两个格式错误的日期字符串,并且在尝试写入损坏的记录时这段代码正在死去。解决此问题的一种方法是尝试在 CSV 读取上进行日期转换,我相信它确实支持DROPMALFORMED样式解析选项。
推荐阅读
- java - 在 try-catch 块中,“finally”是否会覆盖异常块中的“return”?
- python - 用于在 Python 中提取脚本标签的正则表达式
- python - 如何在抽象模型的 ManyToMany 字段中设置related_name?
- sql - 更改后如何知道列的先前长度
- laravel - Laravel 5 从其他表中获取关系数据而不使用数据透视表
- javascript - 在同一个数组元素上使用 $regex 和 $nor 运算符
- mysql - 如何使用 select sum() 按组选择值?
- java - 将 SpringDataJpa 与 Hibernate/eclipselink 一起使用时 entityManager 的行为
- javascript - 无法弄清楚如何通过调整窗口大小使 toggleClass 正常工作
- swift - NSLayoutAnchor 的类型