json - Spark json 模式验证
问题描述
我正在使用 python 库 Draft7Validator ( https://python-jsonschema.readthedocs.io/en/stable/validate/ ) 来测试每个文件的 json 模式。不幸的是它很慢,在 scala/java 中有一个库,我可以在 Spark 中使用它来验证每个文件的 json 模式。
解决方案
您可以使用everit进行 json 验证。您可以在这里找到一个示例, 我认为@Srinivas 还提供了一个不错的选项circe-json-schema,但是everit(它是 circe-json-schema 的基础库)也支持不同的草稿,因此这取决于您的验证要求和使用的草稿
推荐阅读
- windows - Powershell - 如何使用 Get-WindowsOptionalFeature 命令“打开和关闭 Windows 功能”
- python - Twitter 流媒体 - 查找 10 大热门话题 | PySpark
- javascript - 从http post请求下载文件 - Angular 6
- java - 如何在 Spring Boot 中测试组件/bean
- redhat-datavirt - JDV中是否存在函数NTILE
- jquery - jquery使用parseFloat和toFixed
- javascript - lodash 链式方法中的当前链
- javascript - OnEdit() 谷歌脚本触发器在函数中的使用
- android - 你如何让 Android TextView 向右展开?
- python - 如何在 Python 的 yaml 文件中配置多个字典键?