mongodb - 如何区分火花数据框中的空值和缺失的 mongogdb 值?
问题描述
前提条件:MongoDB 文档的架构未知。它有空值和缺失值:例如以下文档中的 CCNO (1) 有值 (2) 有空值 (3) 缺失。
我正在使用 MongoSpark.load(SparkSession, ReadConfig) 在 spark 中获取它们,但它正在用数据框中的空值替换缺失值。
请建议一种方法来区分手动插入的空值和火花插入的空值(对于缺失值)。
解决方案
推荐阅读
- python - Python Scrapy 在第一个元素 csspath() 处停止并且不会抓取其余部分
- c# - 逐帧/逐样本播放时同步音频和视频播放
- excel - 如何将不同的临时值传递给触发的子程序?
- javascript - React Router 中的多个可选参数
- google-cloud-platform - 如何使用来自 gapi(google-api-javascript-client)库的客户端通过 Google Cloud IAP 进行身份验证?
- python - 使用Python登录Investors Business Daily并获取股票数据
- stata - Stata 中 Sergio Corriea 的 ppmlhdfe 命令的负二项式替代方案
- python - 在创建幻灯片之前创建 python PPTX 内部超链接
- python - 列表中的 SIDERA 字典 模块执行期间出现意外故障
- authentication - 使用外部 API 对单页应用程序进行 Google 身份验证