首页 > 解决方案 > 在 R 中加载数据时嵌入 Nul(s)

问题描述

我所说的数据是以 CSV 格式从 SQL 服务器导出的,并且有大约 200 万行。后来这通过 Filezilla 分享给了我(因为这是客户的数据)。我试图将此 CSV 文件加载到 R 环境中,并面临以下警告消息:

警告消息: 在 scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : 在输入中找到嵌入的 nul(s)

这不仅是一条警告消息,而且在加载数据后我丢失了大约 150 万行。这意味着只有 500K 行是非空的。所有这 500K 行都处于良好状态,并且与客户端的父数据相匹配。

这就是谜题中有趣的部分开始的地方。我们让我们的客户将 CSV 上传回 SQL 服务器,以便创建一个新表并检查总行数(以及一些其他指标)。所有的数据都在那里,他们甚至没有错过任何一行。

嵌入式 nul(s)上的其他线程正在帮助在没有警告的情况下读取数据。但我不想那样。所以我请求你的帮助来回答我以下问题:

  1. 有没有办法使用嵌入式 nuls 读取文件(即使它们是 nuls 我没有问题,但想先读取所有 200 万行)
  2. 在与用户共享敏感数据的同时,是否有任何可能的安全措施将大部分数据转换为 NULL?(可能是我的客户,我对此一无所知并试图解决错误的问题)

笔记:

标签: pythonrsql-serverfilezilladata-loss

解决方案


推荐阅读