首页 > 解决方案 > 为什么 RDS 文件不同(如果它们应该相同)?

问题描述

我重新运行了一些我的旧 R 代码。作为检查,我计算了生成的 RDS 文件的 md5sum。它与我认为相同的旧 RDS 文件不同,因为它是使用相同的代码创建的。

我将这两个文件都加载到了数据框中,看起来内容是一样的。

我将两个数据框导出为两个 csv 文件,它们具有相同的校验和。

我再次将两个数据帧导出为两个 RDS 文件,这再次导致了两个不同的校验和(与开头的 RDS 文件相同。)

我将两个数据帧的 head() 导出为 RDS,但包括所有行(实际上是整个数据帧,与原始加载的 RDS 文件相同的数据帧)。(即数据框有 2255 行,所以我做了saveRDS(head(df1, n=2255), "head_df1.RDS")

两个“头”文件的校验和现在相同,但与两个原始 RDS 文件不同。

这怎么可能?两个具有相同数据的 RDS 文件之间有什么区别?数据帧的 head() 与原始 RDS 文件有何不同?

标签: rdataframechecksumdifference

解决方案


推荐阅读