首页 > 解决方案 > R中read.xlsx时的日期值不一致

问题描述

我正在使用 R 中的 read.xlsx 函数来读取 excel 表。日期列“A”的所有值的格式为 dd/mm/yyyy。但是,当使用 read.xlsx 函数时,解析的日期值的范围是整数,即。42283 到字符串,即 20/08/2015。即使我使用 read.xlsx2,这个问题仍然存在。

我猜想不同行的格式不一致使得很难将列更改为单一标准格式。此外,由于我有 100 多个变量,因此很难在 read.xlsx 中指定列类。

有没有办法解决这个问题,这也是一个excel特定的问题吗?

谢谢!

标签: rdate

解决方案


日期格式的这个问题很普遍,似乎每个 R 包都有不同的处理方式。我的经验read.xlsx是它有时将日期保存为数字字符串,例如“42438”作为字符数据,然后我必须将其转换为数字,然后再转换为 POSIXct。然后其他时候,它似乎将其保存为数字,有时保存为字符,偶尔保存为 POSIXct!如果您一直以“20/08/2015”形式获取字符数据,请尝试以下lubridate包:

 library(lubridate)
 dmy("20/08/2015")

推荐阅读