c++ - 如何在 C++ 中的镶木地板文件中保存时间戳并在 Python Pandas 中加载它?
问题描述
我Apache Arrow
在 C++ 中使用将时间序列集合保存为 parquet 文件,并使用 python 将 parquet 文件加载为Pandas
Dataframe
. 该过程适用于除Date64Type
. 我在 C++ 中保存纪元时间,当在熊猫中加载它时,时间信息会丢失。
例如对于 boost posix time : 2018-04-01T20:11:17.112Z
,纪元时间 (in int64_t
) 是1522613477112000
,但是当我将 parquet 文件保存为 ( Date64Type
) 并加载到 pandas 时,结果是2018-04-01
并且时间信息丢失了。在镶木地板文件中保存时间戳的正确方法是什么?
解决方案
你需要arrow::TimestampType
改用。Date32Type
并且Date64Type
只支持日解析;它们的内部表示有点不同(int32_t
自 UNIX 纪元以来的天数与int64_t
自 UNIX 纪元以来的毫秒数)
推荐阅读
- spacy - 添加正则表达式以停止 spacy 中的单词
- google-chrome - 非隐身模式下的vscode chrome调试器
- angular - Angular8:HttpClient发布到服务器地址
- c++ - 检测和计数接触(遮挡问题)并具有相同颜色的图像
- string - 字符串文字和字符连接输出
- javascript - 如何在 React 本机应用程序上从本机调用 JavaScript 函数
- python-3.x - 在 Pandas 列中查找多行的最大值
- snowflake-cloud-data-platform - 是否可以在不限定数据库名称的情况下运行雪花 sql 脚本。?
- asp.net-mvc - 为什么我在 .net core 3 中收到错误 CS0246?
- blogger - 目标 _blank “条件”