python - 具有不同模式的镶木地板
问题描述
我的文件夹中有一个镶木地板文件列表./my_file/*.parquet
。好的有一个列“date_time”,它应该是一个整数(unix 纪元时间戳)。
root
|-- date_time: integer (nullable = true)
但其中一些有一个真正的时间戳字段。
root
|-- date_time: timestamp (nullable = true)
问题是所有这些文件都在同一个文件夹中,当我阅读它们时,action
我的数据框中的任何文件都会产生错误:
列:[date_time],预期:LongType,找到:INT96
您有什么好的方法可以轻松地将“时间戳”文件与“整数”文件分开吗?我的文件夹中有超过 30k 个文件,我只是不知道如何处理它们,因为任何操作都会产生错误。
解决方案
推荐阅读
- node.js - NODE APP:Systemd 启动脚本不起作用?
- java - 如何使用 MyBatis 迭代一个对象的所有字段?
- android - Firestore 使用包含多个字段
- html - 用于多服务器公共网站的 html 私有 IP 重定向
- node.js - setHeader(“Content-Type”,值)中需要node.js http“值”吗?
- javascript - 如何在中心对齐谷歌地理图表图例
- java - 如何使 70 字节的 .class 文件打印“Hello World”?
- php - 为什么在 Laravel 5.6 中没有突出显示当前的引导菜单?
- javascript - 如何以引导程序 ngb-tabset 的角度 6 以编程方式加载选项卡
- windows - 使用 bazel 在 Windows 上构建 tensorflow r1.12 mkl,导致链接错误