python - 镶木地板文件格式是否必须始终保存模式(带有数据类型)和标头?
问题描述
将数据保存为 Parquet 文件格式时 - 具有数据类型的 Schema 是否也必须保存在 Parquet 文件格式中?(或者可以跳过)
另外 - 是否也需要保存标题?(或者可以跳过)
谢谢。
解决方案
您将始终需要 Parquet 文件的架构,因为它们是二进制的,没有架构就无法被阅读器反序列化。
并不是说 Parquet 没有真正的页眉而是页脚。所有元数据(包括架构)都保存在文件末尾。Parquet 文件的结构见下图:
推荐阅读
- reactjs - React State 在断言之前没有得到更新,即使在 act 函数中起作用
- .net - 如何在所有 windows 平台(win7、win8、win10 和 windows Server 2008、windows server 2016 等)中找到 RegAsm.exe
- docker - wwwroot 中的静态文件不包含在 Docker 映像中
- ruby-on-rails - 如何通过 activerecord 以两种不同的方式关联两个模型?
- xml - 如何获取重复的“xsl:when”元素中包含的特定值?
- angular - 按顺序存储 HTTP 响应
- scala - Scalalikejdbc 隐式参数
- javascript - React States 使用 Window Location url 创建外部链接
- python - 由于奇怪的错误,Jupyter Notebook 无法打开
- javascript - 提高多个承诺的性能