footer - 镶木地板页脚规范
问题描述
是否有详细的 Parquet 页脚规范?当我以编程方式将数据转换为 Parquet 时,我看到 Parquet 页脚变得非常大。我意识到它有块偏移和块的最小/最大值,但那里似乎有更多信息。了解更多页脚设计可以让我在块大小、块数和页脚大小方面做出权衡。谢谢,马克
解决方案
parquet 文件格式是使用parquet-format github 存储库中的thrift指定的。自述文件的元数据部分还显示了结构的图形概述。
此结构中不应有任何大量数据,但页脚还可以包含额外的任意key_value_metadata
对。这通常用于以文本格式存储原始模式,例如 avro,并且可能会增加几千字节。
推荐阅读
- c - 为什么我无法使用 msgrcv() 访问消息队列中的消息文本?
- django - Django templates - include and repeat the block contents
- python - How to extract symbols from Image?
- c# - Capturing Receipt Data from receipt printer after transaction c#
- python - pytest 的错误分布NotFound
- opengl - 如何增加OpenGL中的窗口深度?
- git - 在 docker-compose up 之后运行 Dockerfile 命令
- javascript - 滚动到 id 只向下滚动
- machine-learning - Genisim doc2vec:短文档是如何处理的?
- android - Android 日期选择器没有清楚地显示标题或数字