首页 > 解决方案 > 使用箭头数据集 cpp api 仅从 HDFS 读取选定的文件

问题描述

我有一个特殊的用例,我想从 hdfs 文件系统的目录中只读取选定的 parquet 文件(文件列表)。我知道我可以将整个目录用作数据集,然后对数据应用过滤器,但我只想读取选定的文件列表。如何使用箭头 cpp api 做到这一点?此外,如果您可以分享一个如何使用 hdfs 文件系统使用箭头 cpp api 读取镶木地板文件的示例。(我可以在其中传递我想要读取的文件列表)。提前致谢。

标签: c++hdfsapache-arrow

解决方案


推荐阅读