首页 > 解决方案 > 如何将 CSV 文件加载到 Apache Kylin

问题描述

我想将包含 >10000000 行数据的 csv 文件加载到 Apache Kylin 中。目前,我的 Kylin(版本 3.0.2)安装在 AWS EMR 集群中。我的 csv 文件当前存储在 s3 存储桶中。我在 EMR 中创建了 hive 表,我可以通过查询 'select count(*) from my_table; 来计算所有数据,但是当我尝试执行其他特定查询时,它没有显示结果,只是显示 OK和运行时间。

然后,我尝试将配置单元表加载到 Kylin UI。它已成功加载,我能够为它创建多维数据集。但是,多维数据集是 0 GB,但我能够看到数据源中的所有列名、数据类型和文件大小。

如何在 Kylin UI 中加载数据?

谢谢

标签: csvhiveamazon-emrkylin

解决方案


推荐阅读