首页 > 解决方案 > 存储为子句 CSV Hive 中无法识别的文件格式

问题描述

我正在尝试在 S3 中创建一个 csv 配置单元表(使用 Hive CLI)。

create external table hello (
name INT)
stored as csv
location 's3://bucket/myfolder;

==> 错误语义异常Unrecognized file format in stored as clause 'CSV'

我删除了外部

create table hello (
name INT)
stored as csv
location 's3://bucket/myfolder;

==> 相同的错误 SemanticExceptionUnrecognized file format in stored as clause 'CSV'

知道我使用的是 Apache Hive + Apache Hadoop(我安装它是因为 Hive 需要一些 hadoop 二进制文件)。

请问有什么想法吗,谢谢

标签: csvapache-sparkhadoophive

解决方案


CSV 不是有效的文件类型。试试这个:

create external table hello (
name INT)
row format delimited
fields terminated by ','
stored as textfile
location 's3://bucket/myfolder';

或者

create external table hello (
name INT)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile
location 's3://bucket/myfolder';

推荐阅读