首页 > 解决方案 > 将数据从 .csv 文件加载到配置单元表

问题描述

我创建了一个配置单元表并希望将 csv 数据加载到其中。数据在单元格中有多个换行符,因此它返回不需要的结果。

如何处理配置单元表中的多个换行符?

我试过这种代码:

使用这种格式

这是整行数据

这是我从查询中得到的结果

但预期的结果只是日期。

CREATE EXTERNAL TABLE db_raw.schoolData
(
     Date string, 
     height string,
     weight string,
     ready_to_make string
)

ROW FORMAT serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
    "separatorChar" = ",",
    "quoteChar"     = "\""

)     
STORED AS TEXTFILE
LOCATION 'bucket path'
tblproperties('skip.header.line.count'='1');

获取此类数据作为输出

Select Date from schoolData

输出:

May 15, 2018                                       |
|  '21232514346020300                                |
|  '21232514346020300 '21232514346020300,OD212325143460203000,62029200,

预期结果:

May 15, 2018

也提到了这个链接,但它没有帮助

同类型的问题

标签: hadoophive

解决方案


推荐阅读