hadoop - 将数据从 .csv 文件加载到配置单元表
问题描述
我创建了一个配置单元表并希望将 csv 数据加载到其中。数据在单元格中有多个换行符,因此它返回不需要的结果。
如何处理配置单元表中的多个换行符?
我试过这种代码:
但预期的结果只是日期。
CREATE EXTERNAL TABLE db_raw.schoolData
(
Date string,
height string,
weight string,
ready_to_make string
)
ROW FORMAT serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
"separatorChar" = ",",
"quoteChar" = "\""
)
STORED AS TEXTFILE
LOCATION 'bucket path'
tblproperties('skip.header.line.count'='1');
获取此类数据作为输出
Select Date from schoolData
输出:
May 15, 2018 |
| '21232514346020300 |
| '21232514346020300 '21232514346020300,OD212325143460203000,62029200,
预期结果:
May 15, 2018
同类型的问题
解决方案
推荐阅读
- c# - 当 2 个方法在同一个类中时,使用正确的参数调用验证方法
- c# - System.Data.Odbc 未被引用
- clojure - Figwheel 环境变量
- javascript - 根据从 DropDownList 中选择的项目将最小值和最大值设置为 TextBox?
- javascript - 错误:在 aurelia 中找不到模块“gulp”
- c - 将结构数组设置为空白/空,而不是在 C 中显示 0
- hyperledger-fabric - 单一组织 Hyperledger 结构 n/w
- javascript - 我希望 javascript 在调用函数之前验证数字类型并仅选择整数
- elasticsearch - Elasticsearch 是否支持 AND 查询多个值?
- java - thymleaf 中的 TemplateResolver.setOrder 用户是什么?