pyspark - 等效于数据类型“真实”的 Spark
问题描述
我正在寻找我们可以在 SQL 中使用的“真实”类型的 Spark 中的等价物。我看到“双重”是最接近“真实”的类型。
我试图创建一个这样的表:
CREATE EXTERNAL TABLE customers (
name string,
salary real
)
partitioned by (country string, age integer)
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION 's3a://path-s3/customers/';
我收到了这个错误:
DataType real is not supported.
- 为什么我们不能在 Spark 中使用这种类型?
- “真实”和“双重”有什么区别?
谢谢
解决方案
推荐阅读
- npm - 如何在苗条的 JS 应用程序中添加引导模块?
- laravel - 表上存在具有相同值的两列的 Laravel 验证
- java - 什么系统时钟 System.currentTimeMillis(); 在 centOS 上的 Java 中使用
- css - CSS - 来回动画 css 设置
- html - 当它们都是 DIV 标记时,列表项不显示
- ios - ios上的Appsee热图
- kubernetes - 使用 TLS 为 GRPC 正确设置 Istio 网关
- google-translate - Yandex API 翻译 PDF 并返回翻译后的 PDF?
- go - 在协调功能中检测规格更新
- javascript - player.js:1 Uncaught SyntaxError: Identifier 'Player' has been declared laravel-6