apache-spark - Spark 2.4.3 - 当数据库表模式有数字类型时怎么办?
问题描述
我需要使用 spark 从数据库表 (Teradata) 加载数据,但表的模式的类型为 NUMBER,没有精度和比例。正如我们在这里看到的那样https://github.com/apache/spark/pull/8780。
因此,当我加载包含“NUMBER”列且这些列中具有浮点值的表时,在 spark 数据框中,这些值的精度显示为 NUMBER(38,0),并且这些值的精度会丢失。
例子:
兆数据:
values
50.00
94.30
23.30
20.01
数据框火花:
values
50
94
23
20
有人可以帮我吗?
解决方案
推荐阅读
- powershell - 启用用户脚本
- python - 在同一个数据框上使用 pandas.style 和 HTML CSS
- sql-server - 通过多次调用同一张表来优化查询
- reactjs - 从外部 React 应用程序导入的组件中的 React Router useHistory
- mongodb - Mongobee 在退出前几分钟卡住了
- cloud - 将数据从 Azure Blob 传输到 Salesforce Marketing Cloud
- django - 在 Kubernetes 集群上使用超过 1 个副本时,Django 发布请求在同一路由上循环
- node.js - NodeJS 使用 https.request 使用传输编码分块
- javascript - VUEJS import js file ERROR Failed to compile with 6 errors 找不到这些相关模块:* ../layout-mode
- laravel - Livewire + AlpineJS:使用 x-data 作为连线:单击参数