scala - 从 Databricks 环境加载 SnowFlake 数据时出现意外行为
问题描述
我只是想从如下雪花表中加载数据(在 Databricks env 中使用Spark/Scala ):
def loadDataFromSnowFlake(SfOptions: Map[String, String], query: String): DataFrame =
spark.read
.format("net.snowflake.spark.snowflake")
.options(SfOptions)
.option("query", query)
.load()
}
val SfOptions = ???
val query = "SELECT * FROM databaseName.public.tableName LIMIT 10"
val testDf = loadDataFromSnowFlake(SfOptions, query)
testDf.show()
testDf.show()
问题是脚本末尾的两个 show() 给我发回了两个不同的结果,我不明白当我的数据帧testDf被声明为不可变时怎么可能。
我希望对此作出澄清。非常感谢。干杯
解决方案
让我们尝试在 Snowflake 端排序数据:
SELECT *
FROM databaseName.public.tableName
ORDER BY <column_name>
LIMIT 10
这可能是个问题。作为替代方案,您可以使用该display(testDf)
功能。Python 支持它,但我不确定 Scala。
推荐阅读
- javascript - 用javascript重定向到一个id,效果平滑
- django - django 中的子进程和 os.Popen 无法在 Linux Fedora30 上使用 mod_wsgi 的 apache 下运行
- javascript - Javascript使用优先级数组对对象数组进行排序
- java - Android:如何解决位图平滑问题?
- typescript - 如何将 react native 的特定于平台的扩展与 typescript 一起使用?
- r - R:从字符串中提取带有大写字母的子字符串
- elixir - 如何在 Ecto 的联接查询中更新两个表中具有相同名称的列
- javascript - 单击按钮以使用 jQuery 将数据发送到服务器时网页消失
- ssis - 行分隔符 SSIS
- java - Android 大小分析器插件错误 - IDE 致命错误(“AnalyzeMenu”未注册)