scala - 从另一个数据框列值过滤数据框
问题描述
我们有两个数据框,我们需要用另一个数据框列中的数据过滤一个数据框中的数据
df1
-------------------------------
name paid_amount date_paid
-------------------------------
aaa 10 2017-10-10
aba 10 2017-01-10
aac 10 2017-10-10
daa 10 2017-16-10
df2
-----------------------------
start_date end_date
-----------------------------
2017-01-01 2018-01-01
------------------------------
we need to create third dataframe by checking
(date_paid) field in df1 falls in between df2(start_date) & df2(end_date)
df1.where($date_paid).isin(df2.start_date && df2.end_date)
解决方案
应该:
df1.crossJoin(df2).where($"date_paid".between($"start_date", $"end_date"))
推荐阅读
- python - reticulate 在 Linux 上找不到 conda env
- swift - Swift:Jazzy 无法运行 xcodebuild
- docker - Matlab 代码生成问题和 WIN10 和 WIN2016 服务器 Docker 容器上的进程之间的差异
- javascript - 如何过滤与 URL 参数相同的 id?
- python - 如何从 AWS-chalice 应用程序生成可执行文件?
- database - 如何打开已经在颤振中创建的数据库并显示其数据?
- javascript - 从 JSON ReactJS 中的 JSON 数组中获取值
- python - 训练测试拆分未正确拆分
- solr - Solr 获取最新更新/添加的文档
- flutter - 如何在 Flutter 中保存测验应用程序的进度?