sql - Spark SQL - “包含”功能的替代方案
问题描述
我有一个场景,我需要在另一个数据框的另一列中的较大字符串中找到数据框列中字符串的存在。我正在使用Spark 2.4.4和Scala 2.11.12。
解决方案
具有org.apache.spark.sql.Column
包含函数,可用于在包含字符串的 2 列之间执行字符串样式包含操作。
val df = //a dataframe buiktas a result of join and has 2 columns - c1, c2
df.filter(col("c1").contains(col("c2"))).show()
推荐阅读
- vue.js - Vue2 - 从组件内的主实例调用方法
- python-3.x - 在 QPlainTextEdit (PyQt5) 中为 python 实现自动缩进
- mysql - 如何从 mySQL 浮点列中选择十进制数
- python - 如何使用硒和python点击网页上的所有“角色=按钮”
- quantifiers - Dafny/Boogie 中的触发器是什么?
- mysql - 在具有各种其他条件的 MYSQL 中使用 DISTINCT 时查询缓慢(1000 万条记录)
- php - 当公用文件夹名称为下划线时,链接不起作用,例如 public_html
- service-worker - 拦截 fetch 事件并返回 indexedDB 数据
- octave - Plotting line graph with custom X values
- ruby - 检查答案是否为空