首页 > 解决方案 > 输入布尔表达式的最佳方法

问题描述

我正在尝试解决这个问题。我在 SQL 中有一个查询,我正在迁移到 spark 中。

我的数据中有 4 个特征。基于这些特征值的不同组合,我可以确定一个新的第五个特征。

例如:假设 A、B、C、D 是特征。

条件可以是:

WHEN (A like "%App%" or A like "%Appl%" or B like "%Bana%" or B like "%Banana%") then "Fruit"

WHEN (A like "%Bal%" or A like "%Ball%" or B like "%Ba%" and B like "%Bat%") then "Cricket"

在上面,有一些复杂的表达式/组合可以导致输出的特定值。

我试图找到一种方法从用户那里读取这些组合并使用它们来评估新的特征值,并为用户提供在未来添加或更新这些值的任何组合而无需更改代码级别的规定。

Ps:我不确定添加的标题是否捕获了我的用例。随意编辑/建议一个更好的标题,它可以准确地捕捉到问题。

标签: sqlapache-sparkboolean-expression

解决方案


推荐阅读