首页 > 解决方案 > 在列表中使用通配符排除相似词

问题描述

我们想在字数查询中排除常用词和停用词,并且某些术语有细微的变化,例如“帐户”、“帐户”、“帐户”等。有没有办法使用通配符之类的东西(例如作为 LIKE 函数的 _)在排除列表中排除所有变体?有成千上万个单词,“帐户”只是一个例子。

询问:

SELECT subject
from subject_table
WHERE subject NOT IN ('', 'and', 'for', 'of', 'account')

标签: amazon-redshift

解决方案


尝试使用[REGEXP_INSTR][1].

SELECT subject
from subject_table
WHERE REGEXP_INSTR(subject, '(and|for|of|account.*)') = 0

推荐阅读