python - 检查所有子字符串是否存在于python中的字符串中
问题描述
如果所有 X、Y、Z 和 A 都在句子中,我想得到 True。如果它们中的任何一个都存在,则下面的代码有效,但如果所有都存在,我想要“TRUE”,否则为 False。
df['D'] = (df['CT'].str.contains("X|Y|Z|A", case = False))
对于上下文:
我正在做文本分析,其中有一列,每一行都包含一些文本。我想要一些可以使用“AND”和“OR”运算符的东西。
例如:如果句子是“我的网速有问题”。在这种情况下,我想看看这三个词是否存在问题,互联网和速度。基于这三个词,我将其放在“互联网速度问题”桶下。
解决方案
如果Y
总是跟随X
在每个字符串中,那么您将您的正则表达式更改为"X.*Y"
. 添加Z
和A
留给读者作为练习。