首页 > 解决方案 > 用于分类的字符串操作

问题描述

我有一个链接列表,例如:

Website
www.uk_nation.co.uk
www.nation_ny.com
www.unitednation.com
www.nation.of.freedom.es
www.freedom.org

等等。

以上是我的数据帧列的样子。如您所见,它们的共同点是“ nation”。我想标记/分组它们并在我的数据框中添加一列以响应布尔值(真/假;例如列:Nation?选项:) True/False

Website                       Nation?
www.uk_nation.co.uk           True
www.nation_ny.com             True
www.unitednation.com          True
www.nation.of.freedom.es      True
www.freedom.org               False

我需要这样做以便以更简单(并且可能更快)的方式对网站进行分类。你对如何做有什么建议吗?

欢迎任何帮助。

标签: pythonpandasclassificationtext-mining

解决方案


尝试str.contains

df['Nation']=df.Website.str.upper().str.contains('NATION')
0     True
1     True
2     True
3     True
4    False
Name: Website, dtype: bool

推荐阅读