首页 > 解决方案 > Python 搜索字符串包含字符

问题描述

我有以下数据:

col1      
086945159
549615853
589ac2546
GED456231
F56hy8W12

我想查找是否col具有非数字值并返回。

col1         col2 
086945159    086945159
549615853    549615853
589ac2546    Nan
GED456231    Nan
F56hy8W12    Nan
111111111    Nan
222222222    Nan

re.search(r'[^0-9]+', str)以前找的。但是,我如何使用它,apply()因为如果 value incol具有相同的数字,比如11111111and 222222222,这应该返回Nan

标签: pythonregexpandasdata-manipulationre

解决方案


您可以使用mask条件模式:

# first part to match any non-digit
# second part to match identical characters
df['col2'] = df.col1.mask(df.col1.str.contains(r'\D|^(.)\1*$'))

输出:

        col1       col2
0  086945159  086945159
1  549615853  549615853
2  589ac2546        NaN
3  GED456231        NaN
4  F56hy8W12        NaN
5  111111111        NaN
6  222222222        NaN

推荐阅读