python - 如何从熊猫系列中删除一个或多个字母 x?
问题描述
我一直在尝试从熊猫系列中删除仅包含字母 x 的单词,但它没有按预期工作。如何x xx xxx xxxx
从熊猫系列中删除只能有任意数量 x 的单词?
我的尝试
import numpy as np
import pandas as pd
pd.set_option('max_colwidth',500)
data = np.array(['transworld system inc trying colect xx xxxx debt mine owed inacurate',
'complaint cals ocur betwen xx xx xx xx cel job ',
'company violated',
'previously xxxx xxxx xxxx requested experian actualy mine xxxx xxxx instead',
'company xx trans union xx noticed '])
s = pd.Series(data)
s.str.replace(r'(\sx+\s)',r' ',regex=True)
输出
我期待空格字母 * N 空格替换为一个空格,但它不起作用。如何解决问题?
解决方案
您可以\b
用于单词边界,因此'xxx abcd'
可以被替换。由于x
and
可以交错并且您可以将它们全部删除,因此您可以使用:
s.str.replace(r'\b[x\s]+\b',' ')
输出:
0 transworld system inc trying colect debt mine ...
1 complaint cals ocur betwen cel job
2 company violated
3 previously requested experian actualy mine ins...
4 company trans union noticed
dtype: object
推荐阅读
- python - Getting last character of string not working
- mysql - MySQL vs MongoDB index performance
- javascript - How to add a each element of an array into React state
- postgresql - 如何使用 golang 和 prepare 更新 postgres 中的多行?
- javascript - 如何使用“d3-force-cluster-3d”npm
- python - 我正在用python制作一个屏幕截图窗口,但截图很奇怪
- r - 在R中反转矩阵的三种方法都给出不同的结果
- server - 如何检查洪流跟踪服务器的状态?
- c++ - 如何从c字符串中删除特定字符而不转换为字符串?
- javascript - JavaScript 中标准函数的范围是什么?