首页 > 解决方案 > 如何从熊猫系列中删除尾随点?

问题描述

如何从熊猫系列中删除尾随点?

我的尝试

import numpy as np
import pandas as pd

pd.set_option('max_colwidth',1000)

s = pd.Series(["""Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagram.com/p/YGEt5JC6JM/"""])


s.str.replace(r'(\w)\.+',r'\1',regex=True)

我的结果

Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperias… http://instagramcom/p/YGEt5JC6JM/


wanted:
Finally a transparant silicon case ^^ Thanks to my uncle :) #yay #Sony #Xperia #S #sonyexperia http://instagramcom/p/YGEt5JC6JM/

标签: pythonpandas

解决方案


那些不是句点,它们是省略号字符,即 Unicode 字符\u2026。请参阅我应该如何写三个点?

s.str.replace(r'(\w)\u2026+',r'\1',regex=True)

推荐阅读