首页 > 解决方案 > 如何从数据框列中删除所有空格

问题描述

如何有效地从数据框列中删除非数值,这是一个删除所有非数字字符的代码片段

In [1]: dataset = pd.DataFrame([[653051], [653053], [90 <––9785], [<–{uWÕ¨]], columns=['column'])

dataset.column= dataset.column.replace('[^0-9 ]', '', regex=True)

输出

Out[1]:
    0           653051
    1           653053
    2           90 9785
    3           NaN      <-- Expected Output (for non-numeric values only) 

但是剩余的数值中有空格,当我使用

dataset.column.replace(" ",  "")

或者

dataset.column.strip()

它留下了已经填充值的 NaN 字段,例如

后:

0           NaN    <-- Not expected 
1           NaN    <-- Not expected 
2           909785 <-- Expected 
3           NaN    <-- Expected 

标签: pythonpandasdataset

解决方案


推荐阅读