首页 > 解决方案 > 如何修剪列值而不将它们变成字符串?

问题描述

我正在寻找一种方法来修剪数据集的单元格,以便清理它,但是诸如 trim() 之类的方法最终会将整数转换为字符串。有没有办法在不更改数据类型的情况下确保我的数据中没有空格?

def clean_data(df):
    for c in df.columns: 
        df = df.withColumn(c, trim(col(c))) 
    return df

标签: pythonpandasdata-cleaning

解决方案


我认为您的数据实际上是字符串格式,这就是您拥有whitespaces. 因此,如果您将该数据转换为 a int,则应该没问题。

df = int(df.withColumn(c, trim(col(c))))

推荐阅读