首页 > 解决方案 > 遍历 Panda 的 df col 以删除 str

问题描述

我正在尝试解决这个问题。基本上我的专栏'review'有一堆垃圾 HT​​ML 东西,它们是由汤返回的。我不确定如何删除它,并尝试以各种方式进行迭代。您将如何遍历 df 并替换这些值?我希望它们空白,但我正在使用 HELLO 进行测试。

for index, row in enumerate(df['review']):
    row = df.replace('<div class="text show-more__control">', 'HELLO', inplace=False)
    df['review'] = row

标签: pythonseleniumbeautifulsoupscripting

解决方案


您的方法是矫枉过正,因为迭代一个数据框iterrows很慢,因为它遍历所有行(每个行的所有列),并且您真的只想将替换应用于一列。

我的建议是使用仅适用于要替换的列的 lambda 函数:

df['column'] = df['column'].apply(lambda x: x.replace('replacethis', 'withthis'))

推荐阅读