首页 > 解决方案 > 删除包含数字字符的行

问题描述

我一直在研究一个包含与产品相关的一元组的数据集。在数据框中,我们有像 cadbury9gm 或 100gmdoritos 这样的 unigram,所以我想删除包含此类名称的整行,即包含数值以使数据框更干净,以便我可以进一步进行,因为我必须将产品分类为类别和子类别。有没有办法删除包含数字字符的行?谢谢

标签: pythondataframedatasetspyderdata-cleaning

解决方案


这就是我要做的:

import pandas as pd
import numpy as np

bogus_data = {
    'Name': ['Acme', 'Foo', 'Bar', 'Loren', 'Ipsum'],
    'Label': ['abc', '3ds', 'cba', 'b3ewq', 'asdf'],
    'Value': np.random.rand(5)
}

df = pd.DataFrame(bogus_data, columns=['Name', 'Label', 'Value'])
df = df[~df["Label"].str.contains(r'[0-9]')]

print(df)

打印此数据框的结果是

    Name Label     Value
0   Acme   abc  0.574412
2    Bar   cba  0.354460
4  Ipsum  asdf  0.047170

推荐阅读