首页 > 解决方案 > 转换 pandas 中的数据类型并删除不必要的行

问题描述

我想在文件中删除不必要的行,但我的原始数据中的数据类型被声明为对象。我尝试使用 .astype 对其进行转换,但它似乎不起作用。

df = pd.read_csv(raw_data, header=None) 
print(df.dtypes) headers = ['random'] 
print("headers\n", headers) 
df.columns = headers print(df.dtypes)

在此处输入图像描述

我只需要看起来像这样的数据:

::rc=80000000:lq=135:ct=31D2

其他一切都是不必要的。

标签: pandaspandas-groupbydata-handling

解决方案


类型是 Pandas 存储字符串的方式(直到最近发布的 v1,但类型是否适合您的目的object仍然不是问题)。object当您说您希望数据看起来像该行时,这取决于您必须做到的具体程度。如果足以检查具有的行,::rc=那么您可以执行以下操作:

df[df.random.str.contains('::rc=')]

否则,您可以使用更精细的正则表达式模式来准确获取您想要的行。


推荐阅读