首页 > 解决方案 > 如何在熊猫中按日期边界从文本文件中选择行?

问题描述

我有这个输入文件:temp2.​​txt:

82.0    1   77  918     12/04/13        
47.0    1   77  9399    19/06/13        
39.0    1   77  4522    07/07/14        
52.0    1   77  504     13/05/14    

我只想将日期介于 a 和 b 之间的行从复制temp2.txtoutput_file.txt

我写了这段代码:

import pandas as pd

    a = "01/01/2013"
    b = "31/12/2013"

    df = pd.read_csv('temp2.txt', header=None, sep='\s+')
    df['tmp'] = pd.to_datetime(df[4], errors='coerce')

    df['tmp'] = df['tmp'].between(a, b, inclusive=True)

    df.drop('tmp', axis=1, inplace=True)
    df.to_csv('output_file.txt', header=False, index=False, sep='\t')

但这似乎对我不起作用,我得到了所有的行,而不仅仅是我想要的 2 行。我在这里做错了什么?

标签: pythonpandasfiledatetimebetween

解决方案


请换成df.drop('tmp', axis=1, inplace=True)这个。

df = df.loc[df['tmp']]

所以整个代码是:

import pandas as pd

a = "01/01/2013"
b = "31/12/2013"

df = pd.read_csv('temp2.txt', header=None, sep='\s+')
df['tmp'] = pd.to_datetime(df[4], errors='coerce')

df['tmp'] = df['tmp'].between(a, b, inclusive=True)

df = df.loc[df['tmp']]
df.to_csv('output_file.txt', header=False, index=False, sep='\t')

推荐阅读