首页 > 解决方案 > 如何在熊猫中导入这个文件?

问题描述

我正在尝试使用“.txt”文件导入数据,read_csv但我没有设法正确导入。所有列都作为一个导入。我想有四个单独的列。这是文件中的一个示例:

    TIME                 A        B       C
----                ------- ------- -------
1599004800003299944 51      -731    17271
1599004800008323314 47      -606    17245
1599004800013323079 71      -755    17300
1599004800018324785 23      -621    17273
1599004800023317477 42      -705    17268
1599004800028280442 48      -715    17239
 

标签: pythonpandascsvpython-import

解决方案


您必须首先用自然语言描述您的文件:

  1. 字段由可变数量的空格分隔
  2. 第一行包含标题
  3. 第二行应该被忽略

现在您只需阅读相关文档并将其转换为适当的参数:

  1. sep=r'\s+'delim_whitespace=True(后者是不太常用的AFAIK)
  2. header=0
  3. skiprows=[1]

它给:

df = pd.read_csv(file_name, sep=r'\s+', header=0, skiprows=[1])

推荐阅读