首页 > 解决方案 > Python:在读取时区分 CSV 分隔符

问题描述

我需要在事先不知道任何细节的情况下阅读不同的 CSV 文件。其中一些由实际的逗号分隔,但一些实际上由分号分隔。我知道我可以将分隔符/分隔符指定为参数,如下例所示:

import pandas as pd

data = pd.read_csv(file_path, encoding='utf-8', sep=',')
# or
data = pd.read_csv(file_path, encoding='utf-8', sep=';')
import csv

with open(file_path, newline='\n', encoding='utf-8') as f:
    reader = csv.reader(f, delimiter=',')
    # or
    reader = csv.reader(f, delimiter=';')
    # ...

但是,我还没有找到一种直接的方法来找出我应该使用哪个分隔符。目前我决定解析标题并基本上计算逗号和分号的数量来决定我应该使用哪个,但这就像一种解决方法......还有另一种方法来识别CSV文件中的分隔符吗?

感谢您的帮助!!

标签: pythonpandascsv

解决方案


推荐阅读