首页 > 解决方案 > 如何读取没有标题的 CSV

问题描述

我有一个包含以下数据的 CSV(无标题)

12,2010,76
2,2000,45
12,1940,30

我正在使用以下CSVReader阅读

using UnityEngine;
using System;
using System.Collections;
using System.Collections.Generic;
using System.Text.RegularExpressions;

public class CSVReader
{
    static string SPLIT_RE = @",(?=(?:[^""]*""[^""]*"")*(?![^""]*""))";
    static string LINE_SPLIT_RE = @"\r\n|\n\r|\n|\r";
    static char[] TRIM_CHARS = { '\"' };

    public static List<Dictionary<string, object>> Read(string file)
    {
        var list = new List<Dictionary<string, object>>();
        TextAsset data = Resources.Load (file) as TextAsset;

        var lines = Regex.Split (data.text, LINE_SPLIT_RE);

        if(lines.Length <= 1) return list;

        var header = Regex.Split(lines[0], SPLIT_RE);
        for(var i=1; i < lines.Length; i++) {

            var values = Regex.Split(lines[i], SPLIT_RE);
            if(values.Length == 0 ||values[0] == "") continue;

            var entry = new Dictionary<string, object>();
            for(var j=0; j < header.Length && j < values.Length; j++ ) {
                string value = values[j];
                value = value.TrimStart(TRIM_CHARS).TrimEnd(TRIM_CHARS).Replace("\\", "");
                object finalvalue = value;
                int n;
                float f;
                if(int.TryParse(value, out n)) {
                    finalvalue = n;
                } else if (float.TryParse(value, out f)) {
                    finalvalue = f;
                }
                entry[header[j]] = finalvalue;
            }
            list.Add (entry);
        }
        return list;
    }
}

问题在于这个 CSVReader 使用List<Dictionary<string, object>>,因此如果没有标题信息,字典键将变为 null 或(不太可能)为空字符串。在将条目添加到字典时,这两种情况都会导致异常抛出。

我可以将标题添加到 CSV 文件中,但这不是理想的解决方案。

标签: c#csv

解决方案


首先,几乎可以肯定有很多现成的库可以用于此任务,它们可能在 NuGet 上可用。其中之一可能是更好的解决方案。

尽管如此,使用您已经拥有的东西,您可以制作该方法的替代版本,它返回一个简单的对象列表,并从中删除填充标题的代码。像这样的东西(未经测试,但我认为它应该工作):

public static List<List<object>> ReadWithoutHeader(string file)
{
    var list = new List<List<object>>();
    TextAsset data = Resources.Load (file) as TextAsset;
    var lines = Regex.Split (data.text, LINE_SPLIT_RE);

    if(lines.Length <= 1) return list;

    for(var i=0; i < lines.Length; i++) {

        var values = Regex.Split(lines[i], SPLIT_RE);
        if(values.Length == 0 ||values[0] == "") continue;
        var entry = new List<object>();

        for(var j=0; j < values.Length; j++ ) {
            string value = values[j];
            value = value.TrimStart(TRIM_CHARS).TrimEnd(TRIM_CHARS).Replace("\\", "");
            object finalvalue = value;
            int n;
            float f;
            if(int.TryParse(value, out n)) {
                finalvalue = n;
            } else if (float.TryParse(value, out f)) {
                finalvalue = f;
            }
            entry.Add(finalvalue);
        }
        list.Add(entry);
    }
    return list;
}

推荐阅读