首页 > 解决方案 > 混淆矩阵准确性评估非等长用户和生产者数据集

问题描述

我正在尝试执行以下分类评估:在此处输入图像描述

我的问题是我的分类有超过 3000000 个分类像素,而我的训练数据集只有大约 30-40 个(可以说明的每个类有 10-15 个)。

我的数据集都具有以下相同的布局:

训练行示例 = [[230,40,120,2]] 前三个值是像素色带(BGR),最后一个是规定的输出类(我们可以 1-3)。

我正在将训练数据作为 csv 文件读取并转换为 pandas 数据框。

问题:即使我在两个数据集中有不同数量的预测和实际数据值,是否可以使用此方法?如果是这样,不确定第 9 行到第 13 行的用途。

代码:

b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")

标签: pythonpandasclassificationconfusion-matrix

解决方案


推荐阅读