python - 混淆矩阵准确性评估非等长用户和生产者数据集
问题描述
我的问题是我的分类有超过 3000000 个分类像素,而我的训练数据集只有大约 30-40 个(可以说明的每个类有 10-15 个)。
我的数据集都具有以下相同的布局:
训练行示例 = [[230,40,120,2]] 前三个值是像素色带(BGR),最后一个是规定的输出类(我们可以 1-3)。
我正在将训练数据作为 csv 文件读取并转换为 pandas 数据框。
问题:即使我在两个数据集中有不同数量的预测和实际数据值,是否可以使用此方法?如果是这样,不确定第 9 行到第 13 行的用途。
代码:
b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")
解决方案
推荐阅读
- c# - CS0120 非静态字段需要对象引用
- javascript - 在特定时间后重定向到另一个页面并显示倒计时
- python - 通过查询内联替换 AST 节点
- c# - 消费者传奇何时/如何完成?
- ionic-framework - 为什么 jhipster-ionic 会失败?
- c# - 如何在 C# 中的图像上添加带有文本的边框?
- android - E/dalvikvm: JNI ERROR (app bug): local reference table overflow (max=512)
- python - 如何在python中获取数组中一批元素的索引?
- java - SQL 错误:1064,SQLState:42000 在@Query - JPA,MySQL,Hibernate
- javascript - 当我的音效启动时背景音乐变得失真