首页 > 解决方案 > 关于 YOLO 向量值

问题描述

解析预测

predict_boxes = predict[0, :, :, num_classes + boxes_per_cell:]
predict_boxes = tf.reshape(predict_boxes, [cell_size, cell_size, boxes_per_cell, 4])

confidence_boxes = predict[0, :, :, num_classes:num_classes + boxes_per_cell]
confidence_boxes = tf.reshape(confidence_boxes, [cell_size, cell_size, boxes_per_cell, 1])

class_prediction = predict[0, :, :, 0:num_classes]
class_prediction = tf.argmax(class_prediction, axis=2)

上面的代码是 yolov1 代码的一部分。在查看此处的代码时,有些东西我不明白。

我不知道为什么通过一个称为暗网的卷积网络获得的图像会派生 x,y,w,h 坐标,从而允许您像下面的代码一样绘制一个框。

而接下来我很好奇的是……我用yolo的暗网把448x448的图像做成了7x7xA。我想知道一个 7x7 的网格如何从 448x448 图像中得到一个网格除以 7x7 的值。

标签: object-detectionyolodarknet

解决方案


推荐阅读