首页 > 解决方案 > 如何根据神经网络中的图像分辨率计算特征数量(非线性假设)?

问题描述

遇到 Andrew Ng 的神经网络非线性假设,我有一个 MCQ 来查找分辨率为 100x100 灰度强度的图像的特征数量。

答案是 5000 万,5 x 10^7。

然而,早先对于 50 x 50 像素的灰度图像,特征数是 50x50 (2500),而对于 RGB 图像,它是 7500。

为什么是 5 x 10^7 而不是 10,000?

然而,他确实说包括所有二次项 (xi,xj) 作为特征。

问题是:

假设您正在学习从 100×100 像素图像(灰度,而不是 RGB)中识别汽车。让特征是像素强度值。如果你训练逻辑回归,包括所有的二次项 (xi,xj) 作为特征,你会有多少特征?

之前他补充说,如果我们使用 xi, xj ,我们最终会得到总共 300 万个特征。我还是不知道这是什么关系?

标签: machine-learningimage-processingneural-networkcomputer-visionfeature-scaling

解决方案


您对图像特征数量(=像素)的相似名称以及逻辑回归算法需要学习的特征数量来解决分类问题感到困惑。

对于 100x100 像素的图像,图像中有 10,000 个像素。但是,如果您有一个复杂的分类问题,仅仅学习这些像素的线性模型(例如 )是不够的theta0 + theta1*x1 + theta2*x2 + theta3*x1x2,您还需要包含更高阶的项,例如 x²,这会在您的方程中产生更多的项(= 特征) (例如theta0 + theta1*x1 + theta2*x2 + theta3*x1x2 + theta4*x1²x2 + theta5*x1x2² + theta6*x1²x2²)。

这就是他的意思

如果您训练逻辑回归,包括所有二次项 (xi,xj) 作为特征

如您所见,我们在上面的等式中有 x1 和 x2 的二次项的所有组合。

您需要多少项(= 特征)取决于您要解决的分类问题的复杂性。

这就是为什么您会以更少的像素获得如此多的特征的原因。(他还在视频中的 2 分钟左右展示了一个例子)


推荐阅读