machine-learning - 如何根据神经网络中的图像分辨率计算特征数量(非线性假设)?
问题描述
遇到 Andrew Ng 的神经网络非线性假设,我有一个 MCQ 来查找分辨率为 100x100 灰度强度的图像的特征数量。
答案是 5000 万,5 x 10^7。
然而,早先对于 50 x 50 像素的灰度图像,特征数是 50x50 (2500),而对于 RGB 图像,它是 7500。
为什么是 5 x 10^7 而不是 10,000?
然而,他确实说包括所有二次项 (xi,xj) 作为特征。
问题是:
假设您正在学习从 100×100 像素图像(灰度,而不是 RGB)中识别汽车。让特征是像素强度值。如果你训练逻辑回归,包括所有的二次项 (xi,xj) 作为特征,你会有多少特征?
之前他补充说,如果我们使用 xi, xj ,我们最终会得到总共 300 万个特征。我还是不知道这是什么关系?
解决方案
您对图像特征数量(=像素)的相似名称以及逻辑回归算法需要学习的特征数量来解决分类问题感到困惑。
对于 100x100 像素的图像,图像中有 10,000 个像素。但是,如果您有一个复杂的分类问题,仅仅学习这些像素的线性模型(例如 )是不够的theta0 + theta1*x1 + theta2*x2 + theta3*x1x2
,您还需要包含更高阶的项,例如 x²,这会在您的方程中产生更多的项(= 特征) (例如theta0 + theta1*x1 + theta2*x2 + theta3*x1x2 + theta4*x1²x2 + theta5*x1x2² + theta6*x1²x2²
)。
这就是他的意思
如果您训练逻辑回归,包括所有二次项 (xi,xj) 作为特征
如您所见,我们在上面的等式中有 x1 和 x2 的二次项的所有组合。
您需要多少项(= 特征)取决于您要解决的分类问题的复杂性。
这就是为什么您会以更少的像素获得如此多的特征的原因。(他还在视频中的 2 分钟左右展示了一个例子)
推荐阅读
- html5-audio - 如何将音频播放器嵌入到 wix 网站?
- electron - 我可以在只有一个没有桌面的简单 archlinux 的计算机上使用电子应用程序打开文件吗?
- iis - 如何使用 InstallShield 创建以下 IIS 结构
- r - 如何用数字替换特定字符串?
- python - 具有不同 ForeignKey 的 django 查询
- .htaccess - 是否可以创建一个像符号链接一样工作的 .htaccess 重写/重定向规则?
- ios - “NSObjCMessageLoggingEnabled”还活着吗?
- javascript - 如何在悬停该行时仅突出显示表格中一行的几个单元格?
- javascript - 如何在循环内显示数组元素
- java - 通过 spring-data-jdbc Resultset.TYPE_FORWARD_ONLY READ_ONLY 流式传输非常大的表