machine-learning - 是否可以将牛顿法与图像分类相结合?
问题描述
嗨,我是机器学习领域的新手,现在我的第一个挑战是提高基于狗和猫图像分类的图像分类的准确性。所以我在谷歌上搜索想办法做到这一点,我找到了牛顿的方法。然而,它说它很大,一般不太可能使用。就我而言,我只为 7 个班级使用了大约 1600 张图像。所以我想也许(我不知道)这是可能的。
你有什么想法 ?在我的情况下这可能吗?
我对机器学习及其算法一无所知,所以如果你给我一些建议会很有帮助。
解决方案
Well Newton 的方法由于各种原因一般不用于优化,梯度下降用于优化,并且已经证明它显示出非常好的输出。那么为什么不使用牛顿法,你可以在这里找到原因。
图像分类属于计算机视觉任务,它使用作为机器学习一部分的深度学习(神经网络)获得了最先进的结果。
好吧,您的任务是提高图像分类模型的准确性。因此,我假设您正在使用任何深度学习模型,为了提高其准确性,您必须先查看数据,然后再查看模型。我的意思是说首先提高数据的质量,如果你没有得到结果,那么你应该研究模型..
提高数据质量
- 检查您的数据是否平衡。我的意思是你有 7 个类和总共 1600 张图像,所以要确保 7 个类之间的图像分布不存在不平等。
- 例如,如果一个类有 60% 的数据,其余的 40% 被划分到其他类,那么你的数据是高度不平衡的。
- 在这种情况下,您可以对样本较少的类使用数据增强。数据增强技术包括裁剪、模糊、添加抖动、盐和纸张噪声、锐化等。
提高模型精度
- 尝试更改您的优化算法(Adam、SGD 等)
- 尝试更改优化算法的学习率。
- 应用批量标准化
- 添加辍学层。
最佳解决方案 - 使用使用任何预训练模型(如 ResNet、Inception、Xception 等)和 Adam 优化器的迁移学习。
推荐阅读
- laravel - 如何将所有 laravel 异常消息写入特定文件。如模型异常
- swiftui - 使用 Swift UI 将 CLLocationManager 的代表放在哪里?
- botframework - BotComposer,如何使用 lg 语言遍历字符串的字符?
- machine-learning - 计算kmeans模型的准确度得分
- react-native - 如何在 android studio 上运行 expo 弹出的应用程序
- python - 使用python在表格中显示csv数据
- c++ - 在 C++ 中声明 const 对象需要用户定义的默认构造函数。如果我有一个可变成员变量,为什么不呢?
- typescript - vue-class-component 和 Mixins
- excel - 如何在群组中查找最近的日期
- generics - 收集到 Vec 与 &Vec