machine-learning - 如何使用小数据集提高我的 convnet 性能

问题描述

我有一个非常小的图像数据集（大约 8 张图像）。我知道我的模型可能会导致对小数据集的过度拟合，我想要一些关于如何处理数据集与上述一样小的情况的想法。

标签： machine-learning

处理此类问题的最佳方法是使用图像增强。有几个库可以提供这个，比如 opencv2、keras、scikit-image。图像增强背后的基本思想是通过在数据中引入某些变化（例如旋转图像、在某些侧面模糊图像、放大/缩小图像、更改颜色、翻转图像等），从一张图像中人工创建更多图像更多的。您可以从一张图像创建 10x、20x、40x 等图像。

此方法将帮助您生成更多图像，但请记住 8 张图像是一个非常小的数据，这些新的增强图像将在某种程度上具有与原始图像相似的特征。

machine-learning - 如何使用小数据集提高我的 convnet 性能

问题描述

解决方案

推荐阅读