首页 > 解决方案 > 是否可以在 pytorch 的 transform.compose 中添加自己的函数

问题描述

我正在使用预训练的 Alex 模型。我在一些随机图像数据集上运行这个模型。我想在训练之前将 RGB 图像转换为 YCbCr 图像。

我想知道是否可以自己添加一个函数transform.compose,例如:

transform = transforms.Compose([
  ycbcr(), #something like this
  transforms.Resize((224, 224)),
  transforms.ToTensor(),
  transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

在哪里,

def ycbcr(img):
   img = cv2.imread(img)  
   img = cv2.cvtColor(img, cv2.COLOR_BGR2ycbcr)
   t = torch.from_numpy(img)
 return t

training_dataset = datasets.ImageFolder(link_train ,transform = transform_train)

training_loader = torch.utils.data.DataLoader(training_dataset, batch_size=96, shuffle=True)

这个过程正确吗?请帮助我如何进行?

标签: python-3.xmachine-learningdeep-learningneural-networkpytorch

解决方案


您可以通过torchvision.transform定义一个类来传递自定义转换。

为了更好地理解,我建议您阅读文档

在您的情况下,它将类似于以下内容:

class ycbcr(object):
    def __call__(self, img):
        """
        :param img: (PIL): Image 

        :return: ycbr color space image (PIL)
        """
        img = cv2.imread(img)  
        img = cv2.cvtColor(img, cv2.COLOR_BGR2ycbcr)
        # t = torch.from_numpy(img)

        return Image.fromarray(t)

    def __repr__(self):
        return self.__class__.__name__+'()'

请注意,它获取一个 PIL 图像并返回一个 PIL 图像。因此,您可能需要正确调整代码。但这是定义自定义转换的一般方法。


推荐阅读