deep-learning - 神经网络中图像的默认输入尺寸?
问题描述
阅读 PyTorch 书籍时,我遇到了作者更改轴顺序的这段代码。
img_t.permute(1, 2, 0) (将轴的顺序从 C × H × W 更改为 H × W × C)
H x W x C 是神经网络中输入图像的默认输入尺寸吗?
解决方案
在 PyTorch 中,输入是形状为 N x C x H x W 的浴缸。所以 N 是批量大小,C 是图像通道的数量,如您所知,H 和 W 是高度和宽度。但是当您使用例如 cv2 时,图像的默认形状是 HxWxC,因此您需要交换 pytorch 的尺寸。
推荐阅读
- python - 如何在tensorflow中使用csv文件中的换行符解析字符串?
- python-3.x - 如何用大陆替换数据框列国家名称?
- bash - 在 Shell 脚本变量中搜索相同的字符串
- javascript - 如何打开“联系方式”并选择号码
- c# - 如何从 Facebook 登录获取令牌 [UWP]
- html - 带 3 列的 Bootstrap 推拉
- javascript - 在 node.js 中提取查询
- python - 在 Python 中,如何做 groupby + transform + 一个设计函数来移动一列中的值?
- laravel - 在 Laravel 5.6 中创建或更新给出“可填充”异常消息
- c# - 从表单流中获取数据并将其输入到 api 调用中