machine-learning - 如何计算卷积神经网络中的参数总数?
问题描述
如何计算 CNN 网络中的参数总数
这是代码:
input_shape = (32, 32, 1)
flat_input_size = input_shape[0]*input_shape[1]*input_shape[2]
num_classes = 4
cnn_model = Sequential()
cnn_model.add(Conv2D(32, (3, 3), padding='same',
input_shape=input_shape))
cnn_model.add(Activation('relu'))
cnn_model.add(MaxPooling2D(pool_size=(2, 2)))
cnn_model.add(Conv2D(64, (3, 3)))
cnn_model.add(Activation('relu'))
cnn_model.add(MaxPooling2D(pool_size=(2, 2)))
cnn_model.add(Dropout(0.25))
cnn_model.add(Conv2D(128, (3, 3), padding='same'))
cnn_model.add(Activation('relu'))
cnn_model.add(MaxPooling2D(pool_size=(2, 2)))
cnn_model.add(Dropout(0.25))
cnn_model.add(Flatten())
cnn_model.add(Dense(512))
cnn_model.add(Activation('relu'))
cnn_model.add(Dropout(0.5))
cnn_model.add(Dense(num_classes))
cnn_model.add(Activation('softmax'))
如何获得320、18496、73856、590336、2052,谁能解释一下?
解决方案
您可以使用这个通用公式:
channels_in * kernel_width * kernel_height * channels_out + num_channels
所以第一个例子:
1 * 3 * 3 * 32 + 32 = 320
第二个:
32 * 3 * 3 * 64 + 64 = 18,496
通道数的加法是偏置项。
推荐阅读
- spring-cloud - 在多个 feign 客户端上共享断路器
- html - 容器不适合屏幕和 flex-direction:行无法正常工作
- java - AWS Lambda:通过 Java SDK 列出执行/描述执行
- docker - 尝试在 aj Jenkins 管道中使用 docker.build(),同时定义一个特定的 docker 文件以供使用
- python - 我可以在嵌套函数中定义函数吗?
- bash - 在 shell 提示符下键入文本
- tensorflow - _Rendezvous:<_Rendezvous 的 RPC 终止于:details="Name resolution failure"
- sql-server - 为每个出纳员和每天的总计生成子报告
- c# - 如何在不出现阴影的情况下设置材料设计按钮的背景?
- bash - 通过 ssh 执行命令