python-3.x - 无法保存自定义子类模型
问题描述
受tf.keras.Model 子类化的启发,我创建了自定义模型。
我可以训练它并获得成功的结果,但我无法保存它。
我将 python3.6 与 tensorflow v1.10(或 v1.9)一起使用
此处的最小完整代码示例:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
class Classifier(tf.keras.Model):
def __init__(self):
super().__init__(name="custom_model")
self.batch_norm1 = tf.layers.BatchNormalization()
self.conv1 = tf.layers.Conv2D(32, (7, 7))
self.pool1 = tf.layers.MaxPooling2D((2, 2), (2, 2))
self.batch_norm2 = tf.layers.BatchNormalization()
self.conv2 = tf.layers.Conv2D(64, (5, 5))
self.pool2 = tf.layers.MaxPooling2D((2, 2), (2, 2))
def call(self, inputs, training=None, mask=None):
x = self.batch_norm1(inputs)
x = self.conv1(x)
x = tf.nn.relu(x)
x = self.pool1(x)
x = self.batch_norm2(x)
x = self.conv2(x)
x = tf.nn.relu(x)
x = self.pool2(x)
return x
if __name__ == '__main__':
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(*x_train.shape, 1)[:1000]
y_train = y_train.reshape(*y_train.shape, 1)[:1000]
x_test = x_test.reshape(*x_test.shape, 1)
y_test = y_test.reshape(*y_test.shape, 1)
y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)
model = Classifier()
inputs = tf.keras.Input((28, 28, 1))
x = model(inputs)
x = tf.keras.layers.Flatten()(x)
x = tf.keras.layers.Dense(10, activation="sigmoid")(x)
model = tf.keras.Model(inputs=inputs, outputs=x)
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["accuracy"])
model.fit(x_train, y_train, epochs=1, shuffle=True)
model.save("./my_model")
错误信息:
1000/1000 [==============================] - 1s 1ms/step - loss: 4.6037 - acc: 0.7025
Traceback (most recent call last):
File "/home/user/Data/test/python/mnist/mnist_run.py", line 62, in <module>
model.save("./my_model")
File "/home/user/miniconda3/envs/ml3.6/lib/python3.6/site-packages/tensorflow/python/keras/engine/network.py", line 1278, in save
save_model(self, filepath, overwrite, include_optimizer)
File "/home/user/miniconda3/envs/ml3.6/lib/python3.6/site-packages/tensorflow/python/keras/engine/saving.py", line 101, in save_model
'config': model.get_config()
File "/home/user/miniconda3/envs/ml3.6/lib/python3.6/site-packages/tensorflow/python/keras/engine/network.py", line 1049, in get_config
layer_config = layer.get_config()
File "/home/user/miniconda3/envs/ml3.6/lib/python3.6/site-packages/tensorflow/python/keras/engine/network.py", line 1028, in get_config
raise NotImplementedError
NotImplementedError
Process finished with exit code 1
我查看了错误行,发现get_config方法检查self._is_graph_network
有人处理这个问题吗?
谢谢!
更新 1:
在 keras 2.2.2(不是 tf.keras)上
找到注释(用于模型保存)
文件:keras/engine/network.py
功能:get_config
# 子类网络不可序列化
#(除非序列化是由
#子类网络的作者实现的)。
所以,显然它不会工作......
我想知道,他们为什么不在文档中指出它(比如:“使用没有保存能力的子类化!”)
更新 2:
在keras 文档中找到:
在子类模型中,模型的拓扑被定义为 Python 代码
(而不是层的静态图)。这意味着
无法检查或序列化模型的拓扑。因此,以下
方法和属性不适用于子类模型:模型输入和模型输出。
model.to_yaml() 和 model.to_json()
model.get_config() 和 model.save()。
所以,没有办法通过使用子类来保存模型。
可以只使用Model.save_weights()
解决方案
TensorFlow 2.2
感谢@cal 提醒我新的 TensorFlow 已支持保存自定义模型!
通过使用 model.save 保存整个模型并使用 load_model 恢复以前存储的子类模型。以下代码片段描述了如何实现它们。
class ThreeLayerMLP(keras.Model):
def __init__(self, name=None):
super(ThreeLayerMLP, self).__init__(name=name)
self.dense_1 = layers.Dense(64, activation='relu', name='dense_1')
self.dense_2 = layers.Dense(64, activation='relu', name='dense_2')
self.pred_layer = layers.Dense(10, name='predictions')
def call(self, inputs):
x = self.dense_1(inputs)
x = self.dense_2(x)
return self.pred_layer(x)
def get_model():
return ThreeLayerMLP(name='3_layer_mlp')
model = get_model()
# Save the model
model.save('path_to_my_model',save_format='tf')
# Recreate the exact same model purely from the file
new_model = keras.models.load_model('path_to_my_model')
请参阅:使用 Keras 保存和序列化模型 - 第二部分:子类模型的保存和加载
TensorFlow 2.0
TL;博士:
- 不要
model.save()
用于自定义子类 keras 模型; - 使用
save_weights()
andload_weights()
代替。
在 TensorFlow 团队的帮助下,保存自定义子类 Keras 模型的最佳实践是保存其权重并在需要时将其加载回来。
我们不能简单地保存一个 Keras 自定义子类模型的原因是它包含自定义代码,无法安全地序列化。但是,当我们具有相同的模型结构和自定义代码时,可以保存/加载权重没有任何问题。
Keras 的作者 Francois Chollet 编写了一个很棒的教程,介绍如何在 Colab 中的 Tensorflow 2.0 中保存/加载顺序/功能/Keras/自定义子类模型。在保存子类模型部分,它说:
顺序模型和功能模型是表示 DAG 层的数据结构。因此,它们可以安全地序列化和反序列化。
子类模型的不同之处在于它不是数据结构,而是一段代码。模型的架构是通过调用方法的主体定义的。这意味着模型的架构无法安全地序列化。要加载模型,您需要访问创建它的代码(模型子类的代码)。或者,您可以将此代码序列化为字节码(例如通过酸洗),但这不安全且通常不可移植。
推荐阅读
- sql - 获取用户的名字、城市和当月乘坐的次数
- ruby-on-rails - Rails:回形针上传时 AWS S3 访问被拒绝错误
- python - Python 如果它的相同输出不发送消息
- ajax - 通过laravel中的ajax在表中显示来自sql查询的数据
- scala - 如何在 Scala 中使用 Heroku DATABASE_URL 环境变量?
- c# - 是否可以将 HttpServer 和 WPF 作为单个应用程序运行?
- java - 找不到类?com.google.cloud.sql.mysql.SocketFactory 尝试连接云 sql
- java - 更改 ArrayList 中元素顺序的最快方法是什么?
- python-3.x - AWS Lambda:在运行时获取当前重试次数
- git - 带有预提交钩子的 Git 提交,为什么会得到不同的结果?