GitHub Repository: tensorflow/docs-l10n
Path: blob/master/site/ja/guide/keras/save_and_serialize.ipynb
²⁵¹¹⁸ views

Kernel: Python 3

Copyright 2020 The TensorFlow Authors.

In [ ]:

#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

Kerasモデルの保存と読み込み

View on TensorFlow.org

Google Colab で実行

GitHub でソースを表示

ノートブックをダウンロード

重み値のみを保存。（通常、モデルのトレーニング時に使用）。

from tensorflow import keras model = keras.models.load_model('path/to/location')

モデルに含まれるレイヤーとそれらの接続方法を指定するアーキテクチャまたは構成。
重み値のセット（「モデルの状態」）。
オプティマイザ（モデルのコンパイルによって定義されます）。
損失とメトリックのセット（モデルをコンパイルするか、add_loss() または add_metric() を呼び出すことにより定義されます）。

セットアップ

import numpy as npimport tensorflow as tffrom tensorflow import keras
tf.keras.models.load_model()
重み値のみを保存します。これは通常、モデルのトレーニング時に使用されます。

例：

モデルの保存と読み込み方法

このガイドを読む時間が 10 秒しかない場合は、次のことを知っておく必要があります。

Keras モデルの保存

model = ...  # Get model (Sequential, Functional Model, or Model subclass)
model.save('path/to/location')

モデルの読み込み

from tensorflow import keras
model = keras.models.load_model('path/to/location')

詳細を見てみましょう。

セットアップ

In [ ]:

import numpy as np
import tensorflow as tf
from tensorflow import keras

モデル全体の保存と読み込み

モデル全体を１つのアーティファクトとして保存できます。その場合、以下が含まれます。

モデルのアーキテクチャ/構成
モデルの重み値（トレーニング時に学習される）
モデルのコンパイル情報（compile() が呼び出された場合）
あれば、オプティマイザとその状態（中断した所からトレーニングを再開するため）

API

model.save() または tf.keras.models.save_model()
tf.keras.models.load_model()

モデル全体をディスクに保存するには TensorFlow SavedModel 形式と古い Keras H5 形式の 2 つの形式を使用できます。推奨される形式は SavedModel です。これは、model.save() を使用する場合のデフォルトです。

次の方法で H5 形式に切り替えることができます。

save_format='h5' を save() に渡す。
.h5 または .keras で終わるファイル名を save() に渡す。

SavedModel 形式

SavedModel は、モデルアーキテクチャ、重み、および呼び出し関数のトレースされた Tensorflow サブグラフを保存する、より包括的な保存形式です。これにより、Keras は組み込みレイヤーとカスタムオブジェクトの両方を復元できます。

例:

In [ ]:

def get_model():
    # Create a simple model.
    inputs = keras.Input(shape=(32,))
    outputs = keras.layers.Dense(1)(inputs)
    model = keras.Model(inputs, outputs)
    model.compile(optimizer="adam", loss="mean_squared_error")
    return model


model = get_model()

# Train the model.
test_input = np.random.random((128, 32))
test_target = np.random.random((128, 1))
model.fit(test_input, test_target)

# Calling `save('my_model')` creates a SavedModel folder `my_model`.
model.save("my_model")

# It can be used to reconstruct the model identically.
reconstructed_model = keras.models.load_model("my_model")

# Let's check:
np.testing.assert_allclose(
    model.predict(test_input), reconstructed_model.predict(test_input)
)

# The reconstructed model is already compiled and has retained the optimizer
# state, so training can resume:
reconstructed_model.fit(test_input, test_target)

SavedModel に含まれるもの

model.save('my_model')を呼び出すと、以下を含むmy_modelという名前のフォルダが作成されます。

In [ ]:

!ls my_model

以下は、**config メソッドを上書きせずに **SavedModel 形式からカスタムレイヤーを読み込んだ場合の例です。

SavedModel 形式についての詳細は「SavedModel ガイド（ディスク上の SavedModel 形式）」をご覧ください。

SavedModel によるカスタムオブジェクトの処理

モデルとそのレイヤーを保存する場合、SavedModel 形式はクラス名、呼び出し関数、損失、重み（および実装されている場合は構成）を保存します。呼び出し関数は、モデル/レイヤーの計算グラフを定義します。

モデル/レイヤーの構成がない場合、トレーニング、評価、および推論に使用できる元のモデルのようなモデルを作成するために呼び出し関数が使用されます。

しかしながら、カスタムモデルまたはレイヤークラスを作成する場合は、常に get_config および from_config メソッドを使用して定義することをお勧めします。これにより、必要に応じて後で計算を簡単に更新できます。詳細については「カスタムオブジェクト」をご覧ください。

例:

In [ ]:

class CustomModel(keras.Model):
    def __init__(self, hidden_units):
        super(CustomModel, self).__init__()
        self.dense_layers = [keras.layers.Dense(u) for u in hidden_units]

    def call(self, inputs):
        x = inputs
        for layer in self.dense_layers:
            x = layer(x)
        return x


model = CustomModel([16, 16, 10])
# Build the model by calling it
input_arr = tf.random.uniform((1, 5))
outputs = model(input_arr)
model.save("my_model")

# Delete the custom-defined model class to ensure that the loader does not have
# access to it.
del CustomModel

loaded = keras.models.load_model("my_model")
np.testing.assert_allclose(loaded(input_arr), outputs)

print("Original model:", model)
print("Loaded model:", loaded)

上記の例のように、ローダーは、元のモデルのように機能する新しいモデルクラスを動的に作成します。

SavedModel の構成

TensoFlow 2.4 の新機能引数 save_traces が model.save に追加されました。これにより、SavedModel 関数のトレースを切り替えることができます。関数は、Keras が元のクラス定義なしでカスタムオブジェクトを再読み込みできるように保存されるため、save_traces=False の場合、すべてのカスタムオブジェクトには get_config/from_config メソッドが定義されている必要があります。読み込み時に、カスタムオブジェクトを custom_objects 引数に渡す必要があります。save_traces=False は、SavedModel が使用するディスク容量を削減し、時間を節約します。

Keras H5 形式

Keras は、モデルのアーキテクチャ、重み値、および compile() 情報を含む１つの HDF5 ファイルの保存もサポートしています。これは、SavedModel に代わる軽量な形式です。

例：

In [ ]:

model = get_model()

# Train the model.
test_input = np.random.random((128, 32))
test_target = np.random.random((128, 1))
model.fit(test_input, test_target)

# Calling `save('my_model.h5')` creates a h5 file `my_model.h5`.
model.save("my_h5_model.h5")

# It can be used to reconstruct the model identically.
reconstructed_model = keras.models.load_model("my_h5_model.h5")

# Let's check:
np.testing.assert_allclose(
    model.predict(test_input), reconstructed_model.predict(test_input)
)

# The reconstructed model is already compiled and has retained the optimizer
# state, so training can resume:
reconstructed_model.fit(test_input, test_target)

制限事項

SavedModel 形式と比較して、H5 ファイルに含まれないものが 2 つあります。

カスタムレイヤーなどのカスタムオブジェクトの計算グラフは、保存されたファイルに含まれません。読み込む際に、Keras はモデルを再構築するためにこれらのオブジェクトの Python クラス/関数にアクセスする必要があります。詳細については、「カスタムオブジェクト」をご覧ください。
tf.keras.models.model_to_json()およびtf.keras.models.model_from_json()

アーキテクチャの保存

*これは、サブクラス化されたモデルではなく、Functional または Sequential API を使用して定義されたモデルにのみ適用されることに注意してください。

Sequential モデルまたは Functional API モデルの構成

これらのタイプのモデルは、レイヤーの明示的なグラフです。それらの構成は常に構造化された形式で提供されます。

レイヤーの例：

get_config() および from_config()
tf.keras.models.model_to_json() および tf.keras.models.model_from_json()

`get_config()` および `from_config()`

config = model.get_config() を呼び出すと、モデルの構成を含む Python dict が返されます。その後、同じモデルを Sequential.from_config(config)（
Sequential モデルの場合）またはModel.from_config(config)（Functional API モデルの場合）で再度構築できます。

同じワークフローは、シリアル化可能なレイヤーでも使用できます。

レイヤーの例:

In [ ]:

layer = keras.layers.Dense(3, activation="relu")
layer_config = layer.get_config()
new_layer = keras.layers.Dense.from_config(layer_config)

Sequential モデルの例：

In [ ]:

model = keras.Sequential([keras.Input((32,)), keras.layers.Dense(1)])
config = model.get_config()
new_model = keras.Sequential.from_config(config)

Functional モデルの例：

In [ ]:

inputs = keras.Input((32,))
outputs = keras.layers.Dense(1)(inputs)
model = keras.Model(inputs, outputs)
config = model.get_config()
new_model = keras.Model.from_config(config)

例：

これは、get_config / from_config と似ていますが、モデルを JSON 文字列に変換します。この文字列は、元のモデルクラスなしで読み込めます。また、これはモデル固有であり、レイヤー向けではありません。

例:

In [ ]:

model = keras.Sequential([keras.Input((32,)), keras.layers.Dense(1)])
json_config = model.to_json()
new_model = keras.models.model_from_json(json_config)

カスタムオブジェクト

モデルとレイヤー

サブクラス化されたモデルとレイヤーのアーキテクチャは、メソッド __init__ および call で定義されています。それらは Python バイトコードと見なされ、JSON と互換性のある構成にシリアル化できません。pickle などを使用してバイトコードのシリアル化を試すことができますが、これは安全ではなく、モデルを別のシステムに読み込むことはできません。

カスタム定義されたレイヤーのあるモデル、またはサブクラス化されたモデルを保存/読み込むには、get_config および from_config（オプション）メソッドを上書きする必要があります。さらに、Keras が認識できるように、カスタムオブジェクトの登録を使用する必要があります。

カスタム関数

カスタム定義関数（アクティブ化の損失や初期化など）には、get_config メソッドは必要ありません。カスタムオブジェクトとして登録されている限り、読み込みには関数名だけで十分です。

TensorFlow グラフのみの読み込み

例：

In [ ]:

model.save("my_model")
tensorflow_graph = tf.saved_model.load("my_model")
x = np.random.uniform(size=(4, 32)).astype(np.float32)
predicted = tensorflow_graph(x).numpy()

この方法にはいくつかの欠点があることに注意してください。

tf.saved_model.loadにより返されるオブジェクトは、Keras モデルではないので、簡単には使えません。たとえば、.predict()や.fit()へのアクセスはありません。
tf.saved_model.load により返されるオブジェクトは、Keras モデルではないため簡単には使えません。例えば、.predict() や .fit() へのアクセスはありません。

この方法は推奨されていませんが、カスタムオブジェクトのコードを紛失した場合や tf.keras.models.load_model() でモデルを読み込む際に問題が発生した場合など、困った状況で役に立ちます。

詳細は、tf.saved_model.load に関するページをご覧ください。

構成メソッドの定義

仕様

get_configは、Keras のアーキテクチャおよびモデルを保存する API と互換性があるように、JSON のシリアル化が可能なディクショナリを返す必要があります。
カスタムレイヤーと関数の例

TensorFlow グラフのみの読み込み

In [ ]:

class CustomLayer(keras.layers.Layer):
    def __init__(self, a):
        self.var = tf.Variable(a, name="var_a")

    def call(self, inputs, training=False):
        if training:
            return inputs * self.var
        else:
            return inputs

    def get_config(self):
        return {"a": self.var.numpy()}

    # There's actually no need to define `from_config` here, since returning
    # `cls(**config)` is the default behavior.
    @classmethod
    def from_config(cls, config):
        return cls(**config)


layer = CustomLayer(5)
layer.var.assign(2)

serialized_layer = keras.layers.serialize(layer)
new_layer = keras.layers.deserialize(
    serialized_layer, custom_objects={"CustomLayer": CustomLayer}
)

例：

Keras は構成を生成したクラスについての情報を保持します。上記の例では、tf.keras.layers.serialize はシリアル化された形態のカスタムレイヤーを生成します。

tf.keras.utils.register_keras_serializable

属性/グラフのエッジは、変数名ではなく、親オブジェクトで使用される名前で命名されていることに注意してください。以下の例のCustomLayerでは、変数CustomLayer.varは、"var_a"ではなく、"var"をキーの一部として保存されます。

読み込み関数で custom_objects 引数を設定する。（上記の「config メソッドの定義」セクションの例をご覧ください）
tf.keras.utils.custom_object_scope または tf.keras.utils.CustomObjectScope
tf.keras.utils.register_keras_serializable

カスタムレイヤーと関数の例

In [ ]:

class CustomLayer(keras.layers.Layer):
    def __init__(self, a):
        self.var = tf.Variable(a, name="var_a")

    def call(self, inputs, training=False):
        if training:
            return inputs * self.var
        else:
            return inputs

    def get_config(self):
        return {"a": self.var.numpy()}

    # There's actually no need to define `from_config` here, since returning
    # `cls(**config)` is the default behavior.
    @classmethod
    def from_config(cls, config):
        return cls(**config)


layer = CustomLayer(5)
layer.var.assign(2)

serialized_layer = keras.layers.serialize(layer)
new_layer = keras.layers.deserialize(
    serialized_layer, custom_objects={"CustomLayer": CustomLayer}
)

例：

with keras.utils.custom_object_scope(custom_objects): new_model = keras.models.clone_model(model)

例:

In [ ]:

with keras.utils.custom_object_scope(custom_objects):
    new_model = keras.models.clone_model(model)

転移学習を行う場合。以前のモデルの状態を再利用して新しいモデルをトレーニングするため、以前のモデルのコンパイル情報は必要ありません。

モデルの重みのみを保存および読み込むように選択できます。これは次の場合に役立ちます。

推論のためのモデルだけが必要とされる場合。この場合、トレーニングを再開する必要がないため、コンパイル情報やオプティマイザの状態は必要ありません。
転移学習を行う場合。以前のモデルの状態を再利用して新しいモデルをトレーニングするため、以前のモデルのコンパイル情報は必要ありません。

メモリ内の重み転移のための API

異なるオブジェクト間で重みをコピーするには get_weights および set_weights を使用します。

tf.keras.layers.Layer.get_weights(): numpy 配列のリストを返します。
tf.keras.layers.Layer.set_weights(): モデルの重みを weights 引数の値に設定します。

以下に例を示します。

インメモリで、1 つのレイヤーから別のレイヤーに重みを転送する

In [ ]:

def create_layer():
    layer = keras.layers.Dense(64, activation="relu", name="dense_2")
    layer.build((None, 784))
    return layer


layer_1 = create_layer()
layer_2 = create_layer()

# Copy weights from layer 2 to layer 1
layer_2.set_weights(layer_1.get_weights())

インメモリで 1 つのモデルから互換性のあるアーキテクチャを備えた別のモデルに重みを転送する

In [ ]:

# Create a simple functional model
inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
outputs = keras.layers.Dense(10, name="predictions")(x)
functional_model = keras.Model(inputs=inputs, outputs=outputs, name="3_layer_mlp")

# Define a subclassed model with the same architecture
class SubclassedModel(keras.Model):
    def __init__(self, output_dim, name=None):
        super(SubclassedModel, self).__init__(name=name)
        self.output_dim = output_dim
        self.dense_1 = keras.layers.Dense(64, activation="relu", name="dense_1")
        self.dense_2 = keras.layers.Dense(64, activation="relu", name="dense_2")
        self.dense_3 = keras.layers.Dense(output_dim, name="predictions")

    def call(self, inputs):
        x = self.dense_1(inputs)
        x = self.dense_2(x)
        x = self.dense_3(x)
        return x

    def get_config(self):
        return {"output_dim": self.output_dim, "name": self.name}


subclassed_model = SubclassedModel(10)
# Call the subclassed model once to create the weights.
subclassed_model(tf.ones((1, 784)))

# Copy weights from functional_model to subclassed_model.
subclassed_model.set_weights(functional_model.get_weights())

assert len(functional_model.weights) == len(subclassed_model.weights)
for a, b in zip(functional_model.weights, subclassed_model.weights):
    np.testing.assert_allclose(a.numpy(), b.numpy())

ステートレスレイヤーの場合

ステートレスレイヤーの場合

In [ ]:

inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
outputs = keras.layers.Dense(10, name="predictions")(x)
functional_model = keras.Model(inputs=inputs, outputs=outputs, name="3_layer_mlp")

# Extract a portion of the functional model defined in the Setup section.
# The following lines produce a new model that excludes the final output
# layer of the functional model.
pretrained = keras.Model(
    functional_model.inputs, functional_model.layers[-1].input, name="pretrained_model"
)
# Randomly assign "trained" weights.
for w in pretrained.weights:
    w.assign(tf.random.normal(w.shape))
pretrained.save_weights("pretrained_ckpt")
pretrained.summary()

# Assume this is a separate program where only 'pretrained_ckpt' exists.
# Create a new functional model with a different output dimension.
inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
outputs = keras.layers.Dense(5, name="predictions")(x)
model = keras.Model(inputs=inputs, outputs=outputs, name="new_model")

# Load the weights from pretrained_ckpt into model.
model.load_weights("pretrained_ckpt")

# Check that all of the pretrained weights have been loaded.
for a, b in zip(pretrained.weights, model.weights):
    np.testing.assert_allclose(a.numpy(), b.numpy())

print("\n", "-" * 50)
model.summary()

# Example 2: Sequential model
# Recreate the pretrained model, and load the saved weights.
inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
pretrained_model = keras.Model(inputs=inputs, outputs=x, name="pretrained")

# Sequential example:
model = keras.Sequential([pretrained_model, keras.layers.Dense(5, name="predictions")])
model.summary()

pretrained_model.load_weights("pretrained_ckpt")

# Warning! Calling `model.load_weights('pretrained_ckpt')` won't throw an error,
# but will *not* work as expected. If you inspect the weights, you'll see that
# none of the weights will have loaded. `pretrained_model.load_weights()` is the
# correct method to call.

重みをディスクに保存して再度読み込むための API

以下の形式で model.save_weights を呼び出すことにより、重みをディスクに保存できます。

TensorFlow Checkpoint
HDF5

model.save_weights のデフォルトの形式は TensorFlow Checkpoint です。保存形式を指定する方法は 2 つあります。

save_format引数: 値を save_format = "tf" または save_format = "h5" に設定します。
path引数: パスが .h5 または .hdf5 で終わる場合、HDF5 形式が使用されます。save_format が設定されていない限り、他のサフィックスでは、TensorFlow Checkpoint になります。

path引数：パスが.h5または.hdf5で終わる場合、HDF5 形式が使用されます。save_formatが設定されていない限り、他のサフィックスでは、TensorFlow Checkpoint になります。

TF Checkpoint 形式

例：

In [ ]:

# Runnable example
sequential_model = keras.Sequential(
    [
        keras.Input(shape=(784,), name="digits"),
        keras.layers.Dense(64, activation="relu", name="dense_1"),
        keras.layers.Dense(64, activation="relu", name="dense_2"),
        keras.layers.Dense(10, name="predictions"),
    ]
)
sequential_model.save_weights("weights.h5")
sequential_model.load_weights("weights.h5")

形式の詳細

ネストされたレイヤーがモデルに含まれている場合、layer.trainableを変更すると、layer.weightsの順序が異なる場合があることに注意してください。

属性/グラフのエッジは、変数名ではなく、親オブジェクトで使用される名前で命名されていることに注意してください。以下の例の CustomLayer では、変数 CustomLayer.var は、"var_a" ではなく、"var" をキーの一部として保存されます。

In [ ]:

class CustomLayer(keras.layers.Layer):
    def __init__(self, a):
        self.var = tf.Variable(a, name="var_a")


layer = CustomLayer(5)
layer_ckpt = tf.train.Checkpoint(layer=layer).save("custom_layer")

ckpt_reader = tf.train.load_checkpoint(layer_ckpt)

ckpt_reader.get_variable_to_dtype_map()

転移学習の例

基本的に、2 つのモデルが同じアーキテクチャを持っている限り、同じチェックポイントを共有できます。

例:

In [ ]:

inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
outputs = keras.layers.Dense(10, name="predictions")(x)
functional_model = keras.Model(inputs=inputs, outputs=outputs, name="3_layer_mlp")

inputs = keras.Input(shape=(784,), name="digits")
x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)

# Add a dropout layer, which does not contain any weights.
x = keras.layers.Dropout(0.5)(x)
outputs = keras.layers.Dense(10, name="predictions")(x)
functional_model_with_dropout = keras.Model(
    inputs=inputs, outputs=outputs, name="3_layer_mlp"
)

functional_model_with_dropout.set_weights(functional_model.get_weights())

通常、モデルの作成には同じ API を使用することをお勧めします。Sequential と Functional、またはFunctional とサブクラス化などの間で切り替える場合は、常に事前トレーニング済みモデルを再構築し、事前トレーニング済みの重みをそのモデルに読み込みます。

では、モデルのアーキテクチャがまったく異なる場合、どうすれば重みを保存して異なるモデルに読み込むことができるのでしょうか？tf.train.Checkpoint を使用すると、正確なレイヤー/変数を保存および復元することができます。

例：

In [ ]:

# Create a subclassed model that essentially uses functional_model's first
# and last layers.
# First, save the weights of functional_model's first and last dense layers.
first_dense = functional_model.layers[1]
last_dense = functional_model.layers[-1]
ckpt_path = tf.train.Checkpoint(
    dense=first_dense, kernel=last_dense.kernel, bias=last_dense.bias
).save("ckpt")

# Define the subclassed model.
class ContrivedModel(keras.Model):
    def __init__(self):
        super(ContrivedModel, self).__init__()
        self.first_dense = keras.layers.Dense(64)
        self.kernel = self.add_variable("kernel", shape=(64, 10))
        self.bias = self.add_variable("bias", shape=(10,))

    def call(self, inputs):
        x = self.first_dense(inputs)
        return tf.matmul(x, self.kernel) + self.bias


model = ContrivedModel()
# Call model on inputs to create the variables of the dense layer.
_ = model(tf.ones((1, 784)))

# Create a Checkpoint with the same structure as before, and load the weights.
tf.train.Checkpoint(
    dense=model.first_dense, kernel=model.kernel, bias=model.bias
).restore(ckpt_path).assert_consumed()

HDF5 形式

HDF5 形式には、レイヤー名でグループ化された重みが含まれています。重みは、トレーニング可能な重みのリストをトレーニング不可能な重みのリストに連結することによって並べられたリストです（layer.weights と同じ）。したがって、チェックポイントに保存されているものと同じレイヤーとトレーニング可能な状態がある場合、モデルは HDF 5 チェックポイントを使用できます。

例：

In [ ]:

# Runnable example
sequential_model = keras.Sequential(
    [
        keras.Input(shape=(784,), name="digits"),
        keras.layers.Dense(64, activation="relu", name="dense_1"),
        keras.layers.Dense(64, activation="relu", name="dense_2"),
        keras.layers.Dense(10, name="predictions"),
    ]
)
sequential_model.save_weights("ckpt")
load_status = sequential_model.load_weights("ckpt")

# `assert_consumed` can be used as validation that all variable values have been
# restored from the checkpoint. See `tf.train.Checkpoint.restore` for other
# methods in the Status object.
load_status.assert_consumed()

ネストされたレイヤーがモデルに含まれている場合、layer.trainable を変更すると、layer.weights の順序が異なる場合があることに注意してください。

In [ ]:

class NestedDenseLayer(keras.layers.Layer):
    def __init__(self, units, name=None):
        super(NestedDenseLayer, self).__init__(name=name)
        self.dense_1 = keras.layers.Dense(units, name="dense_1")
        self.dense_2 = keras.layers.Dense(units, name="dense_2")

    def call(self, inputs):
        return self.dense_2(self.dense_1(inputs))


nested_model = keras.Sequential([keras.Input((784,)), NestedDenseLayer(10, "nested")])
variable_names = [v.name for v in nested_model.weights]
print("variables: {}".format(variable_names))

print("\nChanging trainable status of one of the nested layers...")
nested_model.get_layer("nested").dense_1.trainable = False

variable_names_2 = [v.name for v in nested_model.weights]
print("\nvariables: {}".format(variable_names_2))
print("variable ordering changed:", variable_names != variable_names_2)

転移学習の例

HDF5 から事前トレーニングされた重みを読み込む場合は、元のチェックポイントモデルに重みを読み込んでから、目的の重み/レイヤーを新しいモデルに抽出することをお勧めします。

例：

In [ ]:

def create_functional_model():
    inputs = keras.Input(shape=(784,), name="digits")
    x = keras.layers.Dense(64, activation="relu", name="dense_1")(inputs)
    x = keras.layers.Dense(64, activation="relu", name="dense_2")(x)
    outputs = keras.layers.Dense(10, name="predictions")(x)
    return keras.Model(inputs=inputs, outputs=outputs, name="3_layer_mlp")


functional_model = create_functional_model()
functional_model.save_weights("pretrained_weights.h5")

# In a separate program:
pretrained_model = create_functional_model()
pretrained_model.load_weights("pretrained_weights.h5")

# Create a new model by extracting layers from the original model:
extracted_layers = pretrained_model.layers[:-1]
extracted_layers.append(keras.layers.Dense(5, name="dense_3"))
model = keras.Sequential(extracted_layers)
model.summary()

Copyright 2020 The TensorFlow Authors.

Kerasモデルの保存と読み込み

重み値のみを保存。（通常、モデルのトレーニング時に使用）。

モデルの保存と読み込み方法

セットアップ

モデル全体の保存と読み込み

API

SavedModel 形式

SavedModel に含まれるもの

SavedModel によるカスタムオブジェクトの処理

SavedModel の構成

Keras H5 形式

制限事項

アーキテクチャの保存

Sequential モデルまたは Functional API モデルの構成

レイヤーの例：

`get_config()` および `from_config()`

例：

カスタムオブジェクト

構成メソッドの定義

例：

カスタムレイヤーと関数の例

例：

転移学習を行う場合。以前のモデルの状態を再利用して新しいモデルをトレーニングするため、以前のモデルのコンパイル情報は必要ありません。

メモリ内の重み転移のための API

重みをディスクに保存して再度読み込むための API

TF Checkpoint 形式

形式の詳細

転移学習の例

HDF5 形式

転移学習の例

Product

Resources

Company

Copyright 2020 The TensorFlow Authors.

Kerasモデルの保存と読み込み

重み値のみを保存。（通常、モデルのトレーニング時に使用）。

モデルの保存と読み込み方法

セットアップ

モデル全体の保存と読み込み

API

SavedModel 形式

SavedModel に含まれるもの

SavedModel によるカスタムオブジェクトの処理

SavedModel の構成

Keras H5 形式

制限事項

アーキテクチャの保存

Sequential モデルまたは Functional API モデルの構成

レイヤーの例：

get_config() および from_config()

例：

カスタムオブジェクト

構成メソッドの定義

例：

カスタムレイヤーと関数の例

例：

転移学習を行う場合。以前のモデルの状態を再利用して新しいモデルをトレーニングするため、以前のモデルのコンパイル情報は必要ありません。

メモリ内の重み転移のための API

重みをディスクに保存して再度読み込むための API

TF Checkpoint 形式

形式の詳細

転移学習の例

HDF5 形式

転移学習の例

`get_config()` および `from_config()`