GitHub Repository: tensorflow/docs-l10n
Path: blob/master/site/pt-br/guide/migrate/mirrored_strategy.ipynb
²⁵¹¹⁸ views

Kernel: Python 3

Copyright 2021 The TensorFlow Authors.

In [ ]:

#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

Como migrar o treinamento de um worker com multiplas GPUs

Ver em TensorFlow.org

Executar no Google Colab

Ver fonte no GitHub

Baixar notebook

Este guia demonstra como migrar os workflows de um worker com múltiplas GPUs, do TensorFlow 1 para o TensorFlow 2.

Para realizar treinamento síncrono em múltiplas GPUs de uma única máquina:

No TensorFlow 1, você usa as APIs tf.estimator.Estimator com tf.distribute.MirroredStrategy.
No TensorFlow 2, você pode usar Keras Model.fit ou um loop de treinamento personalizado com tf.distribute.MirroredStrategy. Saiba mais no guia Treinamento distribuído com TensorFlow.

Configuração

Comece com os imports e um dataset simples para fins de demonstração:

In [ ]:

import tensorflow as tf
import tensorflow.compat.v1 as tf1

In [ ]:

features = [[1., 1.5], [2., 2.5], [3., 3.5]]
labels = [[0.3], [0.5], [0.7]]
eval_features = [[4., 4.5], [5., 5.5], [6., 6.5]]
eval_labels = [[0.8], [0.9], [1.]]

TensorFlow 1: treinamento distribuído de um único worker com tf.estimator.Estimator

Este exemplo demonstra o workflow canônico do TensorFlow 1 para treinamento multi-GPU com um único worker. Você precisa definir a estratégia de distribuição (tf.distribute.MirroredStrategy) através do parâmetro config do tf.estimator.Estimator:

In [ ]:

def _input_fn():
  return tf1.data.Dataset.from_tensor_slices((features, labels)).batch(1)

def _eval_input_fn():
  return tf1.data.Dataset.from_tensor_slices(
      (eval_features, eval_labels)).batch(1)

def _model_fn(features, labels, mode):
  logits = tf1.layers.Dense(1)(features)
  loss = tf1.losses.mean_squared_error(labels=labels, predictions=logits)
  optimizer = tf1.train.AdagradOptimizer(0.05)
  train_op = optimizer.minimize(loss, global_step=tf1.train.get_global_step())
  return tf1.estimator.EstimatorSpec(mode, loss=loss, train_op=train_op)

strategy = tf1.distribute.MirroredStrategy()
config = tf1.estimator.RunConfig(
    train_distribute=strategy, eval_distribute=strategy)
estimator = tf1.estimator.Estimator(model_fn=_model_fn, config=config)

train_spec = tf1.estimator.TrainSpec(input_fn=_input_fn)
eval_spec = tf1.estimator.EvalSpec(input_fn=_eval_input_fn)
tf1.estimator.train_and_evaluate(estimator, train_spec, eval_spec)

TensorFlow 2: Treinamento de um único worker com Keras

Ao migrar para o TensorFlow 2, você pode usar as APIs Keras com tf.distribute.MirroredStrategy.

Se você usar as APIs tf.keras para construção de modelo e Keras Model.fit para treinamento, a principal diferença será instanciar o modelo Keras, um otimizador e métricas no contexto de Strategy.scope, em vez de definir uma config para tf.estimator.Estimator.

Se você precisar usar um loop de treinamento personalizado, veja o guia Usando tf.distribute.Strategy com loops de treinamento personalizados.

In [ ]:

dataset = tf.data.Dataset.from_tensor_slices((features, labels)).batch(1)
eval_dataset = tf.data.Dataset.from_tensor_slices(
      (eval_features, eval_labels)).batch(1)

In [ ]:

strategy = tf.distribute.MirroredStrategy()
with strategy.scope():
  model = tf.keras.models.Sequential([tf.keras.layers.Dense(1)])
  optimizer = tf.keras.optimizers.Adagrad(learning_rate=0.05)

model.compile(optimizer=optimizer, loss='mse')
model.fit(dataset)
model.evaluate(eval_dataset, return_dict=True)

Próximos passos

Para saber mais sobre treinamento distribuído com tf.distribute.MirroredStrategy no TensorFlow 2, confira a seguinte documentação:

Copyright 2021 The TensorFlow Authors.

Como migrar o treinamento de um worker com multiplas GPUs

Configuração

TensorFlow 1: treinamento distribuído de um único worker com tf.estimator.Estimator

TensorFlow 2: Treinamento de um único worker com Keras

Próximos passos

Product

Resources

Company