Path: blob/master/site/pt-br/lite/microcontrollers/get_started_low_level.md
25118 views
Introdução aos microcontroladores
Este documento explica como treinar um modelo e executar a inferência usando um microcontrolador.
Exemplo Hello World
O objetivo do exemplo Hello World (Olá, mundo) é demonstrar o uso básico do TensorFlow Lite para Microcontroladores. Treinamos e executamos um modelo que replica uma função de seno, ou seja, recebe um único número como entrada e gera como saída o valor seno do número. Quando implantado no microcontrolador, suas previsões são usadas para piscar luzes LED ou controlar uma animação.
O workflow completo é composto pelas seguintes etapas:
Treine um modelo (no Python): um arquivo do Python para treinar, converter e otimizar um modelo para uso em dispositivos.
Execute a inferência (no C++ 17): um teste de unidade fim a fim que executa a inferência no modelo usando a biblioteca do C++.
Use um dispositivo com suporte
O aplicativo de exemplo que usaremos foi testado nos seguintes dispositivos:
Arduino Nano 33 BLE Sense (usando Arduino IDE)
SparkFun Edge (compilando diretamente a partir do código-fonte)
STM32F746 Discovery kit (usando Mbed)
Adafruit EdgeBadge (usando Arduino IDE)
Adafruit TensorFlow Lite for Microcontrollers Kit (usando Arduino IDE)
Adafruit Circuit Playground Bluefruit (usando Arduino IDE)
Espressif ESP32-DevKitC (usando ESP IDF)
Espressif ESP-EYE (usando ESP IDF)
Saiba mais sofre as plataformas com suporte no TensorFlow Lite para Microcontroladores.
Treine um modelo
Observação: você pode pular esta seção e usar o modelo treinado incluído no código de exemplo.
Use train.py para treinamento do modelo Hello World de reconhecimento de senoides.
Execute: bazel build tensorflow/lite/micro/examples/hello_world:train
bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/
Execute a inferência
Para executar o modelo em seu dispositivo, falaremos sobre as instruções no arquivo README.md
:
As próximas seções falam sobre o teste de unidade evaluate_test.cc
do exemplo, que demonstra como executar a inferência usando o TensorFlow Lite para Microcontroladores. Ele carrega o modelo e executa a inferência diversas vezes.
1. Inclua os cabeçalhos da biblioteca
Para usar a biblioteca do TensorFlow Lite para Microcontroladores, precisamos incluir os seguintes arquivos de cabeçalho:
micro_mutable_op_resolver.h
– fornece as operações usadas pelo interpretador para executar o modelo.micro_error_reporter.h
– gera como saída informações de depuração.micro_interpreter.h
– contém código para carregar e executar modelos.schema_generated.h
– contém o esquema do formato de arquivo de modeloFlatBuffer
do TensorFlow Lite.version.h
– fornece informações de versionamento do esquema do TensorFlow Lite.
2. Inclua o cabeçalho do modelo
O interpretador do TensorFlow Lite para Microcontroladores espera que o modelo seja fornecido como um array do C++. O modelo é definido nos arquivos model.h
e model.cc
. O cabeçalho é incluído com a seguinte linha:
3. Inclua o cabeçalho do framework de teste de unidade
Para criar um teste de unidade, incluímos o framework de teste de unidade do TensorFlow Lite para Microcontroladores com a seguinte linha:
O teste é definido usando-se as seguintes macros:
Agora, vamos falar sobre o código incluído na macro acima.
4. Configure a gravação de logs
Para configurar a gravação de logs, um ponteiro tflite::ErrorReporter
é criado usando-se um ponteiro para uma instância de tflite::MicroErrorReporter
:
Essa variável será passada ao interpretador, o que permite a ele escrever logs. Como os microcontroladores costumam ter uma variedade de mecanismos de gravação de logs, a implementação de tflite::MicroErrorReporter
foi criada de forma que possa ser personalizada para seu dispositivo específico.
5. Carregue um modelo
No código abaixo, o modelo é instanciado usando dados de um array char
, g_model
, que é declarado em model.h
. Em seguida, verificamos o modelo para garantir que a versão do esquema seja compatível com a versão que estamos usando.
6. Instancie o resolvedor de operações
Uma instância de MicroMutableOpResolver
é declarada, que será usada pelo interpretador para registrar e acessar as operações usadas pelo modelo:
MicroMutableOpResolver
requer um parâmetro de template que indique o número de operações que serão registradas. A função RegisterOps
registra as operações no resolvedor.
7. Aloque memória
Precisamos pré-alocar uma determinada quantidade de memória para os arrays de entrada, saída e intermediários. Isso é fornecido como um array uint8_t
de tamanho tensor_arena_size
:
O tamanho necessário dependerá do modelo que você estiver usando e talvez precise ser determinado fazendo experimentos.
8. Instancie o interpretador
Criamos uma instância de tflite::MicroInterpreter
passando as variáveis criadas anteriormente:
9. Aloque tensores
Dizemos ao interpretador para alocar memória de tensor_arena
para os tensores do modelo:
10. Valide o formato da entrada
A instância de MicroInterpreter
pode nos fornecer um ponteiro para o tensor de entrada do modelo, basta chamar .input(0)
, em que 0
representa o primeiro (e único) tensor de entrada:
Em seguida, inspecionamos esse tensor para confirmar que o formato e o tipo sejam os esperados:
O valor enum kTfLiteFloat32
é uma referência a um dos tipos de dados do TensorFlow Lite e é definido em common.h
.
11. Forneça um valor de entrada
Para fornecer um valor de entrada ao modelo, definimos o conteúdo do tensor de entrada da seguinte forma:
Neste caso, fornecemos como entrada um valor de ponto flutuante que representa 0
.
12. Execute o modelo
Para executar o modelo, chamamos Invoke()
na instância de tflite::MicroInterpreter
:
Podemos verificar o valor retornado, um TfLiteStatus
, para determinar se a execução foi bem-sucedida. Os valores possíveis de TfLiteStatus
, definidos em common.h
, são kTfLiteOk
e kTfLiteError
.
O código abaixo indica que o valor é kTfLiteOk
, ou seja, a inferência foi executada com êxito.
13. Obtenha a saída
O tensor de saída do modelo pode ser obtido chamando-se output(0)
em tflite::MicroInterpreter
, em que 0
representa o primeiro (e único) tensor de saída.
Neste exemplo, a saída do modelo é um único valor de ponto flutuante contido dentro de um tensor bidimensional:
Podemos ler o valor diretamente no tensor de saída e confirmar que é o esperado:
14. Execute a inferência novamente
O restante do código executa a inferência diversas outras vezes. Em cada execução, atribuímos um valor ao tensor de entrada, chamamos o interpretador e lemos o resultado no tensor de saída: