Path: blob/master/site/pt-br/lite/microcontrollers/get_started_low_level.md
38471 views
Introdução aos microcontroladores
Este documento explica como treinar um modelo e executar a inferência usando um microcontrolador.
Exemplo Hello World
O objetivo do exemplo Hello World (Olá, mundo) é demonstrar o uso básico do TensorFlow Lite para Microcontroladores. Treinamos e executamos um modelo que replica uma função de seno, ou seja, recebe um único número como entrada e gera como saída o valor seno do número. Quando implantado no microcontrolador, suas previsões são usadas para piscar luzes LED ou controlar uma animação.
O workflow completo é composto pelas seguintes etapas:
Treine um modelo (no Python): um arquivo do Python para treinar, converter e otimizar um modelo para uso em dispositivos.
Execute a inferência (no C++ 17): um teste de unidade fim a fim que executa a inferência no modelo usando a biblioteca do C++.
Use um dispositivo com suporte
O aplicativo de exemplo que usaremos foi testado nos seguintes dispositivos:
Arduino Nano 33 BLE Sense (usando Arduino IDE)
SparkFun Edge (compilando diretamente a partir do código-fonte)
STM32F746 Discovery kit (usando Mbed)
Adafruit EdgeBadge (usando Arduino IDE)
Adafruit TensorFlow Lite for Microcontrollers Kit (usando Arduino IDE)
Adafruit Circuit Playground Bluefruit (usando Arduino IDE)
Espressif ESP32-DevKitC (usando ESP IDF)
Espressif ESP-EYE (usando ESP IDF)
Saiba mais sofre as plataformas com suporte no TensorFlow Lite para Microcontroladores.
Treine um modelo
Observação: você pode pular esta seção e usar o modelo treinado incluído no código de exemplo.
Use train.py para treinamento do modelo Hello World de reconhecimento de senoides.
Execute: bazel build tensorflow/lite/micro/examples/hello_world:train bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/
Execute a inferência
Para executar o modelo em seu dispositivo, falaremos sobre as instruções no arquivo README.md:
As próximas seções falam sobre o teste de unidade evaluate_test.cc do exemplo, que demonstra como executar a inferência usando o TensorFlow Lite para Microcontroladores. Ele carrega o modelo e executa a inferência diversas vezes.
1. Inclua os cabeçalhos da biblioteca
Para usar a biblioteca do TensorFlow Lite para Microcontroladores, precisamos incluir os seguintes arquivos de cabeçalho:
micro_mutable_op_resolver.h– fornece as operações usadas pelo interpretador para executar o modelo.micro_error_reporter.h– gera como saída informações de depuração.micro_interpreter.h– contém código para carregar e executar modelos.schema_generated.h– contém o esquema do formato de arquivo de modeloFlatBufferdo TensorFlow Lite.version.h– fornece informações de versionamento do esquema do TensorFlow Lite.
2. Inclua o cabeçalho do modelo
O interpretador do TensorFlow Lite para Microcontroladores espera que o modelo seja fornecido como um array do C++. O modelo é definido nos arquivos model.h e model.cc. O cabeçalho é incluído com a seguinte linha:
3. Inclua o cabeçalho do framework de teste de unidade
Para criar um teste de unidade, incluímos o framework de teste de unidade do TensorFlow Lite para Microcontroladores com a seguinte linha:
O teste é definido usando-se as seguintes macros:
Agora, vamos falar sobre o código incluído na macro acima.
4. Configure a gravação de logs
Para configurar a gravação de logs, um ponteiro tflite::ErrorReporter é criado usando-se um ponteiro para uma instância de tflite::MicroErrorReporter:
Essa variável será passada ao interpretador, o que permite a ele escrever logs. Como os microcontroladores costumam ter uma variedade de mecanismos de gravação de logs, a implementação de tflite::MicroErrorReporter foi criada de forma que possa ser personalizada para seu dispositivo específico.
5. Carregue um modelo
No código abaixo, o modelo é instanciado usando dados de um array char, g_model, que é declarado em model.h. Em seguida, verificamos o modelo para garantir que a versão do esquema seja compatível com a versão que estamos usando.
6. Instancie o resolvedor de operações
Uma instância de MicroMutableOpResolver é declarada, que será usada pelo interpretador para registrar e acessar as operações usadas pelo modelo:
MicroMutableOpResolver requer um parâmetro de template que indique o número de operações que serão registradas. A função RegisterOps registra as operações no resolvedor.
7. Aloque memória
Precisamos pré-alocar uma determinada quantidade de memória para os arrays de entrada, saída e intermediários. Isso é fornecido como um array uint8_t de tamanho tensor_arena_size:
O tamanho necessário dependerá do modelo que você estiver usando e talvez precise ser determinado fazendo experimentos.
8. Instancie o interpretador
Criamos uma instância de tflite::MicroInterpreter passando as variáveis criadas anteriormente:
9. Aloque tensores
Dizemos ao interpretador para alocar memória de tensor_arena para os tensores do modelo:
10. Valide o formato da entrada
A instância de MicroInterpreter pode nos fornecer um ponteiro para o tensor de entrada do modelo, basta chamar .input(0), em que 0 representa o primeiro (e único) tensor de entrada:
Em seguida, inspecionamos esse tensor para confirmar que o formato e o tipo sejam os esperados:
O valor enum kTfLiteFloat32 é uma referência a um dos tipos de dados do TensorFlow Lite e é definido em common.h.
11. Forneça um valor de entrada
Para fornecer um valor de entrada ao modelo, definimos o conteúdo do tensor de entrada da seguinte forma:
Neste caso, fornecemos como entrada um valor de ponto flutuante que representa 0.
12. Execute o modelo
Para executar o modelo, chamamos Invoke() na instância de tflite::MicroInterpreter:
Podemos verificar o valor retornado, um TfLiteStatus, para determinar se a execução foi bem-sucedida. Os valores possíveis de TfLiteStatus, definidos em common.h, são kTfLiteOk e kTfLiteError.
O código abaixo indica que o valor é kTfLiteOk, ou seja, a inferência foi executada com êxito.
13. Obtenha a saída
O tensor de saída do modelo pode ser obtido chamando-se output(0) em tflite::MicroInterpreter, em que 0 representa o primeiro (e único) tensor de saída.
Neste exemplo, a saída do modelo é um único valor de ponto flutuante contido dentro de um tensor bidimensional:
Podemos ler o valor diretamente no tensor de saída e confirmar que é o esperado:
14. Execute a inferência novamente
O restante do código executa a inferência diversas outras vezes. Em cada execução, atribuímos um valor ao tensor de entrada, chamamos o interpretador e lemos o resultado no tensor de saída: