Path: blob/master/site/pt-br/lite/models/text_classification/overview.md
25118 views
Classificação de texto
Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.
Observação: (1) para integrar um modelo existente, use a TensorFlow Lite Task Library (biblioteca de tarefas do TensorFlow Lite). (2) Para personalizar um modelo, use o TensorFlow Lite Model Maker (criador de modelos do TensorFlow Lite).
Como começar
Se você for iniciante no TensorFlow Lite e estiver trabalhando com o Android, recomendamos conferir o guia da TensorFlow Lite Task Library (biblioteca de tarefas do TensorFlowLite) para integrar modelos de classificação de texto com somente algumas linhas de código. Além disso, você pode integrar o modelo usando a TensorFlow Lite Interpreter Java API (API Java Interpreter do TensorFlow Lite).
O exemplo do Android abaixo demonstra a implementação dos dois métodos como a lib_task_api e a lib_interpreter, respectivamente.
Se você estiver usando outra plataforma que não o Android ou se já conhecer bem as APIs do TensorFlow Lite, pode baixar nosso modelo inicial de classificação de texto.
Como funciona
A classificação de texto categoriza um parágrafo em grupos predeterminados com base no conteúdo.
O modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado usando o Large Movie Review Dataset v1.0 de Mass et al, composto por avaliações de fillmes do IMDB rotulados como positivas ou negativas.
Veja as etapas para classificar um parágrafo usando o modelo:
Tokenize o parágrafo e converta-o em uma lista de IDs de palavras usando um vocabulário predefinido.
Alimente o modelo do TensorFlow Lite com a lista.
Calcule a probabilidade de o parágrafo ser positivo ou negativo usando as saídas do modelo.
Observações
Só há suporte ao idioma inglês.
O modelo foi treinado com o dataset de avaliações de filmes, então pode haver redução da exatidão ao classificar textos de outros domínios de conhecimento.
Referenciais de desempenho
Os referenciais de desempenho são gerados com a ferramenta descrita aqui.
Nome do modelo | Tamanho do modelo | Dispositivo | CPU |
---|---|---|---|
Classificação de texto | 0,6 MB | Pixel 3 (Android 10) | 0,05 ms* |
Pixel 4 (Android 10) | 0,05 ms* | ||
iPhone XS (iOS 12.4.1) | 0,025 ms** |
4 threads usados.
** 2 threads usados no iPhone para o resultado com maior desempenho.
Exemplo de saída
Texto | Negativo (0) | Positivo (1) |
---|---|---|
O melhor filme que vi nos últimos | 25,3% | 74,7% |
: anos. Recomendo muito! : : : | ||
Que desperdício de tempo. | 72,5% | 27,5% |
Use seu dataset de treinamento
Confira este tutorial para aplicar a mesma técnica utilizada aqui para treinar um modelo de classificação de texto usando seus próprios datasets. Com o dataset adequado, você pode criar um modelo para outros casos de uso, como categorização de documentos ou detecção de comentários tóxicos.