Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
tensorflow
GitHub Repository: tensorflow/docs-l10n
Path: blob/master/site/pt-br/lite/models/text_classification/overview.md
25118 views

Classificação de texto

Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.

Observação: (1) para integrar um modelo existente, use a TensorFlow Lite Task Library (biblioteca de tarefas do TensorFlow Lite). (2) Para personalizar um modelo, use o TensorFlow Lite Model Maker (criador de modelos do TensorFlow Lite).

Como começar

Se você for iniciante no TensorFlow Lite e estiver trabalhando com o Android, recomendamos conferir o guia da TensorFlow Lite Task Library (biblioteca de tarefas do TensorFlowLite) para integrar modelos de classificação de texto com somente algumas linhas de código. Além disso, você pode integrar o modelo usando a TensorFlow Lite Interpreter Java API (API Java Interpreter do TensorFlow Lite).

O exemplo do Android abaixo demonstra a implementação dos dois métodos como a lib_task_api e a lib_interpreter, respectivamente.

Exemplo do Android

Se você estiver usando outra plataforma que não o Android ou se já conhecer bem as APIs do TensorFlow Lite, pode baixar nosso modelo inicial de classificação de texto.

Baixar modelo inicial

Como funciona

A classificação de texto categoriza um parágrafo em grupos predeterminados com base no conteúdo.

O modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado usando o Large Movie Review Dataset v1.0 de Mass et al, composto por avaliações de fillmes do IMDB rotulados como positivas ou negativas.

Veja as etapas para classificar um parágrafo usando o modelo:

  1. Tokenize o parágrafo e converta-o em uma lista de IDs de palavras usando um vocabulário predefinido.

  2. Alimente o modelo do TensorFlow Lite com a lista.

  3. Calcule a probabilidade de o parágrafo ser positivo ou negativo usando as saídas do modelo.

Observações

  • Só há suporte ao idioma inglês.

  • O modelo foi treinado com o dataset de avaliações de filmes, então pode haver redução da exatidão ao classificar textos de outros domínios de conhecimento.

Referenciais de desempenho

Os referenciais de desempenho são gerados com a ferramenta descrita aqui.

Nome do modelo Tamanho do modelo Dispositivo CPU
Classificação de texto 0,6 MB Pixel 3 (Android 10) 0,05 ms*
Pixel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**
  • 4 threads usados.

** 2 threads usados no iPhone para o resultado com maior desempenho.

Exemplo de saída

TextoNegativo (0)Positivo (1)
O melhor filme que vi nos últimos25,3%74,7%
: anos. Recomendo muito! : : :
Que desperdício de tempo.72,5%27,5%

Use seu dataset de treinamento

Confira este tutorial para aplicar a mesma técnica utilizada aqui para treinar um modelo de classificação de texto usando seus próprios datasets. Com o dataset adequado, você pode criar um modelo para outros casos de uso, como categorização de documentos ou detecção de comentários tóxicos.

Leia mais sobre classificação de texto