Book a Demo!
CoCalc Logo Icon
StoreFeaturesDocsShareSupportNewsAboutPoliciesSign UpSign In
tensorflow
GitHub Repository: tensorflow/docs-l10n
Path: blob/master/site/pt-br/agents/overview.md
25115 views

Agentes do TensorFlow

Aprendizado por Reforço com o TensorFlow

Os agentes facilitam a criação, a implementação e os testes de novos algoritmos de RL ao fornecer componentes modulares bem testados que podem ser modificados e estendidos. Isso permite a iteração de código rápida, com boa integração de teste e benchmarking.

Para começar, recomendamos conferir um dos nossos tutoriais.

Instalação

O TF-Agents publica builds noturnos e estáveis. Para uma lista de versões, leia a seção Versões. Os comandos abaixo abrangem a instalação de TF-Agents estável e noturna a partir de pypi.org, assim como de um clone do GitHub.

:aviso: Se estiver usando Reverb (buffer de replay), que é bastante comum, o TF-Agents só funcionará com o Linux.

Observação: o Python 3.11 exige o pygame 2.1.3+.

Estável

Execute os comandos abaixo para instalar a versão estável mais recente. A documentação da API para a versão está em tensorflow.org.

$ pip install --user tf-agents[reverb] # Use this tag get the matching examples and colabs. $ git clone https://github.com/tensorflow/agents.git $ cd agents $ git checkout v0.17.0

Se você quiser instalar o TF-Agents com versões do TensorFlow ou Reverb que estão sinalizadas como não compatíveis pela verificação de dependência pip, use o padrão abaixo por sua conta e risco.

$ pip install --user tensorflow $ pip install --user dm-reverb $ pip install --user tf-agents

Se você quiser usar o TF-Agents com o TensorFlow 1.15 ou 2.0, instale a versão 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow. $ pip install tensorflow-probability==0.8.0 $ pip install tf-agents==0.3.0

Noturno

Os builds noturnos incluem recursos mais recentes, mas podem ser menos estáveis do que as versões versionadas. O build noturno é enviado como tf-agents-nightly. Sugerimos instalar versões noturnas do TensorFlow (tf-nightly) e TensorFlow Probability (tfp-nightly), já que são as versões testadas para o TF-Agents noturno.

Para instalar a versão de build noturno, execute o código a seguir:

# `--force-reinstall helps guarantee the right versions. $ pip install --user --force-reinstall tf-nightly $ pip install --user --force-reinstall tfp-nightly $ pip install --user --force-reinstall dm-reverb-nightly # Installing with the `--upgrade` flag ensures you'll get the latest version. $ pip install --user --upgrade tf-agents-nightly

A partir do GitHub

Depois de clonar o repositório, as dependências podem ser instaladas ao executar pip install -e .[tests]. O TensorFlow precisa ser instalado de maneira independente: pip install --user tf-nightly.

Contribuição

Estamos animados para colaborar com você! Veja em CONTRIBUTING.md um guia sobre como contribuir. Esse projeto adere ao código de conduta do TensorFlow. Ao participar, você deve seguir esse código.

Versões

O TF Agents tem versões estáveis e noturnas. As versões noturnas são geralmente boas, mas podem ter problemas devido a bibliotecas upstream em fluxo. A tabela abaixo lista as versões do TensorFlow que se alinham a cada versão do TF Agents. Versões de interesse:

  • 0.16.0 é a primeira versão compatível com o Python 3.11.

  • 0.15.0 é a última versão compatível com o Python 3.7.

  • Se estiver usando numpy < 1.19, utilize o TF-Agents 0.15.0 ou mais recente.

  • 0.9.0 é a última versão compatível com o Python 3.6.

  • 0.3.0 é a última versão compatível com o Python 2.x.

VersãoBranch / TagVersão do TensorFlowVersão dm-reverb
Noturnamastertf-nightlydm-reverb-nightly
0.17.0v0.17.02.13.00.12.0
0.16.0v0.16.02.12.00.11.0
0.15.0v0.15.02.11.00.10.0
0.14.0v0.14.02.10.00.9.0
0.13.0v0.13.02.9.00.8.0
0.12.0v0.12.02.8.00.7.0
0.11.0v0.11.02.7.00.6.0
0.10.0v0.10.02.6.0
0.9.0v0.9.02.6.0
0.8.0v0.8.02.5.0
0.7.1v0.7.12.4.0
0.6.0v0.6.02.3.0
0.5.0v0.5.02.2.0
0.4.0v0.4.02.1.0
0.3.0v0.3.01.15.0 e 2.0.0.

Princípios

Esse projeto adere aos princípios de IA do Google. Ao participar, usar ou contribuir com esse projeto, você deve seguir esses princípios.

Citação

Se você usar esse código, cite desta maneira:

@misc{TFAgents, title = {{TF-Agents}: A library for Reinforcement Learning in TensorFlow}, author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and Vincent Vanhoucke and Eugene Brevdo}, howpublished = {\url{https://github.com/tensorflow/agents}}, url = "https://github.com/tensorflow/agents", year = 2018, note = "[Online; accessed 25-June-2019]" }