TensorFlow Agents
TensorFlowによる強化学習
エージェントは、変更および拡張が可能な十分にテストされたモジュール式コンポーネントを提供するため、新しい強化学習アルゴリズムの設計、実装、およびテストが容易になります。また、優れたテストの統合とベンチマークにより、コードのイテレーションが大幅に高速化されます。
はじめるには、チュートリアルをご確認ください。
インストール
TF-Agent は毎晩安定したビルドを公開します。リリースのリストについては、リリースセクションを参照してください。以下のコマンドを実行すると、pypi.org、または、GitHub クローンから、TF-Agent ステーブル版を毎晩インストールできます。
:警告: Reverb(リプレイバッファ)の使用は非常に一般的ですが、この場合、TF-Agents は Linux でしか動作しません。
注意: Python 3.11 には pygame 2.1.3+ が必要です。
ステーブル版
以下のコマンドを実行して、最新の安定版リリースをインストールします。このリリースの API ドキュメントは tensorflow.org からご覧いただけます。
Tensorflow のバージョン、または、pip 依存関係チェックで互換性がないとフラグが付けられている Reverb で TF-Agents をインストールする場合、自己責任で以下のパターンを使用してください。
TensorFlow 1.15 または 2.0 で TF-Agents を使用する場合は、バージョン 0.3.0 をインストールします。
ナイトリービルド
ナイトリービルドには新しい機能が含まれていますが、バージョン付きのリリースよりも安定性が低い場合があります。ナイトリ―ビルドは、tf-agents-nightly
としてプッシュされます。TensorFlow のナイトリーバージョン (tf-nightly
) と TensorFlow Probability (tfp-nightly
) のインストールをお勧めします。これらは TF-Agents ナイトリ―がテストされるバージョンです。
ナイトリービルドバージョンをインストールするには、次のコマンドを実行します。
GitHub から
リポジトリのクローンを作成したら、pip install -e .[tests]
を実行して依存関係をインストールできます。TensorFlow はpip install --user tf-nightly
を実行して個別にインストールする必要があります。
コントリビューション
TensorFlow では皆様からのコントリビューションを歓迎しています。コントリビューションについてのガイドは、CONTRIBUTING.md
をご覧ください。このプロジェクトは、TensorFlow の行動規範に準拠しています。参加することにより、このコードに準拠することに同意したことになります。
リリース
TF Agents には安定版とナイトリーリリースがあります。多くの場合ナイトリーリリースを使用しても問題はありませんが、上流のライブラリが変動するため、問題が発生する可能性もあります。以下の表は、各 TF Agents リリースに対応する TensorFlow のバージョンを示しています。関連するリリースバージョンは以下のとおりです。
0.16.0 は Python 3.11 をサポートした最初のバージョンです。
0.15.0 は Python 3.7 に対応する最後のリリースです。
Numpy < 1.19 を使用している場合は、TF-Agents 0.15.0 およびそれ以前のリリースを使用してください。
0.9.0 は Python 3.6 に対応する最後のリリースです。
0.3.0 は Python 2.x. に対応する最後のリリースです。
リリース | ブランチ/タグ | TensorFlow バージョン | dm-reverb バージョン |
---|---|---|---|
ナイトリー | マスター | tf-nightly | dm-reverb-nightly |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 and 2.0.0. |
原則
このプロジェクトは、Google の AI 原則に準拠しています。 このプロジェクトに参加、使用、またはコントリビューションすることにより、これらの原則を遵守することに同意されたものとします。
引用
このコードを使用する場合は、次のように表記してください。