Path: blob/master/site/ja/lite/models/convert/operation_fusion.md
25118 views
TensorFlow 演算の融合
概要
このページでは、TensorFlow の複合演算を TensorFlow Lite の融合演算に変換するために必要な設計とステップを説明します。このインフラストラクチャは汎用であり、TensorFlow のあらゆる複合演算を TensorFlow Lite の対応する融合演算に変換する操作をサポートしています。
このインフラストラクチャの使用例では、こちらに説明される通りに、TensorFlow RNN 演算を TensorFlow Lite に融合しています。
融合演算とは
TensorFlow 演算は、tf.add のような原子演算であるか、tf.einsum などのほかの原子演算から作成することができます。原子演算は、TensorFlow グラフでは単一ノードとして現れますが、複合演算は TensorFlow グラフではノードのコレクションです。複合演算を実行することは、それを構成する原子演算をそれぞれ実行することに相当します。
融合演算は、対応する複合演算内の各原子演算が実行するすべての計算を組み込んだ単一の演算です。
融合演算のメリット
融合演算は、根底にあるカーネル実装のパフォーマンスを最大化するために存在しており、計算全体を最適化し、メモリのフットプリントを縮小することで実現されます。特に、低レーテンシ推論ワークロードとリソース制限のあるモバイルプラットフォームにおいて非常に有益です。
融合演算は、量子化といった複雑な変換を定義するためのより高レベルのインターフェースも提供します。これがない場合、より粒度の高いレベルで実行することが不可能でなかったとしても、非常に困難となります。
TensorFlow Lite には、前述の理由により、融合演算のインスタンスが多数あります。こういった融合演算は通常、ソース TensorFlow プログラムの複合演算に対応しています。TensorFlow Lite で単一の融合演算として実装されている TensorFlow の複合演算には、単方向および双方向シーケンスLSTM、畳み込み(conv2d、バイアス加算、relu)、完全接続(matmul、バイアス加算、relu)などのさまざまな RNN 演算などの例があります。TensorFlow Lite では現在のところ、LSTM 量子化は融合 LSTM 演算にのみ実装されています。
融合演算の課題
複合演算を TensorFlow から TensorFlow Lite の融合演算に変換するのは、難しい問題です。これには次の理由があります。
複合演算は、TensorFlow グラフで十分に定義された境界のない原子演算のセットとして表されています。このような複合演算に対応するサブグラフを(パターンマッチなどで)特定することは非常に困難です。
融合 TensorFlow Lite 演算をターゲットとする TensorFlow 実装が 1 つ以上存在する可能性があります。たとえば、TensorFlow には多数の LSTM 実装(Keras、Babelfish/lingvo など)があり、それぞれが異なる原子演算で構成されてはいますが、TensorFlow Lite では同一の融合 LSTM 演算に変換される可能性があります。
そのため、融合演算の変換は、難易度が非常に高いことが証明されています。
複合演算から TFLite カスタム演算に変換する (推奨)
複合演算を tf.function
でラッピングする
多くの場合、モデルの一部の部分を TFLite の単一の演算にマッピングできます。これにより、特定の演算の最適化された実装を作成するときに、パフォーマンスが改善されます。TFLite で融合演算を作成するには、融合演算を表すグラフの部分を特定し、tf.function
と "experimental_implements" 属性で、tfl_fusable_op
と値 true
の tf.function
にマッピングします。カスタム演算が属性を取る場合は、同じ "experimental_implements" の部分として属性を渡します。
例
コンバータで allow_custom_ops
を設定する必要はありません。tfl_fusable_op
属性には、この設定がすでに含まれています。
カスタム演算の実装と TFLite インタープリタでの登録
融合演算を TFLite カスタム演算として実装します。手順を参照してください。
演算を登録する名前は、実装シグネチャの name
属性で指定した名前に近い名前にしてください。
演算の例を示します。
複合演算から融合演算に変換する (上級)
TensorFlow 複合演算から TensorFlow Lite 融合演算への変換をおこなうための全体的なアーキテクチャは、次のようになっています。
複合演算を tf.function
でラッピングする
TensorFlow モデルのソースコードで、複合演算を特定し、それを experimental_implements 注釈を使って tf.function
に抽象化します。埋め込みルックアップの例をご覧ください。この関数はインターフェースを定義し、変換ロジックにその引数が使用されます。
変換コードを書く
変換コードは、implements
注釈を使って、関数のインターフェースに従って記述されます。埋め込みルックアップの例をご覧ください。概念的には、変換コードによってこのインターフェースの複合実装が融合実装に置き換えられることになります。
prepare-composite-functions パスに、変換コードをプラグインしましょう。
より高度な使用例では、融合演算のオペランドを導出するために、複合演算のオペランドの複雑な変換を実装することが可能です。例として、Keras LSTM 変換コードをご覧ください。
TensorFlow Lite に変換する
TFLiteConverter.from_saved_model API を使用して、TensorFlow Lite に変換します。
内部動作
それでは、TensorFlow Lite の融合演算への変換に高レベルの設計全体の詳細を説明します。
TensorFlow で演算を記述する
tf.function
を experimental_implements 関数の属性で使用することで、TensorFlow の原子演算を使用sh知恵新しい演算を明示的に記述し、その結果として形成される複合演算が実装するインターフェースを指定することができます。これは次の項目を提供するため、非常に有用です。
根底の TensorFlow グラフにおける複合演算の十分に定義された境界。
この演算が実装するインターフェースを明示的に指定できる。
tf.function
の引数は、このインターフェースの引数に対応します。
例として、埋め込みルックアップを実装するために定義される複合演算を考察してみましょう。これは、TensorFlow Lite の融合演算にマッピングします。
上記に示すように、tf.function
を使ってモデルが複合演算を使用するようにすることで、このような演算を融合 TensorFlow Lite 演算に特定して変換する一般的なインフラストラクチャを構築することが可能となります。
TensorFlow Lite コンバータを拡張する
今年前期にリリースされた TensorFlow Lite コンバータは、TensorFlow モデルを、すべての変数が対応する低数値と置き換えられた状態でグラフとしてインポートすることだけだサポートされていました。こういったグラフでは、変数が定数に変換されるようにすべての関数がインライン化されているため、演算の融合には有用ではありませんでした。
変換プロセス中に tf.function
を experimental_implements
機能で利用するには、関数は、後の変換プロセスまで維持される必要があります。
そのため、複合演算の融合の使用事例をサポートするように、コンバータにおける TensorFlow モデルのインポートと変換の新しいワークフローを実装しました。具体的には、新しい機能として次の項目が追加されています。
TensorFlow の SavedModel を MLIR にインポートする
これにより、関数がインライン化する前、そして変数が凍結する前に複合演算を表現する関数を使用して演算の融合を実行することが可能となります。
演算の融合を実装する
演算の融合パスをより詳しく見てみましょう。このパスは、次のことを行います。
MLIR モジュールのすべての関数をループする。
関数に tf._implements 属性がある場合、属性の値に基づいて、適切な演算の融合ユーティリティを呼び出す。
演算の融合ユーティリティは、関数のオペランドと属性で演算(変換のインターフェースとして機能)し、関数の本文を融合演算を含む同等の関数本文に置き換える。
多くの場合、置き換えられた本文には、融合演算の以外の演算が含まれる。この演算は、融合演算のオペランドを取得するために、関数のオペランドでの静的変換に対応しています。この計算はすべて定数で折り畳めるため、融合演算のみが存在するエクスポートされた Flatbuffer には存在しません。
次は、メインのワークフローを示す、このパスのコードスニペットです。
次は、関数を変換インターフェースとして使用し、この複合演算を TensorFlow Lite の融合演算にマッピングする方法を示すコードスニペットです。