Path: blob/master/site/ja/io/tutorials/bigquery.ipynb
25118 views
Copyright 2019 The TensorFlow IO Authors.
BigQuery TensorFlow リーダーのエンドツーエンドの例
概要
このチュートリアルでは、Keras シーケンス API を使用してニューラルネットワークをトレーニングするために BigQuery TensorFlow リーダーを使用する方法を説明します。
データセット
このチュートリアルでは、カリフォルニア大学アーバイン校の機械学習リポジトリが提供する米国国勢調査所得データセットを使用します。このデータセットには 1994 年の国税調査データベースに記録される市民の年齢、学歴、婚姻状況、職業、および年収が 50,000 ドルを超えるかという情報が含まれています。
セットアップ
GCP プロジェクトをセットアップします。
次の手順は、ノートブックの環境に関係なく必要な手順です。
以下のセルにプロジェクト ID を入力してセルを実行し、このノートブックのすべてのコマンドにおいて、Cloud SDK が正しいプロジェクトを使用することを確認します。
注意: Jupyter は、シェルコマンドとして接頭辞 !
のある行を実行し、接頭辞 $
のある Python 変数をこれらのコマンドに補間します。
必要なパッケージをインストールし、ランタイムを再起動します。
認証します。
プロジェクト ID を設定します。
Python ライブラリをインポートして、定数を定義します。
国税調査データを BigQuery にインポートする
データを BigQuery に読み込むヘルパーメソッドを定義します。
国税調査データを BigQuery に読み込みます。
データがインポートされたことを確認します。
作業: をご利用の PROJECT_ID に置き換えます。
注意: --use_bqstorage_api は、BigQueryStorage API を使用してデータを取得し、それを使用する許可が与えられていることを確認するため、プロジェクトで有効化されていることを確認してください。https://cloud.google.com/bigquery/docs/reference/storage/#enabling_the_api
##BigQuery リーダーを使用して、TensorFlow DataSet に国税調査データを読み込む
BigQuery から TensorFlow Dataset に国税調査データを読み出して変換します。
##特徴量カラムを定義する
##モデルを構築してトレーニングする
モデルを構築します。
モデルをトレーニングします。
##モデルを評価する
モデルを評価します。
ランダムなサンプルをいくつか評価します。