Path: blob/master/site/ko/io/tutorials/bigquery.ipynb
25118 views
Copyright 2019 The TensorFlow IO Authors.
BigQuery TensorFlow 리더의 엔드 투 엔드 예제
개요
이 가이드에서는 Keras 순차 API를 사용하여 신경망을 훈련하기 위한 BigQuery TensorFlow 리더의 사용 방법을 보여줍니다.
데이터세트
이 튜토리얼에서는 UC Irvine Machine Learning Repository에서 제공하는 United States Census Income 데이터세트를 사용합니다. 이 데이터세트에는 연령, 학력, 결혼 상태, 직업 및 연간 수입이 $50,000 이상인지 여부를 포함하여 1994년 인구 조사 데이터베이스에 있는 사람들에 대한 정보가 포함되어 있습니다.
설정
GCP 프로젝트 설정하기
노트북 환경과 관계없이 다음 단계가 필요합니다.
아래 셀에 프로젝트 ID를 입력합니다. 그런 다음 셀을 실행하여 Cloud SDK가 이 노트북의 모든 명령에 올바른 프로젝트를 사용하는지 확인합니다.
참고: Jupyter는 앞에 !
가 붙은 줄을 셸 명령으로 실행하고 앞에 $
가 붙은 Python 변수를 이러한 명령에 보간하여 넣습니다.
필수 패키지를 설치하고 런타임을 다시 시작합니다.
인증합니다.
프로젝트 ID를 설정합니다.
Python 라이브러리를 가져오고 상수를 정의합니다.
BigQuery로 인구 조사 데이터 가져오기
BigQuery에 데이터를 로드하는 도우미 메서드를 정의합니다.
BigQuery에서 인구 조사 데이터를 로드합니다.
가져온 데이터를 확인합니다.
수행할 작업: 를 PROJECT_ID로 바꿉니다.
참고: --use_bqstorage_api는 BigQueryStorage API를 사용하여 데이터를 가져오고 사용 권한이 있는지 확인합니다. 프로젝트에 이 부분이 활성화되어 있는지 확인합니다(https://cloud.google.com/bigquery/docs/reference/storage/#enabling_the_api).
##BigQuery 리더를 사용하여 TensorFlow DataSet에 인구 조사 데이터 로드하기
BigQuery에서 인구 조사 데이터를 읽고 TensorFlow DataSet로 변환합니다.
##특성 열 정의하기
##모델 빌드 및 훈련하기
모델을 빌드합니다.
모델을 훈련합니다.
##모델 평가하기
모델을 평가합니다.
몇 가지 무작위 샘플을 평가합니다.