Googleスプレッドシートは、データの共有や管理に非常に便利なツールです。Pythonを使ってGoogleスプレッドシートのデータを取得する方法を紹介します。
必要なパッケージ
Googleスプレッドシートのデータにアクセスするために、gspread
というパッケージを利用します。Google公式が提供しているパッケージよりも必要なデータにアクセスする処理がシンプルなので、こちらをおすすめします。
pip install gspread
GCPAuth情報の取得方法
Spreadsheet APIでは、GCPのAuth情報が必須になります。そのため、GCPのAuth情報を取得するための手順を記載します。
サンプルコード
次にPythonを利用してGoogle Spreadsheetの情報を取得するサンプルコードを記載します。
import pandas as pd
import numpy as np
import gspread
from oauth2client.service_account import ServiceAccountCredentials
import pytz
from google.cloud import storage
import os
Auth = 認証用のJsonファイルのPath
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = Auth
storage_client = storage.Client()
buckets = list(storage_client.list_buckets())
scope = ['https://spreadsheets.google.com/feeds','https://www.googleapis.com/auth/drive']
credentials = ServiceAccountCredentials.from_json_keyfile_name(Auth, scope)
Client = gspread.authorize(credentials)
このコードは、Googleスプレッドシートのデータを取得し、それをPythonのDataFrameに変換します。これにより、データの加工や分析が容易になります。
まとめ
Pythonを使ってGoogleスプレッドシートのデータを取得する方法を紹介しました。これにより、Googleスプレッドシートをデータソースとして活用することが可能になります。さらなるデータ分析のために、このテクニックをぜひ活用してみてください。