Pythonのデータ分析ライブラリであるPandasのDataFrameでは、各列が異なるデータ型を持つことがあります。この記事では、DataFrameの列のデータ型を確認し、必要に応じて型変換を行う方法を紹介します。
DataFrameの列のデータ型の確認
まずは、DataFrameの各列のデータ型を確認する方法から始めましょう。以下のコードを実行すると、各列のデータ型が表示されます。
import pandas as pd
df = pd.DataFrame({
"name": ["foo", "bar", "qux"],
"age": [20, 30, 40],
"score": [8.5, 9.2, 7.8]
})
print(df.dtypes)
このコードを実行すると、以下のような出力が得られます。
name object
age int64
score float64
dtype: object
この出力から、name
列はobject
型(文字列)、age
列はint64
型(整数)、score
列はfloat64
型(浮動小数点数)であることがわかります。
DataFrameの列のデータ型の変換
次に、DataFrameの列のデータ型を変換する方法を見ていきましょう。列のデータ型を変換するには、astype
メソッドを使用します。
以下のコードは、age
列のデータ型をfloat64
に変換します。
df["age"] = df["age"].astype("float64")
このコードを実行した後で再度df.dtypes
を実行すると、age
列のデータ型がfloat64
に変更されていることが確認できます。
以上が、PythonとPandasを使用してDataFrameの列のデータ型を確認し、変換する基本的な方法です。これらの知識を活用して、データ分析の作業をよりスムーズに進めてください。.