Pythonのデータ分析ライブラリであるPandasには、Seriesという1次元のデータ構造があります。この記事では、PandasのSeriesで平均値を計算する方法について解説します。
Pandasのmean関数
PandasのSeriesには、mean
という関数があります。この関数は、Seriesのデータの平均値を計算します。
# Seriesの作成
import pandas as pd
s = pd.Series([1, 2, 3, 4, 5])
# 平均値の計算
average = s.mean()
print(average) # 出力: 3.0
このように、mean
関数を使用すると、Seriesのデータの平均値を簡単に計算することができます。
NaN値の扱い
mean
関数は、デフォルトではNaN値(欠損値)を無視して平均値を計算します。しかし、NaN値を無視せずに平均値を計算したい場合は、skipna=False
と指定します。
# NaN値を含むSeriesの作成
s = pd.Series([1, 2, 3, 4, 5, None])
# NaN値を無視しないで平均値を計算
average = s.mean(skipna=False)
print(average) # 出力: NaN
このように、skipna=False
を指定すると、SeriesのデータにNaN値が含まれている場合、平均値もNaNとなります。
まとめ
この記事では、PythonのPandasライブラリを使用して、Seriesのデータの平均値を計算する方法について解説しました。データ分析を行う際には、平均値の計算は非常に重要な操作の一つです。Pandasのmean
関数を使うことで、簡単に平均値を計算することができます。.