Pythonでは、numpy
やpandas
パッケージのquantile()
関数を使用して四分位数を計算することができます。四分位数は、データセットを四等分する値で、Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)は、データの25%、50%、75%がそれぞれ以下になる値を指します。
例えば、データセットdata
の第一四分位数(上位四分位数)を求めるには、次のようにします。
import numpy as np
q1 = np.quantile(data, 0.25)
このコードは、データセットdata
の25%のデータがこの値以下になる値、つまり第一四分位数(上位四分位数)を求めます。
また、pandas
のデータフレームに対しても同様にquantile()
関数を使用することができます。例えば、データフレームdf
の列time_diff
の第一四分位数を求めるには、次のようにします。
q1 = df['time_diff'].quantile(0.25)
このように、Pythonを使用して四分位数を計算する方法は非常に簡単で、データ分析において重要な統計量を簡単に取得することができます。