Pythonでは、NumPyのquantile
関数を使用してリストやpandasのDataFrame列の分位数を計算することができます。以下にその使用例を示します。
import numpy as np
# リストの作成
my_list = [8, 4, 4, 3, 2, 4, 1, 3, 5, 2, 1, 3, 7]
# リストの四分位数の計算
quartiles = np.quantile(my_list, q=np.arange(0.25, 1, 0.25))
print(quartiles) # 出力: [2. 3. 4.]
上記のコードでは、np.arange(0.25, 1, 0.25)
を使用して0.25、0.5、0.75の値を持つ配列を作成し、これをnp.quantile
関数のq
パラメータに渡しています。これにより、リストmy_list
の第1四分位数、中央値(第2四分位数)、第3四分位数が計算されます。
また、np.quantile
関数のq
パラメータに異なる配列を渡すことで、デシルやパーセンタイルなど、他の種類の分位数も計算することができます。
# デシルの計算
deciles = np.quantile(my_list, q=np.arange(0.1, 1, 0.1))
print(deciles) # 出力: [1.2 2. 2.6 3. 3. 4. 4. 4.6 6.6]
# パーセンタイルの計算
percentiles = np.quantile(my_list, q=np.arange(0.01, 1, 0.01))
print(percentiles)
このように、PythonとNumPyを使用すると、リストの各種分位数を簡単に計算することができます。これは、データ分析において非常に便利な機能です。.