PythonのPandasライブラリを使用して、データフレーム内の特定の列のユニークな値を数える方法について説明します。以下に、いくつかの主要な方法を示します。
pandas.unique()を使用する
pandas.unique()
関数を使用して、特定の列のユニークな値を取得できます。以下に例を示します。
import pandas as pd
df = pd.DataFrame({
'height': [165, 165, 164, 158, 167, 160, 158, 165],
'weight': [63.5, 64, 63.5, 54, 63.5, 62, 64, 64],
'age': [20, 22, 22, 21, 23, 22, 20, 21]
}, index=['Steve', 'Ria', 'Nivi', 'Jane', 'Kate', 'Lucy', 'Ram', 'Niki'])
n = len(pd.unique(df['height']))
print("No.of.unique values :", n)
このコードは、データフレームdf
のheight
列のユニークな値の数を計算し、結果を出力します。
Dataframe.nunique()を使用する
Dataframe.nunique()
関数を使用すると、各列のユニークな値の数を計算できます。以下に例を示します。
import pandas as pd
df = pd.DataFrame({
'height': [165, 165, 164, 158, 167, 160, 158, 165],
'weight': [63.5, 64, 63.5, 54, 63.5, 62, 64, 64],
'age': [20, 22, 22, 21, 23, 22, 20, 21]
}, index=['Steve', 'Ria', 'Nivi', 'Jane', 'Kate', 'Lucy', 'Ram', 'Niki'])
n = df.nunique(axis=0)
print("No.of.unique values in each column :\n", n)
このコードは、データフレームdf
の各列のユニークな値の数を計算し、結果を出力します。
これらの方法を使用すると、PythonのPandasデータフレーム内の特定の列のユニークな値を効率的に数えることができます。これは、データ分析や前処理の際に非常に便利な機能です。