Pythonのデータ分析ライブラリであるPandasには、データをソートするための関数sort_values
があります。この関数は、SeriesでもDataFrameでも使用でき、データ型の違いを気にせずに利用できる利点があります。
sort_values関数の基本的な使い方
sort_values
関数は、以下のように使用します。
# 昇順でソート
dataframe.sort_values('column_name')
# 降順でソート
dataframe.sort_values('column_name', ascending=False)
ここで、dataframe
はPandasのDataFrameオブジェクト、column_name
はソートしたい列の名前を指定します。
sort_values関数の詳細な使い方
sort_values
関数は、さまざまなパラメータを指定して、より詳細なソートを行うことができます。
昇順・降順の指定
ascending
パラメータを使用して、昇順(True
)または降順(False
)を指定できます。
# 昇順でソート
dataframe.sort_values('column_name', ascending=True)
# 降順でソート
dataframe.sort_values('column_name', ascending=False)
NaN値の位置の指定
na_position
パラメータを使用して、NaN値を先頭('first'
)または最後尾('last'
)に置くことができます。
# NaN値を先頭に置く
dataframe.sort_values('column_name', na_position='first')
# NaN値を最後尾に置く
dataframe.sort_values('column_name', na_position='last')
ソート結果の反映
inplace
パラメータをTrue
に設定すると、ソート結果が元のDataFrameに反映されます。
# ソート結果を元のDataFrameに反映
dataframe.sort_values('column_name', inplace=True)
以上、PythonのPandasライブラリのsort_values
関数の使い方について解説しました。この関数を使えば、データ分析時にデータを簡単にソートすることができます。.