Pythonのデータ分析ライブラリであるPandasには、データの中身をソートする機能が備わっています。その中でも、sort_values
関数は特に便利で、SeriesでもDataFrameでも使用することができます。
sort_values関数の基本的な使い方
まずは、sort_values
関数の基本的な使い方を見てみましょう。以下に、Seriesのデータをソートする例を示します。
import pandas as pd
import numpy as np
series = pd.Series([7,3,1,np.nan,0,-12,5])
sorted_series = series.sort_values()
print(sorted_series)
このコードを実行すると、Seriesのデータが昇順(小さい順)にソートされます。
DataFrameでのsort_values関数の使い方
次に、DataFrameでsort_values
関数を使う方法を見てみましょう。DataFrameでsort_values
関数を使う場合、必ずby
引数を指定して、どの列のデータを使ってソートするかを指定する必要があります。
data = {
"a": [3,1,-5,3,8,1,np.nan,0,-1],
"b": ["a","b","A","G","k","C","c","cc","d"]
}
df = pd.DataFrame(data)
sorted_df = df.sort_values(by="a")
print(sorted_df)
このコードを実行すると、DataFrameのデータが列”a”の値に基づいて昇順にソートされます。
以上が、PythonのPandasライブラリのsort_values
関数の基本的な使い方です。この関数を使うことで、データ分析時にデータを効率的にソートすることが可能になります。.