Pythonのデータ分析用ライブラリであるPandasは、データフレームという2次元の表形式のデータ構造を提供しています。このデータフレームは、様々な方法でソート(並び替え)することが可能です。
データフレームの作成
まずは、適当なデータフレームを作成します。以下の例では、商品のID、名前、価格、数量を持つデータフレームを作成しています。
import pandas as pd
sales_list = [
["P001", "iPhone 8 64GB", 85000, 1],
["P002", "iPhone X 256GB", 260000, 2],
["P003", "iPhone SE 32GB", 37000, 1],
["P002", "iPhone X 256GB", 130000, 1]
]
columns = ["Product ID", "Product Name", "Amount (JPY)", "Qty"]
df = pd.DataFrame(data=sales_list, columns=columns)
列の値によるソート
指定した列の値によるソートは、sort_values
メソッドを使用します。以下の例では、”Amount (JPY)”列の値を元に昇順にソートしています。
df.sort_values(by="Amount (JPY)")
降順にソートしたい場合は、ascending=False
を指定します。
df.sort_values(by="Amount (JPY)", ascending=False)
複数の列をキーにソートする場合は、複数の列名をリストで指定します。以下の例では、”Product ID”と”Amount (JPY)”の2つの列を元にソートしています。
df.sort_values(by=["Product ID", "Amount (JPY)"])
インデックスによるソート
インデックスによるソートは、sort_index
メソッドを使用します。以下の例では、インデックスをアルファベット順に並べています。
df.sort_index()
逆にしたいときは、ascending=False
を指定します。
df.sort_index(ascending=False)
以上がPythonとPandasを使ったデータフレームのソートの基本的な方法です。これらの方法を活用することで、データの分析や処理をより効率的に行うことができます。.