Pythonのpandas
ライブラリには、DataFrame
という強力なデータ構造があります。これは2次元の表形式のデータを処理するためのもので、データ分析作業において非常に便利です。
特に、def
関数を使用して自分自身の関数を定義し、それをDataFrame
全体に適用することが可能です。これにより、データの変換や加工を行う際に大変便利です。
例えば、以下のように特定の処理を行う関数を定義し、それをDataFrame
の各セルに適用することができます。
def f(x):
if x > 45:
val = x + 100
return val
df = df.applymap(f)
また、DataFrame
を作成する方法はいくつかあり、リストのリストや辞書のリストから作成することができます。さらに、dataclass
やnamedtuple
からもDataFrame
を作成することが可能です。
import pandas as pd
from dataclasses import dataclass
@dataclass
class Point:
x: int
y: int
p1 = Point(1, 2)
p2 = Point(3, 4)
l = [p1, p2]
df = pd.DataFrame(l)
このように、PythonとDataFrame
を活用することで、データ分析作業をより効率的に、そして柔軟に行うことが可能です。これらの知識を活用して、Pythonでのデータ分析を更に深めていきましょう。.