PythonのライブラリであるPandasは、データ分析を効率的に行うためのツールです。CSVファイルやExcelファイルなどのデータを読み込み、操作することができます。
Pandasのインストール
PythonでPandasを使用するためには、まずPandasをインストールする必要があります。最新版はpipを用いてインストールすることができます。
pip install pandas
Pandasの基本的なデータ型
Pandasでは、主に以下の2つのデータ型を使用します。
- Series: 1次元のデータ
- DataFrame: 2次元のデータ
Seriesの作成
Seriesは1次元のデータで、以下のように作成します。
import pandas as pd
s = pd.Series([1, 11, 111, 1111])
print(s)
DataFrameの作成
DataFrameは2次元のデータで、以下のように作成します。
import pandas as pd
df = pd.DataFrame({
'プログラム言語' :['Python', 'Ruby', 'Go'],
'経験年数' : [1, 1, 2],
'年収' : [3000000, 2800000, 16900000]
})
print(df)
データの取り出し方
Pandasでは、データの取り出し方にはいくつかの方法があります。
locとiloc
loc
とiloc
を使用して、特定の「列と行」のデータを取得することができます。
loc
: 行の名前、列の名前を指定しますiloc
: 行の番号、列の番号で指定します
print(df.loc[0:2,'プログラム言語']) # locを使用した例
以上がPythonとPandasの基本的な使い方になります。これらの基本を押さえつつ、さらに詳細な操作方法を学んでいくことで、より効率的なデータ分析が可能になります。.