PythonにおけるNaN(Not a Number)は、IEEE 754規格の浮動小数点数の特殊な値で、数学的に未定義の演算結果を表します。NaNの特性を理解することは、データ解析や機械学習のプロジェクトを進める上で重要です。
NaNの生成方法
PythonにおいてNaNはfloat型で表現され、直接 float ('nan')
を使って生成できます。例えば、0で割る演算0.0 / 0.0
や、無限大の減算float ('inf') - float ('inf')
などです。
import math
# 0で割る演算
result = 0.0 / 0.0
print(result) # NaN
# 無限大の減算
result = float('inf') - float('inf')
print(result) # NaN
# mathモジュールのnan関数を使ってもNaNを生成できる
result = math.nan
print(result) # NaN
NaNの判定方法
NaNは数値ではないため、通常の比較演算子では正しく判定できないからです。Pythonのmathモジュールには isnan ()
という関数があります。これはNaNを判定するための関数です。
import math
print(math.isnan(float('nan'))) #True
NumPyもまた、 isnan ()
関数を提供しています。リストや配列など、複数の要素を一度に判定する際に便利です。
import numpy
print(numpy.isnan(numpy.array([1.0, numpy.nan, 3.0])))
#array([False, True, False])
NaNをリストから削除・置換する方法
PythonのリストからNaNを削除する場合、 isnan ()
関数とリスト内包表記を組み合わせられます。
import math
# リストの作成(NaNを含む)
my_list = [1.0, 2.0, float('nan'), 3.0, float('nan'), 4.0]
# NaNを削除した新しいリストの作成
new_list = [x for x in my_list if not math.isnan(x)]
print(new_list)
以上がPythonでNaNを扱う基本的な方法です。これらの知識を活用して、データ分析や機械学習のプロジェクトを進めていきましょう。