PythonはUnicodeの仕様をサポートしており、テキストデータを表現するための様々な問題を解決します。Pythonの文字列型はUnicode標準を使用して文字を表現し、Pythonプログラムはこれらの異なる可能性のある文字すべてを扱うことができます。
Unicodeは、人間の言語で使用されるすべての文字をリストし、各文字に一意のコードを割り当てることを目指す仕様です。Unicodeの仕様は、新しい言語やシンボルを追加するために継続的に改訂され、更新されています。
Python 3.0以降、言語のstr型にはUnicode文字が含まれており、”unicode rocks!”、’unicode rocks!’、または三重引用符の文字列構文を使用して作成された任意の文字列はUnicodeとして保存されます。
PythonのUnicodeサポートは強力で堅牢ですが、マスターするには時間がかかります。このチュートリアルはPython中心に設計されており、Pythonのコード例を通じて文字エンコーディングの概念をどのように使用するかを見ることができます。
以下に、Unicode標準に含まれる文字と対応するコードポイントの一部を示します:
0061 'a'; LATIN SMALL LETTER A
0062 'b'; LATIN SMALL LETTER B
0063 'c'; LATIN SMALL LETTER C
...
007B '{'; LEFT CURLY BRACKET
...
2167 'Ⅷ'; ROMAN NUMERAL EIGHT
2168 'Ⅸ'; ROMAN NUMERAL NINE
...
265E '♞'; BLACK CHESS KNIGHT
265F '♟'; BLACK CHESS PAWN
...
1F600 '\uD83D\uDE00'; GRINNING FACE
1F609 '\uD83D\uDE09'; WINKING FACE
...
これらの情報を利用して、PythonでUnicode文字を効果的に使用する方法を理解することができます。.