Pythonのurllib.parse
モジュールは、URLをその構成要素に分解したり、構成要素をURL文字列に組み合わせたりするための標準インターフェースを定義しています。
このモジュールは、URLの解析とURLの引用の2つの広範なカテゴリに分けられる関数を定義しています。
URLの解析
URL解析関数は、URL文字列をその構成要素に分割したり、URL構成要素をURL文字列に組み合わせたりすることに焦点を当てています。
例えば、urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)
関数は、URLを6つの構成要素に解析し、6項目の名前付きタプルを返します。これはURLの一般的な構造に対応しています: scheme://netloc/path;parameters?query#fragment
。
各タプル項目は文字列で、可能な限り空です。構成要素はより小さな部分に分割されず、%エスケープは展開されません。
URLのデコード
URLをデコードするには、urllib.parse.unquote()
関数を使用します。この関数は、URLエンコードされた文字列を受け取り、デコードされた文字列を返します。
以下に、URLをデコードするためのPythonコードの例を示します。
from urllib.parse import unquote
url = "https%3A%2F%2Fwww.example.com%2F"
decoded_url = unquote(url)
print(decoded_url) # https://www.example.com/
このコードは、URLエンコードされた文字列https%3A%2F%2Fwww.example.com%2F
をデコードし、デコードされたURLhttps://www.example.com/
を出力します。
以上がPythonのurllib.parse
モジュールを使ったURLのデコードについての説明です。このモジュールを使うことで、URLの解析やデコードを簡単に行うことができます。