Pythonでは、文字列からURLを抽出するために正規表現を使用することが一般的です。以下にその一例を示します。
import re
def Find(string):
# findall() 正規表現に一致する文字列を検索する
url = re.findall('https?://(?:[-\\w.]|(?:%[\\da-fA-F]{2}))+', string)
return url
string = 'Ceodata のホームページは:https://www.ceodata.com,Google のホームページは:https://www.google.com'
print("Urls: ", Find(string))
このコードは、与えられた文字列からURLを抽出し、それらをリストとして返します。この例では、https://www.ceodata.com
とhttps://www.google.com
の2つのURLが抽出されます。
正規表現は非常に強力なツールであり、文字列のパターンマッチングに広く使用されています。しかし、その複雑さから理解や使用が難しいと感じることもあります。そのため、正規表現を理解し、適切に使用することで、Pythonでの文字列操作の可能性が大幅に広がります。
この記事がPythonでのURL抽出についての理解を深める助けになれば幸いです。