0 Pluspunkte 0 Minuspunkte

Wie kann ich mit Python aus dieser URL

https://www.google.com/search?sourceid=chrome-psyapi2&ion=1&espv=2&ie=UTF-8&q=mh4u%20items&oq=mh4u%20items&aqs=chrome.0.0l2j69j69i60j0l2.1754j0j7/url?q=https://www.w3schools.com/cssref/css3_pr_overflow-wrap.php/&sa=U&ei=n8NvVdSvBMOsyATSzYKoCQ&ved=0CEUQFjAL&usg=AFQjCNGyD5NjsqOncyLElJt9C0hqVQ7gyA

diesen Teil der URL auslesen?

https://www.w3schools.com/cssref/css3_pr_overflow-wrap.php/

von  

1 Antwort

0 Pluspunkte 0 Minuspunkte

Mit dem urllib Modul.

from urllib.parse import urlparse, parse_qs

google_url = "https://www.google.com/search?sourceid=chrome-psyapi2&ion=1&espv=2&ie=UTF-8&q=mh4u%20items&oq=mh4u%20items&aqs=chrome.0.0l2j69j69i60j0l2.1754j0j7/url?q=https://www.w3schools.com/cssref/css3_pr_overflow-wrap.php/&sa=U&ei=n8NvVdSvBMOsyATSzYKoCQ&ved=0CEUQFjAL&usg=AFQjCNGyD5NjsqOncyLElJt9C0hqVQ7gyA"

parsed_url = urlparse(google_url)
query_params = parse_qs(parsed_url.query)

extracted_url = query_params['aqs'][0].split('/url?q=')[1].split('&')[0]
print(extracted_url)
von (542 Punkte)