HTML als Text lesen in Python

Question

1 Antwort

Diese Community basiert auf dem Prinzip der Selbstregulierung. Beiträge werden von Nutzern erstellt, bewertet und verbessert – ganz ohne zentrale Moderation.

Wer hilfreiche Fragen stellt oder gute Antworten gibt, sammelt Punkte. Mit steigender Punktzahl erhalten Mitglieder automatisch mehr Rechte, zum Beispiel

Kommentare verfassen
Fragen und Antworten bewerten
Themen von Fragen bearbeiten
Fragen, Antworten und Kommentare bearbeiten
Inhalte ausblenden

So entsteht eine Plattform, auf der sich Qualität durchsetzt – getragen von einer engagierten Gemeinschaft.

Anonym · Answer 1

Um den reinen Textinhalt einer HTML-Seite zu extrahieren, ohne die HTML-Tags und -Elemente zu speichern, kannst du die sogenannte "Textextraktion" verwenden.

from bs4 import BeautifulSoup

html = """
<html>
<head>
<title>Beispiel</title>
</head>
<body>
<p>Hallo <span>Welt</span>.</p>
</body>
</html>
"""

soup = BeautifulSoup(html, 'html.parser')
text_content = soup.get_text()

print(text_content)

HTML als Text lesen in Python

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Deine Antwort

1 Antwort

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

HTML als Text lesen in Python

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Deine Antwort

1 Antwort

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Ähnliche Fragen