파이썬
파이썬에서 BeautifulSoup를 사용하여 태그를 제거하는 방법
팁저장소
2022. 8. 3. 21:47
이 글에서 우리는 html에서 태그를 제거한 다음 태그와 그 내용을 완전히 파괴하는 파이썬 스크립트 초안을 작성할 것입니다. 이를 위해 모듈에 내장된 decompose() 메서드가 사용됩니다.
Beautifulsoup.Tag.decompose()
Tag.decompose()는 주어진 HTML 문서의 트리에서 태그를 제거한 다음 태그와 그 내용을 완전히 파괴합니다.
구현:
# 모듈 추가
from bs4 import BeautifulSoup
# html tag
text = '<p>태그 제거하기</p>'
soup = BeautifulSoup(text, 'html.parser')
# 제거 전
print("제거 전")
print(soup.p)
# 제거 후
new_tag = soup.p.decompose()
print("제거후:")
print(new_tag)
결과:
제거 전
<p>태그 제거하기</p>
제거 후:
없음