이 글에서 우리는 html에서 태그를 제거한 다음 태그와 그 내용을 완전히 파괴하는 파이썬 스크립트 초안을 작성할 것입니다. 이를 위해 모듈에 내장된 decompose() 메서드가 사용됩니다.
Beautifulsoup.Tag.decompose()
Tag.decompose()는 주어진 HTML 문서의 트리에서 태그를 제거한 다음 태그와 그 내용을 완전히 파괴합니다.
구현:
# 모듈 추가
from bs4 import BeautifulSoup
# html tag
text = '<p>태그 제거하기</p>'
soup = BeautifulSoup(text, 'html.parser')
# 제거 전
print("제거 전")
print(soup.p)
# 제거 후
new_tag = soup.p.decompose()
print("제거후:")
print(new_tag)
결과:
제거 전
<p>태그 제거하기</p>
제거 후:
없음
'파이썬' 카테고리의 다른 글
파이썬에서 입력 받기 (0) | 2022.08.03 |
---|---|
파이썬 pandas csv 파일 읽어서 특정 열 값 가져오기 (0) | 2022.08.03 |
파이썬 BeautifulSoup를 이용해 새로운 태그를 생성하는 방법 (0) | 2022.08.03 |
파이썬 시작하는 방법과 기본 튜토리얼 (0) | 2022.08.03 |
파이썬에서 줄 바꿈 없이 출력하는 방법은? (0) | 2022.08.03 |
최근댓글