Skip to content
/ rmtags Public

Removedor de tags HTML feito com regex no Python!

License

Notifications You must be signed in to change notification settings

TrexPD/rmtags

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

rmtags: REMOVEDOR DE TAGS HTML

Script feito com python para remover todas as tags HTML, deixando apenas o texto puro. Com suporte parcial a entidades do html, podendo ainda salvar o conteúdo final em um arquivo de texto!

Bibliotecas usadas:

re

Uso na prática:

Parametros:
- html: str = recebe o HTML no formato de strings!
- strip: bool = remove todos os espaços antes e depois dos caracteres! (por padrão "True")
- save_file: bool = Cria um arquivo de texto com o resultado final! (por padrão "False")
Chamando a função e entrando com os valores!
html = """<p>&gt;&gt;&gt;O <b>sistema circulatório</b> é o conjunto de órgãos responsáveis pela distribuição
de nutrientes para as <a href="/wiki/C%C3%A9lula" title="Célula">células</a> e coleta de
suas excretas metabólicas para serem eliminadas por órgãos excretores. Os órgãos que fazem
parte do sistema circulatório são:</p>"""

print(removedor_tags_html(html))
Ouput:
>>> O sistema circulatório é o conjunto de órgãos responsáveis pela distribuição de nutrientes para as células e coleta de suas excretas metabólicas para serem eliminadas por órgãos excretores. Os órgãos que fazem parte do sistema circulatório são:

🌟 Favorite este repositório 🌟

Criado com ❤️ e python por Paulo Daniel (TrexPD)!

About

Removedor de tags HTML feito com regex no Python!

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages