Comment séparer HTML & Python code

Python est un langage de programmation orienté objet open-source optimisé pour la création d'applications Web dynamiques. Lors de la programmation en Python, vous pouvez avoir besoin de séparer le formatage du code Python HTML. Par exemple, un utilisateur peut entrer dans une page Web dans un champ de données, vous obligeant à dépouiller les balises HTML pour stocker les données textuelles. Pour supprimer les balises HTML à partir d'une chaîne de caractères, utilisez le "Regex." Built-in Python module Expression régulière

Instructions

1 Ouvrez votre éditeur Python.

2 Chargez le module Expression régulière en tapant ce qui suit:

import re

3 Définir une fonction pour supprimer toutes les balises HTML. Par exemple, tapez ce qui suit:

def delete_html (données):

4 Séparer les éléments de code HTML en utilisant la fonction "re.compile" pour compiler les modèles d'expression régulière dans un objet que vous pouvez utiliser pour le modèle correspondant. En reprenant l'exemple, tapez ceci:

htmlPattern = re.compile (r '<. *>')

Dans cet exemple, le "re.compile" attribut indique Python pour rechercher la chaîne " '<..>" qui signifie le début et la fin des balises HTML.

Le qualificatif ". *?" dit Python pour correspondre uniquement les tags. Sans le qualificatif, Python renvoie la chaîne "<h2> subhead </ h2>"; avec le qualificatif, Python retourne "<h2> et </ h2>."

5 Substituer un espace pour tout le code HTML en utilisant la fonction "sub". En reprenant l'exemple, tapez ce qui suit:

retour htmlPattern.sub ( '', données)

Dans ce cas, Python bandes sur le code HTML et le remplace par un espace vide. À ce stade, selon la façon dont vous voulez structurer les données, vous pouvez utiliser la fonction de chaîne "strip" pour supprimer les espaces vides ou utiliser des expressions régulières, telles que "\ s +," pour supprimer les espaces supplémentaires.