Comment lire une page web en utilisant Python

Cela va vous montrer comment lire une page Web à partir d'un script python donné une URL.

Instructions

1 Installez le constructeur de python à partir d'ici. Ce est gratuit.

http://www.python.org/download/releases/2.5.2/

2 Après avoir installé Python vous pouvez l'exécuter à partir du menu de démarrage

Python 2.5 - IDLE (Python GUI)

3 Une fois que l'application ouvre, il ressemble à bloc-notes. Sélectionnez un fichier dans le menu en haut et une nouvelle fenêtre. Cela va ouvrir une nouvelle fenêtre de texte que vous pouvez enregistrer votre code python.

4 Comment lire une page web en utilisant Python
Copiez le code de suivi dans la nouvelle fenêtre qui vient d'ouvrir.

shutil d'importation
import os
temps d'importation
import datetime
mathématiques à l'importation
urllib d'importation
du réseau d'importation de tableau

filehandle = urllib.urlopen ( 'http://www.loothog.com')

pour les lignes en filehandle.readlines ():

print lines

filehandle.close ()

5 Sélectionnez Fichier - Enregistrer et nommez votre fichier que vous voulez.

6 Appuyez sur F5 pour exécuter votre code.

Pour arrêter le programme d'exécution, cliquez sur la première fenêtre ouverte et sélectionnez dans le menu Shell - Redémarrer Shell

7 Vous pouvez enregistrer toutes ces lignes dans un fichier texte en modifiant le code pour ressembler à ceci.

myFile = open ( 'test.html', 'w')
pour les lignes en filehandle.readlines ():

print lines
myFile.write(lines)

myFile.close ()
filehandle.close ()

8 Comment lire une page web en utilisant Python


Peut-être que vous avez des cotations boursières qui ressemblent à ceci
AAAC, D, 20071210,8.2,8.2,8.2,9.5,1000

et vous voulez obtenir le prix proche de 9,5, alors vous pouvez diviser la ligne par les virgules et l'accès seulement 9,5 comme celui-ci

myFile = open ( 'test.html', 'w')
pour les lignes en filehandle.readlines ():

section = lines.split(',')
print str(sections[6].strip())
myFile.write(str(sections[6].strip()))

myFile.close ()
filehandle.close ()

Remarque: La str () convertit le nombre en une chaîne et l'.strip () va enlever espaces supplémentaires à la fin.

Conseils et avertissements

  • Les lignes après "pour les lignes à filehandle.readlines ():" sont en retrait de 5 places.