Taller de Web Scraping LWSC 2011
De WikiEducator
Actividad
Configuración del entorno
$ sudo pip install http://files.akara.info/00-amara-latest.tar.bz2 Tip: Es necesario tener instalado un compilador de C y la cabeceras de python (en debian/ubuntu hay que instalar python-dev)
|
{{Actividad| TOCdepth=2| Title=Lectura básica de un documento|
from amara.bindery import html
URL = 'http://mypage.com'
doc = html.parse(URL)
}}