Trabajo con ficheros xml / html
De WikiEducator
< Usuario:Lmorillas | intropyaytozgz
Revisión a fecha de 02:15 11 dic 2012; Lmorillas (Discusión | contribuciones)
Amara
- http://wiki.xml3k.org/Amara (Tutorial)
- Tiene dos interfaces:
-
Una muy rápida y con una sintaxis más cercana al xml
import amara URL = '....' # URL puede ser una url, una ruta de un fichero o una cadena de texto doc = amara.parse(URL)
-
Otra más amigable y fácil de utilizar, que convierte el xml en objetos python.
from amara import bindery URL = '....' doc = bindery.parse(URL)
# si el html o xml puede no ser válido: from amara.bindery import html URL = '....' doc = html.parse(URL)
Instalar
Para instalar la última versión:
$ pip install -i http://pypi.zepheira.com/releases/index Amara
O descargar, descomprimir y ejecutar dentro del directorio de amara:
$ python setup.py install
Tip: Es necesario tener instalado un compilador de C y la cabeceras de python (en debian/ubuntu hay que instalar python-dev