Diferencia entre revisiones de «LSWC scraping the web/taller scraping lwsc 2011»

De WikiEducator
Saltar a: navegación, buscar
(Página creada con '{{MiTitulo| Taller de Web Scraping LWSC 2011}} {{Objetivo| * Introducción a las técnicas básicas de scraping usando [http://www.python.org Python] y [http://www.xml3k.org/Am…')
 
Línea 2: Línea 2:
  
 
{{Objetivo|
 
{{Objetivo|
 +
TOCdepth=2|
 
* Introducción a las técnicas básicas de scraping usando [http://www.python.org Python] y [http://www.xml3k.org/Amara Amara]
 
* Introducción a las técnicas básicas de scraping usando [http://www.python.org Python] y [http://www.xml3k.org/Amara Amara]
 
* Herramientas de ayuda (firebug, curl, ...)
 
* Herramientas de ayuda (firebug, curl, ...)
 +
}}
 +
 +
{{Actividad|
 +
TOCdepth=2|
 +
Title=Configuración del entorno|
 +
* Instalación de amara
 +
$ sudo pip install http://files.akara.info/00-amara-latest.tar.bz2
 +
{{Tip|Es necesario tener instalado un compilador de C y la cabeceras de python (en debian/ubuntu hay que instalar '''python-dev''')}}
 +
* Instalar firebug
 +
: https://addons.mozilla.org/es-es/firefox/addon/firebug/
 +
}}
 +
 +
 +
{{Actividad|
 +
TOCdepth=2|
 +
Title=Lectura básica de un documento|
 
}}
 
}}

Revisión de 01:49 7 nov 2011


Actividad

Icon objectives.jpg

Objetivo

  • Introducción a las técnicas básicas de scraping usando Python y Amara
  • Herramientas de ayuda (firebug, curl, ...)


Configuración del entorno

Icon activity.jpg

Configuración del entorno

  • Instalación de amara
$ sudo pip install http://files.akara.info/00-amara-latest.tar.bz2
Icon present.gif
Tip: Es necesario tener instalado un compilador de C y la cabeceras de python (en debian/ubuntu hay que instalar python-dev)


  • Instalar firebug
https://addons.mozilla.org/es-es/firefox/addon/firebug/






Lectura básica de un documento

Icon activity.jpg

Lectura básica de un documento