Curso Web Scraping para SEO – Clase 1

Definición del problema y Entorno de desarrollo 

La idea de este proyecto es ir desarrollando un proyecto real con el lenguaje de programación Python para introducirnos en las distintas funcionalidades del lenguaje y ver casos prácticos.

 

En este proyecto se desarrollará la técnica del Web Scraping que consiste en analizar un sitio web para obtener información de las páginas web.

Esta técnica puede usarse para obtener datos para estadísticas, rendimiento, etc.

En nuestro caso nos enfocaremos en obtener datos del sitio web para mejorar el posicionamiento SEO de nuestro sitio web.

 

Antes de comenzar con el proyecto debemos elegir un entorno de desarrollo para python para poder ir probando los programas que iremos construyendo.

Podéis elegir el entorno de desarrollo para python que más os guste, en mi caso en particular he probado dos que ahora os indico:

 

NetBeans

Este entorno de desarrollo se usa sobre todo para Java pero puede usarse para otros lenguajes o proyectos como HTML ,C++ o Python.

Para trabajar con este IDE debéis descargar e instalar

El JDK 8 de Java 

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

El IDE NetBeans 8.2 lo podeis descargar de

https://netbeans.org/downloads/index.html

 

Para poder trabajar con Python nos bajamos el plugin de Python para NetBeans

http://plugins.netbeans.org/plugin/61688/python

. lo descomprimimos

. abrimos NetBean y vamos a Tools – Plugins – pestaña Downloaded

. pulsamos en “Add plugins..” y seleccionamos los ficheros del plugin descargado.

. los instalamos y reiniciamos NetBeans

 

Visual Studio 2017

Iremos a la página

https://visualstudio.microsoft.com/es/vs/features/python/

Y descargamos la versión Comunity de Visual Studio

Una vez instalado seleccionamos las Herramientas Python para Visual Studio y las instalamos.

 

Si no quereis descargar ningún IDE podéis usar en entorno interactivo en la página https://repl.it que podeis usar directamente desde cualquier navegador web en pc, tablet o móvil.

 

Nuestro proyecto lo probaremos con Netbeans pero podéis usar el IDE que más os guste.

. Abrimos el Netbeans

. creamos el proyecto webscrap con la opción de menú File – New Project

. seleccionamos Python – Python project ant

. le damos el nombre webscrap y creamos el proyecto

 

Para los ejemplos usaremos la versión de Python 2.7 si tenéis otra versión los ejemplos pueden variar.