Definición del problema y Entorno de desarrollo
La idea de este proyecto es ir desarrollando un proyecto real con el lenguaje de programación Python para introducirnos en las distintas funcionalidades del lenguaje y ver casos prácticos.
En este proyecto se desarrollará la técnica del Web Scraping que consiste en analizar un sitio web para obtener información de las páginas web.
Esta técnica puede usarse para obtener datos para estadísticas, rendimiento, etc.
En nuestro caso nos enfocaremos en obtener datos del sitio web para mejorar el posicionamiento SEO de nuestro sitio web.
Antes de comenzar con el proyecto debemos elegir un entorno de desarrollo para python para poder ir probando los programas que iremos construyendo.
Podéis elegir el entorno de desarrollo para python que más os guste, en mi caso en particular he probado dos que ahora os indico:
NetBeans
Este entorno de desarrollo se usa sobre todo para Java pero puede usarse para otros lenguajes o proyectos como HTML ,C++ o Python.
Para trabajar con este IDE debéis descargar e instalar
El JDK 8 de Java
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
El IDE NetBeans 8.2 lo podeis descargar de
https://netbeans.org/downloads/index.html
Para poder trabajar con Python nos bajamos el plugin de Python para NetBeans
http://plugins.netbeans.org/plugin/61688/python
. lo descomprimimos
. abrimos NetBean y vamos a Tools – Plugins – pestaña Downloaded
. pulsamos en “Add plugins..” y seleccionamos los ficheros del plugin descargado.
. los instalamos y reiniciamos NetBeans
Visual Studio 2017
Iremos a la página
https://visualstudio.microsoft.com/es/vs/features/python/
Y descargamos la versión Comunity de Visual Studio
Una vez instalado seleccionamos las Herramientas Python para Visual Studio y las instalamos.
Si no quereis descargar ningún IDE podéis usar en entorno interactivo en la página https://repl.it que podeis usar directamente desde cualquier navegador web en pc, tablet o móvil.
Nuestro proyecto lo probaremos con Netbeans pero podéis usar el IDE que más os guste.
. Abrimos el Netbeans
. creamos el proyecto webscrap con la opción de menú File – New Project
. seleccionamos Python – Python project ant
. le damos el nombre webscrap y creamos el proyecto
Para los ejemplos usaremos la versión de Python 2.7 si tenéis otra versión los ejemplos pueden variar.