Este Curso web scraping con Python consiste en dada la dirección de una sitio web analizar su contenido para obtener información para mejorar el posicionamiento SEO del sitio web.
Dentro de este proyecto se podrían analizar tareas como:
. Obtener el contenido de una página web
. Obtener enlaces internos del sitio web
. Obtener el metatag title de cada página
. Obtener el metatag description
. Obtener el metatag h1
. Guardar los resultados en un fichero para su consulta (txt, excel..)
. Analizar si el sitio web cumple con las premisas SEO recomendadas
Como python es un lenguaje interpretado podemos ir implementando la solución de manera continua, primero haciendo una versión básica e ir refinando el programa hasta encontrar la solución final al problema.
Iremos implementando paso a paso el programa hasta que tengamos implementadas las funcionalidades que requerimos.
El Curso web scraping con Python está organizado en clases para seguir paso a paso el desarrollo del proyecto.
Al alumno se le dará el código fuente de cada paso a seguir.
Al final de las clases se propondrán una serie de Tareas al alumno para mejorar la solución y aprender otros conceptos
Al finalizar se dará al alumno un Ebook con el contenido del curso.
Indice
Clase 1: Definición del problema y Entorno de desarrollo
Clase 2: Leer contenido de una página web con urllib
Clase 3: Obtener enlaces internos de una página web
Clase 4: Decodificar enlaces y ver acentos
Clase 5: Crear lista de enlaces válidos
Clase 6: Buscar todos los enlaces internos del sitio web
Clase 7: Obtener metatag title
Clase 8: Obtener metatag description
Clase 9: Tarea para el alumno: Obtener tag <h1>
Clase 10: Guardar resultados en un fichero
Clase 11: Conversión a Python versión 3.6
Clase 12: Tarea para el alumno: Generar fichero HTML para visualizar en navegador de internet
Clase 13: Tarea para el alumno: Reescribir programa con módulo Beautiful Soup
Si quieres iniciarte con la sintaxis del lenguaje Python puede también seguir el Curso de python online gratis done también se verán conceptos como estructuras de datos, programación funcional, módulos y librerías, etc.
El lenguajes Python está teniendo mucha aceptación estos últimos años debido a la rapidez con la que podemos desarrollar nuestras aplicaciones, el gran numero de bibliotecas y módulos del que podemos disponer para hacer nuestros desarrollos y que lo hace ideal para proyectos de Machine Learning, Análisis de datos e Inteligencia Artificial, entre otros.
En el lenguaje Python se condensan tres paradigmas de la programación como son: la programación imperativa tradicional (como otros lenguajes tipo C), la programación orientada a objectos (como la desarrollada en lenguajes como Java o C#) y la programación funcional (como Scala o Lisp). Esto nos proporciona un abanico de opciones de programación que difícilmente vamos a encontrar en otros lenguajes de programación.
Te puede interesar