Este Curso web scraping con Python consiste en dada la direcciรณn de una sitio web analizar su contenido para obtener informaciรณn para mejorar el posicionamiento SEO del sitio web.
Dentro de este proyecto se podrรญan analizar tareas como:
. Obtener el contenido de una pรกgina web
. Obtener enlaces internos del sitio web
. Obtener el metatag title de cada pรกgina
. Obtener el metatag description
. Obtener el metatag h1
. Guardar los resultados en un fichero para su consulta (txt, excel..)
. Analizar si el sitio web cumple con las premisas SEO recomendadas
Como python es un lenguaje interpretado podemos ir implementando la soluciรณn de manera continua, primero haciendo una versiรณn bรกsica e ir refinando el programa hasta encontrar la soluciรณn final al problema.
Iremos implementando paso a paso el programa hasta que tengamos implementadas las funcionalidades que requerimos.
El Curso web scraping con Python estรก organizado en clases para seguir paso a paso el desarrollo del proyecto.
Al alumno se le darรก el cรณdigo fuente de cada paso a seguir.
Al final de las clases se propondrรกn una serie de Tareas al alumno para mejorar la soluciรณn y aprender otros conceptos
Al finalizar se darรก al alumno un Ebook con el contenido del curso.
Indice
Clase 1: Definiciรณn del problema y Entorno de desarrolloย
Clase 2: Leer contenido de una pรกgina web con urllib
Clase 3: Obtener enlaces internos de una pรกgina web
Clase 4: Decodificar enlaces y ver acentos
Clase 5: Crear lista de enlaces vรกlidos
Clase 6: Buscar todos los enlaces internos del sitio web
Clase 7: Obtener metatag title
Clase 8: Obtener metatag description
Clase 9: Tarea para el alumno: Obtener tag <h1>
Clase 10: Guardar resultados en un fichero
Clase 11: Conversiรณn a Python versiรณn 3.6
Clase 12: Tarea para el alumno: Generar fichero HTML para visualizar en navegador de internet
Clase 13: Tarea para el alumno: Reescribir programa con mรณdulo Beautiful Soup
Si quieres iniciarte con la sintaxis del lenguaje Python puede tambiรฉn seguir el ย Curso de python online gratisย done tambiรฉn se verรกn conceptos como estructuras de datos, programaciรณn funcional, mรณdulos y librerรญas, etc.
El lenguajes Python estรก teniendo mucha aceptaciรณn estos รบltimos aรฑos debido a la rapidez con la que podemos desarrollar nuestras aplicaciones, el gran numero de bibliotecas y mรณdulos del que podemos disponer para hacer nuestros desarrollos y que lo hace ideal para proyectos de Machine Learning, Anรกlisis de datos e Inteligencia Artificial, entre otros.
En el lenguaje Python se condensan tres paradigmas de la programaciรณn como son: la programaciรณn imperativa tradicional (como otros lenguajes tipo C), la programaciรณn orientada a objectos (como la desarrollada en lenguajes como Java o C#) y la programaciรณn funcional (como Scala o Lisp). Esto nos proporciona un abanico de opciones de programaciรณn que difรญcilmente vamos a encontrar en otros lenguajes de programaciรณn.
Te puede interesar