Alex Cantalapiedra
Alex Cantalapiedra
Especialista SEO

Alex Cantalapiedra

Especialista SEO

Especialista Marketing Online

Freelance SEO

Artículo

Cómo scrapear una web sin saber código con Web Scraper

febrero 18, 2019 Uncategorized
Cómo scrapear una web sin saber código con Web Scraper

Introducción

Cuando empecé en el sector SEO, descubrí que una de las maneras de poder aplicar tus conocimientos (aprender) y tener un retorno de la inversión de esas páginas era haciendo páginas webs de afiliación y/o Adsense.

Uno de los primeros pasos que normalmente haces cuando creas un nicho es analizar la competencia y saber qué volumen de búsquedas tienen las keywords principales junto a sus relacionadas para elaborar una estrategia. Hay muchos más factores que te hacen elegir un producto u otro en tu plataforma preferida de afiliación, pero no voy a entrar en este tema, creo que Chuiso lo explica muy bien en sus vídeos y en su blog .

Ya os lo puedo decir, encontrar ese nicho perfecto con alto porcentaje de conversión, con poca competencia etc… es MUY MUY pero MUY complicado, por dos motivos principales:

  1. Los grandes SEO ya conocen esos nichos y están explotados.
  2. Debes tener esa visión, conocimientos y estar en el momento preciso para explotar ese tipo de web.

Entonces, ¿Qué hay de bueno en todo esto, Alex? Nunca he dicho ni diré que vivir de una Internet fuera fácil, sino todo el mundo lo haría. Chuiso, que lleva bastante en esto, lo remarca siempre en todos sus vídeos, si se quiere vivir de tus webs, debes ser paciente y trabajar. Para mi se entiende con esta formula: TIEMPO + TRABAJO + EXPERIENCIA. Aún así nadie te asegura el éxito.

Aunque tenemos herramientas como esta, WEB SCRAPER, que nos ahorra tiempo y trabajo y, por eso, os la quiero presentar.

¿Qué es Web Scraper? y ¿Por qué utilizar Web Scraper?

Vamos al grano, que me lío…

Cuando tengamos clara la temática de nuestra web, la estructura, la plataforma de afiliación, los productos que se venderán etc.. empieza lo bueno.. escribir. Sabemos que el contenido es un factor de posicionamiento importante junto a la intención de búsqueda para poder subir posiciones en la SERPS. Normalmente, escribir sobre una temática que te gusta es relativamente sencillo pero cuando encuentras un nicho que “ni bien ni mal”, escribir 1000 palabras por página, optimizar las páginas de producto etc.. se te puede hacer infernal. Entonces, nos encontramos con 2 soluciones ante esto:

  1. Tiramos de billetera y contratamos a un freelance Copywritter. Aquí se empieza a gastar dinero.
  2. Podemos utilizar el plugin “WEB SCRAPER” para obtener texto de otras páginas y crear nuevo contenido.

Web Scraper es una herramienta que scrapea el contenido que seleccionas de una web para poder exportarlo en formato CSV y luego poder crear contenido de manera más rápida. Seguro que tiene muchas más funcionalidades pero me quiero centrar sólo en esta que menciono.

Cuando tenemos el contenido extraído a través de esta herramienta, luego podemos utilizar diferentes estrategias para poder crear contenido lo más original posible; spinneando texto, cogiendo texto de páginas en otros idiomas y traduciendolo etc.. Siempre he sido de los SEO que prefiere un buen contenido original, orientado a la intención de búsqueda del usuario etc.. pero esta herramienta te permite realizar diferentes usos de ellas para agilizar la extracción de contenido.

Paso a paso

Sin más dilación, os explico como funciona la herramienta (en este caso, haremos el ejemplo para extraer el nombre de todas las ciudades de españa que nos muestra una página web:

  1. Descargamos de CHROME WEB STORE, la herramienta WEB SCRAPER

2. La herramienta se añadirá en la fila superior de “Inspeccionar”.

3. Damos click a “Create Sitemap” para insertar el nombre del scraper + la URL objetivo.

4. Una vez tenemos el nombre del scraper insertado, lo que haremos es añadir selectores.

5. Rellenaremos todos los campos para poder extraer la información que queremos (Insertaré un vídeo explicativo para que se entienda todo):



Los campos que tenemos son los siguientes:

ID: A partir del método de inspeccionar elemento de Chrome, inspeccionaremos el elemento para poder descubrir que “class” o “id” tiene para poder insertarlo.

Type: En este caso, como queremos extraer texto, seleccionaremos “Text”

Selector: con el selector, seleccionaremos todos los títulos parecidos al texto que queremos obtener, si queremos un H1, seleccionaremos con el puntero 1 o 2 h1 más, los otros los selecciona de manera automática.

Haremos click al “check Box” de “Multiple”

Y finalmente, Guardaremos.

Una vez tenemos ya el script configurado, le daremos a la opción “scrape”:

Para acabar, podremos ver un “preview” de los datos que hemos scrapeado.

¡Y ya lo tendremos hecho! Esta herramienta nos permite extraer de manera masiva los datos que queremos sin necesidad de ir página por página. Hay muchas manera de escalar esta técnica y se puede utilizar para muchos usos. Qué herramienta usas tu para scrapear?

VÍDEO explicativo

Os dejo aquí un vídeo completo de cómo scrapear una web. En este vídeo puedes ver paso a paso lo que he explicado anteriormente.

Un saludo!

Summary
Cantineoqueteveo
Article Name
Cantineoqueteveo
Description
Cantineoqueteveo
Author
Publisher Name
Cantineoqueteveo
Write a comment