Extracción de datos SEO – Aprendermarketing.es

El procedimiento de minería de datos web, también conocido como raspado, es ampliamente utilizado por los especialistas en marketing para recopilar precios de los sitios web de los competidores. Pero también puede ser útil para otros especialistas en marketing digital, incluidos los especialistas en marketing de contenido, SEO y PPC. Para probar esto, le mostraremos 5 formas de usar el raspado para un análisis completo de la competencia. Usaremos Araña pico de red como una herramienta de web scraping.

1. Extracción de precios de los sitios web de la competencia

Liquidar los precios de la competencia es una de las principales tareas rutinarias a las que se enfrentan los profesionales del marketing digital y SEO en los proyectos de comercio electrónico. El proceso consta de dos partes. El primero es encontrar un elemento con el valor apropiado (datos). Y la segunda es su extracción. Por cierto, puede seleccionar las categorías o páginas requeridas para extraer.
En la mayoría de los casos, debe hacer lo siguiente para obtener precios de un sitio web:

  1. Abrir la página del producto
  2. Encuentra el precio y pasa el cursor sobre él.
  3. Haga clic derecho sobre él y seleccione «Inspeccionar elemento».
  4. Desplácese hasta una fila resaltada y haga clic derecho sobre ella.
  5. Elija Copiar → Copiar XPath.

  1. Inicie Netpeak Spider.
  2. Vaya a Configuración → Eliminar.
  3. Active la opción «Usar raspado de HTML».
  4. Seleccione el tipo de búsqueda «Xpath» e ingrese el código que copió en el campo «Expresiones de búsqueda». Luego seleccione Modo de extracción de datos → Texto interno.

Recuperación de datos

  1. Haga clic en el botón «Aceptar» para guardar la configuración y cerrar la ventana.
  2. Pegue la URL del sitio web en la barra de direcciones e inicie el escaneo con el botón «Iniciar».
  3. Una vez que se complete el escaneo, vaya a la barra lateral y abra la pestaña Informes → Eliminar.
  4. Haga clic en la fila con varias páginas que contienen los datos solicitados.
  5. Haga clic en el botón Mostrar seleccionado.
  6. Explore el informe en una nueva ventana y exporte los datos de extracción con el botón «Exportar».

También puede utilizar este método para agotar toda la información sobre líneas de productos, condiciones especiales de compra y cualquier otra especificación de producto descrita en las páginas de productos.
Por cierto, el raspado se puede utilizar para analizar competidores y crear feeds de productos en Google Adwords.

2. Análisis de contenido de los competidores más populares

No puede ignorar los movimientos de sus competidores mientras crea contenido en un entorno altamente competitivo. Puede usar el raspado para encontrar las publicaciones más virales de sus competidores. De esta manera, obtendrá una imagen completa y encontrará factores comunes para un contenido exitoso.
Si hay visualizaciones, recursos compartidos, me gusta o contadores de reenvíos abiertos para visualización pública, puede eliminar sus valores de la siguiente manera:

  1. Abra una página con la publicación de un competidor.
  2. Encuentra un contador con un indicador que te interese.
  3. Pase el cursor sobre su valor.
  4. Haz clic izquierdo sobre él y selecciona «Inspeccionar elemento».

Haga clic izquierdo en él y seleccione

  1. Copie el XPath.
  2. Configure y ejecute el procedimiento de eliminación como se muestra arriba.
  3. Exportar datos para su recuperación.

3. Raspado de SERP de Google

Puede obtener automáticamente información sobre la parte superior de la SERP de Google mediante el agotamiento. Puede eliminar hasta 100 fragmentos con URL, títulos y descripciones. Realice el raspado de la siguiente manera:

  1. Abra la página de búsqueda de Google e ingrese su consulta.
  2. Vaya a la página de configuración de búsqueda.
    Vaya a la página de configuración de búsqueda.
  3. Establezca la cantidad adecuada de resultados de búsqueda por página.
    Establezca la cantidad adecuada de resultados de búsqueda por página.
  4. Guarde la configuración y regrese a la página SERP.
  5. Copie la URL de la página SERP.
  6. Inicie Netpeak Spider.
  7. Selecciona «Lista de URLs» → «Entrar manualmente» en el menú principal de Netpeak Spider.
  8. Pegue la URL copiada en una nueva ventana.

Pegue la URL copiada en una nueva ventana.
Puede ingresar tantas URL como desee a la vez.

  1. Vaya a Configuración → Eliminar.
  2. Active la opción «Usar raspado de HTML».
  3. Establezca nombres para búsquedas, por ejemplo, Título SERP, Descripción SERP y URL SERP.
  4. Seleccione el tipo de búsqueda «Xpath». Luego seleccione Modo de extracción de datos → Texto interno.
  5. Introduzca el siguiente código en el cuadro de búsqueda:
    • para borrar títulos—
      //*[@id="rso"]//div[1]/div/div/div/h3/a
    • raspar descripción—
      //*[@id="rso"]//div[1]/div/div/div/div/div/span
    • para copiar URL –
      //*[@id="rso"]//div[1]/div/div/div/h3//@href
  6. No cierre la ventana actual y vaya a la pestaña Agente de usuario. Seleccione Chrome como agente de usuario.
  7. Abra la pestaña «Avanzado» y desactive todos los parámetros.
  8. Ahorrar la configuración.
  9. Vaya a la barra lateral y abra la pestaña Configuración. Desactive todos los parámetros excepto «Raspado».
  10. Inicie el escaneo.
  11. Al final del escaneo, verá varias columnas que corresponden a las búsquedas que estableció anteriormente. Habrá una serie de valores encontrados.
    Habrá una serie de valores encontrados
  12. Para ver los resultados de cualquier búsqueda, haga doble clic en el valor que le interesa.
  13. Mire los datos de raspado en una tabla abierta.
  14. Haga clic izquierdo en el botón Informe para cambiar rápidamente entre los resultados de cada búsqueda.
  15. Para descargar una tabla de resultados, haga clic en el botón «Exportar» y guárdelo como un archivo.

4. Análisis SEO de competidores

A medida que prueba nuevos métodos para mejorar la optimización del sitio web, debe preguntarse qué estrategia de SEO tienen sus competidores. ¿Qué tecnologías utilizan? ¿Qué métodos les ayudaron a lograr sus resultados actuales?
El raspado lo ayudará a obtener rápidamente respuestas a las siguientes preguntas:

  • ¿Sus competidores utilizan datos estructurados específicos?
  • ¿Qué elementos de datos estructurados se utilizan en las páginas de fragmentos enriquecidos de la competencia?
  • ¿Están sus competidores utilizando contenido de medios externos (de Youtube u otras plataformas de audio/video) en sus páginas de productos, por ejemplo?
  • ¿Qué tipo de metadatos utilizan sus competidores?

Puede obtener todas las respuestas a estas preguntas mediante búsquedas simultáneas de sitios web de diferentes competidores en Netpeak Spider.

4.1. Extracción de datos estructurados

Si desea saber si su competidor está utilizando algún elemento de esquema específico, puede hacer lo siguiente:

  1. Vaya a Configuración → Eliminar.
  2. Active la opción «Usar raspado de HTML».
  3. Seleccione el tipo de búsqueda «Contiene». Luego seleccione Modo de extracción de datos → Código fuente completo.
  4. Si necesita verificar algunos elementos específicos en el código de la página, ingrese itemprop = «nombre» en el cuadro de búsqueda (puede especificar cualquier otro elemento del diccionario de esquemas en lugar del nombre).
  5. Si necesita ver todos los datos estructurados en cada página, seleccione el tipo de búsqueda «XPath» y el modo «Extracción de datos» → «Elemento HTML completo».
  6. Ingresar
    //*[@itemtype]/@itemtype

    en el campo de búsqueda.

  7. Guarde la configuración e inicie el escaneo.

4.2. Buscar contenido multimedia

Si quieres saber si hay páginas con contenido incrustado en iFrame (vídeos de YouTube y Vimeo, pistas de audio de Soundcloud, Bandcamp, etc.), sigue estas instrucciones:

  1. Vaya a Configuración → Eliminar.
  2. Active la opción «Usar raspado de HTML».
  3. Seleccione el tipo de búsqueda «Contiene». Luego seleccione Modo de extracción de datos → Código fuente completo.
  4. Empieza a raspar.
  5. Exportar datos para su recuperación.

5. Raspar las opiniones de los clientes

Si se encuentra en un nicho donde las plataformas de revisión tienen mucha influencia, es importante monitorear las revisiones de su empresa y las de sus competidores. Para eliminar reseñas automáticamente, puede usar Netpeak Spider y realizar la extracción de datos de expresiones regulares. Por ejemplo, para eliminar reseñas de G2 Crowd, debes:

  1. Vaya a Configuración → Eliminar.
  2. Active la opción «Usar raspado de HTML».
  3. Crea búsquedas para recuperar partes positivas y negativas de la reseña.
  4. Seleccione el tipo de búsqueda «RegExp». Luego seleccione Modo de extracción de datos → Código fuente completo.
  5. Usar una expresión regular
    (?
  6. Guarde la configuración e ingrese una lista de páginas de G2 Crowd con reseñas y comience a eliminar.
  7. Exporte los resultados exactamente como explicamos en el párrafo 3.

Resumen

El uso práctico del raspado no se limita a la extracción de precios. Hemos descrito el procedimiento de eliminación con Netpeak Spider para mostrarle que puede usarse para resolver muchas tareas de marketing diarias diferentes:

  • Extracción de precios y datos de productos de los sitios web de la competencia.
  • Analizar el contenido de los competidores más populares.
  • Copia SERP de Google.
  • Análisis SEO de la competencia.
  • Eliminación de reseñas de clientes de sitios web especializados.

Por cierto, todos los lectores del blog de Aprendermarketing.es pueden comprar software pico de red productos incluyendo Netpeak Spider con 10% de descuento. Yo sigo esta conexión o usa el código de descuento 26618a85 para activarlo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

rtp live

Baccarat Online

Bonus New Member

Roulette Online

Sicbo Online

slot gacor