Cómo extraer todos los enlaces de una página web (crawling) en segundos sin instalar extensiones ni programas

¿Alguna vez has entrado en una web, has visto una lista enorme de contenido (artículos, videos, productos…) y has pensado: «Ojalá pudiera copiar todos estos enlaces de golpe para guardarlos»?

Seguramente has intentado seleccionarlos con el ratón, copiar y pegar, pero el resultado es un desastre: se copia el texto, las imágenes, el formato… y te toca ir limpiando línea por línea. O peor aún, la web tiene cientos de elementos y tardarías horas en hacerlo a mano.

Hoy te voy a enseñar un truco «ninja» que uso frecuentemente. No necesitas instalar programas extraños, ni extensiones de Chrome que te llenan de publicidad, ni saber programar. Solo necesitas el navegador que ya estás usando.

Este método funciona en casi cualquier sitio moderno, desde blogs hasta tiendas online.

El problema: las webs «infinitas»

Antes de empezar, un detalle técnico importante. Muchas páginas modernas usan una tecnología llamada «Lazy Loading» (carga perezosa).

Esto significa que la página no carga las fotos ni los enlaces que están al final hasta que tú no bajas con el ratón. Si intentas usar un programa automático sin tener esto en cuenta, solo capturará los 10 primeros resultados.

El truco: tu navegador tiene superpoderes

Todos los navegadores (Chrome, Edge, Firefox, Brave) tienen un panel oculto llamado «Herramientas de Desarrollador». Vamos a usar la Consola, que nos permite dar órdenes directas a la página web.

Sigue estos 4 pasos sencillos:

Paso 1: Prepara el terreno

Entra en una web que tenga una lista extensa de contenido. Por ejemplo: https://www.harrypotter.com/fact-file/magical-miscellany

¡Importante! Haz scroll (baja con la rueda del ratón) hasta el final de la página o hasta que veas que se han cargado todos los elementos que te interesan. En este ejemplo tendrás que hacer clic varias veces en el botón «Show more» al final del listado, hasta que se hayan cargados todos los elementos. Tienes que hacer esto para asegurarte de que el navegador «vea» todos los enlaces.

Paso 2: Abre la consola

Una vez tengas todo el contenido en pantalla:

  • En Windows: Pulsa la tecla F12 o la combinación Ctrl + Shift + I.
  • En Mac: Pulsa Cmd + Option + I.

Se abrirá un panel (normalmente a la derecha o abajo). Busca la pestaña que dice «Console» o «Consola». Si ves letras rojas o avisos raros, ignóralos, es normal.

Paso 3: El código mágico

Aquí es donde ocurre la magia. He preparado un pequeño fragmento de código JavaScript que hace el trabajo sucio por ti:

  1. Busca todos los enlaces.
  2. Filtra solo los que te interesan.
  3. Elimina los repetidos.
  4. Te da la lista limpia.

Copia este bloque y pégalo en la consola (donde parpadea el cursor):

// --- CONFIGURACIÓN ---
// Escribe aquí abajo la parte de la URL que se repite en los enlaces que buscas.
// Por ejemplo: si buscas productos, suele ser "/p/" o "/producto/"
const textoAFiltrar = '[PARTE_DE_LA_URL_QUE_BUSCAS]'; 

// --- NO TOQUES NADA DE AQUÍ PARA ABAJO ---
// 1. Seleccionamos todos los enlaces de la web (etiqueta 'a')
const todosLosEnlaces = Array.from(document.querySelectorAll('a'));

// 2. Nos quedamos solo con los que contienen tu texto y extraemos la dirección (href)
const enlacesFiltrados = todosLosEnlaces
  .map(link => link.href)
  .filter(href => href.includes(textoAFiltrar));

// 3. Eliminamos duplicados (el 'Set' hace esto automáticamente)
const listaUnica = [...new Set(enlacesFiltrados)];

// 4. Mostramos el resultado limpio en forma de lista
console.log('--- COPIA DESDE AQUÍ ---');
console.log(listaUnica.join('\n'));
console.log('--- HASTA AQUÍ (' + listaUnica.length + ' enlaces encontrados) ---');

Paso 4: Personaliza y Ejecuta

Antes de pulsar «Enter», fíjate en la primera línea del código donde dice const textoAFiltrar = '...'.

Cambia lo que hay entre comillas por el patrón que identifica los enlaces que quieres.

  • Ejemplo real: Si estás en https://www.harrypotter.com/fact-file/magical-miscellany y quieres sacar todas las fichas, verás que todas las URLs contienen la palabra «fact-file/magical-miscellany». Pues pones eso.

Pulsa ENTER.

¡Boom! 💥 De inmediato, la consola te escupirá un listado perfecto de texto. Solo tienes que seleccionarlo, copiarlo y pegarlo en tu Excel, Bloc de notas o donde quieras.

¿Por qué es mejor hacerlo así?

  1. Es seguro: No estás dando tus datos a ninguna web externa de «Scraping». Todo ocurre en tu ordenador.
  2. Es limpio: Obtienes las URLs exactas, sin títulos, ni fotos, ni basura HTML alrededor.
  3. Es gratis: Te ahorras pagar licencias de software SEO si solo necesitas hacer esto puntualmente.

Espero que este pequeño «hack» te ahorre tanto tiempo como a mí. Si te gusta trastear con la tecnología y descubrir cómo hacer las cosas de forma más inteligente, date un paseo por mi blog o mi canal de YouTube donde subo tutoriales y pruebas de todo tipo.

Este contenido ha sido generado parcialmente con herramientas de Inteligencia Artificial y revisado por un humano.

Comentarios

0 respuestas a «Cómo extraer todos los enlaces de una página web (crawling) en segundos sin instalar extensiones ni programas»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Mario Gómez Luelmo.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento: No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a HOSTINGER operations, UAB que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos.
Privacidad