Es necesario editar el archivo robots.txt de tu sitio web. Si aún no lo has hecho te diremos que es muy sencillo si ya tienes instalado el plugin WordPress SEO by Yoast y muy necesario. Por un lado, las arañas de los motores de búsqueda dedican un tiempo determinado al rastreo de tu web. Si facilitas el trabajo a los motores de búsqueda indicando qué páginas deben rastrear y cuáles no, éstos te lo agradecerán con un mejor posicionamiento. Por otro lado, hay algunas páginas que no se pueden rastrear (páginas de registro, carrito de compra, etc) que también debes bloquear su rastreo. A continuación te vamos a contar cómo funciona el archivo robots.txt y cómo puedes editarlo.
Qué es el archivo robots.txt
El archivo robots.txt (también llamado protocolo para la exclusión de los robots), es un pequeño archivo de texto con extensión .txt, que se crea y se sube a un sitio web para decirle a los motores de búsqueda qué contenidos pueden rastrear y cuáles no.
Es un archivo público, es decir, cualquier usuario puede verlo añadiendo a la url de la web: /robots.txt. Aquí te mostramos un ejemplo:
¿Para qué se utiliza el archivo robots.txt?
Se utiliza este archivo para indicar a los rastreadores o arañas de los buscadores qué apartado no deben entrar a rastrear e indexar de una página web. En él, puedes especificar de manera sencilla, los directorios, subdirectorios, URLs o archivos de tu web que no deberían ser rastreados o indexados por los buscadores.
Este archivo también se utiliza para para indicarle a Google (y al resto de buscadores) cuál es el sitemap de la web, incluyendo su URL en el archivo.
¿Por qué es importante editar el archivo robots.txt?
El principal motivo por el que debes editar el archivo robots.txt es el «presupuesto de rastreo» que el Googlebot (el bot del motor de búsqueda de Google) otorga a una web. Si tienes muchas páginas, a Googlebot le llevará mas tiempo rastrearlas, lo que tendrá efectos negativos en tu ranking. Básicamente, el presupuesto de rastreo es «el número de URLs que el Googlebot puede y quiere rastrear». Necesitas ayudar al Googlebot a rastrear las páginas más valiosas de tu web en el menor tiempo de rastreo posible.
Algunos CMS como WordPress generan este archivo automáticamente y es posible que incluyan como indexables partes que no deberían ser rastreadas, y al contrato. Por lo tanto, es muy importante que aprendas a editar el archivo robots.txt de tu web.
También es posible que los motores de búsqueda no puedan rastrear ciertas partes de tu web por estar encriptadas como las secciones de registro, carrito de compra, pasarela de pago, etc. Si tu web está conectada con Google Search Console, Google te enviará un email informándote de los posibles errores de cobertura de la web. Debes editar el archivo robots.txt e introducir comandos disallow (no rastrear) de las url que estén generando para solucionar estos problemas de cobertura. ,
Así mismo, como afirma Neil Patel en este post, (uno de los profesionales SEO más reconocidos en el mundo), el archivo robots.txt es un método muy sencillo para mejorar el SEO de una Web y que muchos desaprovechan por desconocimiento.
Ahora que ya sabes porqué es importante editar este archivo, vamos a ver cómo editarlo fácilmente.
Comprueba que tienes el archivo robots.txt en tu web
Introduce la url de tu web con la extensión /robots.txt en tu navegador. Por ejemplo:
Pueden pasar varias cosas:
- Que encuentres un archivo robots.txt
- Que encuentres un archivo vacío.
- Que encuentres un error 404.
Si encuentras un archivo, lo más probable es que se haya creado automáticamente (suele pasar si trabajas con WordPress). Si encuentras un archivo vacío o un error 404, necesitarás solucionarlo.
Editar el archivo robots.txt con el plugin WordPress SEO by Yoast
Si utilizas WordPress puedes editar el archivo robots.txt desde plugin SEO by Yoast, sin necesidad de abrir un documento en texto plano, escribir código y subirlo a tu servidor.
Dentro del dashboard de WordPress debes ir a SEO – Herramientas – Herramientas Yoast SEO. Hacer clic en «Editor de Archivos». Ahí aparecerá un recuadro en blanco para que añadas el código del archivo robots.txt, que se guardará desde ahí sin necesidad de acceder a tu servidor de hosting.
En este tutorial de Google puedes aprender mucho más sobre la edición de archivos robots.txt y todos los comandos que podrías utilizar. Los más comunes son: Allow: (permitir que se rastree) Disallow: (no permitir rastreo), Noindex: (no indexar) Nofollow: (no seguir leyendo)
También puedes copiar y pegar ésta que es la más sencilla:
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php
Este es un ejemplo de un archivo robots.txt de una tienda online. Como ves, no se permite el rastreo de algunos apartados como: pedidos, cesta de la compra, favoritos, datos personales, registro… Son apartados a los que no pueden tener acceso los motores de búsqueda, evitando errores de cobertura
User-agent: * Disallow: /login Disallow: /mis_pedidos.php Disallow: /mis_favoritos.php Disallow: /datos_personales.php Disallow: /cambiar_password.php Disallow: /cesta.php Disallow: /guardar_favoritos.php Disallow: /entra_registrate.php Disallow: /*?i= Disallow: /resp_popup_footer.php Disallow: /ajax/ Disallow: /usuario/*
Comprobar tu archivo robots.txt en Google Search Console
La herramienta Probador de robots.txt muestra si el archivo robots.txt bloquea el acceso de los rastreadores web de Google a URL concretas del sitio web. Por ejemplo, puedes utilizar esta herramienta para probar si el rastreador Googlebot-Image puede rastrear la URL de una imagen que quieres bloquear de la Búsqueda de Imágenes de Google.
Puedes enviar una URL al Probador de robots.txt. La herramienta funciona igual que funcionaría el robot de Google para revisar tu archivo robots.txt
y verifica que la URL se haya bloqueado correctamente.
También te puede interesar…
- Guía SEO para principiantes (parte 11): Cómo añadir Rich Snippets a tu WordPress
- Guía SEO para principiantes (parte 10): Cómo optimizar tus páginas de producto para buscadores
- Guía SEO para principiantes (Parte 9): Cómo hacer el análisis on-page de tu web
- Guía SEO para principiantes (parte 8): mejorar los enlaces internos
- Guía SEO para principiantes (parte 7): Estrategias de Linkbuilding
- Guía SEO para principiantes (parte 6): Encontrar las palabras clave para tu nicho de negocio
- Guía SEO para principiantes (parte 5): Cómo escribir un post que posicione y enganche a tus lectores
- Guía SEO para principiantes (parte 4): Instalar y configurar plugin WordPress SEO by Yoast
- Guía SEO para principiantes (parte 3): Cómo crear un Sitemap para WordPress y avisar a Google para que lo indexe
- Guía SEO para principiantes (parte 2) Cómo conectar tu web con Google Analytics
- Guía SEO para principiantes (parte 1): Cómo instalar Google Analytics en tu web, blog o tienda online
Visita este foro de programación para obtener ayuda