Algunas informaciones recientes obtenidas aquí y allá sobre Google (y a veces Bing) ofrecen respuestas a las siguientes preguntas esta semana: ¿Es posible rechazar completamente un TLD y cómo? ¿Es el límite de rastreo de Google definitivo?

Goossip #1

Cómo Rechazar un TLD

John Mueller (Google) explicó que es posible rechazar un TLD (por ejemplo, .xyz) a través de la directiva domain:abc en el archivo de rechazo de enlaces. Para ello, basta con añadir domain:xyz al archivo de rechazo con el fin de bloquear todos los enlaces provenientes de este TLD. Sin embargo, no es posible hacer excepciones para nombres de dominio específicos dentro del TLD rechazado.

Por qué es útil: Los TLD baratos con términos de uso apropiados son utilizados intensamente por spammers. Esta característica ahorra tiempo en lugar de tener que rechazar cientos de nombres de dominio uno por uno.

John Mueller admite que esto no está documentado oficialmente porque es una herramienta muy poderosa ("un gran martillo"). Sin embargo, dado que todavía hay algunos buenos sitios en todos los TLD, Google duda en recomendarlo abiertamente.

Tasa de confiabilidad: ⭐⭐⭐ ¡Estamos de acuerdo!

¿Alguna vez has pensado en usar una bola de demolición para matar un mosquito? Esta técnica es un poco similar. Aunque el procedimiento no es nuevo, no es muy conocido debido a que es radical y un poco arriesgado.

Goossip #2

Los Límites de Rastreo de Googlebot son Flexibles

En el último episodio de Search Off The Record, Gary Illyes y Martin Splitt revelaron que los límites de rastreo de Googlebot son mucho más flexibles de lo que pensamos. El límite de 15 MB es un límite predeterminado establecido a nivel de infraestructura para proteger los servidores de Google. No es definitivo: cada equipo interno puede cambiarlo. Por ejemplo, Google Search puede reducirlo a 2 MB, mientras que para PDFs este límite puede aumentar hasta 64 MB.

Por qué existen estos límites: No se trata solo de un asunto de ancho de banda, sino también de la protección de la infraestructura. Procesar un documento excesivamente grande (transformación, indexación, etc.) puede sobrecargar los sistemas de Google.

Martin Splitt enfatizó que Googlebot no es un sistema fijo y uniforme, sino que funciona más como un servicio cuyos ajustes son modificables. Los parámetros pueden variar según el tipo de contenido (HTML, PDF, imágenes), el proyecto e incluso la velocidad de indexación deseada.

Tasa de confiabilidad: ⭐⭐⭐ ¡Estamos de acuerdo!

Este es un detalle interesante (y útil) que aliviará un poco a los profesionales, y puede volver a asegurar a aquellos afectados por las recientes declaraciones de Google sobre este tema.