Algumas informações obtidas recentemente sobre o Google (e às vezes o Bing) aqui e ali oferecem respostas para as seguintes perguntas esta semana: É possível rejeitar completamente um TLD e como? O limite de rastreamento do Google é definitivo?
Goossip #1Como Rejeitar um TLD
John Mueller (Google) explicou que é possível rejeitar um TLD (por exemplo, .xyz) através da diretiva domain:abc no arquivo de rejeição de links. Para isso, basta adicionar domain:xyz ao arquivo de rejeição para bloquear todos os links provenientes desse TLD. No entanto, não é possível fazer exceções para domínios específicos dentro do TLD rejeitado.
Por que é útil: TLDs baratos com termos de uso apropriados são amplamente utilizados por spammers. Esse recurso economiza tempo ao invés de rejeitar centenas de domínios individualmente.
John Mueller admite que isso não está documentado oficialmente porque é uma ferramenta muito poderosa ("um grande martelo"). No entanto, como ainda existem bons sites em todos os TLDs, o Google hesita em recomendar isso claramente.
Taxa de confiabilidade: ⭐⭐⭐ Concordamos!
Você já pensou em usar uma bola de demolição para matar um mosquito? Essa técnica é um pouco parecida. Embora o procedimento não seja novo, ele não é muito conhecido devido ao seu caráter radical e um pouco arriscado.
Goossip #2Os Limites de Rastreamento do Googlebot São Flexíveis
No último episódio do Search Off The Record, Gary Illyes e Martin Splitt revelaram que os limites de rastreamento do Googlebot são muito mais flexíveis do que pensamos. O limite de 15 MB é um limite padrão definido em nível de infraestrutura para proteger os servidores do Google. Não é definitivo: cada equipe interna pode alterá-lo. Por exemplo, enquanto o Google Search reduz isso para 2 MB, o limite para PDFs pode chegar a 64 MB.
Por que esses limites existem: Isso não é apenas uma questão de largura de banda, mas também está relacionado à proteção da infraestrutura. O processamento de um documento excessivamente grande (conversão, indexação, etc.) pode sobrecarregar os sistemas do Google.
Martin Splitt enfatizou que o Googlebot não é um sistema fixo e uniforme, mas funciona mais como um serviço cujas configurações podem ser alteradas. Os parâmetros podem variar de acordo com o tipo de conteúdo (HTML, PDF, imagens), o projeto e até mesmo a velocidade de indexação desejada.
Taxa de confiabilidade: ⭐⭐⭐ Concordamos!
Esse é um detalhe interessante (e útil) que pode confortar um pouco os profissionais e reassegurar aqueles que foram impactados pelas declarações recentes do Google sobre o assunto.
Comentários
(8 Comentários)