Superando spam de pesquisa interna de sites do WordPress

Ao longo do ano, tenho visto “ataques” generalizados de spam de SEO direcionados a quase todos os sites WordPress do mundo. Este ataque envia spam usando funções spam de pesquisa interna no site e diferentes bots rastreadores de IP. Embora seja uma questão de SEO, esse ataque não afeta a classificação do artigo. Mas para sites de grande porte, esse ataque deixa o proprietário da web bastante preocupado.

SEO negativo é um termo popular há muito tempo. Embora o Google tenha anunciado que pode lidar bem com SEO negativo, muitas pessoas pensam que ainda existem riscos. O mesmo ocorre com spam de pesquisa interna de sites. Este método foi detectado pela primeira vez há algum tempo, quando analisamos a página de índice da página no relatório Console de pesquisa do Google.

Spam interno de pesquisa de sites Google Search Console
Exibição de spam de pesquisa interna de sites no Google Search Console

Mesmo que os relatórios acima não prejudiquem o SEO do site, se o Google rastrear URLs em grande escala, certamente poderá esgotar o ‘orçamento de rastreamento’. Mais importante ainda, desperdiça eletricidade e recursos de servidor para invasores, vítimas e mecanismos de busca. Especialmente em grande escala, os resíduos e o seu impacto continuarão certamente a aumentar.

Exemplo de ataque de spam de pesquisa interna de site

Se examinarmos, esse método de ataque tem diversas variações. Alguns deles são:

  • Spam BOT tem como alvo URLs de formato ?s=exemplo E /pesquisa/exemplo. Os invasores tentarão ambos, na esperança de que o site atacado use uma função ou ambas. Se você usar um sistema de cache estático de HTML, certifique-se de que as consultas ou pesquisas não sejam armazenadas no cache estático de HTML.
  • Eles têm como alvo a paginação, como /página/5/?s=exemplo ou /pesquisa/página/2/?s=exemplo. Essa variação é a mais maligna, porque esses links de paginação no WordPress na verdade passam parâmetros de consulta para o URL de paginação. Agora seu site pode vincular a esses URLs de spam e ‘validá-los’. Isso cria uma enorme confusão no Google Search Console de URLs de spam de ‘auto-referência’ e torna difícil rastrear a fonte original.
  • Além disso, os ataques de spam também têm como alvo versões de feed RSS de resultados de pesquisa (por exemplo, /procurar/[spam]/feed/rss2/). Isso é muito inteligente e suspeito que tenha sido o primeiro método usado. Isso ocorre porque outros sistemas procuram e consomem ativamente feeds RSS e muitas vezes convertem URLs em links. Ele cria links para o site que atacam mais sites. Seu site WordPress é apenas parte de um ataque ‘man in the middle’.

Páginas Noindex de spam de pesquisa interna de sites

O efeito do spam de pesquisa no SEO

Posso confirmar que este ataque não terá um impacto negativo direto no SEO. No entanto, por precaução, instale um plugin de SEO como Yoast SEO, Rank Math ou outros para superar esse problema de spam de pesquisa interna de sites.

Basicamente, o plugin fornece um atributo noindex para todas as URLs que não estão diretamente relacionadas ao artigo. Os plug-ins também podem limpar o rastreamento para que o Google BOT e outros mecanismos de pesquisa não maximizem seus recursos em páginas de spam.

Para ter ainda mais certeza, use o recurso ROBOTS.txt. Para proibir a função de pesquisa, para que não seja rastreada pelo mecanismo de pesquisa. O código é o seguinte:

# We're experimenting with blocking search results to prevent search result spam
Disallow: /?s=*
Disallow: /search/*

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *