Ao final desta lição, você entenderá o que é conteúdo duplicado e por que o Google o desaprova, como o conteúdo duplicado prejudica seu posicionamento nos resultados de busca, os diferentes tipos de conteúdo duplicado em sites, maneiras fáceis de encontrar conteúdo duplicado em seu site e métodos comprovados para corrigir e prevenir problemas com conteúdo duplicado.
O que é conteúdo duplicado?
Conteúdo duplicado ocorre quando o mesmo conteúdo aparece em mais de um lugar na internet. Isso pode acontecer no seu próprio site ou em sites diferentes.
Explicação Simples
Imagine que você escreve uma postagem de blog e a publica em seu site. Em seguida, você copia exatamente a mesma postagem e a publica em outras três páginas do seu site. Isso é conteúdo duplicado.
Ou imagine que alguém copie sua postagem do blog e a publique em seu site sem permissão. Isso também é conteúdo duplicado.
Por que é um problema
Para o Google: O Google quer mostrar aos usuários o melhor e mais original conteúdo. Quando o mesmo conteúdo existe em vários lugares, o Google precisa escolher qual versão exibir. Isso desperdiça tempo e recursos do Google.
Para o seu site: Quando o Google encontra conteúdo duplicado, ele escolhe uma versão para classificar e ignora as outras. Você pode perder posições no ranking porque o Google escolheu a cópia de um concorrente em vez da sua versão original.
Para usuários: Ninguém quer ver o mesmo artigo repetido cinco vezes nos resultados de busca. Conteúdo duplicado cria uma experiência ruim para o usuário.
Tipos de conteúdo duplicado
Conteúdo duplicado pode se apresentar de diferentes formas. Compreender cada tipo ajuda você a resolver os problemas corretamente.
Conteúdo Duplicado Interno
Este conteúdo está duplicado dentro do seu próprio site.
Mesmo conteúdo em vários URLs
Exemplo: Seu produto aparece em várias páginas com URLs diferentes:
yoursite.com/products/blue-shirt
yoursite.com/shop/clothing/blue-shirt
yoursite.com/mens/shirts/blue-shirt
Todas as três páginas mostram exatamente a mesma descrição e conteúdo do produto.
Por que isso acontece:
- Ruim estrutura do site
- Várias maneiras de chegar à mesma página
- Opções de filtro e classificação para criar novos URLs
- Versões para impressão
- URLs com www vs URLs sem www
Impacto: O Google vê três páginas competindo pela mesma palavra-chave. Ele escolhe uma e ignora as outras. O poder do seu conteúdo fica dividido.
Conteúdo padrão
O que é: Texto repetido que aparece em várias páginas do seu site.
Exemplos:
- A mesma descrição do produto foi usada para 50 produtos similares.
- Avisos de direitos autorais em todas as páginas.
- Avisos legais padrão em todos os artigos
- Texto do modelo repetido em todos os lugares
Por que é um problema: Se 80% do conteúdo da sua página for idêntico em todas as páginas, o Google as considerará duplicadas, mesmo que os 20% restantes sejam diferentes.
Solução: Torne cada página única com conteúdo principal diferente, mesmo que elementos padronizados permaneçam.
IDs de sessão em URLs
Exemplo:
yoursite.com/product?sessionid=12345
yoursite.com/product?sessionid=67890
yoursite.com/product?sessionid=24680
Mesma página, mas IDs de sessão diferentes criam URLs diferentes.
Por que isso acontece: Alguns sites adicionam parâmetros de rastreamento ou códigos de sessão aos URLs.
Impacto: O Google vê dezenas ou centenas de URLs para a mesma página.
Navegação Facetada
Comum no comércio eletrônico:
yoursite.com/shoes
yoursite.com/shoes?color=red
yoursite.com/shoes?size=10
yoursite.com/shoes?color=red&size=10
Cada combinação de filtros cria um novo URL com conteúdo semelhante.
O problema: Centenas de combinações de filtros criam milhares de páginas quase idênticas.
Conteúdo Duplicado Externo
Trata-se de conteúdo duplicado entre o seu site e outros sites.
Conteúdo extraído
O que é: Alguém copiou seu conteúdo e o publicou em seu site sem permissão.
Como isso acontece:
- Bots de roubo de conteúdo copiam artigos automaticamente.
- Concorrentes roubam descrições de produtos
- Fazendas de conteúdo republicam seu trabalho
- Ferramentas automatizadas de extração de dados
Impacto: Se o site do ladrão tiver maior autoridade, a cópia roubada poderá ficar acima do seu site original nos resultados de busca. Você perde tráfego para ladrões de conteúdo.
conteúdo sindicalizado
O que é: Você publica seu conteúdo em vários sites intencionalmente.
Exemplos:
- Publicar seu artigo no Medium e no seu blog
- Publicar o mesmo artigo como convidado em 5 sites diferentes.
- Comunicados de imprensa distribuídos a sites de notícias
- Descrições dos produtos fornecidas pelos fabricantes
É sempre ruim? Não necessariamente, se feito corretamente, com atribuição adequada e tags canônicas.
Descrições de produtos copiadas
Problema comum: Lojas online que utilizam descrições de produtos padrão do fabricante.
Exemplo: Mil sites que vendem o mesmo iPhone usam a descrição oficial da Apple palavra por palavra.
Resultado: Sua página de produto é idêntica a 999 páginas de concorrentes. O Google escolhe uma para classificar, provavelmente não a sua.
Licenciamento e Parcerias
O que é: Você tem permissão para republicar conteúdo de parceiros ou fontes licenciadas.
Exemplo:
- Agregadores de notícias republicando artigos
- Sites de franquias que compartilham conteúdo corporativo
- Sites afiliados que utilizam conteúdo fornecido
Desafio: Mesmo com permissão, o Google ainda o considera conteúdo duplicado.
Como o conteúdo duplicado prejudica o SEO
Conteúdo duplicado causa diversos problemas de SEO.
Autoridade de página diluída
O problema: Quando várias páginas têm o mesmo conteúdo, os backlinks são distribuídos entre todas as versões.
Exemplo: Você tem conteúdo idêntico em três URLs. Alguém cria um link para a versão A, outra pessoa para a versão B e outra para a versão C.
Em vez de uma página forte com três backlinks, você tem três páginas fracas com um backlink cada.
Resultado: Nenhuma das suas páginas tem o mesmo desempenho que teria se todos os links apontassem para uma única versão.
Google confuso
O Problema da Decisão: O Google precisa escolher qual versão exibir nos resultados da pesquisa.
Perguntas que o Google enfrenta:
- Qual versão é a original?
- Qual versão deve ser classificada?
- Devemos indexar todas as versões ou apenas uma?
- Qual versão melhor corresponde à consulta de pesquisa?
Seu problema: O Google pode escolher a versão errada ou, pior ainda, nenhuma delas.
Orçamento de rastreamento desperdiçado
O que é orçamento de rastejamento: O Google não rastreia todas as páginas do seu site todos os dias. Sites grandes têm um "orçamento de rastreamento" limitado — o número de páginas que o Google rastreará em um determinado período.
O desperdício: Se o Google gastar tempo rastreando 100 páginas duplicadas, poderá perder 100 páginas únicas e valiosas.
Impacto: Seu conteúdo novo ou atualizado leva mais tempo para ser indexado e classificado.
Penalidades (raras, mas possíveis)
Ação manual: Se o Google acreditar que você está criando conteúdo duplicado deliberadamente para manipular os rankings, você poderá receber uma penalização manual.
Quando isso acontece:
- Extrair conteúdo de outros sites intencionalmente.
- Criar centenas de páginas de entrada com o mesmo conteúdo.
- A reescrita automática de conteúdo (girando conteúdo) é mal feita.
Importante: Na maioria dos casos, os problemas com conteúdo duplicado não resultam em penalidades. O Google simplesmente opta por não classificar páginas duplicadas.
Como Encontrar Conteúdo Duplicado
Utilize esses métodos para descobrir conteúdo duplicado em seu site.
Método 1: Pesquisa Google
Verifique seu próprio site:
Operador de pesquisa:
site:yoursite.com "exact phrase from your content"
Exemplo:
site:yoursite.com "this unique sentence appears in my article"
Resultados: Se várias páginas do seu site aparecerem, significa que você tem páginas duplicadas internas.
Verificar cópias externas:
Pesquise frases únicas:
"exact sentence from your article"
Remover site: o operador deverá pesquisar em toda a internet.
Resultados: Se outros sites aparecerem, é possível que tenham copiado seu conteúdo.
Método 2: Copyscape (Gratuito e Pago)
Versão gratuita:
- Acesse copyscape.com
- Insira o URL da sua página
- Clique em “Ir”
- Verifique se existem cópias online.
Limitações: A versão gratuita verifica apenas uma página por vez.
Versão Premium (US$ 5/mês):
- Assine o Copyscape Premium
- Verificação em lote de vários URLs
- Obtenha relatórios detalhados
- Configure alertas de monitoramento
Ideal para: Detectar conteúdo duplicado externo (outros que copiam você).
Método 3: Google Search Console
Verificar se há problemas com conteúdo duplicado:
- Faça login no Search Console
- Acesse o relatório de "Cobertura".
- Procure por avisos de "Duplicados".
- Clique para ver as páginas afetadas
O que mostra:
- Páginas que o Google considera duplicadas
- Quais páginas são excluídas da indexação?
- Problemas com tags canônicas
Verifique quais páginas estão classificadas:
- Acesse o relatório de “Desempenho”.
- Clique na aba “Páginas”
- Procure por URLs semelhantes que estejam bem posicionadas para as mesmas palavras-chave.
Bandeiras vermelhas: Vários URLs do seu site competindo pelos mesmos termos de pesquisa.
Método 4: Screaming Frog SEO Spider
Como usar:
- Baixe Screaming Frog (grátis até 500 URLs)
- Digite o URL do seu site
- Clique em “Iniciar”
- Acesse a aba “Conteúdo”.
- Clique na seção “Duplicar”
O que encontra:
- Títulos duplicados
- Descrições duplicadas
- Conteúdo de página duplicado
- Tags H1 duplicadas
Benefícios:
- Analisa todo o seu site de uma só vez.
- Identifica padrões
- Dados de exportação para análise
Método 5: Siteliner
Ferramenta online fácil de usar:
- Acesse siteliner.com
- Digite o URL do seu site
- Aguarde a conclusão da digitalização (alguns minutos).
- Resultados da revisão
O que mostra:
- Percentagem de conteúdo duplicado
- Páginas duplicadas internas
- Conteúdo comum em todas as páginas
- Páginas exatas com duplicatas
Ideal para: Visão geral rápida dos problemas internos de duplicação.
Método 6: Revisão Manual
Verifique as áreas problemáticas mais comuns:
Páginas do produto:
- Abra de 5 a 10 produtos similares
- Comparar descrições
- Procure por texto idêntico
Postagens no blog:
- Analisar publicações antigas
- Verifique se você reescreveu os mesmos tópicos.
- Procure por seções de copiar e colar
Páginas de categoria:
- Confira categorias semelhantes
- Procure por descrições repetidas
- Revisar combinações de filtros
Como corrigir conteúdo duplicado
Escolha a solução adequada com base no tipo de conteúdo duplicado.
Solução 1: Usar tags canônicas (Melhor na maioria dos casos)
O que faz: Indica ao Google qual versão das páginas duplicadas é a "principal".
Quando usar:
- O mesmo produto em várias páginas de categoria
- Versões para impressão
- Páginas semelhantes que devem existir
Como implementar:
Adicione este código ao <head> seção de páginas duplicadas:
<link rel="canonical" href="https://yoursite.com/original-page" />
Exemplo:
Você tem três URLs que mostram a mesma camisa azul:
yoursite.com/products/blue-shirt (original)
yoursite.com/mens/blue-shirt (duplicate)
yoursite.com/clothing/shirts/blue-shirt (duplicate)
Nas duas páginas duplicadas, adicione:
<link rel="canonical" href="https://yoursite.com/products/blue-shirt" />
Na página original, adicione o seguinte código canônico com autorreferência:
<link rel="canonical" href="https://yoursite.com/products/blue-shirt" />
Importante:
- Use URLs absolutas (incluindo https://)
- Indique a versão que deseja classificar.
- Utilize em todas as páginas duplicadas.
Solução 2: Redirecionamentos 301 (para páginas desnecessárias)
O que faz: Redireciona permanentemente um URL para outro. Usuários e mecanismos de busca veem apenas a página principal.
Quando usar:
- Páginas duplicadas que você não precisa mais.
- URLs antigos substituídos por novos.
- Várias versões sem motivo para manter ambas.
Como implementar:
Para servidores Apache (arquivo .htaccess):
Redirect 301 /old-page https://yoursite.com/new-page
Vários redirecionamentos:
Redirect 301 /products/old-shirt https://yoursite.com/products/blue-shirt
Redirect 301 /shop/old-shirt https://yoursite.com/products/blue-shirt
Para WordPress: Use um plugin como:
- Redirecionamento (gratuito)
- Yoast SEO (inclui gerenciador de redirecionamento)
- Rank Math (inclui recurso de redirecionamento)
Benefícios:
- Consolida a autoridade de ligação
- Reduz o desperdício de rastejamento
- Estrutura do site mais limpa
Solução 3: Tag noindex (para páginas que os usuários precisam)
O que faz: Mantém a página no seu site, mas informa ao Google para não a indexar.
Quando usar:
- Obrigado paginas
- Resultados da pesquisa interna
- Combinações de filtros que os usuários precisam, mas que não devem classificar.
- Páginas de login/conta
Como implementar:
adicionar aos <head> seção:
<meta name="robots" content="noindex, follow" />
O que significa:
- noindex: Não incluir nos resultados da pesquisa
- Seguir: Continue seguindo os links desta página
Casos de uso de exemplo:
<!-- On search results page -->
<meta name="robots" content="noindex, follow" />
<!-- On thank you page -->
<meta name="robots" content="noindex, follow" />
<!-- On filtered pages -->
<meta name="robots" content="noindex, follow" />
Importante: Não combine noindex com canonical. Escolha uma das soluções.
Solução 4: Manipulação de parâmetros no Search Console
Para URLs dinâmicas com parâmetros:
Exemplo de problema:
yoursite.com/products?sort=price
yoursite.com/products?sort=name
yoursite.com/products?sort=rating
Solução:
- Acesse o Google Search Console
- Clique em “Ferramentas e relatórios legados”
- Acesse “Parâmetros da URL”
- Clique em “Adicionar parâmetro”
- Insira o nome do parâmetro (por exemplo, “classificar”)
- Diga ao Google como lidar com isso:
- “Não afeta o conteúdo da página” (recomendado para classificação)
- “Paginatos”
- “Restringe o conteúdo”
Benefícios: O Google entende quais parâmetros criam duplicados e os trata corretamente.
Solução 5: Consolidar e Reescrever
Para páginas duplicadas reais:
O problema: Você escreveu três artigos semelhantes sobre o mesmo tema.
Exemplo:
- “10 dicas de SEO para iniciantes”
- “Melhores dicas de SEO para novos sites”
- “Conselhos de SEO para Iniciantes”
Todos abordam as mesmas informações.
Solução:
- Escolha o artigo com melhor desempenho.
- Combine informações exclusivas de outras pessoas.
- Crie um artigo abrangente
- Exclua ou redirecione os demais (301)
Benefícios:
- Uma página forte em vez de três páginas fracas.
- Melhor experiência do usuário
- O Google considera este o vencedor indiscutível no ranking.
Solução 6: Bloquear parâmetros de URL no arquivo robots.txt
Para parâmetros que você nunca deseja indexar:
Exemplo:
# Block session IDs
Disallow: /*?sessionid=*
# Block certain filters
Disallow: /*?color=*
# Block sorting parameters
Disallow: /*?sort=*
Quando usar:
- Parâmetros de rastreamento de sessão
- Combinações de filtros desnecessárias
- Versões para impressão
Cuidado: Isso impede completamente o rastejamento. Use com moderação.
Solução 7: Adicionar conteúdo exclusivo
Para páginas de produtos com descrições do fabricante:
O problema: Sua página de produto é idêntica à de 500 sites concorrentes.
Solução:
Adicionar elementos únicos:
- Sua própria avaliação do produto (mais de 200 palavras)
- Opiniões
- Dicas de uso
- Comparação com produtos similares
- Suas fotos e vídeos
- seção FAQ
- Guias de dimensionamento
Exemplo de estrutura:
[Manufacturer description] (20% of content)
Your review and tips (40% of content)
Customer reviews (20% of content)
FAQ (20% of content)
Resultado: Sua página agora é 80% exclusiva, o suficiente para diferenciá-la da concorrência.
Solução 8: Remover conteúdo extraído
Se outras pessoas copiaram seu conteúdo:
Passo 1: Documente o roubo
- Faça uma captura de tela da página deles.
- Observe as datas de publicação (a sua é anterior).
- Salvar URLs e evidências
Passo 2: Entre em contato com o proprietário do site.
- Encontre informações de contato
- Envie um e-mail educado solicitando a remoção.
- Forneça provas de que você é o autor original.
Etapa 3: Registre uma reclamação DMCA Se eles não responderem:
- Envie uma notificação de remoção por violação de direitos autorais (DMCA) ao provedor de hospedagem deles.
- Apresente uma reclamação DMCA ao Google.
- Denuncie ao Google Search Console
Passo 4: Use a ferramenta do Google
- Acesse google.com/webmasters/tools/dmca-notice
- Preencha o formulário de violação de direitos autorais
- Forneça os URLs do conteúdo original e do conteúdo copiado.
- Enviar
O Google irá: Analise sua reclamação e, se necessário, remova o conteúdo copiado dos resultados de pesquisa.
Prevenção de conteúdo duplicado
Evite problemas com conteúdo duplicado antes que eles comecem.
Estratégia de Prevenção 1: Planejar a Estrutura do Local
Antes de construir seu site:
Criar estrutura de URL: Defina um padrão de URL canônico para cada tipo de conteúdo.
Exemplo de produto: ✓ Bom: seudominio.com/produtos/[nome-do-produto] ✗ Evite: Vários caminhos para o mesmo produto
Arquitetura do site:
- Hierarquia de categorias clara
- Sem categorias sobrepostas
- Cada produto em uma categoria principal
Benefícios: Impede a existência de vários URLs desde o início.
Estratégia de prevenção 2: Definir domínio preferencial
Escolha com ou sem www:
No Search Console:
- Vá para as configurações
- Procure as configurações de domínio.
- Defina o domínio preferido
No arquivo .htaccess:
# Redirect non-www to www
RewriteEngine On
RewriteCond %{HTTP_HOST} ^yoursite\.com [NC]
RewriteRule ^(.*)$ https://www.yoursite.com/$1 [L,R=301]
Benefícios: Todos os links apontam para uma única versão, evitando conteúdo duplicado.
Estratégia de prevenção 3: Escreva descrições de produtos originais
Não copie as descrições do fabricante:
Em vez disso, escreva:
- Sua perspectiva sobre o produto
- Benefícios exclusivos que você notou
- Como isso resolve problemas específicos
- Comparação com alternativas
- Cenários de uso reais
Dica para economizar tempo: Crie um modelo, mas personalize-o para cada produto:
- Características (podem ser semelhantes)
- Sua avaliação (deve ser original)
- Casos de uso (variam conforme o produto)
Estratégia de prevenção 4: Use Rel="prev" e Rel="next" para paginação.
Para conteúdo paginado:
Na página 1:
<link rel="next" href="https://yoursite.com/blog?page=2" />
Na página 2:
<link rel="prev" href="https://yoursite.com/blog" />
<link rel="next" href="https://yoursite.com/blog?page=3" />
Na última página 3:
<link rel="prev" href="https://yoursite.com/blog?page=9" />
O que faz: Informa ao Google que essas páginas fazem parte de uma série e não são duplicadas.
Observação: O Google descontinuou isso em 2019, mas ainda o considera um sinal.
Estratégia de Prevenção 5: Diretrizes de Sindicato
Se você republicar o conteúdo em outro lugar:
Passo 1: Aguarde antes de fazer a distribuição. Publique primeiro no seu site e aguarde de uma a duas semanas para que o Google indexe o conteúdo.
Passo 2: Adicione a tag canônica à versão distribuída. Solicite à editora que adicione:
<link rel="canonical" href="https://yoursite.com/original-article" />
Passo 3: Adicionar atribuição de autoria Inclua um link para o seu site na sua linha de crédito.
Passo 4: Evite cópias literais Modifique a introdução ou adicione elementos únicos.
Estratégia de prevenção 6: Bloquear versões da impressora
Se você tiver páginas próprias para impressão:
Opção 1: Não indexá-los
<meta name="robots" content="noindex, follow" />
Opção 2: Usar tags canônicas Aponte as versões impressas de volta para a página principal.
Opção 3: Use CSS para impressão Em vez de páginas separadas, use estilos de impressão CSS:
<link rel="stylesheet" href="print.css" media="print" />
Não é necessário um URL separado.
Estratégia de prevenção 7: Monitorar regularmente
Configurar alertas:
Alertas do Google:
- Acesse google.com/alerts
- Insira frases exclusivas do seu conteúdo.
- Defina a frequência para "conforme acontece".
- Receba um e-mail quando o conteúdo for publicado online.
Copyscape Premium:
- Monitoramento automático
- Relatórios semanais
- Alertas para novas cópias
Confira mensalmente:
- Pesquise no Console por problemas duplicados
- Varredura Siteliner
- Revisão manual de novas páginas
Conteúdo duplicado resulta em penalização do Google?
Não, conteúdo duplicado não é penalizado na maioria dos casos. O Google simplesmente escolhe uma versão para classificar e filtra as outras. Você não será penalizado a menos que esteja manipulando deliberadamente as classificações com conteúdo copiado ou criando centenas de páginas de entrada.
Ter a mesma barra lateral em todas as páginas conta como duplicado?
Não. O Google entende que os modelos de sites incluem elementos repetidos, como cabeçalhos, rodapés, barras laterais e navegação. O que importa é que a área de conteúdo principal seja única em cada página.
O Google Search Console consegue mostrar todos os problemas de conteúdo duplicado?
O Search Console mostra os resultados duplicados que o Google descobriu, mas não todos. Ele se concentra em problemas que afetam a indexação. Use o Screaming Frog ou o Siteliner para uma auditoria interna completa. Combine várias ferramentas para obter melhores resultados.