O vazamento do Google em maio de 2024 é talvez o maior vazamento na história do Google.
Além de uma rara espiada nos algoritmos bem guardados do mecanismo de busca dominante, o que torna o vazamento importante é que alguns detalhes parecem contradizer declarações públicas anteriores de representantes do Google.
No entanto, tendo em conta a cronologia e a natureza destas declarações, as contradições não são inteiramente a preto e branco.
A documentação menciona um recurso que implica a pontuação “siteAuthority” da computação do Google. Consequentemente, isso põe em questão uma declaração de sete anos do porta-voz do Google, John Mueller, na qual ele mencionou que o mecanismo de busca não usa uma “pontuação de autoridade do site”.
Mas Mueller usou frases como “do meu ponto de vista” e “algo parecido”, o que sugere que os porta-vozes do Google podem estar se apoiando na imprecisão e na semântica, uma estratégia comum para representantes corporativos.
Compreensivelmente, o Google deseja proteger seus resultados de pesquisa de pessoas mal-intencionadas. Mas, para o bem dos bem-intencionados e para manter a sua confiança, talvez seja melhor seguir a linha de “Não podemos comentar sobre isso” da próxima vez e evitar mentir.
Portanto, embora o vazamento da API do Google tenha revelado alguns insights fascinantes sobre os algoritmos do gigante dos mecanismos de busca, este não é um momento de “pegadinha” para a otimização de mecanismos de busca (SEO) e profissionais de marketing digital.
Em vez disso, o vazamento deve despertar o entusiasmo dos profissionais em explorar e testar o que o Google diz.
Este artigo analisará os vazamentos do Google da seguinte forma:
- Como ocorreu o vazamento do Google?
- Revelação do último vazamento do Google
- Resposta do Google: Cuidados contra a má interpretação de documentos vazados
- Outro vazamento de dados do Google
- Como a comunidade SEO deve reagir
- Obtenha ajuda com Serviços de SEO
Como aconteceu o vazamento do Google?
A sequência de eventos em torno do vazamento do Google começou em 13 de março, quando uma fonte anônima conhecida como “yoshi-code-bot” postou a documentação vazada no GitHub. Apesar da importância potencial do conteúdo, a postagem não atraiu a atenção do público ou da mídia.
Em um esforço para trazer mais conscientização sobre o vazamento, a fonte anônima entrou em contato com Rand Fishkin por e-mail em 5 de maio. Fishkin, uma figura bem conhecida na comunidade SEO, inicialmente hesitou, mas acabou levando o assunto a sério e procurou o conselho de Mike King, outro respeitado especialista na área.
A colaboração deles culminou com a publicação de suas respectivas análises e comentários por Fishkin e King em 27 de maio. Essas postagens aumentaram significativamente o perfil do vazamento e chamaram a atenção da comunidade SEO e além.
No dia seguinte, 28 de maio, a fonte anônima revelou sua identidade. Erfan Azimi, um profissional de SEO e fundador da EA Eagle Digital, se apresentou e postou um vídeo no YouTube discutindo por que ele buscou o vazamento do algoritmo do Google.
Revelação do último vazamento do Google
Menções a grandes modelos de linguagem e recursos generativos indicam que o vazamento é um documento recente.
“O vazamento nos dá a visão mais ampla que já tivemos sobre como o Google potencialmente classifica os sites ”
Aqui está um resumo do que foi revelado no vazamento do Google:
Mais de 2.500 módulos contendo 14.000 recursos de classificação
O vazamento de dados do Google expõe uma estrutura elaborada com 2.596 módulos com 14.014 atributos. Apesar da extensa documentação, os detalhes sobre a ponderação destas características permanecem um mistério, sugerindo um sistema de classificação altamente complexo e cheio de nuances. Ainda assim, destaca a importância de vários elementos para o SEO.
Os links ainda são importantes, mas a forma como eles são importantes é diferente
A documentação vazada da pesquisa do Google parece enfatizar a diversidade e relevância dos links, juntamente com a influência duradoura do PageRank para homepages de sites. No entanto, o foco parece ter sido provado mudar da quantidade pura para a qualidade e o comportamento real do usuário (cliques). Isso sugere que links de sites respeitáveis que não recebem cliques podem ser irrelevantes.
Um foco inegável em cliques bem-sucedidos
Vários módulos da documentação vazada da API de pesquisa do Google sugerem como o Google rastreia várias métricas de cliques, como “goodClicks”, “badClicks”, “lastLongestClicks” e “unicornClicks” para avaliar o envolvimento e a satisfação do usuário. Isso reforça a necessidade de conteúdo de alta qualidade que mantenha os usuários engajados.
Os dados do Chrome desempenham um papel
Um módulo chamado “ChromeInTotal” implica que o Google alavanca dados de usuários do Chrome para propósitos de classificação, o que significa que o comportamento do usuário dentro do navegador Chrome pode influenciar os resultados da pesquisa. No passado, representantes do Google como Matt Cutts e John Mueller disseram que o Google não usa dados do Chrome para classificação de pesquisa (o que poderia ter sido verdade naquela época).
Domínios na lista de permissões levantam questionamentos
Módulos como “isElectionAuthority” e “isCovidLocalAuthority” no vazamento do algoritmo do Google sugerem que o Google coloca domínios específicos na lista de permissões para eleições e informações sobre a COVID. Embora isso ajude a garantir que fontes confiáveis e de alta qualidade sejam priorizadas, também levanta preocupações sobre o potencial viés e os critérios para tal lista de permissões.
Entidades de editores e autores são destacadas
Recursos como “isPublisher” (proprietário do site) e “isAuthor” (criador de conteúdo) parecem indicar que o Google valoriza essas entidades. Porém, essas entidades são booleanas, o que significa que o algoritmo pode saber quem é o editor ou autor ou não. Caso contrário, o Google provavelmente perderia a confiança no site ou no conteúdo.
Informações de autoria estão sendo armazenadas
O vazamento da API Content Warehouse também mostra que o Google parece armazenar documentação sobre autores. Isso sugere que o Google pode estar usando as informações para determinar a expertise e a autoridade do autor, que são características do EEAT do Google.
Razões para rebaixamento
O vazamento de pesquisa do Google também esclareceu alguns possíveis motivos pelos quais o conteúdo pode ser rebaixado nos resultados de pesquisa com alguns recursos como “anchorMismatchDemotion” (os links não correspondem ao site de destino). Outros motivos incluem análises de produtos de baixa qualidade, incompatibilidade de localização, domínios de correspondência exata (sem qualidade de conteúdo) e conteúdo adulto.
Sites pequenos ganham posição?
Um recurso chamado “smallPersonalSite” na documentação vazada da pesquisa do Google sugere que o Google pode ajustar classificações para pequenos sites e blogs. No entanto, o impacto exato permanece incerto, mas sugere potenciais ajustes de classificação por meio de Twiddlers (sistemas de reclassificação com base em frescor).
As datas são importantes para avaliar a atualização do conteúdo
Vários atributos implicam que o Google valoriza datas, observando datas em linhas de base “bylineDate”, URLs “syntacticDate” e o próprio conteúdo “semanticDate”. Esses recursos destacam o foco do Google em atualidade e, possivelmente, no rastreamento de criadores de conteúdo original ou fontes para rastrear conteúdo duplicado.
Conteúdo-Comprimento e Originalidade São Pontuados
O atributo “OriginalContentScore” sugere que a originalidade do conteúdo seja pontuada de 0 a 512. Curiosamente, para peças mais curtas, a pontuação máxima é limitada a 127. O foco do recurso na originalidade indica que conteúdo superficial não é igual a curto, mas sim a falta de substância, o que pode estar presente tanto em textos curtos quanto longos.
Nada de novo nos títulos das páginas, mas no tamanho da fonte?
O recurso “titlematchScore” parece reiterar a importância dos títulos das páginas. Ele mede quão bem o título de uma página corresponde às consultas de pesquisa. O Google também parece considerar o tamanho médio da fonte ponderada dos termos “avgTermWeight” em documentos e texto âncora.
Agora, há mais de onde isso vem. Muitas das coisas que surgiram parecem confirmar suspeitas que tínhamos há anos.
Mas há uma quantidade enorme de dados para vasculhar, então eu esperaria que mais revelações surgissem nas próximas semanas e meses.
Sempre foi importante ficar por dentro das novidades, testes e estudos do setor, mas é ainda mais importante agora do que nunca.
A documentação vazada da API de pesquisa do Google também revela atributos para rastrear registros de domínio e identificar e manipular sites orientados a vídeo.
Também inclui documentos sobre vários produtos do Google, como Google Cloud, People API, recomendações do YouTube, respostas do Google Assistant, como os livros são classificados nos resultados de pesquisa e como os vídeos são encontrados.
Ainda assim, considerando todas as coisas para a Pesquisa, não está claro como os atributos vazados são precisamente ponderados como fatores de classificação do Google ou quais estão sendo usados no momento.
Resposta do Google: Advertências contra a má interpretação de documentos vazados
A resposta do gigante dos mecanismos de busca ao vazamento da API de pesquisa do Google foi, sem surpresa, comedida, reconhecendo indiretamente o vazamento e reiterando seu compromisso em manter a integridade de seus resultados de pesquisa.
Alertamos contra fazer suposições imprecisas sobre a Pesquisa com base em informações fora de contexto, desatualizadas ou incompletas. Compartilhamos informações extensas sobre como a Pesquisa funciona e os tipos de fatores que nossos sistemas avaliam, ao mesmo tempo que trabalhamos para proteger a integridade de nossos resultados contra manipulação.
– Davis Thompson, porta-voz do Google
Em sua conversa com o Search Engine Land, o Google enfatizou que os fatores ou sinais de classificação do Google estão “mudando constantemente”.
No entanto, o Google esclareceu que isso não significa que seus princípios básicos de classificação sejam alterados – eles permanecem consistentes.
O Google também disse que continuará comprometido em compartilhar todas as informações possíveis com a comunidade de SEO.
Outro vazamento de dados do Google
Em 4 de junho, um banco de dados interno do Google contendo problemas de privacidade e segurança de 2013 a 2018 vazou, obtido pela 404 Media. O vazamento revelou que o Google rastreou esses problemas, mas não necessariamente os divulgou publicamente, e alguns foram resolvidos rapidamente.
Aqui estão alguns dos incidentes nos vazamentos do Google:
- O Google foi encontrado fazendo recomendações do YouTube com base no histórico de exibição excluído dos usuários.
- Um incidente foi sinalizado em que alguém estava manipulando contas de marketing de clientes na plataforma de anúncios do Google.
- Após a aquisição do Socratic.org pelo Google, mais de um milhão de endereços de e-mail de usuários foram expostos publicamente por mais de um ano.
- O Google Street View capturou e armazenou acidentalmente milhares de números de placas de carros em 2016. Um funcionário relatou o problema e o Google posteriormente apagou os dados.
- O Waze, adquirido pelo Google por US$ 1,3 bilhão em 2013, tinha um recurso de carona que vazava os históricos de viagens e endereços residenciais dos usuários.
- Um contratado usou seu acesso de administrador para baixar e assistir a um trailer de jogo privado no canal do YouTube da Nintendo em 2017. O contratado compartilhou uma captura de tela do trailer com um amigo, que então a postou no Reddit . Uma revisão interna do Google considerou o incidente “não intencional”. A Nintendo lançou o trailer no mesmo ano e lançou o jogo Yoshi’s Crafted World no Switch em 2019.
Embora os incidentes individuais possam parecer insignificantes para as massas, o quadro geral que eles pintam é preocupante. Este vazamento do Google, uma empresa poderosa a quem foi confiada uma quantidade enorme de nossos dados pessoais, revela um padrão de manuseio incorreto de informações sensíveis do usuário.
Entre Amazon, Apple, Facebook, X (anteriormente Twitter) e Google, este último é o que coleta a maior parte dos dados dos usuários.
A empresa Alphabet Inc. confirmou esses vazamentos do Google, dizendo que seus funcionários têm um sistema para relatar possíveis problemas com produtos do Google. Afirmou ainda que “os relatórios obtidos pela 404 [Media] são de há mais de seis anos e são exemplos destas bandeiras”.
Como um Essiouzeiro deve avançar
O vazamento do algoritmo do Google oferece um raro vislumbre, não todo o seu funcionamento interno. Não é aconselhável pegar nenhum dos atributos mencionados na documentação e tratá-lo como um fator definitivo de classificação do Google.
Novamente, não podemos ter certeza de quais desses atributos ou sistemas estão ativos ou desativados.
Podemos conhecer alguns ingredientes-chave do “molho secreto” do Google, mas não sabemos necessariamente quanto açúcar ou tempero adicionar.
Concentre-se em oferecer a melhor experiência possível ao usuário em seu site e combiná-la com um conteúdo forte que atenda às necessidades do seu público.
Testar, observar e otimizar.
Vamos trabalhar juntos para classificar sua marca
Como um profissional do marketing e Consultor de SEO entendo o quão significante é se manter atualizado e aplicando técnicas em cada atualização do google para manter sempre as melhores classificações para as empresas dos meus clientes.
Alguns dos meus serviços de SEO são: