Google 12 anos: o que mudou nos sites de busca

04/10/2010

O Google nasceu em 1998, ano em que o mercado de busca já era volumoso mas representava um gigantesco ponto de interrogação em termos de perspectivas de lucro. Hoje, pelo menos no que se refere ao Google, não existe mais qualquer sombra de duvida com relação à lucratividade desse modelo de negócio e somente a empresa Google faturou em 2009 a bagatela de 23,6 bilhões de dólares. Com tanto dinheiro envolvido neste negócio é natural que tenha havido uma evolução na ferramenta de busca que, afinal de contas, é o pilar sobre o qual se assenta essa dinheirama toda.

O Google e a maioria dos sites de busca desejam essencialmente agradar o seu usuário. Para isso a ferramenta de busca deve trazer resultados relevantes, ou seja, fornecer indicações de páginas que sejam úteis para quem procura por determinada informação. Esse objetivo levou as empresas a modificar o sistema ao longo do tempo tentando evitar a manipulação dos resultados e passando a utilizar critérios que possam reproduzir uma avaliação de qualidade por parte do usuário. Isso é perceptível por meio das mudanças ocorridas nesse período.  

1. Avaliação de qualidade baseada no julgamento humano.
Antes mesmo do Google, o Yahoo que foi um dos mais antigos sites de busca oferecia um diretório dividido por assuntos e administrado por pessoas que incluíam os novos sites a medida que surgiam. Essa forma manual de gerenciamento das informações foi alterada posteriormente em razão do crescimento gigantesco da Internet, mas é possível que tenha sido uma das causas da perda gradativa de posições do Yahoo no mercado. O Google já iniciou suas atividades com um sistema de busca totalmente realizado por robots.

2. Pagerank baseado em densidade de palavras-chave
Além desse problema, o critério de palavra-chave somente não oferecia uma avaliação precisa do valor de uma página, pois embora uma página possa estar fortemente associada a uma palavra-chave, isso não significa necessariamente que ela tenha um conteúdo de qualidade.

3. Pagerank baseado em links
A resposta prática para o problema foi dada justamente por Larry Page e Sergey Brin fundadores do Google. O sistema de busca do Google utiliza como critério de avaliação não somente a palavra-chave, mas também os links existentes entre os milhões de páginas existentes no mundo da Internet. A premissa na qual se baseia esse critério é a de que editores só vão perder tempo colocando um link para a página X se esta realmente for relevante para seus usuários, de tal maneira que cada link externo recebido pela página X funciona como se fosse um voto na qualidade de seu conteúdo. A conseqüência é que quanto maior a quantidade de links externos que uma página recebe, melhor é o seu pagerank. Mas o sistema vai além ao considerar também a qualidade da página de origem do link, de tal forma que receber um link de uma página relevante para determinada palavra-chave, tem mais valor do que receber vários links de páginas não relevantes. O sistema se torna complexo ao juntar a freqüência relativa da palavra-chave, os links de entrada e de saída, o pagerank de cada página que hospeda o link, além de inúmeras outras variáveis, algumas desconhecidas por nós.

Evidentemente o sistema de busca não é perfeito, haja vista que é comum termos que percorrer vários resultados até encontrarmos a informação adequada ao nosso interesse, mas sem dúvida evoluiu sensivelmente nos últimos anos. É possível que em um futuro próximo possamos chegar a algo mais próximo a perfeição. Com certeza, muita gente está trabalhando para que isso ocorra.  

Novos buscadores começam a utilizar sistemas chamados  robots  ou spyders que percorrem a web catalogando e indexando todas as páginas encontradas.  O sistema analisa a página encontrada de forma a detectar quais as palavras-chave mais representativas, baseado na freqüência relativa das palavras na página e na sua localização, entre outros fatores que vão servir como critério de avaliação de sua relevância, ou seu pagerank como é conhecida hoje essa avaliação. Páginas de maior pagerank aparecem em primeiro lugar nos resultados de busca para a palavra-chave em questão. Essa abordagem, baseada exclusivamente nas palavras-chave, mostrou-se frágil para editores mais afoitos por boas posições no ranking que passaram a construir páginas recheadas de palavras-chave repetidas de forma a burlar os sistemas.

Dailton Felipini é mestre e graduado em administração de empresas pela Fundação Getúlio Vargas em São Paulo. Autor do livro Google Top 10, Consultor especialista em e-commerce, palestrante e editor do site www.e-commerce.org.br.

Please rate this

0 respostas

Deixe uma resposta

Want to join the discussion?
Feel free to contribute!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.