Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.
Os Oráculos Digitais: Qual o melhor? (Tutorial, parte 24)
Eu não vou responder à pergunta do título, mas pretendo alimentar suas
idéias para que, a cada vez que realize uma busca, conheça bem suas
opções e avalie quais delas vai utilizar. Há três maneiras de anal;isar
oráculos comparativamente: segundo seus recursos de arquivo e
atualização, sua linguagem de busca e sua área de operação.
Danny Sullivan, da Calafia Consulting mantém em
http://calafia.com/webmasters/chart.htm uma atualizada comparação entre
os "search engines" no aspecto arquivo e atualização. Quem gosta dos
grandes números para tomar decisões deve se dirigir ao banco de dados de
66 milhões de URLs do Lycos. Hotbot, InfoSeek e Excite seguem algo distantes dos calcanhares do Lycos,
com cerca de 50 milhões de URLs.
Mas, veja só, de todos estes oráculos citados, só o Lycos não mantém
arquivo de texto completo das páginas que registra em seu banco de
dados! A vantagem de oráculos com texto completo é óbvia: sua
palavra-chave de busca poderá ser encontrada em qualquer palavra de
qualquer página do banco de dados. No sistema do Lycos, apenas um resumo
do texto da página é arquivado.
O Lycos - e também o Excite e o Open Text -
não reconhece "meta-tags", um recurso da linguagem HTML que ajuda os
oráculos a classificarem as páginas segundo as palavras-chaves e título
de interesse do autor da página. Mas, em compensação, o Lycos, que ficou
na berlinda, cataloga três níveis de cada home-page. Melhor que isso só
o AltaVista, Excite e o Hotbot. A vantagem?
Não só sua home-page estará disponível, como também todas as demais
páginas que estiverem no servidor até o número de níveis (três, para o
Lycos, e ilimitado para o HotBot). Naturalmente, o HotBot está liderando
nesta área.
Somente o Lycos e o AltaVista são capazes de oferecer um importante
recurso: a informação de quando a página foi checada pela última vez..
Fui ao Altavista e procurei por "charlab" e "97" (você já sabe que para
procurar por duas palavras no AltaVista devemos colocar o sinal de +
antecedendo-as). Assim descobri que, há poucos dias, mais exatamente dia
11 de fevereiro, ganhei menção na página do Mauricio Rocha, sobre
"Oncologia e Aquariofilia" (http://www.geocities.com/CapeCanaveral/8557/). Uma informação similar,
algo menos relevante, é a data de quando a página foi arquivada no banco
de dados, o que pelo menos oferece pistas de quão atual é o oráculo.
Este segundo recurso é oferecido pelo AltaVista, HotBot e InfoSeek.
E qual seria o oráculo atualizado diariamente? O OpenText! Altavista e
InfoSeek anunciam atualizações em um a dois dias; HotBot e Excite,
semanais; Lycos, entre duas e quatro semanas.
A IslandWeb Ventures reuniu
mais informações sobre os oráculos para um quadro comparativo sobre suas
respectivas áreas de operação. Em resumo:
A busca exige palavra-chave ou grandes temas? No segundo caso, busque o Yahoo!, Lycos, Excite, InfoSeek e Galaxy.
Quais oráculos são do tipo "meta", submetendo sua busca a vários mecanismos simultaneamente? MetaCrawler e Savvy Search.
Liste os que são capazes de procurar arquivos em FTP: Lycos e Galaxy.
E os que vasculham mensagens da Usenet? Yahoo!, HotBot, AltaVista, Dejanews, Excite e InfoSeek.
Para procurar por pessoas e seus respectivos endereços de correio eletrônico: Yahoo!, Excite e InfoSeek.
E Terry A. Gray, em "How to Search the Web - A Guide To Search Tools",
apresenta outra interessante comparação, desta vez destacando aspectos
específicos da linguagem de busca de cada oráculo. Veja:
Quais oráculos distinguem maiúsculas e minúsculas? AltaVista e InfoSeek.
Quais aceitam booleanos? AltaVista, Excite, WebCrawler, OpenText e
NlightN
Quais fazem busca pela proximidade entre as palavras-chaves?
AltaVista, WebCrawler, OpenText e InfoSeek.
Quais aceitam frases para a busca? AltaVista, WebCrawler, OpenText,
InfoSeek, e NlightN.
Vale a pena saber o que a crítica especializada pensa sobre os oráculos.
A C/NET
recomenda o meu favorito - Metacrawler - para quem sabe
o que procura. Em busca de orientação, o caminho deve ser o, Yahoo!,
claro. E ainda saiu uma menção honrosa para o AltaVista.
Eu não faria uma crítica muito diferente disto. Gosto imensamente destes
três oráculos, e ainda dou crédito ao Excite por sua página de notícias
personalizadas; ao Lycos por sua variedade de assuntos pesquisáveis
concentrados num único oráculo; ao NlightN por sua exclusiva utilização
de bancos de dados (pagos) científicos que não fazem parte do Word Wide
Web. Também destaco as ferramentas independentes, como o More like this.
Vou concluir este tutorial com um resumo de uso e indicações de exemplos
de busca. Se desejar fazer parte, basta que me envie um tema ou
palavras-chaves para busca, assim como a aprovação para que eu a cite no
texto, bem como identifique você com nome completo e e-mail.
Esta coluna de hoje é especialmente dedicada ao meu amigo André, cujo
ramal de telefone é o 24. Também a dedico ao Liberatti, competentíssimo
ilustrador aqui do JB, não por afinidade numerológica, mas porque me
honrou com seu traço na edição da semana passada, que eu pretendia
ilustrar com a teoria dos conjuntos, de álgebra. Facilitaria a
compreensão dos booleanos (tema da parte 23). Quem tiver interesse
(claro!) e for capaz de receber imagem formato jpeg, em "attached" numa
mensagem de e-mail pode pedir enviando mensagem para charlab@ax.apc.org.
Para receber as outras partes deste tutorial (que, aliás, acaba na parte
25!), escreva para charlab@charlab.com.br
* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".