Busca em DICAS
Busca na Internet
Cadernos de Informática
DICAS de MPB
DICAS do Charlab
DICAS do Editor
DICAS dos Leitores
DICAS por E-mail
Internet Kids
Notas na Imprensa
Internet Radios
Internet Shopping
Internet TV
Revistas de Informática
Software na Internet
Turismo Virtual


Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.


Os Oráculos Digitais: Qual o melhor? (Tutorial, parte 24)

Eu não vou responder à pergunta do título, mas pretendo alimentar suas idéias para que, a cada vez que realize uma busca, conheça bem suas opções e avalie quais delas vai utilizar. Há três maneiras de anal;isar oráculos comparativamente: segundo seus recursos de arquivo e atualização, sua linguagem de busca e sua área de operação.

Danny Sullivan, da Calafia Consulting mantém em http://calafia.com/webmasters/chart.htm uma atualizada comparação entre os "search engines" no aspecto arquivo e atualização. Quem gosta dos grandes números para tomar decisões deve se dirigir ao banco de dados de 66 milhões de URLs do Lycos. Hotbot, InfoSeek e Excite seguem algo distantes dos calcanhares do Lycos, com cerca de 50 milhões de URLs.

Mas, veja só, de todos estes oráculos citados, só o Lycos não mantém arquivo de texto completo das páginas que registra em seu banco de dados! A vantagem de oráculos com texto completo é óbvia: sua palavra-chave de busca poderá ser encontrada em qualquer palavra de qualquer página do banco de dados. No sistema do Lycos, apenas um resumo do texto da página é arquivado.

O Lycos - e também o Excite e o Open Text - não reconhece "meta-tags", um recurso da linguagem HTML que ajuda os oráculos a classificarem as páginas segundo as palavras-chaves e título de interesse do autor da página. Mas, em compensação, o Lycos, que ficou na berlinda, cataloga três níveis de cada home-page. Melhor que isso só o AltaVista, Excite e o Hotbot. A vantagem? Não só sua home-page estará disponível, como também todas as demais páginas que estiverem no servidor até o número de níveis (três, para o Lycos, e ilimitado para o HotBot). Naturalmente, o HotBot está liderando nesta área.

Somente o Lycos e o AltaVista são capazes de oferecer um importante recurso: a informação de quando a página foi checada pela última vez.. Fui ao Altavista e procurei por "charlab" e "97" (você já sabe que para procurar por duas palavras no AltaVista devemos colocar o sinal de + antecedendo-as). Assim descobri que, há poucos dias, mais exatamente dia 11 de fevereiro, ganhei menção na página do Mauricio Rocha, sobre "Oncologia e Aquariofilia" (http://www.geocities.com/CapeCanaveral/8557/). Uma informação similar, algo menos relevante, é a data de quando a página foi arquivada no banco de dados, o que pelo menos oferece pistas de quão atual é o oráculo. Este segundo recurso é oferecido pelo AltaVista, HotBot e InfoSeek.

E qual seria o oráculo atualizado diariamente? O OpenText! Altavista e InfoSeek anunciam atualizações em um a dois dias; HotBot e Excite, semanais; Lycos, entre duas e quatro semanas.

A IslandWeb Ventures reuniu mais informações sobre os oráculos para um quadro comparativo sobre suas respectivas áreas de operação. Em resumo:

A busca exige palavra-chave ou grandes temas? No segundo caso, busque o Yahoo!, Lycos, Excite, InfoSeek e Galaxy.
Quais oráculos são do tipo "meta", submetendo sua busca a vários mecanismos simultaneamente? MetaCrawler e Savvy Search.
Liste os que são capazes de procurar arquivos em FTP: Lycos e Galaxy.
E os que vasculham mensagens da Usenet? Yahoo!, HotBot, AltaVista, Dejanews, Excite e InfoSeek.
Para procurar por pessoas e seus respectivos endereços de correio eletrônico: Yahoo!, Excite e InfoSeek.

E Terry A. Gray, em "How to Search the Web - A Guide To Search Tools", apresenta outra interessante comparação, desta vez destacando aspectos específicos da linguagem de busca de cada oráculo. Veja:

Quais oráculos distinguem maiúsculas e minúsculas? AltaVista e InfoSeek.
Quais aceitam booleanos? AltaVista, Excite, WebCrawler, OpenText e NlightN
Quais fazem busca pela proximidade entre as palavras-chaves? AltaVista, WebCrawler, OpenText e InfoSeek.
Quais aceitam frases para a busca? AltaVista, WebCrawler, OpenText, InfoSeek, e NlightN.

Vale a pena saber o que a crítica especializada pensa sobre os oráculos. A C/NET recomenda o meu favorito - Metacrawler - para quem sabe o que procura. Em busca de orientação, o caminho deve ser o, Yahoo!, claro. E ainda saiu uma menção honrosa para o AltaVista.
Eu não faria uma crítica muito diferente disto. Gosto imensamente destes três oráculos, e ainda dou crédito ao Excite por sua página de notícias personalizadas; ao Lycos por sua variedade de assuntos pesquisáveis concentrados num único oráculo; ao NlightN por sua exclusiva utilização de bancos de dados (pagos) científicos que não fazem parte do Word Wide Web. Também destaco as ferramentas independentes, como o More like this.

Vou concluir este tutorial com um resumo de uso e indicações de exemplos de busca. Se desejar fazer parte, basta que me envie um tema ou palavras-chaves para busca, assim como a aprovação para que eu a cite no texto, bem como identifique você com nome completo e e-mail.

Esta coluna de hoje é especialmente dedicada ao meu amigo André, cujo ramal de telefone é o 24. Também a dedico ao Liberatti, competentíssimo ilustrador aqui do JB, não por afinidade numerológica, mas porque me honrou com seu traço na edição da semana passada, que eu pretendia ilustrar com a teoria dos conjuntos, de álgebra. Facilitaria a compreensão dos booleanos (tema da parte 23). Quem tiver interesse (claro!) e for capaz de receber imagem formato jpeg, em "attached" numa mensagem de e-mail pode pedir enviando mensagem para charlab@ax.apc.org. Para receber as outras partes deste tutorial (que, aliás, acaba na parte 25!), escreva para charlab@charlab.com.br


* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".