Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.
Os Oráculos Digitais: MetaCrawler (Tutorial, parte 16)
Como tudo, cada oráculo digital terá sempre seu lado positivo e
negativo. Então, depois de 15 semanas acompanhando a série, você quer
saber como escolher o melhor para fazer sua busca? Embora eu já tenha me
programado para não encerrar a série sem antes fazer a melhor análise
comparativa que minha capacidade permitir, a escolha do melhor não é tão
importante assim. Você sempre pode usar mais de um orá culo. Pensando
nisso é que surgiu o MetaCrawler. Com este
metaoráculo, você faz sua busca simultaneamente nos seguintes oráculos:
Open Text, Lycos, WebCrawler, InfoSeek, Excite, Inktomi, Yahoo e Galaxy.
Note a importância da palavra simultaneamente; não se trata de uma mera
relação de vários orá culos, mas de um mecanismo que opera a busca nos
vários oráculos de uma só vez.
Brilhante idéia, não? Tão brilhante que o MetaCrawler tornou-se em pouco
tempo o melhor segredo dos grandes WebDetetives. Uma busca: resposta de
oito oráculos. Não tenho certeza se o projeto de Erik Selberg, Greg
Lauckhart e do professor Oren Etzioni foi o primeiro a usar o conceito
de meta na área. Mas eu venho usando o MetaCrawler há muito tempo, desde
que ele era relativamente lento e atendia no modesto endereço
http://metacrawler.cs.washington.edu/, da universidade de seus
criadores. Como a Internet é campo fértil para mentes criativas, já, já
aparecem os metametaoráculos. Sim, porque se existem metaoráculos que
fazem buscas em outros oráculos, haverá de surgir metametaoráculos que
farão busca em metaorá culos. E assim sucessivamente, claro...
A interface padrão do MetaCrawler é simplíssima, mas o que não falta é
tecnologia e possibilidades de refinamentos com Java, frames, cookies e
sabe-se lá mais o quê. Naturalmente, a utilidade de metaoráculos como o
MetaCrawler paga o peso de relativa lentidão (embora a criatividade
tenha contornado isso, oferecendo as primeiras respostas sem esperar
pelo final dos resultados).
Teoricamente não há risco de repetição de respostas, porque o
MetaCrawler elimina duplicidades. Também não se pode sair refinando
muito uma busca em metaoráculo, desde o início, com o uso de operadores
boleanos (ou booleanos, porque vêm da criação do matemático Boole). Mas
mesmo assim o MetaCrawler oferece a chance de uso de sinais de + e - e
também de configuração extra com alguns recursos interessantes
(descritos adiante). Além disso, permite busca por qualquer
palavra-chave, por todas as palavras-chaves ou por frase (todas as
palavras na ordem exata em que são pesquisadas).
Finalmente, recebe-se aquela super-resposta. Depois, muitas vezes, ainda
sobra o trabalho de refinar busca a busca, oráculo por oráculo. Mas são,
assim mesmo, muito convenientes. Deu para entender que o MetaCrawler,
portanto, não tem nenhum banco de dados interno, não?
O MetaCrawler permite algumas configurações muito úteis (embora exija do
seu browser a capacidade de receber cookies - se quiser saber mais sobre
cookies, escreva para charlab@ax.apc.org). Quem não tem browser com
cookies pode fazer um bookmark da página resultante da configuração e
acessar o MetaCrawler a partir deste bookmark. Vá até
http://www.metacrawler.com/configure.html e selecione as opções de
acordo com sua demanda. Extra Functionality mostra na tela padrão do
MetaCrawler algumas opções a mais. Você poderá escolher o número máximo
de respostas por oráculo procurado, o tempo máximo de espera e
(excelente esta que vem agora) limitar os resultados geograficamente.
Recomendo marcar.
Dynamic Status Displays permite aos browsers equipados com Java
acompanhar o processo de metabusca (sensacional!). Usuários do Explorer
3.0 devem fazer o upgrade para 3.01 se quiserem se divertir com este
aplicativo Java. Frame Support, quando habilitado, põe o aplicativo Java
mencionado acima num frame especial, melhorando o conjunto de interface.
E Link Targets, com as opções same windows, same frame e new window
permite escolher se, ao clicar num link de resposta, você abrirá uma
nova página na mesma janela, no mesmo frame ou em outra janela de
browser.
O MetaCrawler permite também que seja ordenada a lista de respostas de
uma busca por localidade, região ou tipo de organização. E apresenta os
resultados em um ranking cujos escores representam a média dos escores
dos oráculos pesquisados.
Esta foi a décima sexta parte da série que apresenta os mecanismos
debusca e indexadores da Internet. A expectativa dos leitores, em
votação estimulada pela própria coluna, é de que chegarei até a parte 17
ou 20. Sempre lembro aos que estão lendo pela primeira vez uma parte da
série que podem pedir os textos anteriores enviando mensagem para este
meu outro endereço fácil de guardar: charlab@charlab.com.br. Os leitores
regulares ficariam impressionados com a quantidade de gente que aparece
de repente e fica com vontade de saber o que aconteceu até aqui. E quem
acompanha a série mas perdeu uma ou outra parte não deve se intimidar:
peça o que lhe falta. Para mim, esta correspondência é estimulante.
Monitoro o ânimo de quem me lê, e esforço-me mais para justificar as
palavras carinhosas das mensagens dos leitores.
Maurício Pereira (mpereira@acd.ufrj.br) me fez perceber a ambigüidade do
meu comentário, semana passada, de que "83% do Web ainda está sob
sistemas Unix!". Diz ele: "De acordo com a exclamação ao final da
observação - e da palavra ainda - pressupõe-se que este ambiente não
mais deveria estar rodando sob Unix. Gostaria de saber por quê". Ora,
ainda, embora possa ser interpretado do jeito que o Maurício entendeu,
foi colocado ali com orgulho. Ou seja, quer com NT, Mac ou sei lá o quê,
o Unix está firmíssimo. Vê agora como o texto era dúbio? Interessante é
o fato de que o Maurício, admirador do Unix como eu, foi entender
exatamente pelo lado oposto.
Parece usuário de Mac. :-)
* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".