Busca em DICAS
Busca na Internet
Cadernos de Informática
DICAS de MPB
DICAS do Charlab
DICAS do Editor
DICAS dos Leitores
DICAS por E-mail
Internet Kids
Notas na Imprensa
Internet Radios
Internet Shopping
Internet TV
Revistas de Informática
Software na Internet
Turismo Virtual


Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.


Os Oráculos Digitais: HotBot (Tutorial, parte 4)

O mecanismo de busca azul-piscina com verde-abacate, o HotBot - que enche o peito de orgulho ao anunciar seu arquivo (o maior!) de 54 milhões de páginas Web, e a disposição de vasculhar totalmente o World Wide Web a cada sete dias, encontrando novas páginas e atualizando as existentes - (ufa!) ainda é o nosso tema. A modalidade "expert" (clique no botão "expert", logo embaixo do "modify") confere enorme versatilidade ao HotBot e você deve aprender a usar estes recursos para alcançar melhores resultados em suas buscas.

A primeira opção de detalhamento de busca é fazer alguma restrição de data. Usei a palavra "restrição" porque é isso, afinal que queremos, não? Recursos que ajudem a evitar que uma busca apresente como resposta milhares de possibilidades (quem teria tempo de checar uma a uma?). O que desejamos é uma resposta de poucas dezenas de itens, bem no alvo, e arrumados segundo um ranking correto de importância para os objetivos da nossa busca. (O ranking do HotBot é feito a partir de uma ponderação entre várias coisas, como a frequência com que a palavra ou expressão procurada aparece na página, no título - sempre conta muito! -, na tag "meta" - esta é uma tag especial para os mecanismos de busca -, etc.)

Ao restringir a data, nos casos em que isso for conveniente, você limitará as respostas do HotBot àquelas compreendidas no período da sua escolha. A opção "whenever" clicada não limita nada. Qualquer data serve. (E por data entenda-se o dia, mês e ano em que, pela primeira vez, o HotBot encontra uma página que inclui em seu arquivo.) Por exemplo, buscando referências com a palavra-chave "charlab" encontro entre as dez primeiras respostas nove ligadas ao conjunto de páginas chamado "Visita de Sérgio Charlab ao Recife" (quando lancei meu livro lá, no dia 8) onde a data é 9 de fevereiro de 1996. (Quem quiser ver os resultados de uma câmara digital Casio, de pouco menos de US$ 500, deve ir até lá: http://www.truenet.com.br/studioweb/charlab/index.html. As imagens foram feitas com a mesma câmara que, dias mais tarde, se tornaria famosa ao reproduzir para o mundo imagens do Carnaval de Olinda.)

Voltando ao HotBot, pode-se escolher uma data que sirva de referência para uma busca "depois" ou "antes" dela ("after" e "before"). Colocando "after" 1 de março de 1996 eu só encontro uma página dos meus amigos do Recife (que traz uma data mais recente, provavelmente porque foi atualizada), e o número de respostas à palavra "charlab" cai de 977 para 696.

Uma linha mais embaixo, se eu limitar para "within the last" (dentro dos últimos) "1 month[s]" (1 mês) - não esqueça de clicar na bolinha à esquerda da opção! -, fico sabendo o que é que o HotBot anda fazendo recentemente em suas buscas pela Internet: 51 respostas com "charlab".

Descendo na nossa oferta de restrições de busca do HotBot, temos "media type". Ali você pode selecionar o tipo de arquivo que deseja ver o HotBot procurar nas suas buscas. Para dar uma idéia de como isso é interessante, vamos ver um exemplo onde você acaba de descobrir a tecnologia de shockwave, da Macromedia (recomendo a quem ainda não instalou em seu browser; visite http://www.macromedia.com). Naturalmente, fascinado com o shockwave, você agora quer procurar páginas que tenham arquivos shockwave. Nada mais fácil! Em vez de escrever "shockwave" como palavra-chave, você simplesmente clica no quadradinho correspondente junto à área de "media type" do HotBot. Vai resultar numa montanha de páginas com arquivos shockwave. Você pode ainda escrever logo a extensão que está procurando (shockwave = cdr) junto ao quadradinho "Extensions".

Usando o recurso "media type" você encontra facilmente páginas e arquivos contendo Java, JavaScript, VRML (3D), acrobat, shockwave, e até os "smileys" - aquelas carinhas que mostram as emoções de quem escreve na Internet. :-) Como fazer, por exemplo, para saber quais páginas ligadas ao Brasil têm algum recurso de shockwave? Escreva "brasil" como palavra-chave e clique em "media type" shockwave.

Então imagine você ali, diante da sua home-page em construção e querendo procurar uma imagem da bandeira do Brasil. O que fazer? HotBot! Mas não faz sentido escrever "brasil" como palavra-chave e marcar em "Extensions" escrevendo "gif". Melhor é usar apenas como palavra-chave "brasil.gif". O resultado serão páginas que possuem uma imagem chamada brasil.gif. Há boas chances de que você encontre, então, sua bandeira nacional.

Não se preocupe em seguir caminhos errados algumas vezes. Mas não deixe de recolher os ensinamentos resultantes dos erros. Assim você vai apurando sua técnica.

Em "location", o próximo item de restrições do HotBot, você pode selecionar suas buscas por domínio - seja por nome ou pela geografia. Posso, assim, limitar minha busca ao servidor jb.com.br (ou qualquer outro) para procurar apenas nele. Outro exemplo é quando escrevo "ercília" e mando procurar somente em "uol.com.br", e assim encontro um bate-papo com a simpática colunista da Folha de São Paulo. Ou posso escolher como limitação geográfica "South America" (se quiser procurar apenas no Brasil escreva ".br" no item "Cyberplace" ou visite os mecanismos brasileiros, claro - e por falar nisso, já visitou http://www.edirectory.com). Com o HotBot e estes recursos, posso saber quantas vezes a palavra "charlab" aparece no Web só no Brasil (866), nos EUA (89) e Europa (16) .

Finalmente, em "show" você pode controlar o número de referências que deseja obter por vez como resposta do HotBot (às vezes é muito aborrecido ir de 10 em 10, mas o carregamento de uma página com 100 referências pode ser muito lento). O que o HotBot não faz (e neste sentido perde feio para o Altavista): * Não faz busca por proximidade onde se obtém respostas que levam em conta a distância entre duas palavras que usadas como chaves na busca. * Não faz busca por "strings" parciais. Você não pode, por exemplo, buscar a Torre Eiffel sem saber como se escreve "Eiffel". No Altavista, você pode procurar por "Eif*l" e achar as referências da famosa torre, além de aprender a ortografia correta. Além disso, tem alguns bugs (defeitos) notáveis.

Esta foi a quarta parte da série sobre os mecanismos de busca e indexadores da Internet. Se você está gostando, avise aos seus amigos da Internet. Ainda vou escrever sobre vários mecanismos - inclusive os brasileiros - e softwares de busca. Eu acredito que dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Quem perdeu uma das partes anteriores pode pedir o texto digital enviando mensagem para este endereço especial: charlab@charlab.com.br. (Como sou eu mesmo quem responde, sem ajuda de ninguém - se bem que estou treinando o Jacques, meu filho de cinco anos, para isso… -, excepcionalmente você terá que aguardar 15 dias, pois estou longe do computador. Mas em compensação vai receber estas quatro e ainda as duas próximas partes da série, de modo que se você não assina ainda o JB poderá dormir até mais tarde nas duas próximas terças-feiras.)


* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".