|
Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.
Os Oráculos Digitais: HotBot (Tutorial, parte 4)
A primeira opção de detalhamento de busca é fazer alguma restrição de
data. Usei a palavra "restrição" porque é isso, afinal que queremos,
não? Recursos que ajudem a evitar que uma busca apresente como resposta
milhares de possibilidades (quem teria tempo de checar uma a uma?). O
que desejamos é uma resposta de poucas dezenas de itens, bem no alvo, e
arrumados segundo um ranking correto de importância para os objetivos da
nossa busca. (O ranking do HotBot é feito a partir de uma ponderação
entre várias coisas, como a frequência com que a palavra ou expressão
procurada aparece na página, no título - sempre conta muito! -, na tag
"meta" - esta é uma tag especial para os mecanismos de busca -, etc.)
Descendo na nossa oferta de restrições de busca do HotBot, temos "media
type". Ali você pode selecionar o tipo de arquivo que deseja ver o
HotBot procurar nas suas buscas. Para dar uma idéia de como isso é
interessante, vamos ver um exemplo onde você acaba de descobrir a
tecnologia de shockwave, da Macromedia (recomendo a quem ainda não
instalou em seu browser; visite http://www.macromedia.com).
Naturalmente, fascinado com o shockwave, você agora quer procurar
páginas que tenham arquivos shockwave. Nada mais fácil! Em vez de
escrever "shockwave" como palavra-chave, você simplesmente clica no
quadradinho correspondente junto à área de "media type" do HotBot. Vai
resultar numa montanha de páginas com arquivos shockwave. Você pode
ainda escrever logo a extensão que está procurando (shockwave = cdr)
junto ao quadradinho "Extensions". Em "location", o próximo item de restrições do HotBot, você pode selecionar suas buscas por domínio - seja por nome ou pela geografia. Posso, assim, limitar minha busca ao servidor jb.com.br (ou qualquer outro) para procurar apenas nele. Outro exemplo é quando escrevo "ercília" e mando procurar somente em "uol.com.br", e assim encontro um bate-papo com a simpática colunista da Folha de São Paulo. Ou posso escolher como limitação geográfica "South America" (se quiser procurar apenas no Brasil escreva ".br" no item "Cyberplace" ou visite os mecanismos brasileiros, claro - e por falar nisso, já visitou http://www.edirectory.com). Com o HotBot e estes recursos, posso saber quantas vezes a palavra "charlab" aparece no Web só no Brasil (866), nos EUA (89) e Europa (16) . Finalmente, em "show" você pode controlar o número de referências que deseja obter por vez como resposta do HotBot (às vezes é muito aborrecido ir de 10 em 10, mas o carregamento de uma página com 100 referências pode ser muito lento). O que o HotBot não faz (e neste sentido perde feio para o Altavista): * Não faz busca por proximidade onde se obtém respostas que levam em conta a distância entre duas palavras que usadas como chaves na busca. * Não faz busca por "strings" parciais. Você não pode, por exemplo, buscar a Torre Eiffel sem saber como se escreve "Eiffel". No Altavista, você pode procurar por "Eif*l" e achar as referências da famosa torre, além de aprender a ortografia correta. Além disso, tem alguns bugs (defeitos) notáveis.
Esta foi a quarta parte da série sobre os mecanismos de busca e
indexadores da Internet. Se você está gostando, avise aos seus amigos da
Internet. Ainda vou escrever sobre vários mecanismos - inclusive os
brasileiros - e softwares de busca. Eu acredito que dominar o uso das
técnicas de busca nestes "oráculos digitais" é a melhor estratégia para
quem quiser sentir-se à vontade com a Internet.
Quem perdeu uma das partes anteriores pode pedir o texto digital
enviando mensagem para este endereço especial: charlab@charlab.com.br.
(Como sou eu mesmo quem responde, sem ajuda de ninguém - se bem que
estou treinando o Jacques, meu filho de cinco anos, para isso… -,
excepcionalmente você terá que aguardar 15 dias, pois estou longe do
computador. Mas em compensação vai receber estas quatro e ainda as duas
próximas partes da série, de modo que se você não assina ainda o JB
poderá dormir até mais tarde nas duas próximas terças-feiras.)
|