Os Oráculos da Internet - série de reportagens de Sérgio Charlab, sobre os instrumentos de busca da Internet, conforme publicado na sua coluna "Ciberespaço", do Jornal do Brasil, e que o mesmo, gentilmente, nos autorizou a reproduzir, em DICAS da Semana.
Os Oráculos Digitais: Deja News (Tutorial, parte 11)
Acho que já disse aqui que estou de mudança. Para ir do computador à
cama, um dos caminhos principais onde ainda moro (passei anos tentando
colocar a geladeira neste trajeto), preciso driblar meia dúzia de caixas
de papelão entupidas de livros e cacarecos. Eu não sou uma pessoa
experiente com mudanças de residência. Até hoje só fiz uma. Por isso
mesmo, quando minha mulher pediu para eu começar a arrumar as coisas,
sentei-me diante do computador e comecei a apagar todos os arquivos e
diretórios imprestáveis. Não faz sentido ter o trabalho de levá-los para
nosso novo endereço. Senti-me orgulhoso por assim poder colaborar para
que nossa mudança seja feita com mais organização.
Fiquei tão empolgado com a faxina que tomei uma decisão que vinha
protelando: resolvi investigar minha correspondência eletrônica diária
não-solicitada. Durante dois dias, somei tudinho e calculei que mais de
35% dos e-mails que chegam aos meus..., deixe ver..., cinco endereços
(agora quatro, porque, diante do custo incompatível com os preços do
mercado, resolvi cancelar o charlab@embratel.net.br) são indesejados.
Listas que não pedi para entrar, releases (muitas vezes em duplicata)
que não dou conta de ler e uma enxurrada de correntes e propaganda capaz
de desesperar até gari da Comlurb acostumado a trabalhar no dia 1 de
janeiro na praia de Copacabana. Note que não são - jamais serão -
indesejáveis as mensagens espontâneas de amigos, leitores e gente que
quer me contar algo, trocar uma conversa ou fazer umas perguntas. Diante
do lixo, no entanto, minha correspondência desejada, muita vezes, fica
encoberta. E isso é mal.
Na verdade, se há algo que me preocupa em relação à Internet neste fim
de 1996 não é a velocidade da rede ou a briga dos browsers. Mas, sim, a
ameaça da correspondência eletrônica não-solicitada. Não creio que tenha
a força para liderar um movimento desta natureza, mas considero iniciada
minha batalha contra as correntes. O leitor está convidado a me
acompanhar, bastando para isso que não as passe adiante.
O que isso tudo tem a ver com o Deja News?
Pesquisa. Um dos endereços (falsos) mais ofensivos em termos de e-mails
não-solicitados é o Mailer@aol.com. Na verdade, o verdadeiro emissor
destas "baboseiras" se esconde atrás do domínio Interramp, mas quando
escrevo o e-mail "Mailer@aol.com" no mecanismo de busca do Deja News,
fico logo sabendo que milhares e milhares de usuários da Internet
adorariam dar um "boot" na cara deste artista. Ou se escrevo "good times
virus" logo fico sabendo que não passa de mais uma lenda da Internet. É
mentira, não existe.
O que o Deja News faz é ler tudo o que se escreve em 15 mil newsgroups
da Usenet. (E para atiçar logo alguns leitores, hoje o Deja News é
provavelmente a melhor solução para a maioria de nós brasileiros que não
conta com um servidor de news operativo em nossos respectivos
provedores.)
O que é Usenet? O Deja News gosta da definição de Harley Hahn, no
trabalho "A Student's Guide to UNIX": "Simplificando, a Usenet é o maior
serviço existente de informação". Abriga, em todo o mundo, mais de 20
mil diferentes tópicos. Em cada um deles, uma determinada comunidade de
usuários pergunta, responde e troca informação ou papo furado. Fala-se
de receitas da vovó, ao reverso da turbina do Fokker; de vídeos piratas
da Xuxa, até a reeleição de FHC. Acredite, fala-se de tudo, todos os
dias. Alguém disse certa vez que o conhecimento humano roda nos
newsgroups Usenet inteiramente a cada três dias. É um certo exagero, mas
a Usenet é capaz de resolver muita dúvida, fazer amigos e encontrar
gente como a gente em qualquer canto do planeta digital.
Os newsgroups não são ainda muito populares no Brasil. Primeiro porque,
em geral, o idioma é o inglês (embora existam newsgroups absolutamente
brasileiros). Depois porque a maioria dos usuários de Internet no Brasil
não dispõe de condições de acesso aos newsgroups. Mas é lá, na Usenet,
que se desenrolam os grandes papos da Internet. Note que é diferente do
conceito de IRC, onde o papo é na hora, em tempo real. Na Usenet, você
escreve e sua mensagem fica disponível para quem desejar lê-la, como se
fosse num grande quadro de aviso.
Que tal testar este conceito? O Deja News mantém uma coleção indexada de
tudo o que se posta na Usenet, desde março de 1995, o que significa 80
Gbytes de informação disponível para sua procura neste oráculo. São mais
de 50 milhões de artigos, o que não impede o Deja News de ser
extremamente rápido. E a meta é aumentar os arquivos de modo que algum
dia o Deja News se orgulhe de ter absolutamente tudo postado na Usenet
desde 1979, quando surgiram os newsgroups.
Usar o Deja News é fácil. Aprender toda a potencialidade do mecanismo de
busca deste oráculo requer, no entanto, mais dedicação. Para começar,
basta escrever uma ou mais palavras-chaves para a busca. Palavras
incompletas, usadas como radicais, também funcionam, como "jorna*", que
serve para localizar menções de "jornal", "jornalista", "jornaleiro",
etc.
Usando os chamados filtros, sua busca pode ser restrita a um subconjunto
do banco de dados, formado por determinado newsgroup, autor, data e
assunto. Pode-se também ler todo o fluxo de mensagens sobre um
determinado assunto. É nestas possibilidades que o Deja News se mostra
superior aos mecanismos de busca no Web, como o Altavista, Excite ou
Infoseek, entre outros, que também vasculham a Usenet. Só no Deja News
você pode, por exemplo, pedir um relatório completo sobre as postagens
de determinada pessoa nos últimos meses. São dados interessantes, mas
também absolutamente antiprivacidade. Empresas nos EUA vasculham o Deja
News antes de contratar candidatos a empregos. É o lado bom e mau da
tecnologia. Por isso mesmo é que existem os meios de você postar
mensagens na Usenet de forma anônima. Mas isso é outra conversa.
Por favor, teste o Deja News, porque vou voltar a falar dele assim que
me livrar das tarefas da mudança, o que espero seja na próxima terça,
claro. Esta foi a décima primeira parte da série sobre os mecanismos de
busca e indexadores da Internet. Apostas estão sendo aceitas para ver
quem adivinha em que parte a série chegará ao fim. Histórias
verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de
busca são bem-vindas e devem ser enviadas para meu endereço usual,
charlab@ax.apc.org. Os que chegaram agora podem pedir os textos
anteriores da série enviando mensagem para este outro endereço:
charlab@charlab.com.br
* Sérgio Charlab (charlab@ax.apc.org) é editor-chefe de Seleções do Reader's Digest, colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" e "O Seu Futuro Eletrônico".