|
Pesquisadores
criam esquema simples de combate a spam
Philip
Ball
The New York Times
Um esquema simples e de fácil implementação para combate de e-mails
indesejados foi concebido por dois pesquisadores nos Estados Unidos.
A técnica explora a estrutura das redes sociais para determinar rapidamente se
uma certa mensagem vem de um amigo ou é um "spam" (e-mail
indesejado). O método só funciona em cerca da metade das mensagens recebidas
-mas em todos os casos, ela separa a mensagem na categoria certa.
O sistema evita muitos dos problemas encontrados na maioria dos filtros de spam
disponíveis. Ele é simples, rápido e parece nunca rejeitar mensagens legítimas
sob a falsa impressão de serem spam.
P. Oscar Boykin e Vwani Roychowdhury, da Universidade da Califórnia, em Los
Angeles, que conceberam o sistema, disseram que o método deles deve provar ser
altamente eficiente quando somado a métodos de filtragem mais sofisticados, porém
mais desajeitados. Tal combinação deve ser capaz de selecionar apropriadamente
todas as mensagens que chegam.
"Ela parece ser uma idéia razoável", disse Mark Newman, especialista
em redes da Universidade de Michigan. "É claramente baseada em coisas que
sabemos, como a estrutura social das redes de e-mail."
A guerra contra o spam nunca pareceu mais desoladora -cerca de 60% de todos os
e-mails são spam. Em janeiro no Fórum Econômico Mundial em Davos, Suíça,
Bill Gates, o presidente da Microsoft, previu que o spam será em breve uma
coisa do passado, graças a programas que estão sendo desenvolvidos em sua
empresa. Mas os usuários de computador sitiados provavelmente só acreditarão
quando verem.
Boykin e Roychowdhury decidiram tratar o problema tirando proveito do fato da
maioria dos e-mails das pessoas vir de uma rede social limitada, e estas redes
tendem a ser reunidas em grupos nos quais todos conhecem uns aos outros. Se
Alice conhece e envia e-mails para Bob e Chris, por exemplo, então há uma
possibilidade muito grande de Bob e Chris se conhecerem e enviarem e-mails um
para outro do que se não tivessem uma amiga em comum. Os e-mails que partem de
uma fonte de spam não compartilham esta propriedade de agrupamento -a grande
maioria dos recebedores não conhecem uns aos outros.
O método volta eficazmente a arma dos autores de spam contra eles próprios. O
próprio fato de poderem enviar tantas mensagens garante um baixo grau de
agrupamento, que é aquilo que os denuncia.
Os grupos de e-mail podem ser mapeados inspecionando os campos "de",
"para" e "cc" na caixa de entrada do usuário. Um sistema
automatizado pode rapidamente formar uma lista de autores de spam, assim como
uma lista de remetentes aprovados.
Boykin e Roychowdhury descobriram que quantificando o agrupamento de e-mails
enviados eles podiam eliminar cerca de 54% do spam. Os e-mails acima de um certo
"limite de agrupamento" são sempre amigáveis, e aqueles abaixo de um
limite inferior são sempre spam. As mensagens que ficam entre estes dois
limites são "desconhecidas" -o sistema não sabe ao certo como
classificá-las. Geralmente, disseram os pesquisadores, isto se aplica a cerca
de 50% das mensagens recebidas.
A metade restante dos e-mails pode então ser filtrada de forma mais
sofisticada. Mas nesta altura a escala do problema já foi reduzida pela metade.
Tradução: George El Khouri
Andolfato
|