O Futuro é a Liberdade

Discussões sobre Software Livre e Sociedade

Filtro anti-spam criado na Unicamp supera todos os competidores

Posted by Paulo em 17/09/2010

Artigo original via SITE INOVAÇÃO TECNOLÓGICA.

Isabel Gardenal – Jornal da Unicamp – 16/09/2010

Em 2008, internautas brasileiros enviaram 2,7 trilhões de spams. No primeiro bimestre deste ano, o país passou à primeira posição no ranking mundial, após ter sido responsável por 7,7 trilhões somente em 2009.

“Isso é lamentável, porque não dispomos de respaldo jurídico contra esse tipo de fraude. Com isso, a situação tende a se agravar”, prevê o pesquisador Tiago Agostinho de Almeida.

Tecnólogo em computação, Tiago desenvolveu em sua tese doutorado, defendida na Unicamp, um filtro para classificar automaticamente mensagens de e-mail: o MDL-CF Spam Filter.

Filtro anti-spam

O novo filtro, um método computacional que classifica os e-mails como spam ou como e-mail legítimo, deriva de duas técnicas: MDL (Minimum Description Length – Princípio da Descrição mais Simples) e CF (Confidence Factors – Fatores de Confidência).

O objetivo era oferecer uma classificação balanceada proporcionando uma alta taxa de bloqueio de spams e, simultaneamente, tomando os cuidados necessários para evitar classificação incorreta de um e-mail legítimo. “A nossa técnica mostrou-se simples, eficiente e rápida. Seus resultados indicam que ela é superior aos melhores filtros anti-spam que existem,” garante Tiago.

Na maioria dos casos, os próprios servidores de e-mail oferecem filtros anti-spam, como o GMail, o Hotmail e o Yahoo. Entretanto, a sua eficácia depende diretamente dos seus usuários. “É preciso saber usar corretamente a ferramenta oferecida pelo gerenciador de e-mails. Se souberem, a eficácia pode chegar a 95%”, garante o pesquisador.

Ele explica que o maior desafio dos filtros anti-spam é não classificar um e-mail legítimo como spam. Isso é considerado um erro grave, pois a mensagem acaba sendo enviada para a caixa de spams. “Os prejuízos podem ser enormes, pois o usuário pode não tomar conhecimento de uma informação muito importante.”

Campeonatos de spam

O tecnólogo simulou campeonatos de spams com base em modelos existentes. Ele explica que grandes corporações como Google e Microsoft, com frequência, financiam estes eventos para avaliar os filtros anti-spam. No estudo de Almeida, foram simuladas três competições em que concorreram o filtro proposto contra 13 métodos consagrados.

“O MDL-CF obteve o melhor desempenho. Em uma situação real, ele teria sido tricampeão. O nosso filtro teve um melhor desempenho em relação aos métodos comparados, mesmo aqueles que partem de grandes corporações, que recebem um alto investimento e que têm uma grande equipe dando-lhes suporte”, comemora ele.

O pesquisador pretende oferecer plug-ins para possibilitar uma maneira simples e eficaz de empregar o filtro MDL-CF em conjunto com os principais gerenciadores de e-mail disponíveis, como o Microsoft Outlook e o Mozilla Thunderbird. “Vamos tentar desenvolver os plug-ins e oferecê-los gratuitamente como uma forma de fazer com que o fruto dessa pesquisa seja usufruído pela sociedade”, almeja.

Um único spam pode danificar o equipamento, pelo fato de muitas vezes vir acompanhado de vírus. A dica de Almeida é sempre verificar os e-mails de maneira consciente. “É preciso ter um filtro anti-spam instalado ou ainda usar os recursos anti-spam oferecidos pelo provedor. Além do filtro, existem outras ferramentas que devem ser empregadas para aumentar a segurança dos usuários, como um antivírus e um firewall, um programa que bloqueia acessos”, aconselha.

Prejuízos dos spams

Os spams são enviados pelos spammers, pessoas que geralmente estão interessadas na comercialização de produtos. Existem também aqueles cuja intenção é prejudicar os usuários mediante o roubo de senhas, seja de alguma informação pessoal e até mesmo do uso do seu computador para enviar spams, uma prática que vem aumentando no Brasil.

Uma das consequências dos spams é que eles envolvem um custo elevado, difícil de ser calculado. Relaciona-se inclusive à perda da produtividade de funcionários nas empresas, que gastam o seu tempo lendo e apagando mensagens não solicitadas. O conteúdo é bastante abrangente. Fora os casos de transmissão de vírus, eles permeiam propagandas, pornografia, boatos, esquemas de enriquecimento ilícito e mensagens religiosas. Existem duas formas mais corriqueiras de se apropriar dos dados pessoais dos usuários.

Numa delas, o usuário se cadastra numa empresa idônea, o qual comercializa as informações de seus consumidores para os spammers. Outra é realizada através de um arquivo chamado cookie, que armazena as informações trocadas entre o navegador e o servidor.

Ao informar o endereço de e-mail mediante esses cookies, o site poderá usar aquela informação e vendê-la. “Existe uma máfia de compra e venda nesta direção”, constata Almeida, e é muito difícil chegar à fraude. “O e-mail é uma presa fácil de ser burlada. Quem envia o spam não necessariamente é aquela pessoa. Os endereços que eles enviam em geral são inválidos.”

Legislação contra os spams

Em alguns países há legislações que criminalizam o envio de spams. Os exemplos mais significativos são os Estados Unidos e países da Comunidade Europeia. Ambos têm meios legais e diferentes de condenar o envio de spams.

Nos Estados Unidos, o método adotado permite que o spam seja enviado desde que ele respeite algumas regras. Dentre elas, o endereço de e-mail do remetente deve ser verdadeiro e a mensagem deve conter um mecanismo explícito para que o usuário solicite nunca mais recebê-lo. “O que acontecer fora disso, é considerado ilegal. Se conseguirem pegar o spammer, ele poderá ser multado ou, até mesmo, preso”, revela o tecnólogo.

Já na Europa, o método adotado não permite que o spammer envie qualquer tipo de mensagem sem o consentimento prévio do usuário. “Se enviar um primeiro spam que seja, ele já estará cometendo uma infração.”

No Brasil, a realidade é outra. “Apesar de a situação ser alarmante, não existe uma regulamentação jurídica específica com relação ao spam”, relata Almeida, enfatizando a urgência de uma medida que impeça essa prática.

O volume de spams vem crescendo de forma surpreendente no Brasil, diz o tecnólogo, em princípio porque o número de usuários está aumentando e muitos utilizam o computador de maneira desprotegida. Portanto, apesar de o país ser um grande emissor de lixo virtual, não significa que ele tenha o maior número de spammers, e sim que os usuários, por falta de conhecimento, acabam sendo alvos de spammers de outros países. O pesquisador também destaca que uma das estratégias mais utilizadas pelos spammers é “sequestrar” computadores de usuários comuns e utilizá-los para enviar mais spams.

Carne enlatada originou termo spam

Existem diversas versões a respeito da origem da palavra spam. A mais aceita afirma que o termo originou-se da marca SPAM, um tipo de carne enlatada da Hormel Foods Corporation, e foi associado ao envio de mensagens não solicitadas devido a um quadro do grupo humorístico inglês Monty Phython.

O episódio ironiza o racionamento de comida ocorrido na Inglaterra durante a Segunda Guerra Mundial. SPAM foi um dos poucos alimentos excluídos desse racionamento, o que eventualmente levou as pessoas a enjoarem do produto.

Esse quadro envolve um casal discutindo com uma garçonete em um restaurante a respeito da quantidade de SPAM presente nos pratos. Enquanto o casal pergunta por um prato que não contenha a carne enlatada, a garçonete repete constantemente a palavra SPAM. Eventualmente, a discussão faz com que um grupo bizarro de vikings, presente no local, comece a cantar “SPAM, amado SPAM, glorioso SPAM, maravilhoso SPAM!”, “impossibilitando qualquer tipo de conversa, assim como o spam atrapalha a comunicação por e-mail”, compara Almeida.

Vítimas dos spams

As maiores vítimas dos spams são pessoas que possuem endereços de e-mail bastante divulgados, como presidentes de grandes corporações. Alguns exemplos são o dono do domínio acme.com, Jef Poskanzer, e o empresário co-fundador da empresa de tecnologia Apple Inc, Steve Jobs.

De acordo com o presidente-executivo da Microsoft, Steve Ballmer, em matéria veiculada na BBC News, o fundador da Microsoft – Bill Gates – recebe em média 4 milhões de e-mails por ano, sendo a grande maioria spams.

Curiosamente, Poskanzer recebia já em 2005 cerca de 1 milhão de spams por dia, quase 100 vezes mais que Bill Gates. “Sem os filtros anti-spam, provavelmente o sistema de e-mail não seria mais suportável”, comenta Almeida.

O fato é que os spams são um negócio lucrativo, isso porque o e-mail é uma forma de comunicação muito barata e que atinge muitas pessoas simultaneamente. Desta forma, os spammers conseguem obter lucro mesmo que a taxa de resposta dos usuários seja baixa. Um estudo recente mostrou que mesmo um índice de resposta de 1 para cada 12,5 milhões de e-mails enviados ainda consegue gerar bons lucros aos spammers.

Em 2002, o mundo todo recebia em média 860 milhões de spams por dia. Para 2010, a Cisco Systems, empresa de segurança computacional, estimou que, em média, cerca de 300 bilhões de spams serão enviados diariamente, representando mais de 90% dos e-mails em circulação.

2 Respostas to “Filtro anti-spam criado na Unicamp supera todos os competidores”

  1. Alvaro said

    Boa noite amigo, gostaria de fazer uma leiga pergunta sem nada a ver com o topico mesmo, tenho o ubunto 10.04 instalado e fiz varias modificaçoes, mas gostaria de saber como posso deixar os menus nado mesmo jeito que voce deixou os seus, no video de configuraçao do modem zte mf110 achei mto legal mesmo…
    parabens.

    abraço

    • stellarium said

      Olá, Álvaro.
      O modem foi configurado num netbook Acer utilizando o Ubuntu Netbook Remix (UNR). Você pode instalar os pacotes através da Central de programas do Ubuntu. Procure por Ubuntu Netbook Remix na caixa de pesquisa e instale o pacote ubuntu-netbook-remix.

      Abraço

Deixe um comentário