De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.

Bogofilter - Treinamento

Colaboração: Eduardo Sztokbant

Data de Publicação: 05 de Fevereiro de 2004

O bogofilter pode ser treinado com um script perl que vem com ele chamado 'bogominitrain.pl'. Recomendo a leitura do FAQ do bogofilter pra ver como ele faz (http://bogofilter.sourceforge.net/bogofilter-faq.html)

Em seguida, coloquei no .procmailrc pra ele filtrar usando 3 status (spam, not-spam e unsure) e marcar o status e o indice de spamicidade no cabeçalho do e-mail para depois tomar a decisão. No caso, usei o bogominitrain.pl treinando o bogofilter com >0.7=spam, <0.3=not_spam e entre esses valores marquei como unsure. Na filtragem, diminuí um pouco a margem: >0.65=spam, <0.45=not_spam.

De tempos em tempos pego os raros falsos positivos/negativos, concateno nos meus arquivos de spam/not_spam e rodo novamente o bogominitrain.pl.

Já fiz alguns testes com ele e, neste exato momento, estou rodando-o com 0.9 e 0.3 pra fazer mais testes. O melhor é ir testando até achar uma configuração ideal.

.procmailrc bogofilter session BEGIN

  BOGOFILTER=/usr/bin/bogofilter
  
  :0fw
  | $BOGOFILTER -e -p -o 0.65,0.45 -3
  
  # if bogofilter failed, return the mail to the queue, the MTA will
  # retry to deliver it later
  # 75 is the value for EX_TEMPFAIL in /usr/include/sysexits.h
  :0e
  { EXITCODE=75 HOST }
  
  :0:
  * ^X-Bogosity: Yes, tests=bogofilter
  SPAM/
  .procmailrc bogofilter session END -----

Unicamp: Especialização em Orientação a Objetos

Estão abertas na UNICAMP as inscricoes para o Curso de Especialização em ORIENTACAO A OBJETOS, de um ano e meio de duração, com inicio em 28/FEVEREIRO. O curso aborda tecnologias de bancos de dados, linguagem Java e UML, dentre outras.

INSCRICOES ate 11/02 na Escola de Extensão da UNICAMP ou on-line http://www.extecamp.unicamp.br/dados.asp?sigla=INF-400&of=012

OFERECIMENTO - 28/02/2004 a 28/05/2005 Para mais informacoes, contatar (19) 3289-0109 (http://eoo.ic.unicamp.br)

OUTROS CURSOS: http://www.ahand.unicamp.br/cursos/agenda/agenda.html


Chipsets SiS no Linux

http://www.linuxdicas.com.br/sections-viewarticle-233.html

Adicionar comentário

* Campos obrigatórios
5000
Powered by Commentics

Comentários

Nenhum comentário ainda. Seja o primeiro!


Veja a relação completa dos artigos de Eduardo Sztokbant