Tag Archives: spamfilter

Spam filtering: No, Gmail doesn’t like bit.ly links

A rather big part of my weekly newsletter goes out to Gmail accounts. Too bad, if those emails don’t make it through the spam filter to the inbox. But hey, I got my lesson learned… 😉 Continue reading

Spam filter effectiveness: Hotmail vs. Gmail vs. Yahoo! Mail

Interesting insights from Cascade Insights, a company specialized in competitive intelligence. The goal of the study “Web Mail Provider: SPAM Filtering Effectiveness Research” [full-PDF] was to quantify and compare the spam filtering capabilities of Hotmail, Gmail, and Yahoo! Mail.
Continue reading

Video: Wie Spam-Filter funktionieren…

Anbei ein kleines Video vom Anti-Spam-/Anti-Virus-Anbieter TheEmailLaundy.com, das einen Teil der Errungenschaften moderner Spam-Filter-Technologien verdeutlichen soll:

[youtube=http://www.youtube.com/watch?v=k1t_Amorxzo]

… während der Kollege im Postamt sich früher noch mühsam jeden Brief durchsehen musste, um für die Empfänger eine Vorsortierung vorzunehmen, geht glücklicherweise heute bei der Masse der E-Mails vieles automatisiert, zuverlässiger und bereits auf den schnellen ersten Blick anhand der Verbindungsdaten…

(Wer mag, kann ja mal den kleinen SMTP-Praxis-Exkurs aus dem vorangegangenen Artikel durchgehen – das ein oder andere wird dann aus dem Video bekannt vorkommen 🙂 )

Ein weiteres Video zur Funktionsweise der Cisco IronPort Spam-Filter:
http://www.ironport.com/products/how_it_works.html

(Via EmailKarma.net)

Schon gewusst? Spamfilter lesen zum Teil Text in Bildern

Hätten Sie es gewusst? Zum Teil lesen und analysieren Spamfilter auch den Text in den Bildern Ihrer E-Mails im Hinblick auf spammige Schlüsselwörter…

Hintergrund

Image-Spam war in 2006 einer der großen Trends unter Spammern.[1] Die E-Mails enthielten ihre Nachricht nicht mehr in Textform sondern kodiert in einem Bild, dessen semantischer Inhalt für Spamfilter damals standardmäßig nicht zugänglich war. So entstanden Filter-Lösungen, die auf Basis von OCR-Technologien nicht nur den Body, sondern auch die Bilder in E-Mails hinsichtliche spammiger Begriffe analysieren konnten. Eine ziemlich große Herausforderung, denn die Spammer zogen mit animierten GIF-Grafiken und verzerrten Buchstaben (wie in CAPTCHA-Codes) alle Register, um die Mitteilungen nicht maschinenlesbar zu machen.[2]

Imagespam-Filter: FuzzyOcr

FuzzyOcr: Per OCR Text in Bildern auf Spam untersuchen (Quelle: fuzzyocr.own-hero.net)

FuzzyOcr: Per OCR Text in Bildern auf Spam untersuchen (Quelle: fuzzyocr.own-hero.net)

Ein weit verbreiteter Filter ist das Plugin FuzzyOcr für den SpamAssassin. Was kann das Plugin? Die Features:

  • Optical Character Recognition using different engines and settings
  • Fuzzy word matching algorithm applied to OCR results
  • Image hashing system to learn unique properties of known spam images
  • Dimension, size and integrity checking of images
  • Content-Type verification for the containing email

(Via Beitrag von Matt Vernhout im EmailKarma-Blog)

Nachtrag:
Vor ca. einem Monat patentierte auch Kaspersky Lab eine ähnliche Lösung.

Fußnoten

[1] Vgl. z. B. den Ironport-Report: “Image-Spam: Die Mail-Epidemie in 2006

[2] Vgl. Wikipedia: Image-Spam.