THEMEN

Content-Filter


Die folgenden Zeilen erläutern den Einsatz von Content Filtern und deren technische Umsetzung. Ein Content Filter ist ein Zusammenschluss verschiedener Filtertechniken und soll zum Schutz Schutz im Techniklexikon des Users eingesetzt werden.

So könnten z. B. junge Menschen vor pornografischen, rassistischen oder gewaltverherrlichenden Inhalten geschützt werden. Dieser Schutz liegt jedoch in der Verantwortung der einzelnen Eltern bzw. Erziehungsberechtigten dieser jungen Menschen. Der Umfang dieser Filterung kann ein komplettes System beinhalten, welches dem User bzw. ganzen Usergruppen einen Schutz vor ungewolltem Internet- bzw. Emailverkehr bietet.

Technik des Content Filter

Ein User versucht eine Internetseite aufzurufen, indem dieser die URL der gewünschten Adresse eingiebt und die Anfrage abschickt. Der Seitenaufbau wird durch den Filter blockiert.

Was geschieht jedoch genau bei der Filterung, dass die Seite nicht aufgebaut wird ?
Die eingegebene URL wird dem Filter übergeben und intern mit der Filterliste verglichen, ob der angeforderte Verbindungswunsch zugelassen werden kann. Beinhaltet die Filterliste die angeforderte Zieladresse, so wird der Zugriff verweigert und dementsprechend geblockt. Gute Filter besitzen dabei mehr als 10 Millionen Einträge solcher verbotenen bzw. unerwünschten Adressen. Eine Aktualisierung dieser Liste wird nicht per Hand, sondern mittels software-basierender Prozesse realisiert. Die Software baut dabei auf einer künstlichen Intelligenz auf und kann so konzipiert sein, dass die Filterung auf Wort-, Bild, und Symbolerkennung basiert. Hierbei werden die angewählten Internetseiten durchsucht und Wörter, Bilder und Symbole mit Seiten in der Filterliste verglichen. So wächst die Filterliste dementsprechend automatisch mit.

Da es sich bei dem Content Filter um eine Ansammlung verschiedener Techniken handelt, kann dieser universell eingesetzt werden.
Die folgende Tabelle illustriert einige dieser verschiedensten Techniken:

URL- / Adressfilter
White List
Black List
- explizites Zulassen bestimmter Adressen
- Sperren bestimmter Adressen
Datei-Typ-Filter Hierbei werden bestimmte Dateitypen gesperrt (z.B. pdf, jpg…)
Optimierungsalgorithmen Hierbei wird der Kontext überprüft und Fingerprints bzw. Ähnlichkeiten mit bekannten und gesperrten Seiten abgeglichen.
Filterkategorien Hierbei sind verschiedene Kategorien der Filterung einstellbar .
- Gewalt
- Pornografie
- Rassismus
User / Gruppen / Host – Filter Hierbei können User, Gruppen oder Hosts bestimmte Berechtigungen zugewiesen und so die Filterung unterschiedlich eingerichtet werden.
Bandbreitenmanagement Hierbei kann eine Vorgabe der Bandbreite bzw. der Datenmenge für die Kommunikation eingerichtet werden.
Zeitfilterung Hierbei können für bestimmte Zugriffe diverse Zeitbeschränkungen eingerichtet werden.

Im Folgenden werden einzelne dieser Techniken näher beleuchtet.

Worterkennung
Bei dieser Technik der Filterung wird im Quellcode Quellcode im Techniklexikon des HTML-Dokuments nach bestimmten Wörtern bzw. Sätzen gesucht. Dabei wird der komplette Quellcode analysiert. Ist der Suchalgorithmus erfolgreich (Auffinden eines gesperrten Wortes im Quellcode), so wird die Seite geblockt. Ratsam ist es dabei diese Technik mit der Adressfilterung zu kombinieren.

Diese Technik ist jedoch machtlos im Bereich Grafiken, denn diese werden nicht untersucht. Bei einer Internetseite, welche rein aus Grafikelementen besteht (z. B. Internetseite komplett mit Flash Flash im Techniklexikon erstellt), ist aus diesem Grund keine Filterung mittels Worterkennung möglich.

Somit wird eine Technik benötigt, welche Grafiken auswerten kann.

Bild- bzw. Mustererkennung
Beim Laden der Internetseite werden die Grafiken nach bestimmten Mustern und Darstellungen gescannt. Dabei werden Farben, dargestellte Formen und Kombinationen in bestimmten Bereichen überprüft. Bei einer Internetseite mit sexuellem Hintergrund sind z. B. Bilder mit einem erhöhten Anteil von Hautfarben zu erwarten, was der Filter registriert und die Seite sperrt. Jedoch ist diese Filterung sehr fehleranfällig, denn oftmals werden harmlose Seiten (Bsp: hoher Anteil Hautfarben kann auch Katalog für Bademode sein…) gesperrt. Der User muss dementsprechend eine Umkonfiguration der Filterung vornehmen, was mit der Zeit durchaus lästig werden kann.

Heuristische Technik
Es handelt sich hierbei um eine Kombination der Wort- und Bilderkennung. Diese Technik basiert dabei auf künstlicher Intelligenz (KI) und kann eine verbesserte Trefferquote gewährleisten.

Kombinierte Techniken
Es handelt sich hierbei um eine Verknüpfung bzw. Kombination aus mehreren bekannten Filtertechniken (Wort- und Bildererkennung, Black- und White-List…). Die einzelnen Techniken werden so kombiniert, dass dem User ein komplettes Filtersystem zur Verfügung steht. Die Aktualisierung der Filterlisten ist automatisiert. Der Administrator hat dabei die Hoheit den verschiedenen Usern bzw. Gruppen individuelle Filterregeln zuzuweisen.

Die einzelnen Filtertechniken bzw. die Kombination aus diesen wird ständig weiterentwickelt und dementsprechend verbessert.

Beispiele für Content Filter

1. SurfControl Web Filter
Hersteller: Connect GmbH
Link: www.connect-gmbh.de/produkte/surfcontrol-web-filter.html

2. 602 LAN Suite Content Filter
Hersteller: Software 602
Link: www.software602.com/products/Contentfilter/

3. ADS & Web Content Filter
Hersteller: ActMask
Link: www.killhistory.net.washall.org


  

[ Zurück zum Anfang ]

 >> zurück zur Startseite
antispam_logo
  Antispam Tutorials