Content-Filter
Die folgenden Zeilen erläutern den Einsatz von Content Filtern und deren
technische Umsetzung. Ein Content Filter ist ein Zusammenschluss verschiedener
Filtertechniken und soll zum Schutz des Users eingesetzt werden.
So könnten z. B. junge Menschen vor pornografischen, rassistischen
oder gewaltverherrlichenden Inhalten geschützt werden. Dieser Schutz liegt
jedoch in der Verantwortung der einzelnen Eltern bzw. Erziehungsberechtigten
dieser jungen Menschen. Der Umfang dieser Filterung kann ein komplettes System
beinhalten, welches dem User bzw. ganzen Usergruppen einen Schutz vor ungewolltem
Internet- bzw. Emailverkehr bietet.
Technik des Content Filter
Ein User versucht eine Internetseite aufzurufen, indem dieser
die URL der gewünschten Adresse eingiebt und die Anfrage abschickt. Der
Seitenaufbau wird durch den Filter blockiert.
Was geschieht jedoch genau bei der Filterung, dass die Seite
nicht aufgebaut wird ?
Die eingegebene URL wird dem Filter übergeben und intern mit der Filterliste
verglichen, ob der angeforderte Verbindungswunsch zugelassen werden kann. Beinhaltet
die Filterliste die angeforderte Zieladresse, so wird der Zugriff verweigert
und dementsprechend geblockt. Gute Filter besitzen dabei mehr als 10 Millionen
Einträge solcher verbotenen bzw. unerwünschten Adressen. Eine Aktualisierung
dieser Liste wird nicht per Hand, sondern mittels software-basierender Prozesse
realisiert. Die Software baut dabei auf einer künstlichen Intelligenz auf
und kann so konzipiert sein, dass die Filterung auf Wort-, Bild, und Symbolerkennung
basiert. Hierbei werden die angewählten Internetseiten durchsucht und Wörter,
Bilder und Symbole mit Seiten in der Filterliste verglichen. So wächst
die Filterliste dementsprechend automatisch mit.
Da es sich bei dem Content Filter um eine Ansammlung verschiedener
Techniken handelt, kann dieser universell eingesetzt werden.
Die folgende Tabelle illustriert einige dieser verschiedensten Techniken:
URL- / Adressfilter
White List
Black List
|
- explizites Zulassen bestimmter Adressen
- Sperren bestimmter Adressen |
Datei-Typ-Filter |
Hierbei werden bestimmte Dateitypen gesperrt (z.B. pdf, jpg…) |
Optimierungsalgorithmen |
Hierbei wird der Kontext überprüft und Fingerprints bzw. Ähnlichkeiten
mit bekannten und gesperrten Seiten abgeglichen. |
Filterkategorien |
Hierbei sind verschiedene Kategorien der Filterung einstellbar .
- Gewalt
- Pornografie
- Rassismus |
User / Gruppen / Host – Filter |
Hierbei können User, Gruppen oder Hosts bestimmte Berechtigungen
zugewiesen und so die Filterung unterschiedlich eingerichtet werden. |
Bandbreitenmanagement |
Hierbei kann eine Vorgabe der Bandbreite bzw. der Datenmenge für
die Kommunikation eingerichtet werden. |
Zeitfilterung |
Hierbei können für bestimmte Zugriffe diverse Zeitbeschränkungen
eingerichtet werden. |
Im Folgenden werden einzelne dieser Techniken näher beleuchtet.
Worterkennung
Bei dieser Technik der Filterung wird im Quellcode des HTML-Dokuments nach bestimmten
Wörtern bzw. Sätzen gesucht. Dabei wird der komplette Quellcode analysiert.
Ist der Suchalgorithmus erfolgreich (Auffinden eines gesperrten Wortes im Quellcode),
so wird die Seite geblockt. Ratsam ist es dabei diese Technik mit der Adressfilterung
zu kombinieren.
Diese Technik ist jedoch machtlos im Bereich Grafiken, denn
diese werden nicht untersucht. Bei einer Internetseite, welche rein aus Grafikelementen
besteht (z. B. Internetseite komplett mit Flash erstellt), ist aus diesem Grund
keine Filterung mittels Worterkennung möglich.
Somit wird eine Technik benötigt, welche Grafiken auswerten
kann.
Bild- bzw. Mustererkennung
Beim Laden der Internetseite werden die Grafiken nach bestimmten Mustern und
Darstellungen gescannt. Dabei werden Farben, dargestellte Formen und Kombinationen
in bestimmten Bereichen überprüft. Bei einer Internetseite mit sexuellem
Hintergrund sind z. B. Bilder mit einem erhöhten Anteil von Hautfarben
zu erwarten, was der Filter registriert und die Seite sperrt. Jedoch ist diese
Filterung sehr fehleranfällig, denn oftmals werden harmlose Seiten (Bsp:
hoher Anteil Hautfarben kann auch Katalog für Bademode sein…) gesperrt.
Der User muss dementsprechend eine Umkonfiguration der Filterung vornehmen,
was mit der Zeit durchaus lästig werden kann.
Heuristische Technik
Es handelt sich hierbei um eine Kombination der Wort- und Bilderkennung. Diese
Technik basiert dabei auf künstlicher Intelligenz (KI) und kann eine verbesserte
Trefferquote gewährleisten.
Kombinierte Techniken
Es handelt sich hierbei um eine Verknüpfung bzw. Kombination aus mehreren
bekannten Filtertechniken (Wort- und Bildererkennung, Black- und White-List…).
Die einzelnen Techniken werden so kombiniert, dass dem User ein komplettes Filtersystem
zur Verfügung steht. Die Aktualisierung der Filterlisten ist automatisiert.
Der Administrator hat dabei die Hoheit den verschiedenen Usern bzw. Gruppen
individuelle Filterregeln zuzuweisen.
Die einzelnen Filtertechniken bzw. die Kombination aus diesen wird ständig
weiterentwickelt und dementsprechend verbessert.
Beispiele für Content Filter
1. SurfControl Web Filter
Hersteller: Connect GmbH
Link: www.connect-gmbh.de/produkte/surfcontrol-web-filter.html
2. 602 LAN Suite Content Filter
Hersteller: Software 602
Link: www.software602.com/products/Contentfilter/
3. ADS & Web Content Filter
Hersteller: ActMask
Link: www.killhistory.net.washall.org
[ Zurück zum Anfang ] |