# Mechanizm filtrowania

Mechanizm filtrowania stron internetowych w OpiekunieWEB jest - jak widać na poniższej ilustracji - nieco bardziej skomplikowany niż w poprzednich wersjach programu. Największą zmianą jest dodanie osobnego mechanizmu analizującego wykorzystanie wyszukiwarek Google i Bing - od niego zatem zaczniemy opis.

## Kontrola wyszukiwarek

Gdy program rozpozna, że dana strona jest stroną wyszukiwarki Google albo Bing to standardowa ścieżka filtrowania jest omijana a strona przekazywana jest do mechanizmu oceniającego wykorzystanie wyszukiwarek. Mechanizm ten można wyłączyć - wtedy strona wyszukiwarki traktowana jest jako zwykła strona i stosują się do niej wszystkie mechanizmy opisane w następnym rozdziale.

Jak widać na ilustracji są trzy mechanizmy filtrowania dla wyszukiwarek:

  1. „Safe Search” – na przeglądarce wymuszana jest funkcja bezpiecznego wyszukiwania dostępna w opcjach wyszukiwarki. Może mieć ona różną nazwę. Przykładowo w Google jest to opcja „SafeSearch”, w wyszukiwarce Bing – „Bezpieczne wyszukiwanie”.
  2. Analiza – zapytania wpisywane do wyszukiwarki są analizowane pod kątem użycia słów i fraz mogących wyświetlić niepożądane treści w wynikach wyszukiwania.
  3. Blokada – blokada wyszukiwania grafiki w wyszukiwarce. Standardowe wyszukiwanie treści nadal działa, blokowane jest tylko wyszukiwanie grafiki.

Powyższe mechanizmy mogą być włączane lub wyłączane - w zależności od preferowanych ustawień. Ustawienia te można modyfikować w Aplikacji Webowej lub Konsoli.

## Mechanizm filtrowania treści internetowych

Mechanizm filtrowania zbudowany jest z czterech modułów działających na zasadzie kaskady - jeśli na etapie danego modułu jest możliwe podjęcie jednoznacznej decyzji (strona jest bezpieczna - należy ją wyświetlić lub strona jest niebezpieczna należy ją zablokować) decyzja cedowana jest na kolejny moduł. Moduły biorące udział w ocenie strony są następujące:

1. Strony Użytkownika
W pierwszej kolejności adres strony konfrontowany jest z bazą stron użytkownika. Strony użytkownika mogą należeć do kategorii niedozwolonych, dozwolonych lub kontrolowanych po treści. W zależności od tego, do której kategorii strona należy podejmowane są różne działania:

  • kategoria blokowana - strona zostanie zablokowana
  • kategoria dozwolona - strona zostanie wyświetlona
  • kategoria kontrolowana po treści - strona zostanie przekazana do dalszej oceny modułowi oceny treści (p.3)

2. Baza stron SoftStory
Adres strony konfrontowany jest z bazą stron SoftStory. Ogólnie rzecz biorąc zasada działania jest analogiczna do bazy stron użytkownika aczkolwiek istnieją pewne dodatkowe mechanizmy umożliwiające bardziej zniuansowane zarządzanie stronami. Np. mechanizm pierwszej strony - sprawia, że dla niektórych witryn otwierana jest pierwsza strona (traktowana jako bezpieczna) natomiast kolejne podstrony są filtrowane po treści - jest to przydatne np. w przypadku portali informacyjnych, które na pierwszych stronach unikają treści drastycznej lub nieodpowiedniej dla dzieci ale już głębiej - np. w dziale „Rozrywka” czy „Kobieta” pozwalają sobie na więcej. Wszystkie strony w bazie są skategoryzowane - nazywane są w programie Kategoriami Systemowymi. Kategorie systemowe - tak samo jak kategorie użytkownika - można ustawić jeden z trzech stanów: blokowana, dozwolona, kontrolowana po treści. Działanie tych stanów jest identyczne jak przy kategoriach użytkownika.

3. Słowa Użytkownika
Gdy na podstawie adresu strony nie uda się dokonać jednoznacznej oceny bezpieczeństwa - strona jest wczytywana i program przystępuje do analizy treści z uwzględnieniem słów kluczowych wprowadzonych przez użytkownika. <wrap em>Uwaga:</wrap> program traktuje słowa kluczowe z użytkownika z wielką powagą - oznacza to, że wystarczy tylko jedno takie słowo na stronie i strona zostanie zablokowana. Należy być świadomym, że na treść strony składa się wiele tekstu, który nie jest widoczny dla użytkownika jest analizowany przez mechanizmy filtrowania Opiekuna. Program traktuje tak samo każde słowo kluczowe bez względu na to w którym miejscu strony się ono znajduje. Słowa kluczowe użytkownika, które znajdują się w kategorii o statusie „dozwolona” są ignorowane - gdyż nie jest tak, że jedno dozwolone słowo na stronie sprawi, że strona jest bezpieczna. Jeśli algorytm nadal nie jest w stanie określić czy strona jest bezpieczna przechodzi do ostatniego etapu.

4. Analiza treści
Analiza treści na podstawie bazy słów kluczowych SoftStory jest znacznie bardziej skomplikowanym mechanizmem niż analiza na podstawie słów kluczowych użytkownika. Pod uwagę brane jest wiele czynników: ile razy dane słowo występuje na stronie, w jakiej części strony (np. w tytule ma większą wagę niż w treści), jakie inne słowa występują na stronie - co może wskazywać na inny kontekst użycia słowa. Baza słów SoftStory zawiera słowa w wielu językach. Jeśli na tym ostatnim etapie strona nie zostanie zakwalifikowana do niebezpiecznych zostanie ona wyświetlona w przeglądarce.

Więcej na ten temat w rozdziale: Konfiguracja dostępu do Internetu