Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Poprzednia rewizja po obu stronach Poprzednia wersja
Poprzednia wersja
filter [2016/09/30 00:00]
filter [2016/09/30 17:08]
admin [Mechanizm filtrowania treści internetowych]
Linia 1: Linia 1:
 +# Mechanizm filtrowania
 +
 +Mechanizm filtrowania stron internetowych w **OpiekunieWEB** jest - jak widać na poniższej ilustracji - nieco bardziej skomplikowany niż w poprzednich wersjach programu. Największą zmianą jest dodanie osobnego mechanizmu analizującego wykorzystanie wyszukiwarek Google i Bing - od niego zatem zaczniemy opis. 
 +
 +{{ :​mechanizm_filtrowania.png?​300 |}} 
 +
 +## Kontrola wyszukiwarek
 +
 +Gdy program rozpozna, że dana strona jest stroną wyszukiwarki Google albo Bing to standardowa ścieżka filtrowania jest omijana a strona przekazywana jest do mechanizmu oceniającego wykorzystanie wyszukiwarek. Mechanizm ten można wyłączyć - wtedy strona wyszukiwarki traktowana jest jako zwykła strona i stosują się do niej wszystkie mechanizmy opisane w następnym rozdziale.
 +
 +Jak widać na ilustracji są trzy mechanizmy filtrowania dla wyszukiwarek:​
 +
 +  - **„Safe Search”** – na przeglądarce wymuszana jest funkcja bezpiecznego wyszukiwania dostępna w opcjach wyszukiwarki. Może mieć ona różną nazwę. Przykładowo w Google jest to opcja „SafeSearch”,​ w wyszukiwarce Bing – „Bezpieczne wyszukiwanie”.
 +  - **Analiza** – zapytania wpisywane do wyszukiwarki są analizowane pod kątem użycia słów i fraz mogących wyświetlić niepożądane treści w wynikach wyszukiwania.
 +  - **Blokada** – blokada wyszukiwania grafiki w wyszukiwarce. Standardowe wyszukiwanie treści nadal działa, blokowane jest tylko wyszukiwanie grafiki.
 +
 +Powyższe mechanizmy mogą być włączane lub wyłączane - w zależności od preferowanych ustawień. Ustawienia te można modyfikować w [[webapp:​start|Aplikacji Webowej]] lub [[console:​windows_accounts|Konsoli]].
 +
 +## Mechanizm filtrowania treści internetowych
 +
 +Mechanizm filtrowania zbudowany jest z czterech modułów działających na zasadzie kaskady - jeśli na etapie danego modułu jest możliwe podjęcie jednoznacznej decyzji (strona jest bezpieczna - należy ją wyświetlić lub strona jest niebezpieczna należy ją zablokować) decyzja cedowana jest na kolejny moduł. Moduły biorące udział w ocenie strony są następujące:​
 +
 +**1. Strony Użytkownika** \\
 +W pierwszej kolejności adres strony konfrontowany jest z bazą stron użytkownika. Strony użytkownika mogą należeć do kategorii niedozwolonych,​ dozwolonych lub kontrolowanych po treści. W zależności od tego, do której kategorii strona należy podejmowane są różne działania:
 +  * **kategoria blokowana** - strona zostanie zablokowana
 +  * **kategoria dozwolona** - strona zostanie wyświetlona
 +  *** kategoria kontrolowana po treści** - strona zostanie przekazana do dalszej oceny modułowi oceny treści (p.3)
 +
 +**2. Baza stron SoftStory** \\
 +Adres strony konfrontowany jest z bazą stron **SoftStory**. Ogólnie rzecz biorąc zasada działania jest analogiczna do bazy stron użytkownika aczkolwiek istnieją pewne dodatkowe mechanizmy umożliwiające bardziej zniuansowane zarządzanie stronami. Np. mechanizm pierwszej strony - sprawia, że dla niektórych witryn otwierana jest pierwsza strona (traktowana jako bezpieczna) natomiast kolejne podstrony są filtrowane po treści - jest to przydatne np. w przypadku portali informacyjnych,​ które na pierwszych stronach unikają treści drastycznej lub nieodpowiedniej dla dzieci ale już głębiej - np. w dziale "​Rozrywka"​ czy "​Kobieta"​ pozwalają sobie na więcej. Wszystkie strony w bazie są skategoryzowane - nazywane są w programie Kategoriami Systemowymi. Kategorie systemowe - tak samo jak kategorie użytkownika - można ustawić jeden z trzech stanów: blokowana, dozwolona, kontrolowana po treści. Działanie tych stanów jest identyczne jak przy kategoriach użytkownika.
 +
 +**3. Słowa Użytkownika** \\
 +Gdy na podstawie adresu strony nie uda się dokonać jednoznacznej oceny bezpieczeństwa - strona jest wczytywana i program przystępuje do analizy treści z uwzględnieniem słów kluczowych wprowadzonych przez użytkownika. <wrap em>​Uwaga:</​wrap>​ program traktuje słowa kluczowe z użytkownika z wielką powagą - oznacza to, że wystarczy tylko jedno takie słowo na stronie i **strona zostanie zablokowana**. Należy być świadomym, że na treść strony składa się wiele tekstu, który nie jest widoczny dla użytkownika jest analizowany przez mechanizmy filtrowania **Opiekuna**. Program traktuje tak samo każde słowo kluczowe bez względu na to w którym miejscu strony się ono znajduje. Słowa kluczowe użytkownika,​ które znajdują się w kategorii o statusie "​dozwolona"​ są ignorowane - gdyż nie jest tak, że jedno dozwolone słowo na stronie sprawi, że strona jest bezpieczna. Jeśli algorytm nadal nie jest w stanie określić czy strona jest bezpieczna przechodzi do ostatniego etapu.
 +
 +**4. Analiza treści** \\
 +Analiza treści na podstawie bazy słów kluczowych **SoftStory** jest znacznie bardziej skomplikowanym mechanizmem niż analiza na podstawie słów kluczowych użytkownika. Pod uwagę brane jest wiele czynników: ile razy dane słowo występuje na stronie, w jakiej części strony (np. w tytule ma większą wagę niż w treści), jakie inne słowa występują na stronie - co może wskazywać na inny kontekst użycia słowa. Baza słów **SoftStory** zawiera słowa w wielu językach. Jeśli na tym ostatnim etapie strona nie zostanie zakwalifikowana do niebezpiecznych zostanie ona wyświetlona w przeglądarce.
 +
 +Więcej na ten temat w rozdziale: ​
 +[[console:​categories|]]