MASOWA INWIGILACJA – CZY ISTNIEJE

by romskey

Gdyby ktoś starał się przekonać Was, że ukrywa słonia w pudełku po butach, to zapewne w większości uznalibyście taką deklarację za mocno naciąganą. Nasza niewiara wynikałaby ze zwykłej świadomości rozmiarów słoni i pudełek. Jednak w zetknięciu z pojęciem „masowej inwigilacji” dzieje się odwrotnie. Jest to zrozumiałe gdyż arkana technologii cyfrowych są wciąż postrzegane jako rodzaj czarnej magii. Brak danych o możliwościach sprzętu z którego na co dzień korzystamy zastępujemy różnorodnymi wyobrażeniami i tu mówiąc wprost – potrafimy nieco przeszacować. Gdybyśmy jednak potrafili dokonać w pełni miarodajnych szacunków, to – co czasem zdarza się – błędem byłoby wysnucie wniosku, że skoro w pudełku nie ma słonia to znaczy, że nie ma w nim zupełnie niczego.

Strona praktyczna

Kupujemy nową kamerę i kręcimy wszystko na co mamy ochotę. Zapewne dość szybko zdamy sobie sprawę z tego, że pamięć kamery jest ograniczona, dlatego zakupimy kolejne karty pamięci lub zaczniemy kasować to co uznaliśmy za zbędne. Miniaturyzacja potrafi miło zaskoczyć (skoro na karcie pamięci wielkości paznokcia możemy zapisać zawartość wielkiej biblioteki) dlatego możemy słusznie założyć, że filmy dokumentujące wybrane zdarzenia z 10 lat naszego życia zmieścimy bez problemu w paczce po zapałkach. To niewiele i zapis 10 lat życia miliona osób zająłby powierzchnię miliona paczek po zapałkach czyli gdyby ustawić je na sobie to powstałby słupek o wysokości 10 km. Zmagazynowanie takiej ilości danych jest osiągalne (np. dla rządów) zarówno pod względem miejsca przechowywania i kosztów. Zdecydowanie mniej osiągalny jest – zdałoby się banalny – cel pt.: „kto miałby to przeglądać?” (a wspomnijmy, że te milion osób każdego dnia dostarcza kilka nowych paczek). Oczywiście nie musimy zakładać, że rząd musiałby zatrudnić liczbę analityków równą (a nawet większą) liczbie inwigilowanej populacji, gdyż mamy przecież „sztuczna inteligencję”, tylko że możliwości sztucznej inteligencji również potrafimy nieco przeszacować. Uprzedzając zastrzeżenia, tak, owszem, „masowa inwigilacja” jest teoretycznie możliwa, jednak „możliwość” a więc prawdopodobieństwo np. wygranej w lotto to nie to samo co odebranie wygranej (tym także różni się matematyka od fizyki).

Czy wiecie, że na oceanach dryfują wyspy plastikowych śmieci, a jedna z takich wysp ma wielkość Francji? Nie jest to agitacja ekologiczna – choć tej również należałoby poświęcić trochę miejsca – tylko zwrócenie uwagi na to, że człowiek generuje całkiem sporo śmieci także w obszarze cyfrowym. Właściwie, to nie minąłbym się z prawdą, gdybym stwierdził, że produkujemy głównie śmieci, skoro np klienci serwisów komputerowych prosząc o „wgranie nowego systemu” zastrzegają, że można skasować wszystko, tylko jedynie zdjęcia z wesela zostawić. Ktoś, kto projektowałby masową inwigilację zetknąłby się z podobnymi uwarunkowaniami. Można podejrzewać, że służb specjalnych nie interesuje 50 milionów półgodzinnych filmików pt. „krowa je”, „pies się bawi” lub „pociąg jedzie”. Odsianie tego co interesujące od tego co nieinteresujące wymaga możliwości obliczeniowych większych niż było potrzebnych do ich stworzenia. Skutek taki łatwo opisać problemem CERN, gdzie dane ze zderzeń są stale zbierane (koszty zbierania i przechowywania sięgają miliardów euro), lecz ich analiza zderza się z problemem ich …zakorkowania. Czyli mówiąc wprost jest ich nieco więcej niż można sensownie czy na bieżąco przetworzyć.

Powiecie, że obłudnie Was tutaj uspokajam, ale zadajmy sobie praktyczne pytanie, czy jakikolwiek rozumny inwigilator miałby ochotę ponosić koszty przeglądania wyspy śmieci o rozmiarach Francji w poszukiwaniu jednego patyczka higienicznego na którym znajduje się jakiś ślad w postaci DNA? Jeżeli przerzucenie takiej sterty odpadów kosztowałoby miliard dolarów to wcześniej czy później pojawi się myśl, czy nie byłoby łatwiej takiego patyczka zdobyć inną metodą np. za 10 dolarów? Jak słusznie domyślacie się, zmierzam do tego, że zdecydowanie łatwiej i taniej inwigilować jednego opozycjonistę, niż dwoić się i troić nad wyłuskaniem jednego opozycjonisty z danych kilkudziesięciu milionów ludzi (czyli w większości danych o których już wspomniałem, a więc typu „krowa je”, „pies się bawi” lub „pociąg jedzie”). Choć miały i mają miejsce pomysły masowego poszukiwania np. „niebezpiecznych słów” zostawianych np. w internecie (co z przyczyn technicznych jest o niebo prostsze niż analiza np. filmów lub audio), to osiągnięcia związane ze stosowania tej metody nie są spektakularne i nie będę już opisywał znanych (bo komicznych) przypadków w których FBI dopadło człowieka, który kupił szybkowar lub matkę przedszkolaka, która podzieliła się wrażeniem z bombowego przyjęcia w przedszkolu. Do tego, nikt przecież nie powiedział, że cel inwigilacji w ogóle korzysta z telefonu, komputera czy internetu w ramach realizowania swojej tajemnej misji. Oznacza to mniej więcej tyle, że w wyspie śmieci w ogóle nie musi znajdować się to czego szuka „wielki śledczy”. To zmienia trochę postać rzeczy – przyznajcie.

Pod lupą

Nośność mitu „masowej inwigilacji” ma nieco inne podłoże i wracamy tu do punktu: „w pudełku nie ma słonia, ale to nie znaczy, że nic w nim nie ma”. Uogólniając – internet zbiera o nas różne dane i jest to owe ziarno prawdy, na którym buduje się różne teorie. Do rozwoju tego obszaru przyczynił się rozwój „cyfrowego marketingu” i wprowadzić musimy tutaj nowe/stare pojęcie „śladu cyfrowego” (zetknąłem się również z nazwą „punkt informacji”). Nieszczególnie przepadam za spiskogennymi nazwami, w których można zmieścić wszystko, dlatego sprecyzujmy czym są i mogą być ślady cyfrowe. Śladem cyfrowym jest np. historia odwiedzanych witryn, śladem cyfrowym jest np. informacja o zakupionych produktach, oglądanych reklamach, polubieniach w Facebooku, dane o używanym oprogramowaniu. Śladem cyfrowym mogą być także nasze personalia, nasz wizerunek, PESEL, miejsce zamieszkania, stan zdrowia, powiązania rodzinne – czyli ogólnie wszystko co mądrze lub niemądrze zostawiamy w sieci. Takie dane nieco różnią się od danych na temat każdego naszego kroku o czym była mowa wcześniej. Danych tego rodzaju jest znacznie mniej a ich przetwarzanie jest stosunkowo proste.

Praktycznie nie wiemy jak wiele „internet” wie o nas i tu jak z pojemnością mikro kart pamięci możemy zostać zaskoczeni. Algorytmy przetwarzające ślady cyfrowe są w stanie stworzyć nasz w miarę poprawny profil fizyczno-psychologiczny i to na podstawie tej bardzo małej ilości danych. Taki profil nie musi być w 100% prawdziwy (i pełny), gdyż oprócz tego, że strasznie śmiecimy to i prawdy o nas, które zostawiamy w sieci nie zawsze są całkiem prawdziwe. Jednak nie da się ukryć, że algorytm potrafi wyłonić co nieco na nasz temat jak i na temat pewnych zbiorowych trendów. Tworzenie profili i trendów nazywamy psychografią lub psychometrią (oczywiście chodzi o cyfrową odmianę tych dziedzin). Jeden z psychologów a zarazem współtwórca algorytmów stwierdził, że można dowiedzieć się więcej o nas poznając preferencje naszych znajomych niż nas samych. Brzmi ciekawie i trudno taką deklarację podważyć. Gdy mamy wśród znajomych Owsiaka, Frasyniuka, Rzeplińskiego, Biedronia i Sorosa to raczej mało prawdopodobne jest, że biegamy po mieście z flagą z krzyżem celtyckim i ryczymy coś o pedałowaniu. Takich historii o algorytmach jest wiele, ponoć stwierdzono m.in. związek np. antysemitów z sympatią do marki wafelków KiteKat.

Wielki regał zawierający skany naszych dowodów tożsamości z dopiętymi załącznikami o tym co lubimy a czego nie, stanowi jakieś źródło wiedzy o nas. Zaciera się granica pomiędzy danymi osobowymi, danymi prywatnymi lub niespersonalizowanymi identyfikatorami klienta ale podkreślmy jedno – trudno taki zbiór danych nazwać inwigilacją podobną do tej prowadzonej np. przez służby, które dysponują większością takich danych zanim w ogóle przystąpią do działań operacyjnych.
Nie oznacza to, że te dane to dane śmieciowe. Można wykorzystać je w kampaniach reklamowych a co ostatnio nieco smutne – także w kampaniach politycznych. Znając preferencje czy oczekiwania wyborców można uszyć np. „doskonały” program polityczny oraz wiedzieć komu podsunąć go pod nos, by wiedział na kogo głosować.

W pewnym sensie to nic nowego. Handlowcy i politycy od lat starają się poznać preferencje ludzi. Lata temu narzędziem służącym temu były sondaże, dziś narzędziem stał i staje się internet. Problematyczna różnica polega na tym, że dziś nie bardzo wiemy, że ktoś nas bada, jak i kiedy z tego korzysta. Pewne jest to, że zainteresowani nami nie wyciągają od nas więcej niż sami w sieci zostawiamy (celowo wyłączam tu działania hakerów, którzy działają raczej jak służby niż marketerzy).

Podsumowując. W pudełku nie ma słonia o imieniu „Masowa Inwigilacja”, natomiast jest w nim kot o imieniu „Masowe Profilowanie” i jest z nim trochę jak ze znanym kotem Schrödingera, o którym nie za bardzo wiemy czy jest żywy czy martwy. Jak dotąd nie udało się określić konkretnego wpływu jaki można za jego pomocą wywrzeć np. na proces wyborczy. Wiemy jedynie, że taki wpływ istnieje lub ma miejsce. Gdy znajdziemy odpowiedź na to pytanie, zdecydowanie łatwiej będzie stworzyć regulacje, określić ramy legalności.
Choć może będzie już za późno? 😉

Reklamy