Cztery razy V

Dajcie mi punkt podparcia, a poruszę Ziemię! – miał podobno powiedzieć Archimedes zaraz po tym, jak uświadomił sobie, jak działa dźwignia. Dzisiaj może by powiedział: dajcie mi odpowiednią ilość danych, a przepowiem przyszłość.

Ilość danych, jaką produkuje współczesna cywilizacja, jest przerażająca. Na serwis YouTube, który jest w pewnym sensie magazynem filmów, w ciągu jednej minuty wrzucana jest tak duża ich ilość, że aby je zobaczyć, trzeba by siedzieć przed ekranem komputera dwa lata! Na portalach społecznościowych miliony osób, dziesiątki milionów codziennie tworzą jakieś treści. Setki tysięcy czujników mierzy i waży, miliony kart chipowych rejestruje. To wszystko jest magazynowane. Jeżeli mieszkamy w mieście, codziennie obserwuje nas kilka, kilkanaście kamer monitoringu miejskiego. Nasz telefon komórkowy loguje się do stacji bazowych, a ta informacja także jest przechowywana. Tak samo jak ilość SMS-ów i to, do kogo były wysyłane. A to wciąż tylko wierzchołek góry lodowej. Dane statystyczne dotyczące naszego zdrowia, naszych operacji bankowych, tego, ile zużywamy prądu, wody czy gazu. Co i gdzie kupujemy, w jakich sytuacjach i średnio ile płacimy, korzystając z karty kredytowej... O tym, że jesteśmy cały czas pod obserwacją (albo pośrednią, albo bezpośrednią) pisaliśmy w „Gościu” wiele razy. Czy ta gigantyczna ilość informacji, która jest zbierana, przechowywana i analizowana, może się na coś przydać? Jak najbardziej.

Zaczynamy nieśmiało zdawać sobie z tego sprawę.

Google przewidział grypę

Obsługiwanie tej ogromnej ilości danych pochodzących z różnych źródeł, ich analiza i magazynowanie czasami określa się terminem Big Data, czyli w skrócie Duża Ilość Danych. Z tym terminem wiąże się coś, co czasami określa się jako 4xV, czyli Volume (duża ilość), Velocity (duża szybkość pojawiania się nowych informacji, ale także szybkość ich analizy), Variety (różnorodność) i Value (duża wartość dostarczanych informacji). Tematu w ogóle by nie było, gdyby chodziło tylko o wytwarzanie dużej ilości informacji. Po to, by sprawnie je analizować, dane muszą być przechowywane w formie cyfrowej, w skrócie: muszą być „w komputerze”. Kiedyś analizowanie danych różnego typu także było możliwe, ale zbieranie informacji było kosztowne, dlatego analizowano tylko niewielkie próbki. Słowo „kiedyś” nie znaczy tutaj 200 lat temu ani nawet 50 lat temu. „Kiedyś” znaczy 10 lat temu. 12 lat temu, czyli w roku 2001, tylko 24 proc. wszystkich informacji na świecie zapisanych było w formie cyfrowej. Dzisiaj cyfrowo zapisanych jest 98 proc. informacji. A to oznacza, że jedynie od inwencji badacza zależy, do czego będzie próbował się dokopać. Wszystko to brzmi dość enigmatycznie, dlatego czas na przykłady. Jednym z najbardziej spektakularnych jest to, co trzy lata temu zrobiła firma Google. Jej programiści sprawdzili zależność pomiędzy częstotliwością wyszukiwania w internecie informacji na temat objawów i lekarstw na grypę a zachorowaniem na grypę. Okazało się (co nie powinno nikogo dziwić), że te dwie wielkości są ze sobą ściśle skorelowane. I na tym można by poprzestać, ale Google zrobił krok dalej. Stworzył aplikację, która w czasie rzeczywistym oceniała, jakie jest zagrożenie epidemiologiczne w zależności od informacji, jakich użytkownicy poszukiwali w internecie. Okazało się, że był to strzał w dziesiątkę. Przypadek został opisany w prestiżowym czasopiśmie naukowym „Nature” i wywołał szeroką dyskusję. Dzięki tym informacjom służby medyczne mogły modyfikować swoje postępowanie. Kierując odpowiednią ilość leków w rejony najbardziej zagrożone czy w skrajnych przypadkach decydując się na kwarantannę. Oczywiście bez Google’a informacja o zagrożeniu także dotarłaby do Centrum Kontroli i Prewencji Chorób, ale dzięki niemu była dostępna natychmiast i to z bardzo dużego obszaru. W „Nature” pisano, że wspomniana aplikacja analizuje miliardy wpisów.

Strażacy się cieszą

Kojarzenie ze sobą niepowiązanych z pozoru danych leży u podstaw Big Data. Dzięki temu, że informacja jest zapisana w formie cyfrowej (nikt nie musi wertować spisanych w tabelkach rzędów liczb), analiza ogromnych pakietów danych nie stanowi problemu technicznego. Dzięki odpowiednio napisanemu programowi udało się mocno obniżyć ilość pożarów w dużych miastach USA. Jak? Pożary i zaczadzenia najczęściej zdarzają się w starych kamienicach, w których nielegalnie mieszka zbyt wiele osób. Najczęściej dochodzi tam do samowolek budowlanych (dzielenia mieszkań na mniejsze), w czasie których nie są zachowane żadne normy budowlane. W takich sytuacjach instalacje gazowe, elektryczne czy te związane z centralnym ogrzewaniem nie są prawidłowo wykonane.

«« | « | 1 | 2 | » | »»

aktualna ocena |   |
głosujących |   |
Ocena | bardzo słabe | słabe | średnie | dobre | super |

Dodaj komentarz
Gość
    Nick (wymagany lub )

    Ze względów bezpieczeństwa, kiedy korzystasz z możliwości napisania komentarza lub dodania intencji, w logach systemowych zapisuje się Twoje IP. Mają do niego dostęp wyłącznie uprawnieni administratorzy systemu. Administratorem Twoich danych jest Instytut Gość Media, z siedzibą w Katowicach 40-042, ul. Wita Stwosza 11. Szanujemy Twoje dane i chronimy je. Szczegółowe informacje na ten temat oraz i prawa, jakie Ci przysługują, opisaliśmy w Polityce prywatności.

    Autopromocja