Tiedon hakeminen Internetistä tarkoittaa käytännössä myös sitä, että käyttäjä jättää itsestään tietoa vierailemilleen sivustoille ja sitä kautta näiden sivustojen yhteistyökumppaneille. Yksittäisten käyttäjien toimintaa voidaan seurata laajemmin evästeiden ja digitaalisen sormenjäljen avulla.
Kirjoittajat: Mikko Janhonen ja Aki Vainio
#DigiLAHTI on LAMKin, LUTin ja Ladecin yhteinen EU:n aluekehitysrahaston rahoittama hanke, jonka tavoitteena on alueen yritysten digitaalisten valmiuksien kehittäminen. Eräs esiin nouseva aihe on analytiikka, mutta analytiikan mahdollisuuksia esiteltäessä nousee esiin aiheen toinen puoli: Jos minulla on mahdollisuus saada näin paljon tietoa, mitä kaikkea tietoa minusta on saatavilla?
Verkkoselailu tapahtuu selaimen kautta tehtävien pyyntöjen avulla. Selain lähettää sivuston sisältävälle palvelimelle pyynnön, joka sisältää erinäisiä tietoja, jotta palvelin osaa palauttaa oikeaan paikkaan oikealla tavalla muotoiltua sisältöä. Kuva 1 esittää http-pyyntöä, joka paljastaa paljon tietoa käyttäjästä, kuten esimerkiksi toivotun kielen ja sijainnin. Pyyntöön liittyy myös aina IP-osoite.
Kuva 1: Esimerkki HTTP Requestista Wikipedian Hypertext Transfer Protocol -sivulle
Internet-sivustot keräävät Mayerin ja Mitchellin (2012) mukaan tietoa kahdella eri tavalla: tietokoneelle tallennettuna evästeinä (cookie) ja digitaalisen sormenjälkitunnistuksen avulla, missä vierailija tunnistetaan oman laitteen ja sen asetusten perusteella. Tietoa tallennetaan erilaisiin tarkoituksiin. Niiden avulla voidaan esimerkiksi yrittää selvittää ongelmatilanteita, mikäli palvelimeen kohdistuu hyökkäys tai on tapahtunut käyttäjävirhe, tunnistaa ongelmia ohjelmiston kanssa tai tarkkailla olemassa olevan laitteiston riittävyyttä. Jotkut sivustot kehittävät myös käyttöliittymiään seuraamalla käyttäjien hiirten liikettä ja reaktioaikoja.
Evästeet ja niiden toiminta
Eväste on selaimien työkalu, jonka avulla sivustot voivat tallentaa tietoa selaimeen. Näiden alkuperäinen tarkoitus oli mahdollistaa käyttäjän sisäänkirjautumisen eri järjestelmiin. Niihin voidaan myös tallentaa sivustoon liittyviä asetuksia. Monet sivustot tallentavat evästeisiin paljon erilaista tietoa, jota selaimen käyttäjä ei välttämättä pääse lukemaan. (Mazel ym. 2017; Jyrhämä 2018)
Evästeiden tallentamisen selaimeen voi estää ja olemassa olevat evästeet voi tuhota, mutta tämä tarkoittaa usein, että merkittävä osa sivujen toiminnallisuudesta ei ole käytössä. Vastaavasti voit käyttää selaimen yksityistilaa, mutta sen mahdollistama yksityisyys on hyvin rajoitettua. Se voi ainoastaan estää historian tallentumisen selaimen profiiliin, mutta se ei voi esimerkiksi estää tietojen tallentamista palvelimelle. (Mazel ym. 2017; Jyrhämä 2018)
Suurin osa seurannasta ja mainonnan kohdennuksesta tapahtuu evästeiden avulla. Evästeeseen liittyy numeerinen tunniste, joita tallennetaan sivuilla vierailtaessa. Evästeeseen tallennetaan usein tietoa siitä, mitä sivuilla on tehty, mutta sama tieto tallennetaan myös palvelimelle. Aiemmin kerätty tieto voidaan yhdistää käyttäjään uudelleen, mikäli hänet voidaan tunnistaa jollain muulla tapaa. (Rigatelli 2017; Brain 2007)
Evästeen voi lukea ainoastaan sen lähettänyt verkkopalvelu tai palvelin. Evästeen asettaja ei ole kuitenkaan aina se Internetsivusto jolla vieraillaan, vaan sivuston eri sisällöt voivat olla peräisin myös toisilta palvelimilta. Sivuilla on usein monia evästeitä eri lähteistä. Lisäksi, ei ole mitään teknistä estettä sille, että palveluntarjoaja jakaa keräämiään tietoja muiden kanssa. (Rigatelli 2017; Brain 2007)
On myös olemassa menetelmiä, joilla normaalievästeiden rajoituksia pyritään kiertämään. Tietoja tallennetaan selaimen oman profiilin ulkopuolelle, jolloin niiden poistaminen vaikeutuu, eikä kokenutkaan käyttäjä ole välttämättä tietoinen niiden olemassaolosta. (Braun 2018)
Digitaalinen sormenjälkitunnistus
Http-pyynnöt sisältävät paljon informaatiota, jonka avulla on mahdollista liittää käyttäjä aiempaan selailuun eli ne toimivat digitaalisena sormenjälkenä. Tämä ei ole aina pitkällä aikavälillä mahdollista, koska laitteet vaihtuvat, selaimia päivitetään ja sijainti ei ole aina sama. On kuitenkin mahdollista käyttää erilaisia käyttäjän itsestään antamia tietoja, kuten esimerkiksi sivuille kirjautumiset, vanhan digitaalisen sormenjäljen liittämiseen uuteen.
On tarjolla palveluita, jotka auttavat selvittämään minkälaisia tietoja selain luovuttaa (esim. Linus, Am I Unique?). Lisäksi on erilaisia ohjelmistoja tai ohjelmistojen lisäosia, jotka auttavat selaimen antamien tietojen rajoittamisessa. Tämä tapahtuu usein esimerkiksi siten, että selain suodattaa pois sivuilla olevia seuraamiseen käytettäviä kolmansien osapuolien ohjelmakoodeja, jolloin nämä kolmannet osapuolet eivät pysty seuraamaan käyttäjän toimintaa (esim. AdBlock Plus 2015), tai siirtää tiedot välityspalvelimien kautta, jolloin IP-osoite paljastuu vain kyseiselle välityspalvelimelle, ei palvelimelle, josta ladattava sivu pyydetään (esim. Hide My IP 2019). (Brain 2007; Helenius 2018, 18.)
Kuva 2. Digitaalinen sormenjälki Am I Unique? –sivuston mukaan
Vuonna 2018 ranskalaisella Internet-sivustolla tehdyn tutkimuksen mukaan yli kahdesta miljoonasta kerätystä digitaalisesta sormenjäljestä tietokoneiden käyttäjistä 35,7% ja mobiililaitteiden käyttäjistä 18,5% oli ainutlaatuisia käyttäjäryhmän sisällä (Gómez-Boix ym. 2018). Tämän tuloksen yleistettävyys ei ole kuitenkaan selvää, koska vertailtavien kohteiden määrä vaikuttaa samanlaisten sormenjälkien määrään ja sivuston kieli rajaa kohderyhmää.
Miksi seurantaa tehdään?
Seurannan avulla mainontaa voidaan kohdistaa. Jo pelkkä sijainnin tunnistaminen auttaa rajaamaan merkittävästi sitä, mitä mainoksia kävijälle kannattaa näyttää. Yritykset tekevät seurantaa myös, koska se on tarkkaa, nopeaa ja toiminta voidaan helposti automatisoida. (Mayer & Mitchell 2012, 2)
Tutkimustulosten mukaan kohdistamattomaan Internet-mainontaan nähden kohdistetun mainonnan tuotto on 2,68 kertainen, koska se palvelee myös käyttäjiä. Seuranta mahdollistaa monen Internet-palvelun toiminnan, koska ne rahoitetaan usein mainostuotoilla. (Beales 2010)
Lopuksi
Big Datan yleistyessä kerätään tietoa käyttäjistä yhä enemmän. Usein tiedot ovat harmittomia, mutta tietojen harkitsematon käyttö on johtanut esimerkiksi tilanteisiin, joissa anonyymina toimivien henkilöllisyys on paljastunut syistä, jotka eivät ole olleet heidän hallinnassaan. Esimerkiksi Facebook käyttää löytämiään yhteystietoja käyttäjiensä yhdistämiseen, mikä on johtanut esimerkiksi siihen, että prostituoitujen henkilöllisyys on paljastunut heidän asiakkailleen (Hill 2017).
Yksityisyyttään voi verkossa varjella, mutta se ei ole helppoa tai vaatii uhrauksia sivustojen käytettävyydessä. Tarkoitukseen on olemassa erilaisia apuvälineitä, mutta myös ne keräävät usein dataa käyttäjistään myydäkseen sitä eteenpäin tai käyttääkseen sitä muihin tarkoituksiin.
Lähteet
Adblock Plus. 2015. [Viitattu 30.1.2019]. Saatavilla: https://adblockplus.org/en/about
Am I Unique? [Viitattu 6.3.2019]. Saatavissa: https://amiunique.org/fp
Beales, H. 2010. The Value of Behavioral Targeting. [Viitattu 3.6.2019]. Saatavilla: https://www.researchgate.net/publication/265266107_The_Value_of_Behavioral_Targeting
Brain, M. 2007. How internet cookies work. [Viitattu 30.1.2019]. Saatavilla: http://jjconline.net/747Files/Google_Privacy/Howstuffworks_Internet_Cookies.pdf
Braun, A. 2018. What are Supercookies, Zombie Cookies, and Evercookies, and Are They Threat? [Viitattu 30.1.2019]. Saatavilla: https://www.maketecheasier.com/supercookies-zombie-cookies-evercookies/
Gómez-Boix, A., Laperdrix, P. & Baudry, B., 2018. Hiding in the Crows: an Analysis of the Effectiveness of Browser Fingerprinting at Large Scale. WWW2018 – TheWebConf 2018: 27th International World Wide Web Conference, Apr 2018, Lyon, Ranska, Sivut 1-10. [Viitattu 6.3.2019]. Saatavissa: https://hal.inria.fr/hal-01718234v2/document
Helenius, T. 2018. Käyttäjien seuraaminen verkossa. Pro gradu -tutkielma. Tampereen yliopisto, Luonnontieteiden tiedekunta, Tietojenkäsittelytieteiden tutkinto-ohjelma. Tampere. [Viitattu 1.2.2019]. Saatavilla: http://urn.fi/URN:NBN:fi:uta-201812313072
Hide My IP. 2019. [Viitattu 6.3.2019]. Saatavissa: https://www.hide-my-ip.com/
Hill, K. 2017. How Facebook Outs Sex Workers. Gizmodo. [Viitattu 7.3.2019]. Saatavissa: https://gizmodo.com/how-facebook-outs-sex-workers-1818861596
Jyrhämä, T. 2018. Mitä internet tietää minusta? [Viitattu 31.1.2019]. Saatavilla: https://www.turre.com/mita-internet-tietaa-minusta/
Linus, R. What every browser knows about you. [Viitattu 31.1.2019]. Saatavilla: http://webkay.robinlinus.com/
Mayer, J. & Mitchell, J. 2012. Third Party Web Tracking: Policy and Technology. [Viitattu 1.2.2019]. Saatavissa: https://jonathanmayer.org/publications/trackingsurvey12.pdf
Mazel, J., Garnier, R. & Fukuda, K. 2017. A comparison of web privacy protection techniques. [Viitattu 1.2.2019]. Saatavilla: https://arxiv.org/pdf/1712.06850.pdf
Rigatelli, S. 2017. Kännykkäsi vuotaa tietosi mainostajille -mitä voit tehdä? 4 hyötyä, 4 riskiä ja 7 vinkkiä. [Viitattu 30.1.2019]. Saatavilla: https://yle.fi/uutiset/3-9906380
Kirjoittajat
Mikko Janhonen opiskelee Lahden Ammattikorkeakoulussa ylempää AMK-tutkintoa Liiketoiminta ja uudistava johtaminen
Aki Vainio työskentelee Lahden ammattikorkeakoulussa tietojenkäsittelyn lehtorina ja toimii asiantuntijana #digiLAHTI ja VENLA –hankkeissa.
Artikkelikuva: https://pxhere.com/en/photo/1437977 (CC0)
Julkaistu 10.6.2019
Viittausohje
Janhonen, M. & Vainio, A. 2019. Mitä tietoa sinusta internetin välityksellä kerätään, mitä varten ja pystytkö vaikuttamaan asiaan? LAMK Pro. [Viitattu ja pvm]. Saatavissa: http://www.lamkpub.fi/2019/06/10/mita-tietoa-sinusta-internetin-valityksella-kerataan-mita-varten-ja-pystytko-vaikuttamaan-asiaan/