Big datan määritelmä – Tätä big data tarkoittaa

Big data voidaan erottaa tavallisesta datasta sen niin sanottujen V-ominaisuuksien kautta. V-ominaisuuksien nimi tulee big dataa kuvaavista englanninkielisistä sanoista. Riippuen siitä, miten tarkasti big data määritellään, voidaan haluta, että sen määritelmään sisältyy 3, 4, 5 tai 6 (tai jopa useampi) V.

Big datan määritelmän kannalta niin sanotusti pakolliset V:t ovat Volume, Variety and Velocity. Nuo voidaan suomentaa tarkoittamaan datan isoa määrää, datan isoa monimuotoisuutta ja uuden datan syntymisen suurta nopeutta.

Kolmen V:n big datan määritelmän ”Velocity”-osan voidaan joskus nähdä tarkoittavan uuden datan syntymisen nopeuden lisäksi myös sitä, että big datan kohdalla dataa myös käsitellään erityisen nopeasti.

Big datan neljäs mahdollinen V on Value, eli datan arvo. Yritysmaailmassa dataa tarkastellessa siis käytännössä datan taloudellinen arvo.

Viides mahdollinen big datan V on Veracity. Tämän voi nähdä viittaavan datan laatuun ja totuudenmukaisuuteen. Big datan kohdalla voi olla korostunut riski siihen, että kaikki data ei ole laadukasta.

Kuudes V on Variability. Se viittaa big datan määritelmän yhteydessä käytännössä siihen, että esimerkiksi datan saatavuudessa ja sen muodoissa voi tapahtua muutoksia.

Onko mahdollista sanoa, milloin data muuttuu big dataksi?

On käytännössä mahdotonta määritellä yksittäistä pistettä, jossa data muuttuu big dataksi. Ehkä osittain tuosta syystä nykyään esimerkiksi yritysmaailmassa puhutaankin usein datasta eikä big datasta niissäkin tilanteissa, joissa jälkimmäinen ilmaus todennäköisesti olisi kelvollinen.

Onko big datalle suomennusta?

Jos big datan haluaa suomentaa, niin voi käyttää ilmausta ”massadata” tai ”iso data”. Käytännössä ”big data” on kuitenkin Suomessakin niin vakiintunut ilmaus, että todennäköisesti Suomessakin on useimmissa tilanteissa selkeämpää käyttää sitä kuin sen suomennusta.

Mikä on big datan yhteys tekoälyyn?

Big data voi olla erittäin hyödyllistä tekoälyjen opettamisessa paremmaksi ja toisaalta tekoäly (käytännössä erityisesti sen koneoppimisen haara) voi olla erittäin hyödyllistä big datan tehokasta analysoimista varten.

Sinua voisivat kiinnostaa myös esimerkiksi nämä sivut: