
Tällä sivulla on ensin käsittelyssä se, mitä big data on ja sen jälkeen on käsittelyssä big datan yhteys tekoälyyn.
Tätä big data tarkoittaa
Big data voidaan erottaa tavallisesta datasta sen niin sanottujen V-ominaisuuksien kautta. V-ominaisuuksien nimi tulee big dataa kuvaavista englanninkielisistä sanoista. Riippuen siitä, miten tarkasti big data määritellään, voidaan haluta, että sen määritelmään sisältyy 3, 4, 5 tai 6 (tai jopa useampi) V.
Big datan määritelmän kannalta niin sanotusti pakolliset V:t ovat Volume, Variety and Velocity. Nuo voidaan suomentaa tarkoittamaan datan isoa määrää, datan isoa monimuotoisuutta ja uuden datan syntymisen suurta nopeutta.
Kolmen V:n big datan määritelmän “Velocity”-osan voidaan joskus nähdä tarkoittavan uuden datan syntymisen nopeuden lisäksi myös sitä, että big datan kohdalla dataa myös käsitellään erityisen nopeasti.
Big datan neljäs mahdollinen V on Value, eli datan arvo. Yritysmaailmassa dataa tarkastellessa siis käytännössä datan taloudellinen arvo.
Viides mahdollinen big datan V on Veracity. Tämän voi nähdä viittaavan datan laatuun ja totuudenmukaisuuteen. Big datan kohdalla voi olla korostunut riski siihen, että kaikki data ei ole laadukasta.
Kuudes V on Variability. Se viittaa big datan määritelmän yhteydessä käytännössä siihen, että esimerkiksi datan saatavuudessa ja sen muodoissa voi tapahtua muutoksia.
Onko mahdollista sanoa, milloin data muuttuu big dataksi?
On käytännössä mahdotonta määritellä yksittäistä pistettä, jossa data muuttuu big dataksi. Ehkä osittain tuosta syystä nykyään esimerkiksi yritysmaailmassa puhutaankin usein datasta eikä big datasta niissäkin tilanteissa, joissa jälkimmäinen ilmaus todennäköisesti olisi kelvollinen.
Onko big datalle suomennusta?
Jos big datan haluaa suomentaa, niin voi käyttää ilmausta “massadata” tai “iso data”. Käytännössä “big data” on kuitenkin Suomessakin niin vakiintunut ilmaus, että todennäköisesti Suomessakin on useimmissa tilanteissa selkeämpää käyttää sitä kuin sen suomennusta.
Big data ja tekoäly
Big data voi olla erittäin hyödyllistä tekoälyjen opettamisessa paremmaksi ja toisaalta tekoäly (käytännössä erityisesti sen koneoppimisen haara) voi olla erittäin hyödyllistä big datan tehokasta analysoimista varten.
Vuonna 2025 tehdyn maisteritutkielman perusteella monissa suomalaisissa yrityksissä aliarvioidaan big datan merkitystä tekoälyn hyödyntämisen suhteen. Tutkielmassa tuli esille myös esimerkiksi se, että vaikka kyseessä olisi “big data”, niin on tyypillistä, että yritysmaailmassa siitä puhutaan niin sanotusti ihan vain datana, eli jättäen edestä pois sanan “big”.
Edellä viitattu tutkielma keskittyi varsinaisesti varsinkin tekoälykonsultointiin ja siihen liittyen on nostoja esimerkiksi tällä sivulla.
Sinua voisivat kiinnostaa myös esimerkiksi nämä sivut: