Kvalitatiivinen vs. kvantitatiivinen data – mikä on ero?
Data-analyysi on laajaa, tutkivaa ja suorastaan monimutkaista.
Mutta kun otamme askeleen taaksepäin ja yritämme yksinkertaistaa data-analyysia, näemme nopeasti, että se tiivistyy kahteen menetelmään: Kvalitatiivinen data ja kvantitatiivinen data. Nämä kaksi tietotyyppiä ovat varsin erilaisia, mutta silti ne muodostavat kaiken datan, jota koskaan tullaan analysoimaan.
Ennen kuin sukellamme data-analytiikkaan, on tärkeää ymmärtää kvalitatiivisen ja kvantitatiivisen datan keskeiset erot.
Mitä eroa on kvantitatiivisella ja kvalitatiivisella datalla?
Kvantitatiivista dataa voidaan laskea, mitata ja ilmaista numeroiden avulla. Kvalitatiivinen data on kuvailevaa ja käsitteellistä. Kvalitatiivinen data voidaan luokitella piirteiden ja ominaisuuksien perusteella.
Yksi tietotyyppi on objektiivista, täsmällistä ja lopullista. Toinen tyyppi on subjektiivista, tulkinnallista ja tutkivaa. Kumpi on kumpi?
Nyt kun saimme erot pois tieltä, sukelletaanpa kumpaankin datatyyppiin reaalimaailman esimerkkien avulla.
Mitä on laadullinen data?
Kvalitatiivinen data ei ole tilastollista, ja se on tyypillisesti strukturoimatonta tai puolistrukturoitua. Tätä dataa ei välttämättä mitata kovilla numeroilla, joita käytetään kuvaajien ja kaavioiden laatimiseen. Sen sijaan se luokitellaan ominaisuuksien, attribuuttien, merkintöjen ja muiden tunnisteiden perusteella.
Kvalitatiivista dataa voidaan käyttää kysymyksen ”miksi” esittämiseen. Se on tutkivaa ja usein avointa, kunnes tehdään lisätutkimuksia. Tämän aineiston tuottamista laadullisesta tutkimuksesta käytetään teoretisointeihin, tulkintoihin, hypoteesien kehittämiseen ja alustaviin käsityksiin.
Kvalitatiivista aineistoa voidaan tuottaa seuraavin keinoin:
- Tekstit ja asiakirjat
- Audio- ja videotallenteet
- Haastattelupöytäkirjat ja fokusryhmät
- Havainnot ja muistiinpanot
Yllättävää kyllä, myös tunnistenumeroita, kuten sosiaaliturvatunnusta (SSN) tai ajokorttia, luetaan kvalitatiivisiksi aineistoiksi, koska ne ovat kategorisia ja yksilöllisiä yhdelle henkilölle.
Kvalitatiivisen datan esimerkkejä
Ymmärtääksemme paremmin kvalitatiivista dataa, otetaan esimerkki kirjahyllystä. Tämän kirjahyllyn seuraavat ominaisuudet määrittelevät sen tiedon laadun, joka meillä on siitä saatavilla:
- Valmistettu puusta
- Rakennettu Italiassa
- Syvä ruskea
- Kullanväriset nupit
- Sileä pintakäsittely
- Valmistettu tammesta
Keskustellessamme kvalitatiivisesta aineistosta puhumme tietyn esineen ominaisuuksista. Kvalitatiivinen data saadaan analysoimalla laadullisesti yksityiskohtaista tietoa käsiteltävästä asiasta.
Kirjahyllyn kohdalla on monia tapoja saada erilaista laadullista tietoa eri tarkkailijoilta. Jos jollakulla ei ole tarkempia yksityiskohtia kirjahyllystä, hän voi olettaa, että se on tehty teakista eikä tammesta ja että sen pinta on karhea eikä sileä. Samoin voidaan keskustella siitä, minkälaisesta tammesta se on tehty tai mistä osasta Italiaa se on peräisin.
Kvalitatiivisen datan tunnistetiedot voivat siis olla subjektiivisia, mikä tekee kvalitatiivisen datan analysoinnista monimutkaisen prosessin, jossa on lukuisia mahdollisuuksia ja rakenteita.
Mitä on kvantitatiivinen data?
Kontrastina kvalitatiiviseen dataan kvantitatiivinen data on tilastollista tietoa, ja se on tyypillisesti luonteeltaan strukturoitua – eli jäykempää ja rajatumpaa. Tätä tietotyyppiä mitataan numeroiden ja arvojen avulla, mikä tekee siitä sopivamman ehdokkaan data-analyysiin.
Mikäli kvalitatiivinen data on avoin tutkittavaksi, kvantitatiivinen data on paljon ytimekkäämpää ja suljetumpaa. Sitä voidaan käyttää kysymysten ”kuinka paljon” tai ”kuinka monta” esittämiseen, jota seuraa päättäväinen tieto.
Kvantitatiivista tietoa voidaan tuottaa:
- Testit
- Kokeet
- Kyselyt
- Markkinaraportit
- Metriikka
Kvantitatiivisen tiedon tyyppejä ja esimerkkejä
Kvantitatiivinen tieto voidaan jakaa edelleen alaluokkiin. Näitä luokkia kutsutaan diskreetiksi ja jatkuvaksi dataksi.
Diskreetti data
Diskreetti data on vain dataa, jota ei voi jakaa pienempiin osiin. Tämäntyyppinen data koostuu kokonaisluvuista (positiiviset ja negatiiviset luvut, esim. -100, 10, 100 ja niin edelleen) ja on äärellistä (eli se saavuttaa jonkin rajan).
Muutamia esimerkkejä diskreetistä datasta ovat esimerkiksi se, kuinka paljon pikkurahaa taskussasi on, kuinka monta iPhonea myytiin viime vuonna ja kuinka paljon liikennettä verkkosivuillesi tuli tänään.
Toinen tärkeä huomio on se, että diskreettiä dataa voi teknisesti olla kategorista. Esimerkiksi Meksikossa syntyneiden pesäpalloilijoiden määrä joukkueessa on kokonaisuus ja diskreetti.
Jatkuva data
Jatkuva data on dataa, joka voidaan pilkkoa loputtomasti pienempiin osiin, tai dataa, joka vaihtelee jatkuvasti.
Muutamia esimerkkejä jatkuvasta datasta ovat junan nopeus aamulla työmatkallasi, aika, joka kuluu kirjoittaessasi artikkelia, painosi ja ikäsi.
Kumpi tietotyyppi on parempi data-analyysiä varten?
Nyt kun olemme eritelleet kvalitatiivisen ja kvantitatiivisen datan leipätyöt, on aika miettiä, kumpi tyyppi on parempi data-analyysiä varten.
Kvalitatiivista dataa pidetään melkein aina strukturoimattomana datana tai puolistrukturoituna. Tämäntyyppinen data on löyhästi muotoiltua ja siinä on hyvin vähän rakennetta. Tämän vuoksi laadullista dataa ei voida kerätä ja analysoida tavanomaisilla menetelmillä.
Laadullisen datan järkeistäminen voi olla aikaa vievää ja kallista, vaikka on olemassa joitakin menetelmiä tämän datan ”jäsentämiseksi”.
Voidaan esimerkiksi soveltaa metatietoja kuvaamaan strukturoimatonta datatiedostoa. Alt-teksti on eräänlainen kuvatiedostoihin sovellettava metatieto, joka auttaa hakukoneita, kuten Googlea, Bingiä ja Yahoota, indeksoimaan asiaankuuluvat kuvat.
NoSQL-tietokantojen yleistyminen on tehnyt laadullisen datan keräämisestä ja tallentamisesta paljon helpommin hallittavaa. On kuitenkin vielä matkaa ylöspäin, ennen kuin tämä data voidaan valjastaa kokonaan käyttöön.
Kvantitatiivista dataa pidetään lähes aina strukturoituna datana. Tämäntyyppinen data on muotoiltu siten, että se voidaan nopeasti järjestää ja hakea relaatiotietokannoissa. Ehkä yleisin esimerkki strukturoidusta datasta ovat taulukkolaskentaohjelmista löytyvät numerot ja arvot.
Koska kvantitatiivinen data ja strukturoitu data kulkevat käsi kädessä, kvantitatiivista dataa suositaan yleensä data-analyysissä.
Kvantitatiivinen vs. kvalitatiivinen tutkimus
Kvantitatiivinen tutkimus on tilastollisen ja numeerisen datan numeerista ja tilastollista analyysia (numerot ja tilastot). Toisaalta laadullinen tutkimus käsittelee avoimia ja ei-numeerisia tietoja (käsitteitä, kuvauksia, merkityksiä, sanoja ja muuta).
Kvalitatiivisten tutkimusmenetelmien tyypit
Kvalitatiivisissa tutkimusmenetelmissä keskitytään laadullisiin tiedonkeruumenetelmiin, joilla tutkitaan ja havainnoidaan kohderyhmää ja tehdään johtopäätöksiä kerätystä aineistosta. Tämä tutkimusmenetelmä nojaa enemmän subjektiivisiin ominaisuuksiin, jotka määritetään kvalitatiivisten lähestymistapojen avulla. Seuraavassa on joitakin yleisesti käytettyjä kvalitatiivisia tutkimusmenetelmiä.
Fokusryhmät
Fokusryhmätutkimusmenetelmä on yksi yleisimmin käytetyistä kvalitatiivisista tutkimusmenetelmistä tiedonkeruussa. Fokusryhmä koostuu tietystä määrästä vastaajia (5-10), jotka toimivat klusterina. Voit lähettää verkkokyselyn tai kyselylomakkeen fokusryhmälle saadaksesi heidän palautettaan tai mielipidettään tietystä asiasta ja nauhoittaa heidän vastauksensa nopeaa tietojen analysointia varten.
Fokusryhmien muodostaminen ja hallinnointi voi olla monimutkainen ja kallis prosessi. Sitä käyttävät yritykset, jotka haluavat ehkä lanseerata uuden tuotteen, tutkiakseen markkinoita ja saadakseen tietoa kohdeyleisönsä tarpeista, mieltymyksistä ja käyttäytymispiirteistä.
Etnografinen tutkimus
Etnografisessa tutkimuksessa havainnoidaan ja tutkitaan tutkimusaiheita tietyssä maantieteellisessä paikassa. Tämä maantieteellinen sijainti voi vaihdella pienestä yksiköstä suureen maailmanmaahan. Etnografinen tutkimus auttaa tutkimaan kulttuureja, käyttäytymistä, suuntauksia ja kipupisteitä luonnollisessa ympäristössä. Tämäkin on aikaa vievä ja haastava tutkimusmenetelmä, eikä sitä voida rajata tiettyyn ajanjaksoon.
Tapaustutkimus
Tapaustutkimus on syvällinen analyysi, jota käytetään pääasiassa yhteiskunta- ja kasvatustieteissä. Sitä voi tehdä mikä tahansa organisaatio, suuri tai pieni, tehdäkseen yksityiskohtaisia päätelmiä jostakin aiheesta. Tapaustutkimus on myös yksi suoraviivaisimmista mutta aikaa vievimmistä tutkimusmenetelmistä, joihin liittyy tiedonkeruu useista eri lähteistä.
Narratiivinen
Narratiivinen tutkimusmenetelmä perustuu tarinan kehittämiseen tai luomiseen. Kootaan sarja tapahtumia ja luodaan narratiivi havaitun aiheen ympärille. Tämä tutkimusmenetelmä osoittaa, miten pieni kokonaisuus voi vaikuttaa merkittävään tapahtumaan ja määrittää sen suhdetta.
Fenomenologia
Fenomenologia on toinen tutkimusmenetelmä, joka ottaa huomioon tietyn tapahtuman tai ilmiön laadullisessa tiedonkeruussa. Se auttaa havainnoitsijaa ymmärtämään, miten, miksi ja mitä ilmiötä esiintyy ja sen vaikutusta käsiteltävään asiaan. Fenomenologiassa käytetään erilaisia aineistonkeruumenetelmiä asiakirjoista, videoista ja haastatteluista siihen, että käydään paikan päällä, koetaan ilmiö ja kuvataan, miten se on kehittynyt ja kehittynyt ajan mittaan.
Pohjoismainen teoria
Pohjoismainen teoria keskittyy selittämään tapahtuman esiintymisen taustalla olevia syitä. Perustetussa teoriassa käytetty otoskoko on yleensä alle sata koehenkilöä, ja siinä arvioidaan, miten jokin asia tapahtuu tiettynä ajankohtana.
Kvantitatiivisten tutkimusmenetelmien tyypit
Kvantitatiivisissa tutkimusmenetelmissä taas käytetään kvantitatiivisia lähestymistapoja aineiston keräämiseen ja analysointiin. Se on numeerinen ja tilastollinen tutkimusmenetelmä, jossa käytetään numeroita ja tilastoja järkeviin ja varmoihin johtopäätöksiin. Seuraavassa on joitakin yleisimpiä kvantitatiivisia tutkimusmenetelmiä.
Korrelaatiotutkimus
Korrelaatiotutkimusmenetelmässä tutkitaan kahden tai useamman samankaltaisen ja toisistaan riippuvaisen muuttujan välistä suhdetta. Se osoittaa, miten yksi muuttuja vaikuttaa toiseen ja päinvastoin. Korrelaatiotutkimuksessa käytetään matemaattista analyysia kerättyjen tietojen analysointiin. Tulokset voidaan esittää kaaviossa tai tuottaa tilastoissa tutkimustulosten täydentämiseksi.
Kokeellinen
Kokeellinen tutkimusmenetelmä on teoreettinen tutkimusmenetelmä. Siinä keskitytään teoriaan oikeiden ja väärien väittämien erottamiseksi toisistaan. Tämä tutkimusmenetelmä auttaa todentamaan väitteen, ja sitä käytetään pääasiassa luonnontieteissä.
Keskeis-vertaileva
Keskeis-vertaileva vertaa kahta muuttujaa, jotka eivät ole yhteydessä toisiinsa. Toinen on riippuvainen ja toinen riippumaton. Se tunnetaan myös nimellä kvasikokeellinen tutkimus, ja siinä määritetään näiden muuttujien välinen syy-seuraussuhde.
Kyselytutkimus
Kyselytutkimus on yksi yleisimmin käytetyistä tutkimusmenetelmistä aina koulutuksesta politiikkaan ja talouteen ja monilla muilla aloilla. Organisaatiot käyttävät sitä kerätäkseen palautetta tuotteistaan satunnaisilta vastaajilta kyselytutkimusten, kyselylomakkeiden ja muiden syöttömenetelmien avulla. Kerätyt tiedot analysoidaan sitten määrällisten tulosten saamiseksi.
Miten hyvin tunnet eron?
Vahvistaaksesi ymmärrystäsi kvalitatiivisesta ja kvantitatiivisesta aineistosta mieti muutamia tapoja elämässäsi, joissa molempia voidaan soveltaa.
Aloita esimerkkinä itsestäsi. Jos haluat hankkia laadullista tietoa, mieti tunnistetietoja, kuten vaatteidesi väriä, hiustyyppiä ja nenän muotoa. Kvantitatiivista dataa varten harkitse mittaustietoja, kuten pituuttasi, painoasi, ikääsi ja kengänkokoasi.
Kun hallitset kvalitatiivisen ja kvantitatiivisen datan, voit aloittaa big data -analytiikan hyödyntämisen.