Analiză statistică: Semnificație și intervale de încredere

A se vedea, de asemenea: Elaborarea și testarea ipotezelor

În orice analiză statistică, este probabil să lucrați cu un eșantion, mai degrabă decât cu date din întreaga populație. Prin urmare, este posibil ca rezultatul dumneavoastră să nu reprezinte întreaga populație – și ar putea fi, de fapt, foarte imprecis dacă eșantionarea dumneavoastră nu a fost foarte bună.

De aceea, aveți nevoie de o modalitate de a măsura cât de sigur sunteți că rezultatul dumneavoastră este precis și că nu a apărut pur și simplu din întâmplare. Statisticienii folosesc două concepte legate între ele pentru acest lucru: încredere și semnificație.

Această pagină explică aceste concepte.

Semnificația statistică

Termenul semnificație are un înțeles foarte special în statistică. Acesta vă spune cât de probabil este ca rezultatul dumneavoastră să nu fi apărut din întâmplare.

În diagramă, cercul albastru reprezintă întreaga populație. Atunci când prelevați un eșantion, eșantionul dvs. ar putea fi din întreaga populație. Cu toate acestea, este mai probabil ca acesta să fie mai mic. Dacă este tot din interiorul cercului galben, ați fi acoperit o mare parte din populație. Cu toate acestea, este posibil să fiți ghinionist (sau să fi conceput greșit procedura de eșantionare) și să eșantionați numai din interiorul cercului roșu mic. Acest lucru ar avea implicații serioase în ceea ce privește reprezentativitatea eșantionului dvs. pentru întreaga populație.

Una dintre cele mai bune modalități de a vă asigura că acoperiți o mai mare parte din populație este de a utiliza un eșantion mai mare. Mărimea eșantionului dvs. afectează puternic acuratețea rezultatelor dvs. (și există mai multe despre acest lucru în pagina noastră despre Eșantionare și proiectarea eșantionului).

Cu toate acestea, un alt element afectează, de asemenea, acuratețea: variația în cadrul populației însăși. Puteți evalua acest lucru analizând măsurile de răspândire a datelor dvs. (și pentru mai multe informații despre acest lucru, consultați pagina noastră despre Analiza statistică simplă). Acolo unde există mai multă variație, există mai multe șanse să alegeți un eșantion care nu este tipic.

Conceptul de semnificație aduce pur și simplu dimensiunea eșantionului și variația populației laolaltă și face o evaluare numerică a șanselor că ați făcut o eroare de eșantionare: adică, că eșantionul dumneavoastră nu reprezintă populația dumneavoastră.

Semnificația este exprimată ca o probabilitate ca rezultatele dumneavoastră să fi apărut din întâmplare, cunoscută în mod obișnuit ca o valoare p. În general, căutați ca aceasta să fie mai mică decât o anumită valoare, de obicei fie 0,05 (5%), fie 0,01 (1%), deși unele rezultate raportează și 0,10 (10%).

Ipoteza nulă și alternativă

Când efectuați un experiment sau un studiu de piață, în general doriți să știți dacă ceea ce faceți are un efect. Prin urmare, îl puteți exprima sub forma unei ipoteze:

-x va avea un efect asupra lui y.

Aceasta este cunoscută în statistică drept „ipoteza alternativă”, adesea numită H1.

„Ipoteza nulă”, sau H0, este că x nu are niciun efect asupra lui y.

Statistic vorbind, scopul testului de semnificație este de a vedea dacă rezultatele dvs. sugerează că trebuie să respingeți ipoteza nulă – caz în care, este mai probabil ca ipoteza alternativă să fie adevărată.

Dacă rezultatele dvs. nu sunt semnificative, nu puteți respinge ipoteza nulă și trebuie să concluzionați că nu există niciun efect.

Valoarea p este probabilitatea că ați fi obținut rezultatele pe care le-ați obținut dacă ipoteza nulă este adevărată.

Calcularea semnificației

Un mod de a calcula semnificația este de a folosi un scor z. Acesta descrie distanța de la un punct de date la medie, în termeni de număr de abateri standard (pentru mai multe informații despre medie și abatere standard, consultați pagina noastră despre Analiza statistică simplă).

Pentru o comparație simplă, scorul z se calculează folosind formula:

$$z=\frac{x – \mu}{\sigma}$$$

unde \(x\) este punctul de date, \(\mu\) este media populației sau a distribuției, iar \(\sigma\) este abaterea standard.

De exemplu, să presupunem că dorim să testăm dacă o aplicație de jocuri este mai populară decât alte jocuri. Să spunem că aplicația medie de joc este descărcată de 1000 de ori, cu o abatere standard de 110. Jocul nostru a fost descărcat de 1200 de ori. Scorul său z este:

$$z=\frac{1200-1000}{110}=1.81$$$

Un scor z mai mare semnalează faptul că este mai puțin probabil ca rezultatul să fi apărut din întâmplare.

Puteți utiliza un tabel statistic standard z pentru a converti scorul z într-o valoare p. Dacă valoarea p este mai mică decât nivelul de semnificație dorit, atunci rezultatele dvs. sunt semnificative.

Utilizând tabelul z, scorul z pentru aplicația noastră de joc (1,81) se convertește într-o valoare p de 0,9649. Aceasta este mai bună decât nivelul nostru dorit de 5% (0,05) (deoarece 1-0,9649 = 0,0351, sau 3,5%), astfel încât putem spune că acest rezultat este semnificativ.

Rețineți că există o ușoară diferență pentru un eșantion dintr-o populație, unde scorul z este calculat folosind formula:

$$z=\frac{(x-\mu)}{(\sigma/\sqrt n)}$$$

unde x este punctul de date (de obicei media eșantionului dumneavoastră), µ este media populației sau a distribuției, σ este abaterea standard și √n este rădăcina pătrată a mărimii eșantionului.

Un exemplu va face acest lucru mai clar.

Să presupunem că verificați dacă studenții de la biologie tind să obțină note mai bune decât colegii lor care studiază alte materii. S-ar putea să constatați că nota medie la test pentru un eșantion de 40 de biologi este 80, cu o abatere standard de 5, comparativ cu 78 pentru toți studenții de la acea universitate sau școală.

$$z=\frac{(80-78)}{(5/\sqrt 40)}=2,53$$$

Utilizând tabelul z, 2,53 corespunde unei valori p de 0,9943. Puteți să scădeți această valoare din 1 pentru a obține 0,0054. Aceasta este mai mică de 1%, deci putem spune că acest rezultat este semnificativ la nivelul de 1% și că biologii obțin rezultate mai bune la teste decât studenții medii de la această universitate.

Rețineți că acest lucru nu înseamnă neapărat că biologii sunt mai inteligenți sau mai buni la promovarea testelor decât cei care studiază alte materii. Ar putea însemna, de fapt, că testele la biologie sunt mai ușoare decât cele la alte materii. Găsirea unui rezultat semnificativ NU este o dovadă de cauzalitate, dar vă spune că ar putea exista o problemă pe care doriți să o examinați.

Există mai multe despre testarea semnificației mediilor eșantioanelor și testarea diferențelor dintre grupuri, în pagina noastră despre Dezvoltarea și testarea ipotezelor.

Intervale de încredere

Un interval de încredere (sau nivel de încredere) este un interval de valori care are o anumită probabilitate ca valoarea adevărată să se afle în interiorul acestuia.

Efectiv, acesta măsoară cât de sigur sunteți că media eșantionului dumneavoastră (media eșantionului) este aceeași cu media populației totale din care a fost luat eșantionul dumneavoastră (media populației).

De exemplu, dacă media dumneavoastră este 12,4, iar intervalul de încredere de 95% este 10,3-15,6, aceasta înseamnă că sunteți sigur în proporție de 95% că adevărata valoare a mediei populației se află între 10,3 și 15,6. Cu alte cuvinte, s-ar putea să nu fie 12,4, dar sunteți rezonabil de sigur că nu este foarte diferită.

Diagrama de mai jos arată acest lucru în practică pentru o variabilă care urmează o distribuție normală (pentru mai multe informații despre acest lucru, consultați pagina noastră despre distribuțiile statistice).

Semnificația exactă a unui interval de încredere este că, dacă ați face experimentul dvs. de foarte multe ori, 95% din intervalele pe care le-ați construit din aceste experimente ar conține valoarea adevărată. Cu alte cuvinte, în 5% din experimentele tale, intervalul tău NU ar conține valoarea adevărată.

Puteți vedea din diagramă că există o șansă de 5% ca intervalul de încredere să nu includă media populației (cele două „cozi” de 2,5% de o parte și de alta). Cu alte cuvinte, într-unul din 20 de eșantioane sau experimente, valoarea pe care o obținem pentru intervalul de încredere nu va include media adevărată: media populației va cădea de fapt în afara intervalului de încredere.

Calcularea intervalului de încredere

Calcularea unui interval de încredere utilizează valorile eșantioanelor dumneavoastră și unele măsuri standard (media și abaterea standard) (și pentru mai multe informații despre cum să le calculați, consultați pagina noastră despre Analiza statistică simplă).

Este cel mai ușor de înțeles cu un exemplu.

Să presupunem că am eșantionat înălțimea unui grup de 40 de persoane și am constatat că media era de 159,1 cm, iar abaterea standard era de 25,4.

Deviația standard pentru intervalele de încredere

În mod normal, ați folosi abaterea standard a populației pentru a calcula intervalul de încredere. Cu toate acestea, este foarte puțin probabil să știți care este aceasta.

Din fericire, puteți folosi abaterea standard a eșantionului, cu condiția să aveți un eșantion suficient de mare. În general, se convine că punctul limită este o dimensiune a eșantionului de 30 sau mai mult, dar cu cât este mai mare, cu atât mai bine.

Trebuie să ne dăm seama dacă media noastră este o estimare rezonabilă a înălțimii tuturor oamenilor sau dacă am ales un eșantion deosebit de înalt (sau scund).

Utilizăm o formulă pentru a calcula un interval de încredere. Aceasta este:

$$mean \pm z \frac{(SD)}{\sqrt n}$$$

Unde SD = abaterea standard, iar n este numărul de observații sau mărimea eșantionului.

Valoarea z este luată din tabelele statistice pentru distribuția de referință aleasă de noi. Aceste tabele oferă valoarea z pentru un anumit interval de încredere (să zicem, 95% sau 99%).

În acest caz, măsurăm înălțimile oamenilor și știm că înălțimile populației urmează o distribuție (în linii mari) normală (pentru mai multe informații despre acest lucru, consultați pagina noastră despre Distribuțiile statistice).Prin urmare, putem folosi valorile pentru o distribuție normală.

Valoarea z pentru un interval de încredere de 95% este 1,96 pentru distribuția normală (luată din tabelele statistice standard).

Utilizând formula de mai sus, intervalul de încredere de 95% este, prin urmare:

$$159,1 \pm 1,96 \frac{(25,4)}{\sqrt 40}$$

Când efectuăm acest calcul, aflăm că intervalul de încredere este 151,23-166,97 cm. Prin urmare, este rezonabil să spunem că suntem, prin urmare, 95% încrezători că media populației se încadrează în acest interval.

Înțelegerea scorului z sau a valorii z

Scorul z este o măsură a abaterilor standard de la medie. Prin urmare, în exemplul nostru, știm că 95% din valori se vor încadra în ± 1,96 deviații standard de la medie:

Evaluarea intervalului de încredere

Ca regulă generală, un interval de încredere mic este mai bun. Intervalul de încredere se va restrânge pe măsură ce dimensiunea eșantionului dumneavoastră crește, motiv pentru care este întotdeauna preferat un eșantion mai mare. După cum explică pagina noastră despre eșantionare și proiectarea eșantionului, experimentul dumneavoastră ideal ar implica întreaga populație, dar acest lucru nu este de obicei posibil.

Concluzie

Intervalurile de încredere și semnificația sunt modalități standard de a arăta calitatea rezultatelor dumneavoastră statistice. Vi se va cere să le raportați în mod obișnuit atunci când efectuați orice analiză statistică și, în general, ar trebui să raportați cifre precise. Acest lucru va asigura că cercetarea dumneavoastră este validă și fiabilă.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.