Testarea ipotezei este un proces științific răspândit utilizat în discipline științifice statistice și sociale. În studiul statisticilor, un rezultat semnificativ statistic (sau unul cu semnificație statistică) într-un test de ipoteză este obținut atunci când valoarea p este mai mică decât nivelul de semnificație definit. Valoarea p este probabilitatea obținerii unei statistici sau a unui rezultat de probă la fel de extrem sau mai extrem decât cel observat în studiu, în timp ce nivelul de semnificație sau alfa îi spun unui cercetător care trebuie să fie rezultatele extreme pentru a respinge ipoteza nulă. Cu alte cuvinte, dacă valoarea p este egală sau mai mică decât nivelul de semnificație definit (de obicei notat prin α), cercetătorul poate presupune în siguranță că datele observate sunt incompatibile cu presupunerea că ipoteza nulă este adevărat, ceea ce înseamnă că ipoteza nulă sau premisa că nu există nicio relație între variabilele testate pot fi respinse.
Respingând sau respingând ipoteza nulă, un cercetător ajunge la concluzia că există o bază științifică pentru credința este o anumită relație între variabile și că rezultatele nu s-au datorat erorii de eșantionare sau şansă. Deși respingerea ipotezei nule este un obiectiv central în majoritatea studiului științific, este important să reținem că respingerea ipotezei nule nu este echivalentă cu dovada alternativei cercetătorului ipoteză.
Rezultate semnificative statistice și nivel de semnificație
Conceptul de semnificație statistică este fundamental pentru testarea ipotezelor. Într-un studiu care implică extragerea unui eșantion aleatoriu dintr-o populație mai mare, în efortul de a demonstra un rezultat care poate fi aplicat la în ansamblul populației, există potențialul constant pentru datele studiului să fie rezultatul unei erori de eșantionare sau a unei simple coincidențe sau şansă. Determinând un nivel de semnificație și testând valoarea p cu acesta, un cercetător poate susține sau respinge cu încredere ipoteza nulă. Nivelul de semnificație, în termeni simpli, este pragul de probabilitate de a respinge în mod incorect ipoteza nulă atunci când este de fapt adevărat. Aceasta este cunoscută și sub denumirea de eroare de tip I rată. Prin urmare, nivelul de semnificație sau alfa este asociat cu nivelul de încredere general al testului, ceea ce înseamnă că cu cât valoarea alfa este mai mare, cu atât este mai mare încrederea în test.
Erorile de tip I și nivelul de semnificație
O eroare de tip I, sau o eroare de primul tip, apare atunci când ipoteza nulă este respinsă atunci când în realitate este adevărată. Cu alte cuvinte, o eroare de tip I este comparabilă cu o falsă pozitivă. Erorile de tip I sunt controlate prin definirea unui nivel adecvat de semnificație. Cele mai bune practici în testarea ipotezei științifice necesită selectarea unui nivel de semnificație înainte de începerea colectării datelor. Cel mai frecvent nivel de semnificație este 0,05 (sau 5%) ceea ce înseamnă că există o probabilitate de 5% ca testul să sufere o eroare de tip I respingând o adevărată ipoteză nulă. Acest nivel de semnificație se traduce invers la 95% nivel de încredere, ceea ce înseamnă că peste o serie de teste de ipoteză, 95% nu vor duce la o eroare de tip I.