Criteri e metodi per testare ipotesi statistiche, esempi

Sommario:

Criteri e metodi per testare ipotesi statistiche, esempi
Criteri e metodi per testare ipotesi statistiche, esempi
Anonim

Il test delle ipotesi è una procedura necessaria in statistica. Un test di ipotesi valuta due affermazioni che si escludono a vicenda per determinare quale affermazione è meglio supportata dai dati del campione. Quando si dice che un risultato è statisticamente significativo, è dovuto a un test di ipotesi.

Metodi di verifica

I metodi per verificare le ipotesi statistiche sono metodi di analisi statistica. In genere, vengono confrontati due set di statistiche oppure un set di dati campionato viene confrontato con un set di dati sintetico da un modello idealizzato. I dati devono essere interpretati in modo da aggiungere nuovi significati. Puoi interpretarli assumendo una certa struttura del risultato finale e utilizzando metodi statistici per confermare o rifiutare l'ipotesi. L'ipotesi è chiamata ipotesi e i test statistici utilizzati a questo scopo sono chiamati ipotesi statistiche.

Ipotesi H0 e H1

Ci sono due principalii concetti di verifica statistica delle ipotesi - la cosiddetta "ipotesi principale o nulla" e "ipotesi alternativa". Sono anche chiamate ipotesi di Neyman-Pearson. L'ipotesi del test statistico è chiamata ipotesi nulla, ipotesi principale o H0 in breve. Viene spesso definito presupposto predefinito o presupposto che nulla sia cambiato. Una violazione del presupposto del test viene spesso definita prima ipotesi, ipotesi alternativa o H1. H1 è un'abbreviazione per qualche altra ipotesi, perché tutto ciò che sappiamo è che i dati H0 possono essere scartati.

test di ipotesi nulla
test di ipotesi nulla

Prima di rifiutare o non rifiutare l'ipotesi nulla, il risultato del test deve essere interpretato. Un confronto è considerato statisticamente significativo se è improbabile che la relazione tra i set di dati sia l'implementazione dell'ipotesi nulla secondo la probabilità soglia - il livello di significatività. Esistono anche criteri di bontà di adattamento per la verifica di ipotesi statistiche. Questo è il nome del criterio di verifica dell'ipotesi, che è associato alla presunta legge della distribuzione sconosciuta. Questa è una misura numerica della discrepanza tra la distribuzione empirica e quella teorica.

Procedura e criteri per verificare le ipotesi statistiche

I metodi di selezione delle ipotesi più comuni si basano sul criterio informativo di Akaike o sul coefficiente bayesiano. Il test di ipotesi statistica è una tecnica chiave sia nell'inferenza che nell'inferenza bayesiana, sebbene i due tipi presentino differenze notevoli. Test di ipotesi statistichedefinire una procedura che controlli la probabilità di decidere erroneamente un default errato o un'ipotesi nulla. La procedura si basa su quanto è probabile che funzioni. Questa probabilità di prendere una decisione sbagliata è l'improbabilità che l'ipotesi nulla sia vera e che non esistano particolari ipotesi alternative. Il test non può mostrare se è vero o falso.

Metodi per verificare ipotesi statistiche
Metodi per verificare ipotesi statistiche

Metodi alternativi di teoria delle decisioni

Esistono metodi alternativi di teoria delle decisioni, in cui le ipotesi nulla e prima sono considerate su un piano di parità. Altri approcci decisionali, come la teoria bayesiana, tentano di bilanciare le conseguenze di decisioni sbagliate su tutte le possibilità piuttosto che concentrarsi su una singola ipotesi nulla. Un certo numero di altri approcci per decidere quale delle ipotesi è corretta si basano sui dati, quali di essi hanno le proprietà desiderate. Ma la verifica delle ipotesi è l'approccio dominante all'analisi dei dati in molti campi della scienza.

Verificare l'ipotesi statistica

Ogni volta che una serie di risultati differisce da un' altra serie, è necessario fare affidamento su test di ipotesi statistiche o test di ipotesi statistiche. La loro interpretazione richiede una corretta comprensione dei valori p e dei valori critici. È anche importante capire che, indipendentemente dal livello di significatività, i test possono comunque contenere errori. Pertanto, la conclusione potrebbe non essere corretta.

Il processo di test consiste inpiù passaggi:

  1. Si sta creando un'ipotesi iniziale per la ricerca.
  2. Sono indicate ipotesi nulle e alternative pertinenti.
  3. Spiega le ipotesi statistiche sul campione nel test.
  4. Determinare quale test è appropriato.
  5. Seleziona il livello di significatività e la soglia di probabilità al di sotto della quale l'ipotesi nulla verrà rifiutata.
  6. La distribuzione della statistica del test di ipotesi nulla mostra i possibili valori a cui l'ipotesi nulla viene rifiutata.
  7. Calcolo in corso.
  8. Viene presa la decisione di rifiutare o accettare l'ipotesi nulla a favore di un' alternativa.

Esiste un' alternativa che utilizza un valore p.

Esempi di verifica di ipotesi statistiche
Esempi di verifica di ipotesi statistiche

Test di significatività

I dati puri non sono di alcuna utilità pratica senza interpretazione. Nelle statistiche, quando si tratta di porre domande sui dati e interpretare i risultati, vengono utilizzati metodi statistici per garantire l'accuratezza o la probabilità delle risposte. Quando si verificano ipotesi statistiche, questa classe di metodi è chiamata test statistico o test di significatività. Il termine “ipotesi” ricorda i metodi scientifici, dove si indagano ipotesi e teorie. In statistica, un test di ipotesi risulta in una quantità data una data assunzione. Ti permette di interpretare se un'ipotesi è vera o se è stata commessa una violazione.

Interpretazione statistica dei test

Test di ipotesivengono utilizzati per determinare quali risultati della ricerca porteranno al rifiuto dell'ipotesi nulla per un livello di significatività predeterminato. I risultati di un test di ipotesi statistica devono essere interpretati in modo che il lavoro possa continuare su di esso. Esistono due forme comuni di criteri di verifica delle ipotesi statistiche. Questi sono p-value e valori critici. A seconda del criterio selezionato, i risultati ottenuti devono essere interpretati diversamente.

Cos'è un valore p

L'output è descritto come statisticamente significativo quando si interpreta il valore p. In effetti, questo indicatore indica la probabilità di errore se l'ipotesi nulla viene rifiutata. In altre parole, può essere utilizzato per nominare un valore che può essere utilizzato per interpretare o quantificare il risultato di un test e per determinare la probabilità di errore nel rifiutare l'ipotesi nulla. Ad esempio, puoi eseguire un test di normalità su un campione di dati e scoprire che ci sono poche possibilità di valori anomali. Tuttavia, l'ipotesi nulla non deve essere respinta. Un test di ipotesi statistica può restituire un valore p. Questo viene fatto confrontando il valore di p con un valore di soglia predeterminato chiamato livello di significatività.

Verifica statistica di ipotesi nulle
Verifica statistica di ipotesi nulle

Livello di importanza

Il livello di significato è spesso scritto con la lettera minuscola greca "alfa". Il valore generale utilizzato per l'alfa è 5%, o 0,05. Un valore alfa più piccolo suggerisce un'interpretazione più affidabile dell'ipotesi nulla. Il valore p viene confrontato convalore alfa preselezionato. Il risultato è statisticamente significativo se il valore p è inferiore all'alfa. Il livello di significatività può essere invertito sottraendolo da uno. Questo viene fatto per determinare il livello di confidenza dell'ipotesi dati i dati del campione osservato. Quando si utilizza questo metodo per verificare le ipotesi statistiche, il valore P è probabilistico. Ciò significa che nel processo di interpretazione del risultato di un test statistico, non si sa cosa sia vero o falso.

Teoria statistica del test di ipotesi

Rifiuto dell'ipotesi nulla significa che ci sono prove statistiche sufficienti per farla sembrare probabile. Altrimenti, significa che non ci sono abbastanza statistiche per rifiutarlo. Si può pensare ai test statistici in termini di dicotomia tra rifiutare e accettare l'ipotesi nulla. Il pericolo della verifica statistica dell'ipotesi nulla è che, se accettata, potrebbe sembrare vera. Sarebbe invece più corretto dire che l'ipotesi nulla non viene rifiutata perché non ci sono prove statistiche sufficienti per rifiutarla.

Ipotesi statistica che verifica la bontà dei criteri di adattamento
Ipotesi statistica che verifica la bontà dei criteri di adattamento

Questo momento spesso confonde gli extra principianti. In tal caso, è importante ricordare a te stesso che il risultato è probabilistico e che anche accettare l'ipotesi nulla ha comunque una piccola possibilità di errore.

Ipotesi nulla vera o falsa

L'interpretazione del valore di p non significa zerol'ipotesi è vera o falsa. Ciò significa che è stata fatta la scelta di rifiutare o meno l'ipotesi nulla a un certo livello di significatività statistica sulla base dei dati empirici e del test statistico scelto. Pertanto, il valore p può essere considerato come la probabilità dei dati forniti in base a un'assunzione predeterminata incorporata nei test statistici. Il valore p è una misura della probabilità con cui il campione di dati verrà osservato se l'ipotesi nulla è vera.

Interpretazione dei valori critici

Alcuni test non restituiscono p. Al contrario, possono restituire un elenco di valori critici. I risultati di tale studio sono interpretati in modo simile. Invece di confrontare un singolo valore p con un livello di significatività predeterminato, la statistica del test viene confrontata con un valore critico. Se risulta essere inferiore, significa che non è stato possibile rifiutare l'ipotesi nulla. Se maggiore o uguale, l'ipotesi nulla dovrebbe essere rifiutata. Il significato dell'algoritmo di verifica dell'ipotesi statistica e l'interpretazione del suo risultato è simile al valore p. Il livello di significatività scelto è una decisione probabilistica di rifiutare o meno l'ipotesi del test di base dati i dati.

Errori nei test statistici

L'interpretazione di un test di ipotesi statistica è probabilistica. Il compito di verificare le ipotesi statistiche non è trovare un'affermazione vera o falsa. Le prove del test possono essere errate. Ad esempio, se l'alfa era del 5%, significa che per la maggior parte 1 su 20l'ipotesi nulla sarà respinta per errore. O non lo sarà a causa del rumore statistico nel campione di dati. Dato questo punto, un piccolo valore p al quale rifiutare l'ipotesi nulla può significare che è falso o che è stato commesso un errore. Se viene commesso questo tipo di errore, il risultato viene chiamato falso positivo. E un tale errore è un errore del primo tipo quando si verificano ipotesi statistiche. D' altra parte, se il p-value è abbastanza grande da significare il rifiuto dell'ipotesi nulla, può significare che è vero. Oppure non è corretto e si è verificato un evento improbabile a causa del quale è stato commesso l'errore. Questo tipo di errore è chiamato falso negativo.

Verifica statistica di ipotesi nulle
Verifica statistica di ipotesi nulle

Probabilità di errori

Quando si verificano ipotesi statistiche, c'è ancora la possibilità di commettere uno di questi tipi di errori. Sono molto probabili dati falsi o conclusioni false. Idealmente, dovrebbe essere scelto un livello di significatività che minimizzi la probabilità di uno di questi errori. Ad esempio, il test statistico di ipotesi nulle può avere un livello di significatività molto basso. Sebbene livelli di significatività come 0,05 e 0,01 siano comuni in molti campi della scienza, il livello di significatività più comunemente utilizzato è 310^-7, o 0,0000003. Viene spesso definito "5-sigma". Ciò significa che la conclusione è stata casuale con una probabilità di 1 su 3,5 milioni di ripetizioni indipendenti degli esperimenti. Esempi di verifica di ipotesi statistiche spesso portano tali errori. Questo è anche il motivo per cui è importante avere risultati indipendenti.verifica.

Esempi di utilizzo della verifica statistica

Ci sono diversi esempi comuni di verifica di ipotesi nella pratica. Uno dei più popolari è conosciuto come “Degustazione di tè”. La dottoressa Muriel Bristol, una collega del fondatore della biometria Robert Fisher, ha affermato di essere in grado di dire con certezza se è stata aggiunta prima a una tazza di tè o latte. Fisher si offrì di darle otto tazze (quattro di ogni varietà) a caso. La statistica del test era semplice: contare il numero di successi nella scelta di una tazza. La regione critica è stata l'unico successo su 4, possibilmente in base al solito criterio di probabilità (< 5%; 1 su 70 ≈ 1,4%). Fisher ha sostenuto che non è richiesta un'ipotesi alternativa. La signora ha identificato correttamente ogni tazza, che è stata considerata un risultato statisticamente significativo. Questa esperienza ha portato al libro di Fisher Metodi statistici per ricercatori.

Esempio dell'imputato

La procedura del processo statistico è paragonabile a un tribunale penale in cui l'imputato è ritenuto innocente fino a prova contraria. Il pubblico ministero cerca di provare la colpevolezza dell'imputato. Solo quando ci sono prove sufficienti per un'accusa l'imputato può essere ritenuto colpevole. All'inizio del procedimento, le ipotesi sono due: "L'imputato non è colpevole" e "L'imputato è colpevole". L'ipotesi dell'innocenza può essere respinta solo quando l'errore è molto improbabile perché non si vuole condannare un imputato innocente. Tale errore è chiamato errore di tipo I e la sua occorrenzararamente controllato. Come conseguenza di questo comportamento asimmetrico, l'errore di tipo II, ovvero l'assoluzione dell'autore, è più comune.

Esempi di validazione statistica
Esempi di validazione statistica

Le statistiche sono utili quando si analizzano grandi quantità di dati. Questo vale anche per la verifica delle ipotesi, che possono giustificare le conclusioni anche se non esiste una teoria scientifica. Nell'esempio di degustazione del tè, era "ovvio" che non c'era differenza tra versare il latte nel tè o versare il tè nel latte.

L'applicazione pratica reale del test di ipotesi include:

  • testare se gli uomini hanno più incubi delle donne;
  • attribuzione del documento;
  • Valutare l'influenza della luna piena sul comportamento;
  • determinare l'intervallo entro il quale un pipistrello può rilevare un insetto usando un'eco;
  • scegliere i mezzi migliori per smettere di fumare;
  • Controllare se gli adesivi per paraurti rispecchiano il comportamento del proprietario dell'auto.

Il test di ipotesi statistiche gioca un ruolo importante nella statistica in generale e nell'inferenza statistica. Il test del valore viene utilizzato in sostituzione del tradizionale confronto tra valore previsto e risultato sperimentale al centro del metodo scientifico. Quando una teoria è in grado di predire solo il segno di una relazione, i test di ipotesi diretti possono essere configurati in modo tale che solo un risultato statisticamente significativo supporti la teoria. Questa forma di teoria della valutazione è la più rigidacritica all'uso del test di ipotesi.

Consigliato: