Distribuzione Pearson: definizione, applicazione

Sommario:

Distribuzione Pearson: definizione, applicazione
Distribuzione Pearson: definizione, applicazione
Anonim

Qual è la legge di distribuzione di Pearson? La risposta a questa ampia domanda non può essere semplice e concisa. Il sistema Pearson è stato originariamente progettato per modellare osservazioni distorte visibili. A quel tempo, era ben noto come mettere a punto un modello teorico per abbinare i primi due cumulanti o momenti dei dati osservati: qualsiasi distribuzione di probabilità può essere espansa direttamente per formare un gruppo di scale di localizzazione.

Ipotesi di Pearson sulla normale distribuzione dei criteri

Tranne nei casi patologici, la scala di localizzazione può essere fatta in modo che corrisponda alla media osservata (primo cumulativo) e alla varianza (secondo cumulante) in modo arbitrario. Tuttavia, non era noto come costruire distribuzioni di probabilità in cui l'asimmetria (terzo cumulante standardizzato) e la curtosi (quarto cumulante standardizzato) potessero essere controllate ugualmente liberamente. Questa necessità è emersa quando si è cercato di adattare modelli teorici noti ai dati osservati,che ha mostrato asimmetria.

Nel video qui sotto puoi vedere l'analisi della distribuzione del chi di Pearson.

Image
Image

Cronologia

Nel suo lavoro originale, Pearson identificò quattro tipi di distribuzioni (numerate da I a IV) oltre alla distribuzione normale (che originariamente era conosciuta come tipo V). La classificazione dipende dal fatto che le distribuzioni siano supportate su un intervallo limitato, su un semiasse o sull'intera retta reale e se fossero potenzialmente asimmetriche o necessariamente simmetriche.

Due omissioni sono state corrette nel secondo articolo: ha ridefinito la distribuzione di tipo V (in origine era solo la distribuzione normale, ma ora con gamma inversa) e ha introdotto la distribuzione di tipo VI. Insieme, i primi due articoli coprono i cinque tipi principali del sistema Pearson (I, III, IV, V e VI). Nel terzo articolo, Pearson (1916) introdusse ulteriori sottotipi.

Funzioni di distribuzione di Pearson
Funzioni di distribuzione di Pearson

Migliora il concetto

Rind ha inventato un modo semplice per visualizzare lo spazio dei parametri del sistema Pearson (o la distribuzione dei criteri), che ha poi adottato. Oggi molti matematici e statistici usano questo metodo. I tipi di distribuzioni di Pearson sono caratterizzati da due grandezze, solitamente denominate β1 e β2. Il primo è il quadrato dell'asimmetria. Il secondo è la tradizionale curtosi, o quarto momento standardizzato: β2=γ2 + 3.

I metodi matematici moderni definiscono la curtosi γ2 come cumulanti invece che come momenti, quindi per undistribuzione abbiamo γ2=0 e β2=3. Qui vale la pena seguire il precedente storico e utilizzare β2. Il diagramma a destra mostra quale tipo è una particolare distribuzione di Pearson (indicata dal punto (β1, β2).

Statistiche di Pearson
Statistiche di Pearson

Molte delle distribuzioni asimmetriche e/o non mesocurtiche che conosciamo oggi non erano ancora note all'inizio degli anni '90 dell'Ottocento. Quella che oggi è nota come distribuzione beta è stata usata da Thomas Bayes come parametro a posteriori della distribuzione di Bernoulli nel suo articolo del 1763 sulla probabilità inversa.

La distribuzione beta è salita alla rib alta grazie alla sua presenza nel sistema Pearson ed era conosciuta fino agli anni '40 come distribuzione Pearson di tipo I. La distribuzione di Tipo II è un caso speciale di Tipo I, ma di solito non viene più individuata.

La distribuzione Gamma ha avuto origine dal suo stesso lavoro ed era conosciuta come la distribuzione normale di tipo III di Pearson prima di acquisire il suo nome moderno negli anni '30 e '40. Un articolo del 1895 di uno scienziato presentava la distribuzione di Tipo IV, che contiene la distribuzione t di Student, come un caso speciale, precedente al successivo utilizzo di William Seely Gosset di diversi anni. Il suo articolo del 1901 presentava una distribuzione con gamma inversa (tipo V) e beta primi (tipo VI).

Un' altra opinione

Secondo Ord, Pearson sviluppò la forma base dell'equazione (1) basata sulla formula per la derivata del logaritmo della funzione di densità di distribuzione normale (che fornisce una divisione lineare per lastruttura). Molti specialisti sono ancora impegnati a testare l'ipotesi sulla distribuzione dei criteri di Pearson. E dimostra la sua efficacia.

Distribuzione alternativa di Pearson
Distribuzione alternativa di Pearson

Chi era Karl Pearson

Karl Pearson era un matematico e biostatistico inglese. È accreditato di creare la disciplina della statistica matematica. Nel 1911 fondò il primo dipartimento di statistica al mondo presso l'University College di Londra e diede un contributo significativo ai campi della biometria e della meteorologia. Pearson era anche un sostenitore del darwinismo sociale e dell'eugenetica. Era il protetto e biografo di Sir Francis G alton.

Biometrici

Karl Pearson è stato determinante nella creazione della scuola di biometria, che era una teoria in competizione per descrivere l'evoluzione e l'eredità delle popolazioni all'inizio del XX secolo. La sua serie di diciotto articoli "Contributi matematici alla teoria dell'evoluzione" lo ha stabilito come il fondatore della scuola biometrica dell'ereditarietà. Infatti Pearson dedicò gran parte del suo tempo durante il 1893-1904 a sviluppo di metodi statistici per la biometria. Questi metodi, oggi ampiamente utilizzati per l'analisi statistica, includono il test del chi quadrato, la deviazione standard, i coefficienti di correlazione e di regressione.

Coefficiente di correlazione di Pearson
Coefficiente di correlazione di Pearson

La questione dell'ereditarietà

La legge dell'ereditarietà di Pearson affermava che il plasma germinale è costituito da elementi ereditati dai genitori, nonché da antenati più lontani, la cui proporzione variava secondo varie caratteristiche. Karl Pearson era un seguace di G alton, e sebbene il lorole opere differivano per alcuni aspetti, Pearson ha utilizzato una quantità significativa dei concetti statistici del suo insegnante nella formulazione di una scuola biometrica per l'ereditarietà, come la legge di regressione.

Distribuzione Pearson
Distribuzione Pearson

Caratteristiche della scuola

La scuola biometrica, a differenza dei mendeliani, non era focalizzata sul fornire un meccanismo per l'ereditarietà, ma sul fornire una descrizione matematica che non fosse di natura causale. Mentre G alton ha proposto una teoria dell'evoluzione discontinua in cui le specie cambierebbero con grandi balzi piuttosto che piccoli cambiamenti accumulati nel tempo, Pearson ha sottolineato i difetti in questa argomentazione e ha effettivamente utilizzato le sue idee per sviluppare una teoria dell'evoluzione continua. I mendeliani preferivano la teoria dell'evoluzione discontinua.

Mentre G alton si è concentrato principalmente sull'applicazione di metodi statistici allo studio dell'ereditarietà, Pearson e il suo collega Weldon hanno ampliato il loro ragionamento in quest'area, variazione, correlazioni della selezione naturale e sessuale.

Distribuzione tipica
Distribuzione tipica

Uno sguardo all'evoluzione

Per Pearson, la teoria dell'evoluzione non intendeva identificare il meccanismo biologico che spiega i modelli di eredità, mentre l'approccio mendeliano dichiarava che il gene era il meccanismo dell'ereditarietà.

Pearson ha criticato Bateson e altri biologi per non aver adottato metodi biometrici nel loro studio dell'evoluzione. Ha condannato gli scienziati che non si sono concentrati suvalidità statistica delle loro teorie, affermando:

"Prima di poter accettare [qualsiasi causa di cambiamento progressivo] come fattore, non dobbiamo solo mostrarne la plausibilità, ma, se possibile, dimostrare la sua capacità quantitativa."

I biologi hanno ceduto a "speculazioni quasi metafisiche sulle cause dell'ereditarietà" che hanno sostituito il processo di raccolta dei dati sperimentali, che potrebbe effettivamente consentire agli scienziati di restringere le potenziali teorie.

ponte statistico
ponte statistico

Leggi della natura

Per Pearson, le leggi della natura sono state utili per fare previsioni accurate e per riassumere le tendenze nei dati osservati. Il motivo è stata l'esperienza "che una certa sequenza è avvenuta e si è ripetuta in passato".

Quindi, identificare un particolare meccanismo genetico non è stato uno sforzo degno per i biologi, che dovrebbero invece concentrarsi sulle descrizioni matematiche dei dati empirici. Ciò ha in parte portato a un'aspra disputa tra biometristi e mendeliani, incluso Bateson.

Dopo che quest'ultimo ha rifiutato uno dei manoscritti di Pearson che descriveva una nuova teoria della variazione o omotipia della progenie, Pearson e Weldon fondarono la società Biometrika nel 1902. Sebbene l'approccio biometrico all'ereditarietà alla fine perse la sua prospettiva mendeliana, i metodi che svilupparono all'epoca sono vitali per lo studio della biologia e dell'evoluzione oggi.

Consigliato: