Concetti di base della statistica matematica. Applicazione della statistica matematica

Sommario:

Concetti di base della statistica matematica. Applicazione della statistica matematica
Concetti di base della statistica matematica. Applicazione della statistica matematica
Anonim

Le statistiche matematiche sono una metodologia che ti consente di prendere decisioni informate di fronte a condizioni incerte. Lo studio dei metodi per raccogliere e sistematizzare i dati, elaborare i risultati finali di esperimenti ed esperimenti con casualità di massa e scoprire eventuali schemi è ciò che fa questo ramo della matematica. Considera i concetti di base della statistica matematica.

Differenza con la teoria della probabilità

I metodi della statistica matematica si intersecano strettamente con la teoria della probabilità. Entrambi i rami della matematica si occupano dello studio di numerosi fenomeni casuali. Le due discipline sono collegate da teoremi limite. Tuttavia, c'è una grande differenza tra queste scienze. Se la teoria della probabilità determina le caratteristiche di un processo nel mondo reale sulla base di un modello matematico, la statistica matematica fa il contrario: imposta le proprietà del modello susulla base delle informazioni osservate.

Teoria della probabilità e mat. statistiche
Teoria della probabilità e mat. statistiche

Passaggi

L'applicazione della statistica matematica può essere effettuata solo in relazione ad eventi o processi casuali, o meglio, ai dati ottenuti osservandoli. E questo avviene in più fasi. In primo luogo, i dati degli esperimenti e degli esperimenti subiscono una determinata elaborazione. Sono ordinati per chiarezza e facilità di analisi. Quindi viene effettuata una stima esatta o approssimativa dei parametri richiesti del processo casuale osservato. Possono essere:

  • valutazione della probabilità di un evento (la sua probabilità è inizialmente sconosciuta);
  • studiare il comportamento di una funzione di distribuzione indefinita;
  • stima delle aspettative;
  • stima della varianza
  • ecc.
Fondamenti di mat. statistiche
Fondamenti di mat. statistiche

La terza fase è la verifica di eventuali ipotesi poste prima dell'analisi, ovvero ottenere una risposta alla domanda su come i risultati degli esperimenti corrispondano ai calcoli teorici. In effetti, questa è la fase principale della statistica matematica. Un esempio potrebbe essere considerare se il comportamento di un processo casuale osservato rientra nella distribuzione normale.

Popolazione

I concetti di base della statistica matematica includono popolazioni generali e campionarie. Questa disciplina si occupa dello studio di un insieme di determinati oggetti rispetto ad alcune proprietà. Un esempio è il lavoro di un tassista. Considera queste variabili casuali:

  • carico o numero di clienti: al giorno, prima di pranzo, dopo pranzo, …;
  • tempo di percorrenza medio;
  • numero di domande in arrivo o loro collegamento a quartieri cittadini e molto altro ancora.

Vale anche la pena notare che è possibile studiare un insieme di processi casuali simili, che sarà anche una variabile casuale che può essere osservata.

Popolazione
Popolazione

Quindi, nei metodi della statistica matematica, l'intero insieme di oggetti oggetto di studio oi risultati di varie osservazioni che vengono effettuate nelle stesse condizioni su un dato oggetto è chiamato popolazione generale. In altre parole, matematicamente più rigorosamente, è una variabile aleatoria che è definita nello spazio degli eventi elementari, con una classe di sottoinsiemi designata in essa, i cui elementi hanno una probabilità nota.

Popolazione campione

Ci sono casi in cui è impossibile o impraticabile per qualche motivo (costo, tempo) condurre uno studio continuo per studiare ogni oggetto. Ad esempio, aprire ogni barattolo di marmellata sigillata per verificarne la qualità è una decisione dubbia e cercare di stimare la traiettoria di ogni molecola d'aria in un metro cubo è impossibile. In questi casi viene utilizzato il metodo dell'osservazione selettiva: un certo numero di oggetti viene selezionato (di solito in modo casuale) dalla popolazione generale, e viene sottoposto alla loro analisi.

Campione dal generaleaggregati
Campione dal generaleaggregati

Questi concetti possono sembrare complicati all'inizio. Pertanto, per comprendere appieno l'argomento, è necessario studiare il libro di testo di V. E. Gmurman "Teoria della probabilità e statistica matematica". Pertanto, un set di campionamento o un campione è una serie di oggetti selezionati a caso dall'insieme generale. In termini strettamente matematici, si tratta di una sequenza di variabili casuali indipendenti, uniformemente distribuite, per ciascuna delle quali la distribuzione coincide con quella indicata per la variabile casuale generale.

Concetti di base

Consideriamo brevemente una serie di altri concetti di base della statistica matematica. Il numero di oggetti nella popolazione generale o campione è chiamato volume. I valori del campione che si ottengono durante l'esperimento sono chiamati realizzazione del campione. Affinché una stima della popolazione generale basata su un campione sia affidabile, è importante disporre di un campione cosiddetto rappresentativo o rappresentativo. Ciò significa che il campione deve rappresentare pienamente la popolazione. Questo può essere ottenuto solo se tutti gli elementi della popolazione hanno la stessa probabilità di essere nel campione.

Concetti basilari
Concetti basilari

I campioni distinguono tra ritorno e mancato ritorno. Nel primo caso, nel contenuto del campione, l'elemento ripetuto viene restituito all'insieme generale, nel secondo caso no. Solitamente, in pratica, si utilizza il campionamento senza sostituzioni. Va inoltre notato che la dimensione della popolazione generale supera sempre significativamente la dimensione del campione. Esisteremolte opzioni per il processo di campionamento:

  • semplice - gli oggetti vengono selezionati casualmente uno alla volta;
  • typed - la popolazione generale è divisa in tipi e viene fatta una scelta da ciascuno; un esempio è un sondaggio tra i residenti: uomini e donne separatamente;
  • meccanico - ad esempio, seleziona ogni 10° elemento;
  • seriale - la selezione viene effettuata in serie di elementi.

Distribuzione statistica

Secondo Gmurman, la teoria della probabilità e la statistica matematica sono discipline estremamente importanti nel mondo scientifico, soprattutto nella sua parte pratica. Considera la distribuzione statistica del campione.

Supponiamo di avere un gruppo di studenti che sono stati testati in matematica. Di conseguenza, abbiamo una serie di stime: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - questo è il nostro materiale statistico principale.

Prima di tutto, dobbiamo ordinarlo o eseguire un'operazione di classificazione: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - e quindi ottenere una serie variazionale. Il numero di ripetizioni di ciascuna delle valutazioni è chiamato frequenza di valutazione e il loro rapporto con la dimensione del campione è chiamato frequenza relativa. Facciamo una tabella della distribuzione statistica del campione, o semplicemente una serie statistica:

ai 1 2 3 4 5
pi 1 1 2 4 3

o

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Diamo una variabile casuale su cui condurremo una serie di esperimenti e vedremo quale valore assume questa variabile. Supponiamo che abbia preso il valore a1 - m1 volte; a2 - m2 volte, ecc. La dimensione di questo campione sarà m1 + … + mk=m. L'insieme ai, dove i varia da 1 a k, è una serie statistica.

Distribuzione degli intervalli

Nel libro di VE Gmurman "Probability Theory and Mathematical Statistics" viene presentata anche una serie statistica a intervalli. La sua compilazione è possibile quando il valore della caratteristica in studio è continuo in un certo intervallo e il numero di valori è elevato. Consideriamo un gruppo di studenti, o meglio, la loro altezza: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 studenti in totale. Ovviamente, l' altezza di una persona è un valore continuo. Dobbiamo definire il passo dell'intervallo. Per questo viene utilizzata la formula di Sturges.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Quindi, il valore di 6 può essere preso come dimensione dell'intervallo. Va anche detto che il valore 1+log2m è la formula perdeterminando il numero di intervalli (ovviamente con arrotondamento). Pertanto, secondo le formule, si ottengono 6 intervalli, ognuno dei quali ha una dimensione di 6. E il primo valore dell'intervallo iniziale sarà il numero determinato dalla formula: min - h / 2=156 - 6/2=153. Facciamo una tabella che contenga gli intervalli e il numero di studenti la cui crescita è rientrata in un certo intervallo.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Ovviamente, questo non è tutto, perché ci sono molte più formule nelle statistiche matematiche. Abbiamo considerato solo alcuni concetti di base.

Programma di distribuzione

Grafici di distribuzione
Grafici di distribuzione

I concetti di base della statistica matematica includono anche una rappresentazione grafica della distribuzione, che si distingue per chiarezza. Esistono due tipi di grafici: poligono e istogramma. Il primo è usato per una serie statistica discreta. E per la distribuzione continua, rispettivamente, la seconda.

Consigliato: