Statistiche , la scienza della raccolta, dell'analisi, della presentazione e dell'interpretazione dei dati. Le esigenze governative per i dati del censimento e le informazioni su una varietà di attività economiche hanno fornito gran parte dei primi impulso per il campo della statistica. Attualmente la necessità di trasformare le grandi quantità di dati disponibili in molti campi applicativi in informazioni utili ha stimolato sviluppi sia teorici che pratici in statistica.
I dati sono i fatti e le cifre che vengono raccolti, analizzati e riassunti per la presentazione e l'interpretazione. I dati possono essere classificati come quantitativi o qualitativi. I dati quantitativi misurano la quantità o la quantità di qualcosa, mentre i dati qualitativi forniscono etichette, o nomi, per categorie di elementi simili. Ad esempio, supponiamo che uno studio particolare sia interessato a caratteristiche quali età, sesso, stato civile e reddito annuo per un campione di 100 individui. Queste caratteristiche si chiamerebbero variabili dello studio e i valori dei dati per ciascuna delle variabili sarebbero associati a ciascun individuo. Pertanto, i valori dei dati di 28, maschio, single e $ 30.000 verrebbero registrati per un maschio single di 28 anni con un reddito annuo di $ 30.000. Con 100 individui e 4 variabili, il set di dati avrebbe 100 × 4 = 400 elementi. In questo esempio, età e reddito annuo sono variabili quantitative; i valori dei dati corrispondenti indicano quanti anni e quanti soldi per ogni individuo. Sesso e stato civile sono variabili qualitative. Le etichette maschio e femmina forniscono i dati qualitativi per il genere e le etichette single, sposato, divorziato e vedovo indicano lo stato civile.
I metodi di indagine campionaria vengono utilizzati per raccogliere dati da studi osservazionali e metodi di progettazione sperimentale vengono utilizzati per raccogliere dati da studi sperimentali. L'area della statistica descrittiva riguarda principalmente i metodi di presentazione e interpretazione dei dati mediante grafici, tabelle e riassunti numerici. Ogni volta che gli statistici utilizzano i dati di un campione, ovvero un sottoinsieme della popolazione, per fare affermazioni su una popolazione, eseguono inferenze statistiche . Stima e verifica di ipotesi sono procedure utilizzate per fare statistiche inferenze . Campi come l'assistenza sanitaria, biologia , chimica , fisica , l'istruzione, l'ingegneria, gli affari e l'economia fanno ampio uso di statistiche inferenza .
I metodi di probabilità sono stati inizialmente sviluppati per analisi dei giochi d'azzardo. La probabilità gioca un ruolo chiave nell'inferenza statistica; è usato per fornire misure della qualità e della precisione delle inferenze. Molti dei metodi di inferenza statistica sono descritti in questo articolo. Alcuni di questi metodi sono usati principalmente per studi a variabile singola, mentre altri, come l'analisi di regressione e correlazione, sono usati per fare inferenze sulle relazioni tra due o più variabili.
Le statistiche descrittive sono riepiloghi tabulari, grafici e numerici dei dati. Lo scopo della statistica descrittiva è quello di facilitare la presentazione e l'interpretazione dei dati. La maggior parte delle presentazioni statistiche che compaiono su giornali e riviste sono di natura descrittiva. I metodi univariati di statistica descrittiva utilizzano i dati per migliorare la comprensione di una singola variabile; i metodi multivariati si concentrano sull'utilizzo delle statistiche per comprendere le relazioni tra due o più variabili. Per illustrare i metodi di statistica descrittiva, verrà esaminato l'esempio precedente in cui sono stati raccolti dati su età, sesso, stato civile e reddito annuo di 100 individui.
era John Lennon nei Beatles
Il riepilogo tabulare dei dati più comunemente usato per una singola variabile è una distribuzione di frequenza. Una distribuzione di frequenza mostra il numero di valori di dati in ciascuna delle diverse classi non sovrapposte. Un altro riepilogo tabellare, chiamato distribuzione di frequenza relativa, mostra la frazione, o percentuale, dei valori dei dati in ciascuna classe. Il sommario tabulare più comune dei dati per due variabili è una tabulazione incrociata, una due variabili analogico di una distribuzione di frequenza.
Per una variabile qualitativa, una distribuzione di frequenza mostra il numero di valori dei dati in ciascuna categoria qualitativa. Ad esempio, la variabile genere ha due categorie: maschile e femminile. Pertanto, una distribuzione di frequenza per genere avrebbe due classi non sovrapposte per mostrare il numero di maschi e femmine. Una distribuzione di frequenza relativa per questa variabile mostrerebbe la frazione di individui che sono maschi e la frazione di individui che sono femmine.
La costruzione di una distribuzione di frequenza per una variabile quantitativa richiede maggiore cura nella definizione delle classi e dei punti di divisione tra adiacente classi. Ad esempio, se i dati sull'età dell'esempio sopra variavano da 22 a 78 anni, potrebbero essere utilizzate le seguenti sei classi non sovrapposte: 20-29, 30-39, 40-49, 50-59, 60-69 e 70- 79. Una distribuzione di frequenza mostrerebbe il numero di valori di dati in ciascuna di queste classi e una distribuzione di frequenza relativa mostrerebbe la frazione di valori di dati in ciascuna.
durante la seconda guerra mondiale la Germania era un membro del
Una tabulazione incrociata è una tabella a due vie con le righe della tabella che rappresentano le classi di una variabile e le colonne della tabella che rappresentano le classi di un'altra variabile. Per costruire una tabulazione incrociata utilizzando le variabili genere ed età, il genere potrebbe essere mostrato con due righe, maschio e femmina, e l'età potrebbe essere mostrata con sei colonne corrispondenti alle classi di età 20-29, 30-39, 40-49, 50 -59, 60-69 e 70-79. La voce in ogni cella della tabella dovrebbe specificare il numero di valori dei dati con il genere dato dall'intestazione della riga e l'età data dall'intestazione della colonna. Tale tabella incrociata potrebbe essere utile per comprendere la relazione tra genere ed età.
Sono disponibili diversi metodi grafici per descrivere i dati. UN istogramma è un dispositivo grafico per rappresentare dati qualitativi che sono stati riassunti in una distribuzione di frequenza. Le etichette per le categorie della variabile qualitativa sono mostrate sull'asse orizzontale del grafico. Una barra sopra ogni etichetta è costruita in modo tale che l'altezza di ogni barra sia proporzionale al numero di valori di dati nella categoria. Un grafico a barre dello stato civile per le 100 persone nell'esempio sopra è mostrato inFigura 1. Ci sono 4 barre nel grafico, una per ogni classe. Un grafico a torta è un altro dispositivo grafico per riassumere i dati qualitativi. La dimensione di ogni fetta della torta è proporzionale al numero di valori di dati nella classe corrispondente. Un grafico a torta per lo stato civile dei 100 individui è mostrato infigura 2.
grafico a barre Figura 1: Grafico a barre che mostra lo stato civile di 100 persone. Enciclopedia Britannica, Inc.
grafico a torta Figura 2: grafico a torta per lo stato civile di 100 persone. Enciclopedia Britannica, Inc.
Un istogramma è la presentazione grafica più comune di dati quantitativi che sono stati riassunti in una distribuzione di frequenza. I valori della variabile quantitativa sono riportati sull'asse orizzontale. Viene disegnato un rettangolo sopra ogni classe in modo tale che la base del rettangolo sia uguale alla larghezza dell'intervallo di classe e la sua altezza sia proporzionale al numero di valori di dati nella classe.
Copyright © Tutti I Diritti Riservati | asayamind.com