Tutto su costruzione e ristrutturazione

Livello di significatività statistica in psicologia. Livello di significatività statistica (p)

Livello di significatività - questa è la probabilità che abbiamo considerato le differenze significative, ma in realtà sono casuali.

Quando indichiamo che le differenze sono significative al livello di significatività del 5%, o quando R< 0,05 , allora intendiamo che la probabilità che siano inaffidabili è 0,05.

Quando indichiamo che le differenze sono significative al livello di significatività dell'1%, o quando R< 0,01 , allora intendiamo che la probabilità che siano inaffidabili è 0,01.

Se traduciamo tutto questo in un linguaggio più formalizzato, allora il livello di significatività è la probabilità di rifiutare l'ipotesi nulla, mentre è vera.

Errore,consiste inl'unicocosa noirespintoipotesi nullasebbene sia corretto, viene chiamato errore di tipo 1.(Vedi tabella 1)

Tavolo 1. Ipotesi nulle e alternative e possibili condizioni di test.

La probabilità di un tale errore è solitamente indicata come α. In sostanza bisognerebbe indicare tra parentesi non p < 0,05 o pag < 0,01 e α < 0,05 o α < 0,01.

Se la probabilità di errore è α , quindi la probabilità di una decisione corretta: 1-α. Minore è α, maggiore è la probabilità di una decisione corretta.

Storicamente, in psicologia è generalmente accettato che il livello più basso di significatività statistica sia il livello del 5% (p≤0,05): sufficiente è il livello dell’1% (p≤0,01) e il più alto è il livello dello 0,1% (p≤0,001). , pertanto, le tabelle dei valori critici contengono solitamente i valori dei criteri corrispondenti ai livelli di significatività statistica p ≤ 0,05 e p ≤ 0,01, a volte - p ≤ 0,001. Per alcuni criteri, le tabelle indicano l'esatto livello di significatività dei loro diversi valori empirici. Ad esempio, per φ*=1,56 p=O,06.

Tuttavia, finché il livello di significatività statistica non raggiunge p=0,05, non abbiamo ancora il diritto di rifiutare l’ipotesi nulla. Aderiremo alla seguente regola per rifiutare l'ipotesi di assenza di differenze (Ho) e accettare l'ipotesi di significatività statistica delle differenze (H 1).

Regola per rifiutare Ho e accettare h1

Se il valore empirico del test è uguale o maggiore del valore critico corrispondente a p≤0,05, allora H 0 viene rifiutato, ma non possiamo ancora accettare definitivamente H 1 .

Se il valore empirico del criterio è uguale al valore critico corrispondente a p≤0,01 o lo supera, allora H 0 viene rifiutato e H 1 viene accettato.

Eccezioni : Test del segno G, test di Wilcoxon T e test di Mann-Whitney U. Per loro vengono stabilite relazioni inverse.

Riso. 4. Esempio di “asse di significatività” per il criterio Q di Rosenbaum.

I valori critici del criterio sono designati come Q o, o5 e Q 0,01, il valore empirico del criterio come Q em. È racchiuso in un'ellisse.

A destra del valore critico Q 0,01 si estende la "zona di significatività" - che comprende valori empirici superiori a Q 0,01 e, quindi, certamente significativi.

A sinistra del valore critico Q 0,05 si estende la “zona di insignificanza” che comprende valori Q empirici inferiori a Q 0,05 e quindi sicuramente insignificanti.

Lo vediamo Q 0,05 =6; Q 0,01 =9; Q em. =8;

Il valore empirico del criterio rientra nella regione compresa tra Q 0,05 e Q 0,01. Questa è una zona di “incertezza”: possiamo già rifiutare l'ipotesi sull'inaffidabilità delle differenze (H 0), ma non possiamo ancora accettare l'ipotesi sulla loro affidabilità (H 1).

In pratica, però, il ricercatore può considerare attendibili quelle differenze che non rientrano nella zona di insignificanza, dichiarando che sono attendibili al p < 0,05, oppure indicando l'esatto livello di significatività del valore del criterio empirico ottenuto, ad esempio: p=0,02. Utilizzando le tabelle standard presenti in tutti i libri di testo sui metodi matematici, ciò può essere fatto in relazione ai criteri H di Kruskal-Wallis, χ 2 R Friedman, L di Page, φ* di Fisher .

Il livello di significatività statistica, o valori critici del test, viene determinato in modo diverso quando si testano ipotesi statistiche direzionali e non direzionali.

Con un'ipotesi statistica direzionale viene utilizzato un test a una coda, con un'ipotesi non direzionale viene utilizzato un test a due code. Il test a due code è più stringente perché verifica le differenze in entrambe le direzioni, e quindi il valore empirico del test che in precedenza corrispondeva al livello di significatività p < 0,05, ora corrisponde solo al livello p < 0,10.

Non dovremo decidere ogni volta da soli se utilizza un criterio unilaterale o bilaterale. Le tabelle dei valori critici dei criteri sono selezionate in modo tale che le ipotesi direzionali corrispondano a un criterio unilaterale e le ipotesi non direzionali corrispondano a un criterio bilaterale e i valori indicati soddisfino i requisiti che applicare a ciascuno di essi. Il ricercatore deve solo assicurarsi che le sue ipotesi coincidano nel significato e nella forma con le ipotesi proposte nella descrizione di ciascuno dei criteri.

Lezione 4.

Principi generali verifica di ipotesi statistiche

Sottolineiamo ancora una volta che i dati ottenuti a seguito di un esperimento su qualsiasi campione servono come base per esprimere giudizi sulla popolazione generale. Tuttavia, per ragioni probabilistiche casuali, una stima dei parametri di una popolazione effettuata sulla base di dati sperimentali (campioni) sarà sempre accompagnata da un errore, e pertanto tali stime dovrebbero essere considerate come congetturali e non come affermazioni definitive. Vengono chiamate tali ipotesi sulle proprietà e sui parametri della popolazione ipotesi statistiche .

L'essenza della verifica di un'ipotesi statistica è stabilire se i dati sperimentali e l'ipotesi avanzata sono coerenti; è consentito attribuire la discrepanza tra l'ipotesi e il risultato dell'analisi statistica dei dati sperimentali a cause casuali? Pertanto, un'ipotesi statistica è un'ipotesi scientifica che consente test statistici, e la statistica matematica è una disciplina scientifica il cui compito è la verifica scientificamente fondata di ipotesi statistiche.

Ipotesi statistiche

Quando si testano ipotesi statistiche, vengono utilizzati due concetti: il cosiddetto zero (designazione N 0) e ipotesi alternativa (denotazione N 1).

Ipotesi nullaè un’ipotesi sull’assenza di differenze. È designato e chiamato zero perché contiene il numero 0: , dove sono i valori confrontati delle caratteristiche.

L'ipotesi nulla è ciò che vogliamo rifiutare se vogliamo dimostrare la significatività di una differenza.

Ipotesi alternativaè un'ipotesi sul significato delle differenze. È indicato come . Un'ipotesi alternativa è qualcosa che vogliamo dimostrare, come a volte viene chiamata sperimentale ipotesi.

Ci sono problemi quando è necessario dimostrare l'insignificanza delle differenze, ad es. confermare l’ipotesi nulla. Tuttavia, più spesso è ancora necessario dimostrarlo significato delle differenze, poiché sono più informativi nel trovare qualcosa di nuovo.

Le ipotesi nulla e alternativa possono essere direzionali o non direzionali.

Ipotesi direzionali

: non eccede

: supera

Ipotesi non direzionali

: non è diverso

: è diverso

Se durante l'esperimento si è notato che nel gruppo dell'acqua i valori individuali dei soggetti su qualche attributo, ad esempio il coraggio sociale, erano più alti, e nell'altro gruppo più bassi, allora è necessario testare il significato di queste differenze necessario formulare ipotesi direzionali.

Se è necessario dimostrare che il primo gruppo, sotto l'influenza di alcune influenze sperimentali, ha subito cambiamenti più pronunciati rispetto al secondo gruppo, allora anche in questo caso è necessario formulare ipotesi direzionali.

Se è necessario dimostrare che le forme di distribuzione di una caratteristica differiscono nel primo e nel secondo gruppo, vengono formulate ipotesi non direzionali.

Commento. Quando si descrive ciascun criterio, vengono formulate le ipotesi che aiuta a verificare.

In generale, quando si accettano o si rifiutano le ipotesi, sono possibili diverse opzioni.

Ad esempio, uno psicologo ha condotto test casuali sugli indicatori di intelligenza in un gruppo di adolescenti provenienti da famiglie con due genitori e famiglie monoparentali. Dall’elaborazione dei dati sperimentali è emerso che gli adolescenti provenienti da famiglie monoparentali hanno in media punteggi di intelligenza inferiori rispetto ai loro coetanei provenienti da famiglie intatte. Sulla base dei risultati ottenuti, uno psicologo può concludere che una famiglia incompleta porta ad una diminuzione dell'intelligenza negli adolescenti? La conclusione adottata in questi casi è chiamata decisione statistica. Sottolineiamo che tale decisione è sempre probabilistica.

Quando si verifica un'ipotesi, i dati sperimentali possono contraddire l'ipotesi , allora questa ipotesi viene respinta. Altrimenti, ad es. Se i dati sperimentali sono coerenti con l’ipotesi, questa non viene rifiutata. Spesso in questi casi si dice che l'ipotesi è accettata (anche se questa formulazione non è del tutto esatta, ma è diffusa e la utilizzeremo in futuro). Ciò dimostra che la verifica statistica di ipotesi basate su dati sperimentali e campione è inevitabilmente associata al rischio (probabilità) di prendere una decisione falsa. In questo caso sono possibili errori di due tipi.

Errore del primo tipo si verifica quando si decide di rifiutare un'ipotesi anche se in realtà risulta essere vera.

Errore del secondo tipo si verifica quando si decide di non rifiutare un'ipotesi anche se in realtà sarà errata. È ovvio che anche in due casi si possono trarre conclusioni corrette. È meglio presentare quanto sopra sotto forma di tabella 1:

Tabella 1

È possibile che lo psicologo si sbagli nella sua decisione statistica; come vediamo dalla Tabella 1, questi errori possono essere solo di due tipi. Poiché è impossibile eliminare gli errori quando si accettano ipotesi statistiche, è necessario minimizzare le possibili conseguenze, ad es. accettare un’ipotesi statistica errata. Nella maggior parte dei casi, l’unico modo per ridurre al minimo gli errori è aumentare la dimensione del campione.

Comprendere il livello di significatività statistica

Quando si giustifica l’inferenza statistica, è necessario porsi la domanda: dov’è il confine tra accettare e rifiutare l’ipotesi nulla? A causa della presenza di influenze casuali nell'esperimento, questo confine non può essere tracciato in modo assolutamente accurato. Si basa sul concetto livello di significatività.

sicuramente Livello di significativitàè detta probabilità di rifiutare falsamente l’ipotesi nulla. O, in altre parole, livello di significatività Questa è la probabilità di un errore di tipo I quando si prende una decisione.

Per indicare questa probabilità, di regola, usano una lettera greca o una lettera latina R. Nel seguito useremo la lettera R.

Storicamente, nelle scienze applicate che utilizzano la statistica, e in particolare in psicologia, il livello più basso di significatività statistica è considerato il livello di ; sufficiente - livello e il livello più alto. Pertanto, nelle tabelle statistiche fornite nell'appendice dei libri di testo di statistica, vengono solitamente forniti valori tabellari per i livelli: ; ; . A volte vengono forniti valori tabellari per i livelli e. I valori 0,05, 0,01 e 0,001 sono i cosiddetti livelli standard di significatività statistica . Quando si analizzano statisticamente i dati sperimentali, uno psicologo, a seconda degli obiettivi e delle ipotesi dello studio, deve selezionare il livello di significatività richiesto. Come possiamo vedere, qui il valore più grande, o il limite inferiore del livello di significatività statistica, è pari a 0,05 - ciò significa che sono ammessi cinque errori in un campione di cento elementi (casi, soggetti) o un errore su venti elementi (casi, argomenti). Si ritiene che non possiamo commettere errori né sei, né sette, né più volte su cento. Il costo di tali errori sarà troppo alto.

Si noti che i moderni pacchetti statistici sui computer non utilizzano livelli di significatività standard, ma livelli calcolati direttamente nel processo di lavoro con il metodo statistico corrispondente. Questi livelli, designati dalla lettera R, può avere un'espressione numerica diversa nell'intervallo da 0 a 1, ad esempio, R= 0,7, R= 0,23 o R= 0,012. È chiaro che nei primi due casi i livelli di significatività ottenuti sono troppo alti ed è impossibile dire che il risultato sia significativo. Allo stesso tempo, in quest'ultimo caso, i risultati sono significativi a livello di 12 millesimi, questo è un livello affidabile.

La regola per accettare una conclusione statistica è la seguente: sulla base dei dati sperimentali ottenuti, lo psicologo calcola la cosiddetta statistica empirica, o valore empirico, utilizzando il metodo statistico da lui scelto. È conveniente denotare questa quantità come Campione Poi la statistica empirica Chim viene confrontato con due valori critici che corrispondono ai livelli di significatività del 5% e dell'1% per il metodo statistico selezionato e che sono indicati come . I valori si trovano per un dato metodo statistico utilizzando le tabelle corrispondenti fornite nell'appendice di qualsiasi libro di testo di statistica. Queste quantità, di regola, sono sempre diverse e in futuro, per comodità, possono essere chiamate come e . È conveniente presentare i valori critici rilevati dalle tabelle nella seguente forma di notazione standard:

Sottolineiamo, tuttavia, che abbiamo utilizzato la notazione come abbreviazione della parola “numero”. Tutti i metodi statistici hanno adottato le proprie designazioni simboliche per tutte queste quantità: sia il valore empirico calcolato utilizzando il metodo statistico corrispondente, sia il valore critico trovato dalle tabelle corrispondenti. Ad esempio, durante il calcolo del coefficiente di correlazione del rango di Spearman utilizzando la Tabella 21 dell'Appendice, sono stati trovati i seguenti valori critici, che per questo metodo sono indicati con la lettera greca (rho).

È consuetudine scrivere i valori trovati come segue:

Ora dobbiamo confrontare il nostro valore empirico con i due valori critici rilevati dalle tabelle. Il modo migliore per farlo è posizionare tutti e tre i numeri sul cosiddetto “ assi di significatività». « Asse di significatività"rappresenta una linea retta, all'estremità sinistra della quale si trova lo 0, sebbene, di regola, non sia segnato su questa linea retta stessa, e da sinistra a destra c'è un aumento della serie numerica. In realtà, questo è il solito asse delle ascisse scolastiche OH Sistema di coordinate cartesiano. Tuttavia la particolarità di questo asse è che presenta tre sezioni, “ zone" Viene chiamata la zona sinistra zona di insignificanza , Giusto - zona di rilevanza e l'intermedio zona di incertezza . I confini di tutte e tre le zone sono Cap cr1 Per P = 0,05 e per P = 0,01 come mostrato di seguito.

Quando si giustifica una conclusione statistica la questione deve essere affrontata su dove sia il confine tra accettazione e rifiuto ipotesi? A causa della presenza di influenze casuali nell'esperimento, questo confine non può essere tracciato in modo assolutamente accurato. Si basa sul concetto livello di significatività.Livelloimportanzaè detta probabilità di rifiutare falsamente l’ipotesi nulla. O, in altre parole, livelloimportanza-Questo la probabilità di un errore di tipo I nel prendere una decisione. Per indicare questa probabilità, di regola, usano la lettera greca α o la lettera latina R. Nel seguito useremo la lettera R.

Storicamente è andata così che nelle scienze applicate che utilizzano la statistica, e in particolare in psicologia, si considera che il livello più basso di significatività statistica sia il livello p = 0,05; livello sufficiente R= 0,01 e livello superiore p = 0,001. Pertanto, nelle tabelle statistiche fornite nell'appendice dei libri di testo di statistica, vengono solitamente forniti valori tabellari per i livelli p = 0,05, p = 0,01 e R= 0,001. A volte vengono forniti valori tabellari per i livelli R - 0,025 e p = 0,005.

I valori di 0,05, 0,01 e 0,001 sono i cosiddetti livelli standard di significatività statistica. Quando si analizzano statisticamente i dati sperimentali, uno psicologo, a seconda degli obiettivi e delle ipotesi dello studio, deve selezionare il livello di significatività richiesto. Come possiamo vedere, qui il valore più grande, o il limite inferiore del livello di significatività statistica, è 0,05 - ciò significa che sono ammessi cinque errori in un campione di cento elementi (casi, soggetti) o un errore su venti elementi ( casi, soggetti). Si ritiene che non possiamo commettere errori né sei, né sette, né più volte su cento. Il costo di tali errori sarà troppo alto.

Nota, che nei moderni pacchetti statistici in poi computer Non vengono utilizzati livelli di significatività standard, ma livelli calcolati direttamente nel processo di lavoro con il metodo statistico corrispondente. Questi livelli, designati dalla lettera R, può avere un'espressione numerica diversa nell'intervallo da 0 a 1, ad esempio, p = 0,7, R= 0,23 o R= 0,012. È chiaro che nei primi due casi i livelli di significatività ottenuti sono troppo alti ed è impossibile dire che il risultato sia significativo. Allo stesso tempo, in quest'ultimo caso i risultati sono significativi a livello di 12 millesimi. Questo è un livello affidabile.

Regola di accettazione La conclusione statistica è la seguente: sulla base dei dati sperimentali ottenuti, lo psicologo calcola la cosiddetta statistica empirica, o valore empirico, utilizzando il metodo statistico da lui scelto. È conveniente denotare questa quantità come Campione Poi la statistica empirica Chim viene confrontato con due valori critici, che corrispondono ai livelli di significatività del 5% e dell'1% per il metodo statistico selezionato e che sono indicati come Cap cr. Le quantità Cap cr si trovano per un dato metodo statistico utilizzando le tabelle corrispondenti fornite nell'appendice di qualsiasi libro di testo di statistica. Tali quantità, di regola, sono sempre diverse e nel seguito, per comodità, potranno essere chiamate come Cap cr1 E Cap cr2. Valori critici rilevati dalle tabelle Cap cr1 E Cap kr2È conveniente rappresentarlo nella seguente forma di notazione standard:


Sottolineiamo, tuttavia, abbiamo utilizzato la notazione Chim E Cap cr come abbreviazione della parola "numero". Tutti i metodi statistici hanno adottato le proprie designazioni simboliche per tutte queste quantità: sia il valore empirico calcolato utilizzando il corrispondente metodo statistico sia quello trovato dalle corrispondenti tabelle dei valori critici. Ad esempio, quando si calcola il coefficiente di classifica Correlazioni di Spearman Utilizzando la tabella dei valori critici di questo coefficiente, sono stati trovati i seguenti valori critici, che per questo metodo sono indicati con la lettera greca ρ (“rho”). Così per p = 0,05 valore trovato dalla tabella ρ cr 1 = 0,61 e per p = magnitudo 0,01 ρ cr 2 = 0,76.

Nella forma standard di notazione adottata nella seguente presentazione, appare così:

Ora noi necessario confrontare il nostro valore empirico con due valori critici rilevati dalle tabelle. Il modo migliore per farlo è posizionare tutti e tre i numeri su quello che viene chiamato “asse di significatività”. L '"asse di significato" è una linea retta, alla cui estremità sinistra si trova lo 0, sebbene di regola non sia segnato su questa linea retta stessa, e da sinistra a destra c'è un aumento della serie numerica. In realtà, questo è il solito asse delle ascisse scolastiche OH Sistema di coordinate cartesiano. Tuttavia la particolarità di questo asse è che presenta tre sezioni, “zone”. Una zona estrema è chiamata zona di insignificanza, la seconda zona estrema è chiamata zona di importanza e la zona intermedia è chiamata zona di incertezza. I confini di tutte e tre le zone sono Cap cr1 Per p = 0,05 e Cap kr2 Per p = 0,01, come mostrato in figura.

A seconda della regola decisionale (regola di inferenza) prescritta in questo metodo statistico, sono possibili due opzioni.

Prima opzione: l'ipotesi alternativa è accettata se ChimCap cr.

Zona di significatività
Zona di insignificanza
0,05
0,01
Cap cr1
Cap kr2

Contato Chim secondo qualche metodo statistico, deve necessariamente ricadere in una delle tre zone.

Se il valore empirico rientra nella zona di insignificanza, allora viene accettata l'ipotesi H 0 sull'assenza di differenze.

Se Chim rientra nella zona di significatività, l'ipotesi alternativa H 1 viene accettata e l'ipotesi H 0 viene rifiutata.

Se Chim cade in una zona di incertezza, si trova ad affrontare il ricercatore dilemma. Quindi, a seconda dell'importanza del problema da risolvere, può considerare affidabile la stima statistica ottenuta al livello del 5% e quindi accettare l'ipotesi H 1, rifiutando l'ipotesi H 0 , oppure - inaffidabile al livello dell'1%, accettando così l'ipotesi H 0. Sottolineiamo però che questo è esattamente il caso in cui uno psicologo può commettere errori del primo o del secondo tipo. Come discusso in precedenza, in queste circostanze è meglio aumentare la dimensione del campione.

Sottolineiamo anche che il valore Chim potrebbe corrispondere esattamente a entrambi Cap cr1 O Cap cr2. Nel primo caso, possiamo assumere che la stima sia attendibile esattamente al livello del 5% e accettare l’ipotesi H 1, oppure, al contrario, accettare l’ipotesi H 0. Nel secondo caso, di regola, viene accettata l'ipotesi alternativa H 1 sulla presenza di differenze e l'ipotesi H 0 viene rifiutata.

Definire previsto nei risultati dell'esperimento. In genere, quando gli scienziati conducono un esperimento, hanno già un’idea di quali risultati siano considerati “normali” o “tipici”. Ciò può basarsi su risultati sperimentali di esperimenti passati, su set di dati affidabili, su dati provenienti dalla letteratura scientifica, oppure lo scienziato può fare affidamento su altre fonti. Per il tuo esperimento, determina i risultati attesi ed esprimili come numeri.

  • Esempio: supponiamo che studi precedenti abbiano dimostrato che nel tuo paese i proprietari di auto rosse hanno maggiori probabilità di ricevere multe per eccesso di velocità rispetto ai proprietari di auto blu. Ad esempio, i risultati medi mostrano una preferenza di 2:1 per le auto rosse rispetto a quelle blu. Il nostro compito è determinare se la polizia ha un pregiudizio simile nei confronti del colore delle auto nella tua città. Per fare questo, analizzeremo le multe emesse per eccesso di velocità. Se prendiamo una serie casuale di 150 multe per eccesso di velocità emesse a proprietari di auto rosse o blu, ci aspettiamo questo 100 verranno inflitte multe ai proprietari di auto rosse e 50 - possessori di quelli blu, se la polizia nella nostra città fosse così sbilanciata nei confronti del colore delle auto come si osserva in tutto il paese.

Definire osservato i risultati del tuo esperimento Ora che hai determinato i risultati attesi, devi condurre un esperimento e trovare i valori effettivi (o "osservati"). Ancora una volta, è necessario rappresentare questi risultati come numeri. Se creiamo condizioni sperimentali e i risultati osservati differire rispetto a quanto previsto, allora abbiamo due possibilità: o è successo per caso, oppure è stato causato proprio dal nostro esperimento. Lo scopo di trovare un valore p è determinare se i risultati osservati differiscono dai risultati attesi abbastanza da permetterci di rifiutare l’“ipotesi nulla” – l’ipotesi che non vi sia alcuna relazione tra le variabili sperimentali e i risultati osservati.

  • Esempio: supponiamo che nella nostra città abbiamo selezionato casualmente 150 multe per eccesso di velocità emesse ai proprietari di auto rosse o blu. Lo abbiamo stabilito 90 sono state inflitte multe ai proprietari di auto rosse e 60 - proprietari di quelli blu. Questo è diverso dai risultati attesi, che sono 100 E 50, rispettivamente. Il nostro esperimento (in questo caso il cambiamento dell'origine dati dal livello statale a quello cittadino) ha davvero portato a questo cambiamento nei risultati o la nostra polizia cittadina ha dei pregiudizi nei confronti degli automobilisti? simile, come la media nazionale, e stiamo assistendo solo a una deviazione casuale? Il valore P ci aiuterà a determinarlo.
  • Determinare il numero gradi di libertà il tuo esperimento Il numero di gradi di libertà è il grado di variabilità del tuo esperimento, che è determinato dal numero di categorie esaminate. L'equazione per il numero di gradi di libertà è Numero di gradi di libertà = n-1, dove "n" è il numero di categorie o variabili che stai analizzando nell'esperimento.

    • Esempio: nel nostro esperimento ci sono due categorie di risultati: una categoria per i proprietari di auto rosse e un'altra per i proprietari di auto blu. Pertanto, nel nostro esperimento abbiamo 2-1 = 1 grado di libertà. Se dovessimo confrontare le auto rosse, blu e verdi, lo faremmo 2 gradi di libertà e così via.
  • Confrontare i risultati attesi e osservati utilizzando un criterio chi-quadrato. Il chi-quadrato (scritto "x2") è un valore numerico che misura la differenza tra previsto E osservabile valori sperimentali. L'equazione per il chi quadrato è: x2 = Σ((o-e)2 /e), dove "o" è il valore osservato ed "e" è il valore atteso. Riassumi i risultati di questa equazione per tutti i possibili risultati (vedi sotto).

    • Si noti che questa equazione include un operatore di somma Σ (sigma). In altre parole, è necessario calcolare ((|o-e|-.05) 2 /e) per ogni possibile risultato e aggiungere i numeri risultanti per ottenere il valore del test chi-quadrato. Nel nostro esempio abbiamo due possibili risultati: o l'auto che ha ricevuto il biglietto è rossa oppure è blu. Pertanto dobbiamo calcolare ((o-e) 2 /e) due volte: una per le auto rosse e una per le auto blu.
    • Esempio: inseriamo i nostri valori attesi e osservati nell'equazione x 2 = Σ((o-e) 2 /e). Ricorda che a causa dell'operatore somma, dobbiamo calcolare ((o-e) 2 /e) due volte: una per le auto rosse e una per quelle blu. Faremo questo lavoro come segue:
      • x 2 = ((90-100) 2 /100) + (60-50) 2 /50)
      • x2 = ((-10)2/100) + (10)2/50)
      • x2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • Selezionare livello di significatività. Ora che conosciamo i gradi di libertà del nostro esperimento e il valore del test del chi quadrato, dobbiamo fare ancora una cosa prima di trovare il nostro valore p. Dobbiamo determinare il livello di significatività. A proposito di in un linguaggio semplice, il livello di significatività indica quanto siamo fiduciosi nei nostri risultati. Un valore basso di significatività corrisponde ad una bassa probabilità che i risultati sperimentali siano dovuti al caso e viceversa. I livelli di significatività sono scritti come decimali (ad esempio 0,01), che corrispondono alla probabilità che i risultati sperimentali siano stati ottenuti per caso (in questo caso, la probabilità è dell'1%).

  • Utilizzare la tabella dei dati della distribuzione chi quadrato per trovare il valore p. Scienziati e statistici utilizzano tabelle di grandi dimensioni per calcolare il valore p dei loro esperimenti. Queste tabelle hanno tipicamente un asse verticale a sinistra, corrispondente al numero di gradi di libertà, e un asse orizzontale in alto, corrispondente al valore p. Utilizza i dati della tabella per trovare prima il numero dei tuoi gradi di libertà, quindi guarda la riga da sinistra a destra finché non trovi il primo valore, Di più il tuo valore chi-quadrato. Guarda il valore p corrispondente nella parte superiore della colonna. Il valore p di cui hai bisogno è compreso tra questo numero e quello successivo (quello a sinistra del tuo).

    • Le tabelle chi-quadrato possono essere ottenute da molte fonti: puoi semplicemente trovarle online o cercarle nei libri di scienza o statistica. Se non hai questi libri a portata di mano, usa l'immagine qui sopra o un grafico online che puoi visualizzare gratuitamente, come medcalc.org. Lei si trova.
    • Esempio: il nostro valore del test chi-quadrato era 3. Quindi utilizziamo la tabella di distribuzione chi-quadrato nell'immagine sopra per trovare il valore p approssimativo. Poiché sappiamo che nel nostro esperimento tutto 1 grado di libertà, scegli la prima riga. Andiamo da sinistra a destra lungo questa linea finché non incontriamo un valore maggiore 3 , il nostro valore di test del chi quadrato. Il primo che troviamo è 3,84. Guardiamo la parte superiore della nostra colonna e vediamo che il valore p corrispondente è 0,05. Ciò significa che il nostro valore p tra 0,05 e 0,1(valore p successivo nella tabella in ordine crescente).
  • Decidere se rifiutare o mantenere l'ipotesi nulla. Poiché hai determinato il valore p approssimativo per il tuo esperimento, devi decidere se rifiutare l'ipotesi nulla del tuo esperimento (ricorda, questa è l'ipotesi che le variabili sperimentali che hai manipolato Non influenzato i risultati osservati). Se il valore p è inferiore al livello di significatività, congratulazioni, hai dimostrato che esiste una relazione molto probabile tra le variabili che hai manipolato e i risultati che hai osservato. Se il valore p è superiore al livello di significatività, non puoi dire con certezza se i risultati che hai osservato siano dovuti al puro caso o alla manipolazione delle variabili date.

    • Esempio: il nostro valore p è compreso tra 0,05 e 0,1. È ovvio Non meno di 0,05, quindi purtroppo noi non possiamo rifiutare la nostra ipotesi nulla. Ciò significa che non abbiamo raggiunto la probabilità minima del 95% di affermare che la polizia della nostra città emette multe ai proprietari di auto rosse e blu ad un ritmo molto diverso dalla media nazionale.
    • In altre parole, c'è una probabilità del 5-10% che i risultati che abbiamo osservato non siano gli effetti di un cambiamento di posizione (guardando una città piuttosto che l'intero paese), ma semplicemente dovuti al caso. Poiché la nostra precisione dichiarata non dovrebbe superare il 5%, non possiamo dirlo con certezza che la polizia della nostra città è meno prevenuta nei confronti dei proprietari di auto rosse: c'è una piccola (ma statisticamente significativa) possibilità che non sia così.
  • Le ipotesi vengono testate utilizzando l'analisi statistica. La significatività statistica si trova utilizzando il valore P, che corrisponde alla probabilità di un dato evento assumendo che alcune affermazioni (ipotesi nulla) siano vere. Se il valore P è inferiore a un livello specificato di significatività statistica (di solito 0,05), lo sperimentatore può concludere con sicurezza che l'ipotesi nulla è falsa e procedere a considerare l'ipotesi alternativa. Utilizzando il test t di Student, puoi calcolare il valore P e determinare la significatività per due set di dati.

    Passi

    Parte 1

    Impostazione dell'esperimento

      Definisci la tua ipotesi. Il primo passo per valutare la significatività statistica è scegliere la domanda a cui si vuole rispondere e formulare un'ipotesi. Un'ipotesi è un'affermazione sui dati sperimentali, sulla loro distribuzione e proprietà. Per ogni esperimento esiste sia un’ipotesi nulla che un’ipotesi alternativa. In generale, dovrai confrontare due insiemi di dati per determinare se sono simili o diversi.

      • L'ipotesi nulla (H 0) afferma tipicamente che non c'è differenza tra due insiemi di dati. Ad esempio: quegli studenti che leggono il materiale prima della lezione non ricevono voti più alti.
      • L'ipotesi alternativa (H a) è l'opposto dell'ipotesi nulla ed è un'affermazione che necessita di essere supportata da dati sperimentali. Ad esempio: quegli studenti che leggono il materiale prima della lezione ottengono voti più alti.
    1. Impostare il livello di significatività per determinare quanto la distribuzione dei dati deve differire dal normale affinché possa essere considerata un risultato significativo. Livello di significatività (chiamato anche α (\displaystyle \alpha )-level) è la soglia definita per la significatività statistica. Se il valore P è inferiore o uguale al livello di significatività, i dati sono considerati statisticamente significativi.

      Decidi quale criterio utilizzerai: unilaterale o bilaterale. Una delle ipotesi del test t di Student è che i dati siano distribuiti normalmente. La distribuzione normale è una curva a campana con il numero massimo di risultati al centro della curva. Il test t di Student è un metodo matematico per testare i dati che consente di determinare se i dati non rientrano nella distribuzione normale (più, meno o nelle “code” della curva).

      • Se non sei sicuro che i dati siano superiori o inferiori ai valori del gruppo di controllo, utilizza un test a due code. Ciò ti consentirà di determinare il significato in entrambe le direzioni.
      • Se sai in quale direzione i dati potrebbero non rientrare nella distribuzione normale, utilizza un test a una coda. Nell'esempio sopra, ci aspettiamo che i voti degli studenti aumentino, quindi è possibile utilizzare un test a una coda.
    2. Determinare la dimensione del campione utilizzando la potenza statistica. Il potere statistico di uno studio è la probabilità che, data la dimensione del campione, si ottenga il risultato atteso. Una soglia di potenza comune (o β) è dell'80%. Analizzare la potenza statistica senza dati precedenti può essere difficile perché richiede alcune informazioni sulle medie attese in ciascun gruppo di dati e sulle relative deviazioni standard. Utilizza un calcolatore di analisi della potenza online per determinare la dimensione del campione ottimale per i tuoi dati.

      • In genere, i ricercatori conducono un piccolo studio pilota che fornisce dati per l’analisi statistica della potenza e determina la dimensione del campione necessaria per uno studio più ampio e completo.
      • Se non sei in grado di condurre uno studio pilota, prova a stimare le possibili medie basate sulla letteratura e sui risultati di altre persone. Ciò può aiutarti a determinare la dimensione ottimale del campione.

      Parte 2

      Calcolare la deviazione standard
      1. Scrivi la formula per la deviazione standard. La deviazione standard mostra quanta dispersione c'è nei dati. Ti consente di concludere quanto sono vicini i dati ottenuti da un determinato campione. A prima vista la formula sembra piuttosto complicata, ma le spiegazioni che seguono ti aiuteranno a capirla. La formula è la seguente: s = √∑((x i – µ) 2 /(N – 1)).

        • s - deviazione standard;
        • il segno ∑ indica che devono essere sommati tutti i dati ottenuti dal campione;
        • x i corrisponde al valore i-esimo, cioè un risultato separato ottenuto;
        • µ è il valore medio per un dato gruppo;
        • N è il numero totale di dati nel campione.
      2. Trova la media in ciascun gruppo. Per calcolare la deviazione standard, devi prima trovare la media per ciascun gruppo di studio. Il valore medio è indicato con la lettera greca µ (mu). Per trovare la media, somma semplicemente tutti i valori risultanti e dividili per la quantità di dati (dimensione del campione).

        • Ad esempio, per trovare il voto medio di un gruppo di studenti che studia prima delle lezioni, considera un piccolo set di dati. Per semplicità, utilizziamo una serie di cinque punti: 90, 91, 85, 83 e 94.
        • Sommiamo tutti i valori insieme: 90 + 91 + 85 + 83 + 94 = 443.
        • Dividiamo la somma per il numero di valori, N = 5: 443/5 = 88,6.
        • Pertanto, la media per questo gruppo è 88,6.
      3. Sottrarre ogni valore ottenuto dalla media. Il passo successivo è calcolare la differenza (xi – µ). Per fare ciò, sottrai ciascun valore ottenuto dal valore medio trovato. Nel nostro esempio, dobbiamo trovare cinque differenze:

        • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) e (94 – 88,6).
        • Di conseguenza, otteniamo i seguenti valori: 1.4, 2.4, -3.6, -5.6 e 5.4.
      4. Eleva al quadrato ogni valore ottenuto e sommali tra loro. Ciascuna delle quantità appena trovate dovrebbe essere quadrata. Questo passaggio rimuoverà tutti i valori negativi. Se dopo questo passaggio hai ancora numeri negativi, hai dimenticato di elevarli al quadrato.

        • Per il nostro esempio, otteniamo 1.96, 5.76, 12.96, 31.36 e 29.16.
        • Sommiamo i valori risultanti: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
      5. Dividere per la dimensione del campione meno 1. Nella formula, la somma viene divisa per N – 1 poiché non prendiamo in considerazione la popolazione generale, ma prendiamo un campione di tutti gli studenti per la valutazione.

        • Sottrai: N – 1 = 5 – 1 = 4
        • Dividi: 81,2/4 = 20,3
      6. Prendi la radice quadrata. Dopo aver diviso la somma per la dimensione del campione meno uno, prendi la radice quadrata del valore trovato. Questo è l'ultimo passaggio nel calcolo della deviazione standard. Esistono programmi statistici che, dopo aver inserito i dati iniziali, eseguono tutti i calcoli necessari.

        • Nel nostro esempio, la deviazione standard dei voti degli studenti che hanno letto il materiale prima della lezione è s =√20,3 = 4,51.

      Parte 3

      Determinare il significato
      1. Calcolare la varianza tra i due gruppi di dati. Prima di questo passaggio, abbiamo esaminato un esempio per un solo gruppo di dati. Se vuoi confrontare due gruppi, dovresti ovviamente prendere i dati da entrambi i gruppi. Calcola la deviazione standard per il secondo gruppo di dati, quindi trova la varianza tra i due gruppi sperimentali. La varianza viene calcolata utilizzando la seguente formula: s d = √((s 1 /N 1) + (s 2 /N 2)).