Hypotesetest udføres ved statistisk analyse. Statistisk signifikans blev beregnet ved hjælp af p-værdien, som angiver størrelsen af sandsynligheden for forskningsresultaterne, forudsat at visse udsagn (nulhypotese) er sande. Hvis p -værdien er mindre end det forudbestemte signifikansniveau (generelt 0,05), kan forskeren konkludere, at nulhypotesen ikke er sand og acceptere den alternative hypotese. Ved hjælp af en simpel t-test kan du beregne en p-værdi og bestemme betydningen mellem to forskellige datasæt.
Trin
Del 1 af 3: Opsætning af eksperimenter
Trin 1. Etabler en hypotese
Det første trin i analysen af statistisk signifikans er at bestemme det forskningsspørgsmål, du ønsker at besvare, og formulere din hypotese. En hypotese er en erklæring om dine eksperimentelle data og forklarer mulige forskelle i undersøgelsespopulationen. For hvert forsøg skal der etableres en nulhypotese og en alternativ hypotese. Generelt vil du sammenligne to grupper for at se, om de er ens eller forskellige.
- Nulhypotesen (H0) siger generelt, at der ikke er nogen forskel mellem de to datasæt. Eksempel: gruppen af elever, der læste materialet, før klassen startede, fik ikke bedre karakterer end gruppen, der ikke læste materialet.
- Alternativ hypotese (H-en) er en erklæring, der modsiger nulhypotesen og en, du forsøger at understøtte med eksperimentelle data. Eksempel: gruppen af elever, der læste materialet før klassen, fik bedre karakterer end gruppen, der ikke læste materialet.
Trin 2. Begræns niveauet for betydning for at afgøre, hvor unikke dine data skal være, for at det kan betragtes som væsentligt
Signifikansniveauet (alfa) er den tærskel, der bruges til at bestemme signifikansen. Hvis p -værdien er mindre end eller lig med signifikansniveauet, betragtes dataene som statistisk signifikante.
- Som hovedregel er signifikansniveauet (alfa) sat til 0,05, hvilket betyder, at sandsynligheden for, at begge grupper af data er ens, kun er 5%.
- Ved at bruge et højere tillidsniveau (lavere p -værdi) betyder, at de eksperimentelle resultater vil blive betragtet som mere signifikante.
- Hvis du vil øge konfidensniveauet for dine data, skal du sænke p-værdien mere til 0,01. Lavere p-værdier bruges almindeligvis i fremstillingen ved påvisning af produktfejl. En høj grad af tillid er afgørende for at sikre, at hver fremstillet del udfører sin funktion.
- For hypotesetestforsøg er et signifikansniveau på 0,05 acceptabelt.
Trin 3. Beslut dig for at bruge en ensidig test eller en tohalet test
En af de antagelser, der bruges, når du udfører en t-test, er, at dine data er normalt fordelt. Data, der normalt distribueres, vil danne en klokkekurve, hvor de fleste data er i midten af kurven. T-testen er en matematisk test, der bruges til at se, om dine data ligger uden for normalfordelingen, under eller over kurvens "hale".
- Hvis du ikke er sikker på, at dine data er under eller over kontrolgruppen, skal du bruge en tosidet test. Denne test vil kontrollere betydningen af begge retninger.
- Hvis du kender retningen for tendensen i dine data, skal du bruge en ensidig test. Ved at bruge det foregående eksempel forventede du, at en elevs karakter ville stige. Derfor bør du bruge en ensidig test.
Trin 4. Bestem stikprøvestørrelsen ved teststatistisk effektanalyse
Teststatistikkens magt er sandsynligheden for, at en bestemt statistisk test kan give det korrekte resultat med en bestemt stikprøvestørrelse. Testeffektgrænsen (eller) er 80%. Analyse af styrken af en statistisk test kan være kompliceret uden foreløbige data, fordi du har brug for oplysninger om det estimerede gennemsnit for hvert datasæt og dets standardafvigelse. Brug den online statistiske testeffektanalyseberegner til at bestemme den optimale stikprøvestørrelse for dine data.
- Forskere gennemfører generelt pilotundersøgelser som et materiale til statistisk teststyrke analyse og som grundlag for at bestemme den prøve størrelse, der er nødvendig for større og mere omfattende undersøgelser.
- Hvis du ikke har ressourcer til at gennemføre et pilotstudie, skal du estimere gennemsnittet baseret på den litteratur og anden forskning, der er blevet foretaget. Denne metode giver oplysninger til bestemmelse af stikprøvestørrelsen.
Del 2 af 3: Beregning af standardafvigelsen
Trin 1. Brug standardafvigelsesformlen
Standardafvigelsen (også kendt som standardafvigelsen) er et mål for fordelingen af dine data. Standardafvigelsen giver oplysninger om ligheden mellem hvert datapunkt i din prøve. I første omgang kan standardafvigelsesligningen virke kompliceret, men nedenstående trin hjælper med din beregningsproces. Standardafvigelsesformlen er s = ((xjeg -)2/(N - 1)).
- s er standardafvigelsen.
- betyder, at du skal samle alle de prøveværdier, du har indsamlet.
- xjeg repræsenterer alle de individuelle værdier for dine datapunkter.
- er gennemsnittet af dataene for hver gruppe.
- N er antallet af dine prøver.
Trin 2. Beregn prøvegennemsnittet i hver gruppe
For at beregne standardafvigelsen skal du først beregne prøvegennemsnittet i hvert datasæt. Gennemsnittet betegnes med det græske bogstav mu eller. For at gøre dette skal du tilføje alle prøvedatapunktværdierne og dividere med antallet af dine prøver.
- For eksempel for at få den gennemsnitlige score for gruppen af elever, der læste materialet før klassen, lad os se på eksempeldataene. For nemheds skyld vil vi bruge 5 datapunkter: 90, 91, 85, 83 og 94.
- Tilføj alle prøveværdier: 90 + 91 + 85 + 83 + 94 = 443.
- Divider med antallet af prøver, N = 5: 443/5 = 88, 6.
- Den gennemsnitlige score for denne gruppe var 88. 6.
Trin 3. Træk hver prøvedatapunktværdi med middelværdien
Det andet trin er at fuldføre delen (xjeg -) ligning. Træk hver prøvedatapunktværdi fra det forudberegnede middel. I fortsættelse af det foregående eksempel skal du foretage fem subtraktioner.
- (90- 88, 6), (91- 88, 6), (85- 88, 6), (83- 88, 6) og (94- 88, 6).
- De opnåede værdier er 1, 4, 2, 4, -3, 6, -5, 6 og 5, 4.
Trin 4. Kvadrater hver værdi, der er opnået, og læg dem sammen
Kvadrater hver værdi, du lige har beregnet. Dette trin fjerner eventuelle negative tal. Hvis der er en negativ værdi efter dette trin er udført, eller tiden efter at alle beregninger er udført, har du muligvis glemt dette trin.
- Ved hjælp af det foregående eksempel får vi værdierne 1, 96, 5, 76, 12, 96, 31, 36 og 29,16.
- Saml alle værdierne: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Trin 5. Divider med antallet af prøver minus 1
Formlen udtrykker N - 1 som en justering, fordi du ikke tæller hele befolkningen; Du tager kun et udsnit af befolkningen for at lave et skøn.
- Træk fra: N - 1 = 5 - 1 = 4
- Divider: 81, 2/4 = 20, 3
Trin 6. Beregn kvadratroden
Når du har divideret med antallet af prøver minus en, skal du beregne kvadratroden af den endelige værdi. Dette er det sidste trin til at beregne standardafvigelsen. Der er flere statistiske programmer, der kan beregne standardafvigelsen, efter at du har indtastet rådata.
For eksempel er standardafvigelsen for scorerne for gruppen af elever, der læser materialet, før klassen starter: s = √20, 3 = 4, 51
Del 3 af 3: Bestemmelse af betydning
Trin 1. Beregn variansen mellem de to prøvegrupper
I det foregående eksempel beregnede vi kun standardafvigelsen for en gruppe. Hvis du vil sammenligne to grupper, skal du have data fra de to grupper. Beregn standardafvigelsen for den anden gruppe og brug resultaterne til at beregne variansen mellem de to grupper i eksperimentet. Formlen for varians er sd = ((s1/N1) + (s2/N2)).
- sd er intergruppens varians.
- s1 er standardafvigelsen for gruppe 1 og N1 er antallet af prøver i gruppe 1.
- s2 er standardafvigelsen for gruppe 2 og N2 er antallet af prøver i gruppe 2.
-
For eksempel har data fra gruppe 2 (elever, der ikke læser materialet før undervisningen starter) en stikprøve på 5 med en standardafvigelse på 5,81. Derefter varianten:
- sd = ((s1)2/N1) + ((s2)2/N2))
- sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Trin 2. Beregn t-testværdien af dine data
T-testværdien giver dig mulighed for at sammenligne en datagruppe med en anden datagruppe. T-værdien giver dig mulighed for at udføre en t-test for at bestemme, hvor stor sandsynligheden for, at de to grupper af data, der sammenlignes, er signifikant forskellige. Formlen for værdien af t er: t = (µ1 -2)/sd.
- ️1 er middelværdien for den første gruppe.
- ️2 er gennemsnitsværdien for den anden gruppe.
- sd er variansen mellem de to prøver.
- Brug det større middel som1 så du ikke får negative værdier.
- F.eks. Er den gennemsnitlige score for gruppe 2 (elever, der ikke læser) 80. T-værdien er: t = (µ1 -2)/sd = (88, 6 – 80)/3, 29 = 2, 61.
Trin 3. Bestem prøvens frihedsgrader
Ved brug af t-værdien bestemmes frihedsgraderne af prøvens størrelse. Tilføj antallet af prøver fra hver gruppe og træk derefter to. For eksempel er frihedsgraderne (d.f.) 8, fordi der er fem prøver i den første gruppe og fem prøver i den anden gruppe ((5 + 5) - 2 = 8).
Trin 4. Brug tabel t til at bestemme betydningen
Tabeller med t-værdier og frihedsgrader findes i standard statistikbøger eller online. Se på rækken, der viser de frihedsgrader, du valgte for dine data, og find den passende p-værdi for t-værdien, der stammer fra dine beregninger.
Med frihedsgrader på 8 d.f. og t-værdien på 2,61, p-værdien for den ensidige test er mellem 0,01 og 0,025. Da vi brugte et signifikansniveau på mindre end eller lig med 0,05, viser de data, vi bruger, at de to datagrupper er signifikant forskellige. betydelige. Med disse data kan vi afvise nulhypotesen og acceptere den alternative hypotese: gruppen af elever, der læste materialet, før klassen startede, scorede bedre end gruppen af elever, der ikke læste materialet
Trin 5. Overvej at lave en opfølgende undersøgelse
Mange forskere gennemfører små pilotundersøgelser for at hjælpe dem med at forstå, hvordan man designer større undersøgelser. At foretage yderligere forskning med flere målinger øger din tillid til dine konklusioner.