Het testen van hypothesen wordt gedaan door statistische analyse. De statistische significantie is berekend met behulp van de p-waarde, die de grootte van de waarschijnlijkheid van de onderzoeksresultaten aangeeft, op voorwaarde dat bepaalde uitspraken (nulhypothese) waar zijn. Als de p-waarde kleiner is dan het vooraf bepaalde significantieniveau (meestal 0,05), kan de onderzoeker concluderen dat de nulhypothese niet waar is en de alternatieve hypothese accepteren. Met behulp van een eenvoudige t-test kunt u een p-waarde berekenen en de significantie tussen twee verschillende gegevenssets bepalen.
Stap
Deel 1 van 3: Experimenten opzetten
Stap 1. Stel een hypothese op
De eerste stap bij het analyseren van statistische significantie is het bepalen van de onderzoeksvraag die u wilt beantwoorden en het formuleren van uw hypothese. Een hypothese is een uitspraak over uw experimentele gegevens en verklaart mogelijke verschillen in de onderzoekspopulatie. Voor elk experiment moet een nulhypothese en een alternatieve hypothese worden opgesteld. Over het algemeen vergelijk je twee groepen om te zien of ze hetzelfde of verschillend zijn.
- De nulhypothese (H0) stelt in het algemeen dat er geen verschil is tussen de twee datasets. Voorbeeld: de groep studenten die de stof voor aanvang van de les las, kreeg geen betere cijfers dan de groep die de stof niet las.
- Alternatieve hypothese (Heen) is een bewering die in tegenspraak is met de nulhypothese en die u probeert te ondersteunen met experimentele gegevens. Voorbeeld: de groep studenten die de stof voor de les las, haalde betere cijfers dan de groep die de stof niet las.
Stap 2. Beperk het significantieniveau om te bepalen hoe uniek uw gegevens moeten zijn om als significant te worden beschouwd
Het significantieniveau (alfa) is de drempel die wordt gebruikt om de significantie te bepalen. Als de p-waarde kleiner is dan of gelijk is aan het significantieniveau, worden de gegevens als statistisch significant beschouwd.
- Als algemene regel is het significantieniveau (alfa) ingesteld op 0,05, wat betekent dat de kans dat beide groepen gegevens gelijk zijn slechts 5% is.
- Door een hoger betrouwbaarheidsniveau (lagere p-waarde) te gebruiken, worden de experimentele resultaten als significanter beschouwd.
- Als u het betrouwbaarheidsniveau van uw gegevens wilt verhogen, verlaagt u de p-waarde meer naar 0,01. Lagere p-waarden worden vaak gebruikt in de productie bij het detecteren van productdefecten. Een hoge mate van vertrouwen is essentieel om ervoor te zorgen dat elk gefabriceerd onderdeel zijn functie vervult.
- Voor hypothesetestexperimenten is een significantieniveau van 0,05 acceptabel.
Stap 3. Besluit om een eenzijdige toets of een tweezijdige toets te gebruiken
Een van de aannames die worden gebruikt bij het uitvoeren van een t-test is dat uw gegevens normaal verdeeld zijn. Gegevens die normaal verdeeld zijn, vormen een belcurve waarbij de meeste gegevens zich in het midden van de curve bevinden. De t-test is een wiskundige test die wordt gebruikt om te zien of uw gegevens zich buiten de normale verdeling bevinden, onder of boven de "staart" van de curve.
- Als u niet zeker weet of uw gegevens onder of boven de controlegroep liggen, gebruik dan een tweezijdige test. Deze test controleert de betekenis van beide richtingen.
- Als u de richting van de trend van uw gegevens kent, gebruik dan een eenzijdige test. Aan de hand van het vorige voorbeeld verwachtte je dat het cijfer van een student zou stijgen. Gebruik daarom een eenzijdige test.
Stap 4. Bepaal de steekproefomvang door middel van teststatistische poweranalyse
De kracht van teststatistieken is de kans dat een bepaalde statistische test het juiste resultaat kan geven, bij een bepaalde steekproefomvang. De testvermogensdrempel (of) is 80%. Analyse van de sterkte van een statistische test kan gecompliceerd zijn zonder voorlopige gegevens, omdat u informatie nodig hebt over het geschatte gemiddelde van elke gegevensset en de standaarddeviatie. Gebruik de online rekenmachine voor statistische testvermogensanalyse om de optimale steekproefomvang voor uw gegevens te bepalen.
- Onderzoekers voeren over het algemeen pilootstudies uit als materiaal voor statistische teststerkteanalyse en als basis voor het bepalen van de steekproefomvang die nodig is voor grotere en uitgebreidere onderzoeken.
- Als u niet over de middelen beschikt om een pilotstudie uit te voeren, schat dan het gemiddelde op basis van de literatuur en ander onderzoek dat is gedaan. Deze methode geeft informatie om de steekproefomvang te bepalen.
Deel 2 van 3: De standaarddeviatie berekenen
Stap 1. Gebruik de standaarddeviatieformule
De standaarddeviatie (ook wel de standaarddeviatie genoemd) is een maatstaf voor de verdeling van uw gegevens. De standaarddeviatie geeft informatie over de gelijkenis van elk gegevenspunt in uw steekproef. In eerste instantie lijkt de standaarddeviatievergelijking misschien ingewikkeld, maar de onderstaande stappen zullen u helpen bij uw berekeningsproces. De standaarddeviatieformule is s = ((xl –)2/(N – 1)).
- s is de standaarddeviatie.
- betekent dat je alle steekproefwaarden die je hebt verzameld bij elkaar moet optellen.
- xl vertegenwoordigt alle individuele waarden van uw datapunten.
- is het gemiddelde van de gegevens voor elke groep.
- N is het aantal van uw monsters.
Stap 2. Bereken het steekproefgemiddelde in elke groep
Om de standaarddeviatie te berekenen, moet u eerst het steekproefgemiddelde in elke dataset berekenen. Het gemiddelde wordt aangegeven met de Griekse letter mu of. Om dit te doen, telt u alle voorbeeldgegevenspuntwaarden bij elkaar op en deelt u deze door het aantal van uw monsters.
- Om bijvoorbeeld de gemiddelde score te krijgen van de groep studenten die het materiaal voor de les hebben gelezen, bekijken we de voorbeeldgegevens. Voor de eenvoud gebruiken we 5 gegevenspunten: 90, 91, 85, 83 en 94.
- Tel alle steekproefwaarden bij elkaar op: 90 + 91 + 85 + 83 + 94 = 443.
- Deel door het aantal monsters, N = 5:443/5 = 88, 6.
- De gemiddelde score voor deze groep was 88. 6.
Stap 3. Trek elke voorbeeldgegevenspuntwaarde af met de gemiddelde waarde
De tweede stap is om het onderdeel (xl -) vergelijking. Trek elke waarde van het voorbeeldgegevenspunt af van het vooraf berekende gemiddelde. Als u verdergaat met het vorige voorbeeld, moet u vijf aftrekkingen doen.
- (90 – 88, 6), (91-88, 6), (85 – 88, 6), (83 – 88, 6) en (94 – 88, 6).
- De verkregen waarden zijn 1, 4, 2, 4, -3, 6, -5, 6 en 5, 4.
Stap 4. Vier elke verkregen waarde vierkant en tel ze allemaal bij elkaar op
Vier elke waarde die u zojuist hebt berekend. Met deze stap worden eventuele negatieve getallen verwijderd. Als er een negatieve waarde is nadat deze stap is uitgevoerd of de tijd nadat alle berekeningen zijn uitgevoerd, bent u deze stap misschien vergeten.
- Met behulp van het vorige voorbeeld krijgen we de waarden 1, 96, 5, 76, 12, 96, 31, 36 en 29.16.
- Tel alle waarden bij elkaar op: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Stap 5. Deel door het aantal monsters minus 1
De formule drukt N – 1 uit als een aanpassing omdat je niet de hele populatie meetelt; Je neemt alleen een steekproef van de populatie om een schatting te maken.
- Aftrekken: N – 1 = 5 – 1 = 4
- Delen: 81, 2/4 = 20, 3
Stap 6. Bereken de vierkantswortel
Nadat u hebt gedeeld door het aantal monsters minus één, berekent u de vierkantswortel van de uiteindelijke waarde. Dit is de laatste stap om de standaarddeviatie te berekenen. Er zijn verschillende statistische programma's die de standaarddeviatie kunnen berekenen nadat u de onbewerkte gegevens hebt ingevoerd.
Zo is de standaarddeviatie van de scores voor de groep leerlingen die de stof voor aanvang van de les hebben gelezen: s =√20, 3 = 4, 51
Deel 3 van 3: Betekenis bepalen
Stap 1. Bereken de variantie tussen de twee steekproefgroepen
In het vorige voorbeeld hebben we alleen de standaarddeviatie van één groep berekend. Als je twee groepen wilt vergelijken, heb je gegevens van beide groepen nodig. Bereken de standaarddeviatie van de tweede groep en gebruik de resultaten om de variantie tussen de twee groepen in het experiment te berekenen. De formule voor variantie is sNS = ((s1/N1) + (s2/N2)).
- sNS is de intergroepsvariantie.
- s1 is de standaarddeviatie van groep 1 en N1 is het aantal monsters in groep 1.
- s2 is de standaarddeviatie van groep 2 en N2 is het aantal monsters in groep 2.
-
Gegevens uit groep 2 (studenten die de stof niet lezen voordat de les begint) hebben bijvoorbeeld een steekproefomvang van 5 met een standaarddeviatie van 5,81. Dan de variant:
- sNS = ((s1)2/N1) + ((s2)2/N2))
- sNS = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Stap 2. Bereken de t-testwaarde van uw gegevens
Met de t-testwaarde kunt u een groep gegevens vergelijken met een andere groep gegevens. Met de t-waarde kunt u een t-test uitvoeren om te bepalen hoe groot de kans is dat de twee groepen gegevens die worden vergeleken significant van elkaar verschillen. De formule voor de waarde van t is: t = (µ1 –2)/sNS.
- ️1 is het gemiddelde van de eerste groep.
- ️2 is de gemiddelde waarde van de tweede groep.
- sNS is het verschil tussen de twee steekproeven.
- Gebruik het grotere gemiddelde als1 zodat je geen negatieve waarden krijgt.
- Zo is de gemiddelde score van groep 2 (studenten die niet lezen) 80. De t-waarde is: t = (µ1 –2)/sNS = (88, 6 – 80)/3, 29 = 2, 61.
Stap 3. Bepaal de vrijheidsgraden van het monster
Bij gebruik van de t-waarde worden de vrijheidsgraden bepaald door de grootte van de steekproef. Voeg het aantal monsters van elke groep toe en trek er vervolgens twee van af. De vrijheidsgraden (d.f.) zijn bijvoorbeeld 8 omdat er vijf steekproeven zijn in de eerste groep en vijf steekproeven in de tweede groep ((5 + 5) – 2 = 8).
Stap 4. Gebruik tabel t om de significantie te bepalen
Tabellen met t-waarden en vrijheidsgraden zijn te vinden in standaard statistiekboeken of online. Kijk naar de rij met de vrijheidsgraden die u voor uw gegevens hebt geselecteerd en zoek de juiste p-waarde voor de t-waarde die uit uw berekeningen is afgeleid.
Met vrijheidsgraden van 8 d.f. en de t-waarde van 2,61, de p-waarde voor de eenzijdige test ligt tussen 0,01 en 0,025. Aangezien we een significantieniveau van minder dan of gelijk aan 0,05 hebben gebruikt, bewijzen de gegevens die we gebruiken dat de twee gegevensgroepen significant verschillend. significant. Met deze gegevens kunnen we de nulhypothese verwerpen en de alternatieve hypothese accepteren: de groep studenten die de stof voor aanvang van de les las, scoorde beter dan de groep studenten die de stof niet las
Stap 5. Overweeg een vervolgonderzoek te doen
Veel onderzoekers voeren kleine pilotstudies uit om hen te helpen begrijpen hoe grotere studies moeten worden opgezet. Verder onderzoek doen met meer metingen zal uw vertrouwen in uw conclusies vergroten.