Statistische tests: wat ze betekenen, voorbeelden en typen

statistische tests
Afbeeldingsbron: Course Downloader

Statistische tests zijn een essentieel onderdeel van data-analyse. Ze helpen ons bij het begrijpen van de gegevens en het trekken van conclusies over de populatie. Ze worden ook gebruikt om variabele relaties te onderzoeken en hypothesen te testen. Over het algemeen zijn ze een methode om gegevens te analyseren om te bepalen of er al dan niet een significant verschil is tussen de twee groepen. Aan de hand van voorbeelden gaan we in deze blogpost in op de verschillende soorten statistische toetsen en hun betekenis.

Wat zijn statistische tests?

Statistische tests worden gebruikt om te bepalen of twee sets gegevens significant van elkaar verschillen. Statistische tests bereiken dit door een verscheidenheid aan statistische metingen te gebruiken, zoals het gemiddelde, de standaarddeviatie en de variatiecoëfficiënt. De statistische test vergelijkt vervolgens de berekende statistische metingen met een reeks vooraf bepaalde criteria. De statistische test zal concluderen dat er een significant verschil is tussen de twee sets gegevens als de gegevens aan de criteria voldoen.

Afhankelijk van het type gegevens dat wordt geanalyseerd, kunnen verschillende statistische tests worden gebruikt. T-toetsen, chikwadraattoetsen en ANOVA-toetsen zijn drie van de meest voorkomende statistische toetsen.

Soorten statistische tests

Statistische tests zijn van verschillende typen:

#1. Parametrische statistische tests

Als de gegevens normaal verdeeld zijn, worden parametrische tests gebruikt.

Een parametrische statistische test maakt aannames over de populatieparameters en gegevensverdelingen. Deze tests omvatten t-tests, z-tests en ANOVA-tests, die ervan uitgaan dat de gegevens normaal verdeeld zijn.

Z-test

Wanneer de varianties bekend zijn en de steekproefomvang groot is, wordt een z-toets gebruikt om te bepalen of twee populatiegemiddelden verschillend zijn. Het populatiegemiddelde wordt vergeleken met behulp van de z-toets. De gebruikte parameters zijn het populatiegemiddelde en de standaarddeviatie. De Z-toets wordt gebruikt om te bevestigen dat de getrokken steekproef uit dezelfde populatie komt.

Ho: het steekproefgemiddelde is gelijk aan het populatiegemiddelde (nulhypothese)

z = (x — ) / ( / n), waarbij x=steekproefgemiddelde, u=populatiegemiddelde en / n=populatiestandaarddeviatie.

Accepteer de nulhypothese als de z-waarde kleiner is dan de kritische waarde; verwerp anders de nulhypothese.

T-toets

De t-toets vergelijkt de gemiddelden van twee steekproeven. Wanneer de populatieparameters (gemiddelde en standaarddeviatie) onbekend zijn, wordt een t-toets gebruikt.

Gepaarde T-toetsen worden gebruikt om de verschillen tussen twee variabelen uit dezelfde populatie (pre- en post-testscores) te vergelijken. Bijvoorbeeld, in een trainingsprogramma, de prestatiescore van de stagiair voor en na voltooiing van het programma.

De onafhankelijke t-test, ook wel de two-sample t-test of student t-test genoemd, is een statistische test die wordt gebruikt om te bepalen of er een statistisch significant verschil is tussen de gemiddelden van twee niet-verwante groepen.

Overweeg bijvoorbeeld om jongens en meisjes in een populatie te vergelijken.

Het gemiddelde van een enkele groep wordt vergeleken met een bepaald gemiddelde in een one-sample t-test. Als bijvoorbeeld de gemiddelde verkoop wordt gegeven, kan men de toe- en afname van de verkoop onderzoeken.

t = (x1 — x2) / (/ n1 + / n2), waarbij x1 en x2 respectievelijk de gemiddelden van monsters 1 en 2 vertegenwoordigen.

ANOVA-test

Variantieanalyse (ANOVA) is een statistische techniek die wordt gebruikt om te bepalen of de gemiddelden van twee of meer groepen significant van elkaar verschillen. ANOVA vergelijkt de gemiddelden van verschillende steekproeven om de impact van een of meer factoren te bepalen. Als we een t-toets gebruiken in plaats van een ANOVA-toets, zullen de resultaten onnauwkeurig zijn omdat er meer dan twee steekproeven zijn.

In ANOVA is de geteste hypothese Ho: alle paren steekproeven zijn hetzelfde, dwz alle steekproefgemiddelden zijn gelijk.

Ten minste één paar monsters verschilt aanzienlijk.

We berekenen de F-waarde in een anova-test en vergelijken deze met de kritische waarde

F= ((SSE1 — SSE2)/m)/ SSE2/nk, waarbij SSE = restsom van kwadraten.

m = het aantal beperkingen

k staat voor het aantal onafhankelijke variabelen.

#2. Niet-parametrische statistische tests

Niet-parametrische statistische tests worden gebruikt wanneer de gegevens niet normaal verdeeld zijn. De chikwadraattoets is een voorbeeld van een niet-parametrische toets.

Chikwadraattoets (2 toetsen)

De chikwadraattoets vergelijkt twee categorische variabelen. Door de statistische Chi-kwadraatwaarde te berekenen en deze te vergelijken met een kritieke waarde uit de Chi-kwadraatverdeling, kunt u bepalen of de waargenomen en verwachte frequenties significant verschillen.

Ho: Variabelen x en y zijn onafhankelijk, is de hypothese die wordt getest op chikwadraat.

Variabelen x en y zijn niet onafhankelijk van elkaar.

Chikwadraatformule (o=waargenomen, e=verwacht).

Kiezen welke statistische test te gebruiken

Hier zijn parameters die u zullen helpen bepalen welke statistische test u moet gebruiken

#1. Onderzoeks probleem

De keuze voor een statistische toets wordt bepaald door de te beantwoorden onderzoeksvraag. Bovendien helpen de onderzoeksvragen je bij het ontwikkelen van de datastructuur en het onderzoeksontwerp.

#2. Ontwikkeling van een nulhypothese

Je zou een nulhypothese kunnen maken nadat je de onderzoeksvraag hebt gedefinieerd. Een nulhypothese houdt in dat er geen statistische significantie is in de verwachte waarnemingen.

#3. Belang van het Studieprotocol

Er wordt een significantieniveau gespecificeerd voordat met het onderzoeksprotocol wordt begonnen. Het significantieniveau bepaalt de statistische significantie, die bepaalt of de nulhypothese wordt geaccepteerd of verworpen.

#4. De keuze tussen eenzijdig versus tweezijdig

Je moet beslissen of je onderzoek eenzijdig of tweezijdig wordt. U moet eenzijdige toetsen gebruiken als u duidelijk bewijs heeft dat de statistieken in één richting wijzen. Als er echter geen duidelijke richting van het verwachte verschil is, is een tweezijdige toetsing vereist.

#5. Het aantal variabelen dat wordt onderzocht

Statistische tests en procedures worden geclassificeerd op basis van het aantal variabelen dat ze moeten analyseren. Als gevolg hiervan moet u bij het selecteren van een test overwegen hoeveel variabelen u wilt analyseren.

#6. Data type

Het is van cruciaal belang om aan te geven of uw gegevens continu, categorisch of binair zijn. In het geval van continue gegevens moet u ook bepalen of de gegevens normaal verdeeld of scheef zijn om te bepalen welke statistische toets u moet gebruiken.

#7. Studieontwerpen, gekoppeld en ongepaard

Wanneer de twee steekproeven van elkaar afhankelijk zijn, omvat een gepaard ontwerp vergelijkingsstudies waarin de twee populatiegemiddelden worden vergeleken. De resultaten van de twee steekproeven worden gegroepeerd en vergeleken in een ongepaard of onafhankelijk onderzoeksontwerp.

Je bent op weg om de juiste statistische toets voor je onderzoeksvraag te vinden nu je de stappen voor het selecteren van een statistische toets hebt geleerd. Omdat elke situatie anders is, is het van cruciaal belang om al uw opties te begrijpen en een weloverwogen beslissing te nemen.

Als u niet zeker weet welke test u moet gebruiken, overleg dan altijd met uw hoofdonderzoeker, statisticus of software.

Wat zijn statistische significantietests?

Statistische significantietests zijn een vaststelling door een analist dat de resultaten van de gegevens niet uitsluitend door toeval kunnen worden verklaard. De analist maakt deze bepaling met behulp van statistische hypothesetesten. Deze test retourneert een p-waarde, wat de waarschijnlijkheid is om resultaten te zien die even extreem zijn als die in de gegevens, ervan uitgaande dat de resultaten volledig op toeval berusten. Een p-waarde van 5% of minder wordt algemeen als statistisch significant beschouwd.

Inzicht in statistische significantietests

Statistische significantie is een bepaling van de nulhypothese, wat inhoudt dat de resultaten uitsluitend op toeval berusten. Als de p-waarde klein genoeg is, biedt een dataset statistische significantie.

Wanneer de p-waarde groot is, zijn de resultaten van de gegevens uitsluitend door toeval te verklaren en worden de gegevens geacht consistent te zijn met (maar niet bewijzend) de nulhypothese.

Bovendien, als de p-waarde klein genoeg is (meestal 5% of minder), kunnen de resultaten niet uitsluitend door toeval worden verklaard en worden de gegevens als inconsistent met de nulhypothese beschouwd. De nulhypothese van alleen toeval als verklaring voor de gegevens wordt in dit geval verworpen ten gunste van een meer systematische verklaring.

Statistische significantie wordt vaak gebruikt in nieuwe farmaceutische geneesmiddelenonderzoeken, vaccintesten en pathologisch onderzoek voor het testen van de effectiviteit en het informeren van investeerders over het succes van het bedrijf bij het uitbrengen van nieuwe producten.

Voorbeelden van statistische significantietests

Stel dat Alex, een financieel analist, benieuwd is of sommige investeerders op de hoogte waren van het dreigende faillissement van een bedrijf. Alex besluit het gemiddelde van de dagelijkse marktrendementen voor en na het falen van het bedrijf te vergelijken om te zien of er een statistisch significant verschil is tussen de twee gemiddelden.

De p-waarde voor de studie was 28% (>5%), wat aangeeft dat een verschil van deze grootte (-0.0033 tot +0.0007) niet ongebruikelijk is onder de alleen-kans-verklaring. Als gevolg hiervan leverden de gegevens geen overtuigend bewijs van voorkennis van de storing. Als de p-waarde 0.01% was (veel minder dan 5%), zou het waargenomen verschil uiterst ongebruikelijk zijn onder de alleen-toevallige verklaring. In dit geval kan Alex ervoor kiezen om de nulhypothese te verwerpen en te onderzoeken of sommige handelaren voorkennis hadden.

Statistische significantie wordt ook gebruikt om nieuwe medische producten zoals medicijnen, medische hulpmiddelen en vaccins te evalueren. Openbaar beschikbare statistisch significante rapporten informeren beleggers ook over het succes van het bedrijf bij het uitbrengen van nieuwe producten.

Stel bijvoorbeeld dat een farmaceutisch bedrijf dat gespecialiseerd is in diabetesmedicatie een statistisch significante vermindering van diabetes type 1 rapporteerde na het testen van zijn nieuwe insuline. De studie omvatte 26 weken gerandomiseerde therapie bij diabetespatiënten, met een p-waarde van 4%. Dit vertelt investeerders en regelgevende instanties dat de gegevens een statistisch significante afname van diabetes type 1 laten zien.

Welke factoren beïnvloeden de statistische significantie?

Om te bepalen of de gegevens statistisch significant zijn, wordt gebruik gemaakt van statistische hypothesetesten. Met andere woorden, of het fenomeen al dan niet uitsluitend door toeval kan worden verklaard. Statistische significantie is een bepaling van de nulhypothese, die stelt dat de resultaten volledig op toeval berusten. De nulhypothese moet worden verworpen om de gegevens als statistisch significant te beschouwen.

Wat is P-waarde precies?

Een p-waarde is een maat voor de waarschijnlijkheid dat een waargenomen verschil door toeval zou kunnen zijn ontstaan. Als de p-waarde klein genoeg is (bijv. 5% of minder), kunnen de resultaten niet uitsluitend door toeval worden verklaard en kan de nulhypothese worden verworpen. Wanneer de p-waarde groot is, kunnen de resultaten van de gegevens uitsluitend door toeval worden verklaard en worden de gegevens geacht consistent te zijn met (en dus te bewijzen) de nulhypothese.

Hoe wordt statistische significantie gebruikt?

Statistische significantie wordt vaak gebruikt om de werkzaamheid van nieuwe medische producten zoals medicijnen, apparaten en vaccins te beoordelen. Openbaar beschikbare statistisch significante rapporten informeren beleggers ook over het succes van het bedrijf bij het uitbrengen van nieuwe producten. De aandelenkoersen van farmaceutische bedrijven worden vaak aanzienlijk beïnvloed door aankondigingen over de statistische significantie van hun nieuwe producten.

Wat zijn de drie belangrijkste varianten van statistische tests?

Regressietests, vergelijkingstests en correlatietests zijn de drie belangrijkste varianten van statistische tests.

Wat zijn de statistische tests in SPSS?

T-toetsen, chikwadraat, correlatie, regressie en variantieanalyse behoren tot de statistische toetsen die beschikbaar zijn in SPSS.

Wat zijn de twee belangrijkste methoden in de statistiek?

In de statistiek zijn er twee hoofdmethoden: beschrijvende statistiek, die gegevens samenvat met behulp van indexen zoals gemiddelde en mediaan, en inferentiële statistiek, die conclusies trekt uit gegevens met behulp van statistische tests zoals de student's t-test.

Is ANOVA een statistische test?

ANOVA, wat staat voor Analysis of Variance, is een statistische test die wordt gebruikt om de gemiddelden van meerdere groepen te vergelijken.

Conclusie

Statistische tests worden gebruikt om te bepalen of twee sets gegevens significant van elkaar verschillen. Statistische tests worden ingedeeld in twee typen: parametrische en niet-parametrische. Parametrische tests maken aannames over de gegevens, terwijl niet-parametrische tests geen aannames doen over de gegevens. Beide soorten tests worden gebruikt om conclusies te trekken over een populatie uit een steekproef. Het type test dat moet worden gebruikt, wordt bepaald door het type beschikbare gegevens.

  1. STATISTISCHE ANALYSE: typen, technieken en doel
  2. Vraagplanning: overzicht, vergelijkingen, salarissen en banen
  3. STATISTISCHE METHODEN: Wat u moet weten en begeleiden
  4. Wat is het beste type drugstest om te gebruiken voor werknemersscreening?
  5. Quant-salaris: een complete uitsplitsing en hoe u een Quant kunt worden

Referenties

Laat een reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *

Dit vind je misschien ook leuk