Tests statistiques : ce qu'ils signifient, exemples et types

tests statistiques
Source de l'image : téléchargeur de cours

Les tests statistiques sont une composante essentielle de l'analyse des données. Ils nous aident à comprendre les données et à tirer des conclusions sur la population. Ils sont également utilisés pour étudier les relations variables et tester des hypothèses. Généralement, il s'agit d'une méthode d'analyse des données pour déterminer s'il existe ou non une différence significative entre les deux groupes. À l'aide d'exemples, nous discuterons des différents types de tests statistiques et de leur signification dans cet article de blog.

Que sont les tests statistiques ?

Des tests statistiques sont utilisés pour déterminer si deux ensembles de données sont significativement différents l'un de l'autre. Les tests statistiques y parviennent en utilisant une variété de mesures statistiques telles que la moyenne, l'écart type et le coefficient de variation. Le test statistique comparera ensuite les mesures statistiques calculées à un ensemble de critères prédéterminés. Le test statistique conclura qu'il existe une différence significative entre les deux ensembles de données si les données répondent aux critères.

Selon le type de données analysées, divers tests statistiques peuvent être utilisés. Les tests T, les tests du chi carré et les tests ANOVA sont trois des tests statistiques les plus courants.

Types de tests statistiques

Les tests statistiques sont de différents types :

#1. Tests statistiques paramétriques

Si les données sont distribuées normalement, des tests paramétriques sont utilisés.

Un test statistique paramétrique émet des hypothèses sur les paramètres de la population et la distribution des données. Ces tests incluent des tests t, des tests z et des tests ANOVA, qui supposent que les données sont normalement distribuées.

Test Z

Lorsque les variances sont connues et que la taille de l'échantillon est grande, un test z est utilisé pour déterminer si deux moyennes de population sont différentes. La moyenne de la population est comparée à l'aide du test z. Les paramètres utilisés sont la moyenne et l'écart type de la population. Le test Z est utilisé pour confirmer que l'échantillon tiré provient de la même population.

Ho : la moyenne de l'échantillon est égale à la moyenne de la population (hypothèse nulle)

z = (x — ) / ( / n), où x = moyenne de l'échantillon, u = moyenne de la population et / n = écart type de la population.

Acceptez l'hypothèse nulle si la valeur z est inférieure à la valeur critique ; sinon, rejeter l'hypothèse nulle.

Test T

Le test t compare les moyennes de deux échantillons. Lorsque les paramètres de la population (moyenne et écart-type) sont inconnus, un test t est utilisé.

Les tests T appariés sont utilisés pour comparer les différences entre deux variables d'une même population (scores pré et post-test). Par exemple, dans un programme de formation, le score de performance du stagiaire avant et après la fin du programme.

Le test t indépendant, également connu sous le nom de test t à deux échantillons ou test t de Student, est un test statistique utilisé pour déterminer s'il existe une différence statistiquement significative dans les moyennes de deux groupes non apparentés.

Par exemple, envisagez de comparer les garçons et les filles dans une population.

La moyenne d'un seul groupe est comparée à une moyenne donnée dans un test t à un échantillon. Par exemple, si les ventes moyennes sont données, on peut examiner l'augmentation et la diminution des ventes.

t = (x1 — x2) / (/ n1 + / n2), où x1 et x2 représentent les moyennes des échantillons 1 et 2, respectivement.

Test ANOVA

L'analyse de la variance (ANOVA) est une technique statistique utilisée pour déterminer si les moyennes de deux groupes ou plus diffèrent significativement les unes des autres. L'ANOVA compare les moyennes de différents échantillons pour déterminer l'impact d'un ou plusieurs facteurs. Si nous utilisons un test t au lieu d'un test ANOVA, les résultats seront inexacts car il y a plus de deux échantillons.

Dans l'ANOVA, l'hypothèse testée est Ho : toutes les paires d'échantillons sont identiques, c'est-à-dire que toutes les moyennes des échantillons sont égales.

Au moins une paire d'échantillons diffère significativement.

Nous calculons la valeur F dans le test anova et la comparons à la valeur critique

F= ((SSE1 — SSE2)/m)/ SSE2/nk, où SSE = somme résiduelle des carrés.

m = le nombre de contraintes

k désigne le nombre de variables indépendantes.

#2. Tests statistiques non paramétriques

Des tests statistiques non paramétriques sont utilisés lorsque les données ne sont pas normalement distribuées. Le test du chi carré est un exemple de test non paramétrique.

Test du chi carré (2 tests)

Le test du chi carré compare deux variables catégorielles. Le calcul de la valeur statistique Chi-Square et sa comparaison à une valeur critique de la distribution Chi-Square vous permet de déterminer si les fréquences observées et attendues sont significativement différentes.

Ho : Les variables x et y sont indépendantes dans l'hypothèse testée pour le chi carré.

Les variables x et y ne sont pas indépendantes l'une de l'autre.

Formule du chi carré (o=observé, e=attendu).

Choisir quel test statistique utiliser

Voici des paramètres qui vous aideront à déterminer quel test statistique utiliser

#1. Problème de recherche

Le choix d'un test statistique est déterminé par la question de recherche à laquelle il faut répondre. De plus, les questions de recherche vous aideront à développer la structure des données et la conception de la recherche.

#2. Développement d'une hypothèse nulle

Vous pouvez créer une hypothèse nulle après avoir défini la question de recherche. Une hypothèse nulle implique qu'il n'y a pas de signification statistique dans les observations attendues.

#3. Importance du protocole d'étude

Un niveau de significativité est précisé avant de débuter le protocole d'étude. Le niveau de signification détermine la signification statistique, qui définit si l'hypothèse nulle est acceptée ou rejetée.

#4. Le choix entre unilatéral et bilatéral

Vous devez décider si votre étude sera unilatérale ou bilatérale. Vous devez utiliser des tests unilatéraux si vous avez des preuves claires que les statistiques pointent dans une direction. Cependant, s'il n'y a pas de direction claire de la différence attendue, un test bilatéral est nécessaire.

#5. Le nombre de variables qui seront examinées

Les tests et procédures statistiques sont classés en fonction du nombre de variables qu'ils sont censés analyser. Par conséquent, lors de la sélection d'un test, vous devez tenir compte du nombre de variables que vous souhaitez analyser.

#6. Type de données

Il est essentiel de spécifier si vos données sont continues, catégorielles ou binaires. Dans le cas de données continues, vous devez également déterminer si les données sont normalement distribuées ou asymétriques afin de déterminer quel test statistique utiliser.

#7. Modèles d'étude, appariés et non appariés

Lorsque les deux échantillons dépendent l'un de l'autre, un plan apparié comprend des études comparatives dans lesquelles les moyennes des deux populations sont comparées. Les résultats des deux échantillons sont regroupés et comparés dans un plan d'étude non apparié ou indépendant.

Vous êtes sur la bonne voie pour trouver le bon test statistique pour votre question de recherche maintenant que vous avez appris les étapes de sélection d'un test statistique. Parce que chaque situation est différente, il est essentiel de comprendre toutes vos options et de prendre une décision éclairée.

Si vous ne savez pas quel test utiliser, consultez toujours votre chercheur principal, votre statisticien ou votre logiciel.

Que sont les tests de signification statistique ?

Les tests de signification statistique sont une détermination faite par un analyste que les résultats des données ne peuvent pas être expliqués uniquement par le hasard. L'analyste fait cette détermination en utilisant des tests d'hypothèses statistiques. Ce test renvoie une valeur de p, qui est la probabilité de voir des résultats aussi extrêmes que ceux des données, en supposant que les résultats sont entièrement dus au hasard. Une valeur de p de 5 % ou moins est généralement considérée comme statistiquement significative.

Comprendre les tests de signification statistique

La signification statistique est une détermination de l'hypothèse nulle, ce qui implique que les résultats sont uniquement dus au hasard. Lorsque la valeur de p est suffisamment petite, un ensemble de données fournit une signification statistique.

Lorsque la valeur de p est élevée, les résultats des données ne sont explicables que par le hasard et les données sont jugées cohérentes avec (mais ne prouvent pas) l'hypothèse nulle.

De plus, lorsque la valeur de p est suffisamment petite (généralement 5 % ou moins), les résultats ne peuvent pas être expliqués uniquement par le hasard et les données sont jugées incompatibles avec l'hypothèse nulle. L'hypothèse nulle du hasard seul comme explication des données est rejetée dans ce cas au profit d'une explication plus systématique.

La signification statistique est fréquemment utilisée dans les nouveaux essais de médicaments pharmaceutiques, les tests de vaccins et la recherche en pathologie pour tester l'efficacité et informer les investisseurs sur le succès de l'entreprise dans la commercialisation de nouveaux produits.

Exemples de tests de signification statistique

Supposons qu'Alex, un analyste financier, soit curieux de savoir si certains investisseurs étaient au courant de l'échec imminent d'une entreprise. Alex décide de comparer la moyenne des rendements quotidiens du marché avant et après l'échec de l'entreprise pour voir s'il existe une différence statistiquement significative entre les deux moyennes.

La valeur de p pour l'étude était de 28 % (> 5 %), ce qui indique qu'une différence de cette ampleur (-0.0033 à +0.0007) n'est pas inhabituelle sous l'explication du hasard uniquement. En conséquence, les données n'ont pas fourni de preuves convaincantes d'une connaissance préalable de l'échec. Si la valeur de p était de 0.01 % (beaucoup moins de 5 %), la différence observée serait extrêmement inhabituelle selon l'explication du hasard. Dans ce cas, Alex peut choisir de rejeter l'hypothèse nulle et de vérifier si certains commerçants avaient des connaissances préalables.

La signification statistique est également utilisée pour évaluer de nouveaux produits médicaux tels que des médicaments, des dispositifs médicaux et des vaccins. Des rapports statistiquement significatifs accessibles au public informent également les investisseurs sur le succès de la société dans le lancement de nouveaux produits.

Supposons, par exemple, qu'une société pharmaceutique spécialisée dans les médicaments contre le diabète signale une réduction statistiquement significative du diabète de type 1 après avoir testé sa nouvelle insuline. L'étude comprenait 26 semaines de traitement randomisé chez des patients diabétiques, avec une valeur p de 4 %. Cela indique aux investisseurs et aux organismes de réglementation que les données montrent une diminution statistiquement significative du diabète de type 1.

Quels facteurs influencent la signification statistique ?

Pour déterminer si les données sont statistiquement significatives, des tests d'hypothèses statistiques sont utilisés. Autrement dit, si oui ou non le phénomène s'explique uniquement par le hasard. La signification statistique est une détermination de l'hypothèse nulle, qui stipule que les résultats sont entièrement dus au hasard. L'hypothèse nulle doit être rejetée pour que les données soient considérées comme statistiquement significatives.

Qu'est-ce que la valeur P ?

Une valeur de p est une mesure de la probabilité qu'une différence observée ait pu se produire par hasard. Lorsque la valeur de p est suffisamment petite (par exemple, 5 % ou moins), les résultats ne peuvent pas être expliqués uniquement par le hasard et l'hypothèse nulle peut être rejetée. Lorsque la valeur de p est élevée, les résultats des données ne sont explicables que par le hasard, et les données sont jugées cohérentes avec (et donc prouvant) l'hypothèse nulle.

Comment la signification statistique est-elle utilisée ?

La signification statistique est fréquemment utilisée pour évaluer l'efficacité de nouveaux produits médicaux tels que les médicaments, les appareils et les vaccins. Des rapports statistiquement significatifs accessibles au public informent également les investisseurs sur le succès de la société dans le lancement de nouveaux produits. Les cours des actions des sociétés pharmaceutiques sont fréquemment influencés de manière significative par les annonces concernant la signification statistique de leurs nouveaux produits.

Quelles sont les trois principales variétés de tests statistiques ?

Les tests de régression, les tests de comparaison et les tests de corrélation sont les trois principales variétés de tests statistiques.

Quels sont les tests statistiques dans SPSS ?

Les tests T, le chi carré, la corrélation, la régression et l'analyse de la variance font partie des tests statistiques disponibles dans SPSS.

Quelles sont les deux principales méthodes en statistique ?

En statistique, il existe deux méthodes principales : les statistiques descriptives, qui résument les données à l'aide d'indices tels que la moyenne et la médiane, et les statistiques inférentielles, qui tirent des conclusions à partir de données à l'aide de tests statistiques tels que le test t de l'étudiant.

L'ANOVA est-elle un test statistique ?

ANOVA, qui signifie Analyse de variance, est un test statistique utilisé pour comparer les moyennes de plusieurs groupes.

Conclusion

Des tests statistiques sont utilisés pour déterminer si deux ensembles de données sont significativement différents l'un de l'autre. Les tests statistiques sont classés en deux types : paramétriques et non paramétriques. Les tests paramétriques font des hypothèses sur les données, tandis que les tests non paramétriques ne font aucune hypothèse sur les données. Les deux types de tests sont utilisés pour tirer des conclusions sur une population à partir d'un échantillon. Le type de test à utiliser est déterminé par le type de données disponibles.

  1. ANALYSE STATISTIQUE : types, techniques et objectifs
  2. Planification de la demande : aperçu, comparaisons, salaires et emplois
  3. MÉTHODES STATISTIQUES : Ce que vous devez savoir et guide
  4. Quel est le meilleur type de test de dépistage de drogue à utiliser pour les dépistages des employés ?
  5. Salaire quant: une ventilation complète et comment devenir un quant

Bibliographie

Soyez sympa! Laissez un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *

Vous aimeriez aussi