Test d'adéquation

nombre de valeurs possibles
tout aussi possible
résultat Observations valeur attendue

Qu'est-ce que la qualité de l'ajustement ?

La qualité de l'ajustement évalue dans quelle mesure les données observées correspondent aux valeurs attendues d'un modèle

 statistique .

 
Au fur et à mesure que vous approfondissez

 les statistiques , vous demandez souvent : « Dans quelle mesure mon modèle s'adapte-t-il à mes données ? Votre modèle est très bien. Coupe basse ? Il faudrait peut-être reconsidérer le modèle. C’est l’essence même de la qualité de l’ajustement. Plus précisément :

Un modèle bien adapté aux données peut fournir des prédictions précises et des informations plus approfondies, tandis qu’un mauvais ajustement peut conduire à des conclusions et des prédictions trompeuses. Assurer une bonne adéquation est essentiel pour obtenir des résultats fiables et une action éclairée.
La mesure de l'adéquation de l'ajustement résume l'ampleur de la différence entre les données observées et les valeurs attendues par le modèle. Les tests d'adéquation déterminent si les différences sont statistiquement significatives. De plus, ils peuvent nous guider dans le choix de modèles offrant de meilleures représentations. Les mesures et tests d'ajustement appropriés dépendent du réglage.
 

Qualité de l'ajustement dans les modèles de régression

Dans les modèles de régression, il est essentiel de comprendre la qualité de l'ajustement pour garantir des prédictions précises et des informations significatives ; nous examinerons ici de plus près les mesures clés qui révèlent la cohérence avec les données.
Les modèles de régression s'ajustent bien aux données lorsque les différences entre les valeurs observées et prédites sont faibles et impartiales. Les statisticiens appellent ces différences des résidus.

À mesure que la qualité de l'ajustement augmente, les points de données se rapprochent de la ligne ajustée du modèle.

R-carré (R²)
R-carré est la statistique d'adéquation d'un modèle de régression linéaire. Il utilise une échelle pratique de 0 à 100 % pour mesurer le pourcentage de variation de la variable dépendante expliquée par le modèle.

R-carré évalue la distribution des données autour de la droite de régression ajustée. Pour un ensemble de données, une valeur R au carré plus élevée indique une différence plus petite entre les données de l'échantillon et les valeurs ajustées.

Le modèle avec la distribution la plus large a un R au carré de 15 %, tandis que le modèle avec la distribution la plus étroite a un R au carré de 85 %.


Considérez R² comme le pourcentage de variation expliquée. Plus le R² est élevé, meilleur est l’ajustement.


R² High : votre modèle capture de nombreuses variations.
R² faible : le modèle ne peut pas expliquer la majeure partie de la variance.

N'oubliez pas que ce n'est pas le seul indicateur. Un R² élevé ne signifie pas toujours un modèle parfait !

Erreur type de régression (S)

Cette erreur type de régression est une mesure de l’adéquation de l’ajustement qui fournit la taille typique de la différence absolue entre les valeurs observées et prédites. S utilise les unités de la variable dépendante (DV).

Une petite valeur S : la valeur prédite est proche de la valeur des données.
Une valeur S élevée signifie un écart important par rapport à la valeur prédite.
Supposons que votre modèle utilise l'indice de masse corporelle (IMC) pour prédire le pourcentage de graisse corporelle (DV). Ainsi, si votre modèle a une valeur S de 3,5, alors vous savez que sa valeur prédite est généralement 3,5 % supérieure à la valeur du pourcentage de graisse corporelle observée. Cependant, ne l'examinez pas de manière isolée. Cela doit être comparé aux unités de la variable dépendante pour comprendre son contexte.