Objectifs d'apprentissage
Connaitre les concepts suivants:
- Distribution à deux caractères et corrélation
- Corrélation linéaire et autre interprétation qualitative
- Coefficient de corrélation
- Droite de régression
THÉORIE
- Histogramme, diagramme en bandes verticales collées entre elle et qui représente des données regroupées en classes.
Source: pixabay
Tableaux de données:
- Le tableau de données condensées est utilisé quand il y a un grand nombre de données qui ont tendance à se répéter. L'effectif correspond au nombre de fois que la donnée se répète.
- Le tableau de données groupées par classes est utilisé quand un grand nombre de données ne se répète pas. Chaque caisse est écrite sous forme d'intervalle. L'effectif correspond au nombre de données dans chaque classe. L'amplitude de chaque classe est calculée de la façon suivante:(Plus grande donnée - plus petite donnée)/ Nombre de classes
Nuage de points
- Le nuage de points est une représentation de données d'une distribution à un ou plusieurs caractères dans laquelle chaque donnée est représentée par un point.
- Il permet de mettre en évidence la corrélation entre au moins deux variables.
La corrélation entre deux ou plusieurs variables et le lien qui peut exister entre ces variables. Elle est caractérisée par un sens et une intensité.
- Une corrélation linéaire positive correspond à une corrélation dont la droite de régression a une pente positive. (les valeurs des deux variables augmentent en même temps)
- Une corrélation linéaire négative correspond à une corrélation dont la droite de régression a une pente négative. (Les valeurs d'un des variables augmente quand l'autre diminue).
- Une corrélation linéaire nulle correspond à une absence de corrélation.
Le sens de la corrélation
Coefficient de corrélation
La valeur du coefficient de corrélation est comprise entre -1 et 1.
Corrélation et type de fonction
- Fonction polynomiale du premier degré
- Fonction polynomiale du second degré
Si nous avons le sommet et un point, il faut utiliser la formule canonique pour trouver le "a" et ensuite nous avons l'équation.
- Fonction en escalier ou partie entière, il faut simplement la reconnaitre.
Extrapolation
Une estimation d'une donnée à l'extérieur des valeurs données
Interpolation
Une estimation d'une donnée à l'intérieur des valeurs données
Droite de régression
La droite de régression est la droite dans le nuage de points qui représente le mieux la distribution.
y = ax + b
Méthode du rectangle
La droite de régression est la droite dans le nuage de points qui représente le mieux la distribution.
y = ax + b
Méthode du rectangle
- Faire le nuage de points.
- Tracer une droite qui représente le mieux le nuage de points, elle doit passer par le milieu du nuage.
- Construire un rectangle qui englobe toutes les données sans inclure la ou les données aberrantes.
- Mesurer les côtés du rectangle.
- Calculer le coefficient de corrélation àa l'aide de la formule
Droite de régression
La droite de régression est la droite dans le nuage de points qui représente le mieux la distribution. y = ax + b
La droite de régression est la droite dans le nuage de points qui représente le mieux la distribution. y = ax + b
Méthode intuitive:
La méthode intuitive devrait porter attention de séparer le nuage en deux parties comportant à peu près le même nombre de points afin que la droite soit plus précise.
La méthode intuitive devrait porter attention de séparer le nuage en deux parties comportant à peu près le même nombre de points afin que la droite soit plus précise.
Méthode de la droite de Mayer
Attention, la méthode de Mayer est sensible aux points éloignés.
Exemple:
Attention, la méthode de Mayer est sensible aux points éloignés.
- Placer les couples en ordre croissant de leurs abscisses.
- Diviser la distribution en deux de façon la plus égale possible.
- Calculer la moyenne des abscisses des deux groupes.
- Calculer la moyenne des ordonnées des deux groupes.
- Tracer la droite de régression passant par les deux points trouvés.
- Calculer la pente
- Trouver l'équation
Exemple:
Méthode des points médians (méthode de la droite médiane-médiane)
Comme la médiane-médiane impose de séparer les données dans trois groupes avec, pour le groupe central seulement, la possibilité d'avoir un nombre de données différent des deux autres. Cette méthode représente mieux lorsqu'il y a beaucoup de données ou bien lorsqu'il y a des données aberrantes.
- Placer les couples en ordre croissant de leurs abscisses,
- Diviser la distribution en trois de façon le plus égale possible sinon il faut s'assurer que le premier et le dernier groupe comptent obligatoirement le même nombre.
- Déterminer la médiane des abscisses des groupes.
- Déterminer la médiane des ordonnées des groupes.
- Calculer la moyenne des abscisses des couples médians.
- Calculer la moyenne des ordonnées des couples médians.
- Calculer la pente à partir des poins m.dians du premier et du dernier groupe.
- Trouver l'équation de la droite à partir du point obtenu par les calculs effectuées en 5 et 6.
Mode: La donnée a plus fréquente
- Dans un tableau de données condensées, le mode est la donnée la plus fréquente donc la donnée dont la colonne est la plus élevée.
- Dans un tableau de données regroupées par classe, le mode est le milieu de la classe modale.
Classe modale: La classe dont la fréquence est la plus élevée.
Moyenne: Mesure de tendance centrale.
Exemple:
Dans un tableau de données condensées, la Mayenne se calcule:
Donnée x fréquence - On trouve le produit pour chaque range ensuite on fait la somme et on divise le résultat par le nombre total de donnée.
Exemple:
Dans un tableau de données regroupées par classe, la moyenne est
Point milieu x fréquence - On trouve le produit pour chaque classe ensuite on fait la somme et on divise par le nombre total de donnée.
Dans un tableau de données regroupées par classe, la moyenne est
Point milieu x fréquence - On trouve le produit pour chaque classe ensuite on fait la somme et on divise par le nombre total de donnée.
Médiane:
Mesure de tendance centrale, il faut quelle distribution soit classée par ordre croissant. La façon de déterminer la médiane peut varier selon le type de distribution.
Dans un tableau de données condensées, la médiane:
Compter le nombre de données
- Si le nombre de données est impair
- Si le nombre de données est pair, il faut faire la moyenne des deux données.
Aller voir la position obtenue dans le tableau afin de déterminer la médiane.
Exemple:
L'important c'est d'avoir le même nombre de données à gauche et à droite de la ligne ou du cercle.
Dans un tableau de données regroupées par classe, la médiane est le milieu de la classe tout en calculant le nombre de donnée et en utilisant le nombre pair ou impair.
Étendue: La donnée la plus élevée moins la donnée la plus petite. (Maximun - minimum)