MAT-4152

Objectifs d'apprentissage

Connaitre les concepts suivants:

  • Diagramme à tige et à feuilles
  • Mesures de position et de dispersion
  • Distribution et corrélation
  • Coefficient de corrélation linéaire et droite de régression

THÉORIE

Tableaux de données:
  • Le tableau de données condensées est utilisé quand il y a un grand nombre de données qui ont tendance à se répéter. L'effectif correspond au nombre de fois que la donnée se répète.

  • Le tableau de données groupées par classes est utilisé quand un grand nombre de données ne se répète pas. Chaque caisse est écrite sous forme d'intervalle. L'effectif correspond au nombre de données dans chaque classe. L'amplitude de chaque classe est calculée de la façon suivante:(Plus grande donnée - plus petite donnée)/ Nombre de classes

Mode: La donnée a plus fréquente

  • Dans un tableau de données condensées, le mode est la donnée la plus fréquente donc la donnée dont la colonne est la plus élevée.
  • Dans un tableau de données regroupées par classe, le mode est le milieu de la classe modale.



Classe modale: La classe dont la fréquence est la plus élevée.

Moyenne: Mesure de tendance centrale.

Exemple: On additionne toutes les données et on divise par le nombre de données.

Exemple: 
Dans un tableau de données condensées, la Mayenne se calcule:
Donnée x fréquence - On trouve le produit pour chaque range ensuite on fait la somme et on divise le résultat par le nombre total de donnée.

Exemple:
Dans un tableau de données regroupées par classe, la moyenne est
Point milieu x fréquence - On trouve le produit pour chaque classe ensuite on fait la somme et on divise par le nombre total de donnée.

Médiane: 
Mesure de tendance centrale, il faut quelle distribution soit classée par ordre croissant. La façon de déterminer la médiane peut varier selon le type de distribution.

Dans un tableau de données condensées, la médiane:

Compter le nombre de données
  • Si le nombre de données est impair 
  • Si le nombre de données est pair, il faut faire la moyenne des deux données.

Aller voir la position obtenue dans le tableau afin de déterminer la médiane.

Exemple: 

L'important c'est d'avoir le même nombre de données à gauche et à droite de la ligne ou du cercle.


Dans un tableau de données regroupées par classe, la médiane est le milieu de la classe tout en calculant le nombre de donnée et en utilisant le nombre pair ou impair.

Étendue: La donnée la plus élevée moins la donnée la plus petite. (Maximun - minimum)

Diagramme à tige et à feuilles
Le diagramme à tige et à feuilles est utilisé lorsqu'il y a une ou deux distributions à un caractère.

  • Chaque donnée individuelle est représentée par sa tige (premiers chiffres communs à plusieurs données) et sa feuille (derniers chiffres de ces mêmes données).
  • Chaque ligne est associée à une classe.
  • Les données sont placés d'un côté ou l'autre de la colonne.


Rang centile

Pour trouver le rang centile d'une données

Exemple: Déterminer le rang centile de 17.
Pour trouver la donnée dont on connait le rang centile


Exemple: Déterminer la donnée dont le rang centile est de 34.


Écart moyen

La moyenne entre les écarts de chacune des données par rapport à la moyenne.

Diagrammes
  • Diagramme à bandes est généralement utilisé pour des données à caractère qualitatif ou quantitatif discret.
Source: Pixabay

  • Histogramme, diagramme en bandes verticales collées entre elle et qui représente des données regroupées en classes.
Source: pixabay



Distribution à deux caractères

Ensemble des couples de données


Tableau à double entrée

  • Il permet de représenter les deux variables de la distribution.
  • Il peut qualifier le sens en regardant la concentrations effectifs autour de la diagonale.


Exemple:


Nuage de points


  • Le nuage de points est une représentation de données d'une distribution à un ou plusieurs caractères dans laquelle chaque donnée est représentée par un point.
  • Il permet de mettre en évidence la corrélation entre au moins deux variables.

Corrélation linéaire

La corrélation entre deux ou plusieurs variables et le lien qui peut exister entre ces variables. Elle est caractérisée par un sens et une intensité.

  • Une corrélation linéaire positive correspond à une corrélation dont la droite de régression a une pente positive. (les valeurs des deux variables augmentent en même temps)
  • Une corrélation linéaire négative correspond à une corrélation dont la droite de régression a une pente négative. (Les valeurs d'un des variables augmente quand l'autre diminue).
  • Une corrélation linéaire nulle correspond à une absence de corrélation.
Le sens de la corrélation

Coefficient de corrélation
La valeur du coefficient de corrélation est comprise entre -1 et 1.

Méthode du rectangle 

  • Faire le nuage de points.
  • Tracer une droite qui représente le mieux le nuage de points, elle doit passer par le milieu du nuage.
  • Construire un rectangle qui englobe toutes les données sans inclure la ou les données aberrantes.
  • Mesurer les côtés du rectangle.
  • Calculer le coefficient de corrélation àa l'aide de la formule

Droite de régression

La droite de régression est la droite dans le nuage de points qui représente le mieux la distribution.    y = ax + b

Méthode intuitive: 
La méthode intuitive devrait porter attention de séparer le nuage en deux parties comportant à peu près le même nombre de points afin que la droite soit plus précise.


Méthode du point moyen

  • Calculer la moyenne des abscisses (x,  )
  • Calculer la moyenne des ordonnées (  , y)
  • Coordonnées du point P avec les moyennes (x, y)
  • Tracer la droite représentative
  • Calculer la pente de la droite
  • Trouver l'équation de la droite

Exemple:
Méthode des points médians (méthode de la droite médiane-médiane)

Comme la médiane-médiane impose de séparer les données dans trois groupes avec, pour le groupe central seulement, la possibilité d'avoir un nombre de données différent des deux autres. Cette méthode représente mieux lorsqu'il y a beaucoup de données ou bien lorsqu'il y a des données aberrantes.

  1. Placer les couples en ordre croissant de leurs abscisses,
  2. Diviser la distribution en trois de façon le plus égale possible sinon il faut s'assurer que le premier et le dernier groupe comptent obligatoirement le même nombre.
  3. Déterminer la médiane des abscisses des groupes.
  4. Déterminer la médiane des ordonnées des groupes.
  5. Calculer la moyenne des abscisses des couples médians.
  6. Calculer la moyenne des ordonnées des couples médians.
  7. Calculer la pente à partir des poins m.dians du premier et du dernier groupe.
  8. Trouver l'équation de la droite à partir du point obtenu par les calculs effectuées en 5 et 6.






Copyright © 2018 Blogue à part Tous droits réservés.