regression linéaire

Comment déterminer une droite de régression linéaire ?

Au sommaire de cet article 👀

Les statistiques à deux variables permettent d’étudier la relation entre deux variables numériques. Ces relations peuvent apparaître dans différents domaines comme la physique, la biologie ou l’économie, et il s’agit souvent d’observer comment une variable (la variable dépendante \( Y \)) évolue en fonction d’une autre variable (la variable indépendante \( X \)).

Nuage de points

Nuage de points : Il s’agit de la représentation graphique de données statistiques où chaque point correspond à une observation. L’axe des abscisses (\(X\)) représente la variable indépendante, et l’axe des ordonnées (\(Y\)) représente la variable dépendante.

Exemple :

Imaginons que nous ayons des données sur les heures d’étude (\(X\)) et les notes obtenues (\(Y\)) de 5 élèves.

\[
\begin{array}{|c|c|c|}
\hline
\text{Étudiant} & \text{Heures d’étude (X)} & \text{Note obtenue (Y)} \\
\hline
1 & 2 & 58 \\
\hline
2 & 3 & 65 \\
\hline
3 & 5 & 80 \\
\hline
4 & 7 & 85 \\
\hline
5 & 8 & 90 \\
\hline
\end{array}
\]

Le nuage de points peut être tracé à l’aide d’une calculatrice graphique.

regression linéaire

Point moyen

Le point moyen est un point fictif qui résume la tendance centrale des données en termes de coordonnées moyennes.

Coordonnées du point moyen :

  • L’abscisse du point moyen est la moyenne des \( X \), soit \( \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \).
  • L’ordonnée du point moyen est la moyenne des \( Y \), soit \( \bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i \).

Exemple :

Pour les données précédentes, les coordonnées du point moyen sont calculées ainsi :

– \( \bar{X} = \frac{2 + 3 + 5 + 7 + 8}{5} = 5 \),

– \( \bar{Y} = \frac{58 + 65 + 80 + 85 + 90}{5} = 75.6 \).

Le point moyen est donc \( (5, 75.6) \).

Ajustement affine : Droite de régression linéaire

La droite de régression linéaire permet d’estimer la relation entre deux variables selon un modèle affine \( Y = aX + b \).

– \( a \) représente le coefficient directeur,

– \( b \) est la valeur de \( Y \) lorsque \( X = 0 \), autrement dit l’ordonnée à l’origine.

Les calculatrices graphiques permettent de calculer automatiquement la droite de régression à partir des données saisies et d’obtenir directement l’équation de la droite.

Exemple :

Si nous entrons les données de notre tableau précédent dans une calculatrice, celle-ci nous donnera l’équation de la droite de régression linéaire, qui pourrait être par exemple :

\( Y = 5.42X + 48.5 \)

Cela signifie que pour chaque heure d’étude supplémentaire, la note augmente en moyenne de 5,42 points.

Coefficient de corrélation

Le coefficient de corrélation linéaire \( r \) est un nombre compris entre -1 et 1 qui mesure la force et la direction de la relation linéaire entre les deux variables.

– Si \( r = 1 \), il y a une corrélation positive parfaite,

– Si \( r = -1 \), il y a une corrélation négative parfaite,

– Si \( r = 0 \), cela signifie qu’il n’y a aucune corrélation linéaire.

Ce coefficient est également calculé par la calculatrice en même temps que la droite de régression.

Exercices

Exercice 1 : L’évolution de la température terrestre

Données

Voici les températures moyennes mondiales relevées sur plusieurs années, où l’année 2000 correspond à \( X = 0 \) :

\[
\begin{array}{|c|c|}
\hline
\text{Année (année depuis 2000) } X & \text{Température (°C) } Y \\
\hline
0 & 14.5 \\
\hline
5 & 14.6 \\
\hline
10 & 14.7 \\
\hline
15 & 14.8 \\
\hline
20 & 14.9 \\
\hline
\end{array}
\]

  1. Représenter le nuage de points avec votre calculatrice.
  2. Calculez la droite de régression linéaire à l’aide de votre calculatrice.
  3. Quelle était la température moyenne en 2012 ?
  4. Quelle sera la température moyenne en 2030 ?

Correction de l’exercice :

  1. Représentation du nuage de points

regression linéaire

  1. Droite de régression linéaire

Une fois les points tracés, la calculatrice graphique peut calculer la droite de régression linéaire, elle a pour équation :

\(  Y = 0.02X + 14.5 \)

Ici :

– \( a = 0.02 \) indique que la température augmente de 0,02°C par an,

– \( b = 14.5 \) est la température moyenne en 2000 (année de référence).

  1. Quelle était la température moyenne en 2012 ?

Pour mesurer la température en 2012, on utilise \( X = 12 \), car 2012 correspond à \( 2000 + 12 \).

On remplace \( X = 12 \) dans l’équation de la droite de régression :

\( Y = 0.02 \times 12 + 14.5 = 0.24 + 14.5 = 14.74 \)

Donc, en 2012, la température moyenne était estimée à 14,74°C.

  1. Quelle sera la température moyenne en 2030 ?

Pour mesurer la température en 2030, on utilise \( X = 30 \), car 2030 correspond à \( 2000 + 30 \).

On remplace \( X = 30 \) dans l’équation de la droite de régression :

\( Y = 0.02 \times 30 + 14.5 = 0.6 + 14.5 = 15.1 \)

Donc, en 2030, la température moyenne est estimée à 15,1°C.

Exercice 2 : Évolution du nombre de naissances dans une ville

Le tableau suivant montre l’évolution du nombre de naissances dans une ville, avec \( x \) représentant les années à partir de 2010 (c’est-à-dire \( x = 0 \) pour 2010, \( x = 2 \) pour 2012, etc.) :

\[
\begin{array}{|c|c|c|}
\hline
\text{Année} & x \text{ (Année à partir de 2010)} & \text{Nombre de naissances } Y \\
\hline
2010 & 0 & 350 \\
\hline
2012 & 2 & 340 \\
\hline
2014 & 4 & 330 \\
\hline
2016 & 6 & 315 \\
\hline
2018 & 8 & 300 \\
\hline
\end{array}
\]

  1. Représentez les données sur un nuage de points avec votre calculatrice.
  2. Calculez la droite de régression à l’aide de la calculatrice.
  3. Prédiction : En quelle année le nombre de naissances sera-t-il inférieur à 250 ?

Correction de l’exercice :

  1. Représentation graphique sur un nuage de points

regression linéaire

  1. Calcul de la droite de régression :

La droite de régression est de la forme :  \( Y = ax + b \)

Grâce à une calculatrice ou un tableur, nous pouvons trouver les coefficients \( a \) (pente) et \( b \) (ordonnée à l’origine).

Nous trouvons :

–  \( a \approx -6.25 \)

– \( b \approx 350 \)

Ainsi, l’équation de la droite de régression est : \( Y = -6.25x + 350 \).

  1. En quelle année le nombre de naissances sera-t-il inférieur à 250 ?

Pour trouver quand le nombre de naissances sera inférieur à 250, on résout l’équation suivante :

\[
\begin{align*}
-6.25x + 350 &< 250 \\
-6.25x &< 250 – 350 \\
-6.25x &< -100 \\
x &> \frac{-100}{-6.25} \\
x &> 16
\end{align*}
\]

Donc, le nombre de naissances sera inférieur à 250 lorsque \( x > 16 \), c’est-à-dire 16 ans après 2010.

Réponse : Le nombre de naissances sera inférieur à 250 après l’année 2026.

Tu veux plus d’informations et de conseils pour réussir tes examens et trouver ton orientation ? Rejoins-nous sur Instagram et TikTok !