Les statistiques descriptives en mathématiques

Les statistiques descriptives

Au sommaire de cet article 👀

Dans cet article, nous allons travailler ensemble sur une notion fondamentale en mathématiques : les statistiques descriptives ! Tu vas retrouver cette notion dans de nombreux concepts et théorèmes au baccalauréat et dans le post-bac, il est donc primordial de la comprendre et de savoir l’utiliser. Cet article est justement là pour te permettre de maîtriser toutes les mesures et calculs autour des statistiques descriptives. Tu pourras même t’entraîner avec un exercice corrigé à la fin de cet article !

Qu’est-ce que les statistiques descriptives ?

Les statistiques descriptives sont une partie spécifique des statistiques permettant de décrire et de donner des informations sur un ensemble de données (chiffrés ou non). En effet, les différentes formules des statistiques descriptives vont permettre de mesurer et d’obtenir des informations sur des ensembles de nombres, le plus souvent présentés sous forme de série.

Pour rappel, une série de nombres désigne une suite de nombres qui sont souvent associée à une notion externe. Une série peut être ordonnée par ordre croissant ou décroissant, mais elle peut aussi ne pas être ordonnée. Les notions de séries et de statistiques descriptives sont au cœur du programme de spécialité mathématique.

📊 Exemple de série statistique

Par exemple, prenons la série de notes en Histoire-Géographie, Géopolitique et Sciences Politiques (HGGSP) de Tom, un élève de Terminale : 12, 16, 13, 17.5, 20, 11.

Les statistiques descriptives vont nous permettre de tirer des informations utiles de cette série, comme la moyenne, la médiane, l’étendue ou encore les écarts par rapport à la moyenne.

On va retrouver ainsi différentes mesures et formules dans les statistiques descriptives que nous allons découvrir ensemble par la suite : la moyenne, la médiane, la variance, l’écart-type et les quartiles.

👉🏻 Tu as besoin d’un petit coup de pouce en mathématiques sur les racines carrées ou sur la fonction valeur absolue ? Jette un coup d’œil à nos articles sur tout ce qu’il faut savoir sur les racines carrées ou sur tout ce qu’il faut connaître sur la valeur absolue 👈🏻

La moyenne, notion centrale des statistiques descriptives

La moyenne est la notion principale des statistiques descriptives et tu la retrouveras dans de nombreux exercices. La moyenne désigne la somme de l’ensemble des valeurs d’une série divisée par le nombre d’éléments de cette série.

Si on prend une série de \( n \) valeurs, \( x_1, x_2, \ldots, x_n \). Il y a donc \( n \) éléments dans la série et la moyenne de cette série est donc donnée par la formule suivante :

\[ \displaystyle \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

Si on reprend notre exemple de la série des notes en HGGSP de Tom : \( 12, 16, 13, 17.5, 20, 11 \)

On calcule d’abord la somme de la série :

\[ \displaystyle
\sum_{i=1}^{6} x_i = 12 + 16 + 13 + 17.5 + 20 + 11 = 89.5
\]

Or, il y a 6 éléments dans la série, on a donc la moyenne des notes qui est égale à :

\[ \displaystyle
\bar{x} = \frac{89.5}{6} \approx 14.92
\]

On en conclut qu’en moyenne, Tom a eu 14,92 en HGGSP ce trimestre.

⚠️ Attention à ne pas faire d’erreur de rédaction dans tes calculs, surtout dans les matières scientifiques ! ⚠️

La médiane en statistiques descriptives

La médiane est différente de la moyenne ! En effet, la médiane désigne la valeur qui sépare une série de nombres ou un ensemble de valeurs en deux parties égales. Autrement dit, il y a autant d’éléments à gauche et à droite de la médiane.

Pour trouver la médiane, on commence le plus souvent par ordonner la série par ordre croissant. Il faut alors trouver la valeur qui coupe l’ensemble de la série en deux parts égales.

Si le nombre d’éléments de la série est impair, alors la médiane est la valeur centrale de la série. Si le nombre d’éléments de la série est pair, alors la médiane est la moyenne des deux valeurs centrales.

Avec notre exemple des notes d’HGGSP, on commence par ordonner la série par ordre croissant :

\[
11,\ 12,\ 13,\ 16,\ 17.5,\ 20
\]

Or, il y a 6 éléments dans la série, donc un nombre pair d’éléments.

La médiane est donc la moyenne des deux valeurs centrales qui sont 13 et 16 :

\[ \displaystyle
\text{Médiane} = \frac{13 + 16}{2} = \frac{29}{2} = 14.5
\]

La médiane des notes de Tom en HGGSP est donc égale à 14.5.

Si on avait pris une autre série, comme le prix des différents légumes d’un maraîcher : \( 1.99,\ 3.50,\ 8.75,\ 7.20,\ 4.30 \)

On les classe par ordre croissant :

\[ \displaystyle
1.99,\ 3.50,\ 4.30,\ 7.20,\ 8.75
\]

Il y a 5 éléments dans la série. Donc la médiane est la valeur centrale de la série, soit 4,30 €.

La médiane des prix des légumes du maraîcher est donc égale à 4,30 €.

La variance en statistiques descriptives

La variance permet de mesurer la dispersion des valeurs d’une série de nombres, autrement dit, la variance va nous permettre de savoir si les valeurs sont très éloignées de la moyenne d’une série.

Si on prend une série de \( n \) valeurs, \( x_1, x_2, \ldots, x_n \). Il y a donc \( n \) éléments dans la série et la variance de cette série est donc donnée par la formule suivante:

\[ \displaystyle V(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i – \bar{x})^2 \]

Pour en apprendre plus sur la variance avec des variables aléatoires, tu peux lire cet article sur tout ce qu’il faut savoir sur l’espérance et la variance 👀

Si on reprend notre exemple des notes de Tom, on trouve alors que la variance est donnée par :

\[ \displaystyle V(X) = \frac{1}{6} \Big[ (11 – 14.92)^2 + (12 – 14.92)^2 + (13 – 14.92)^2 + (16 – 14.92)^2 + (17.5 – 14.92)^2 + (20 – 14.92)^2 \Big] \]
\[ \displaystyle V(X)= \frac{1}{6} \Big[ (-3.92)^2 + (-2.92)^2 + (-1.92)^2 + (1.08)^2 + (2.58)^2 + (5.08)^2 \Big] \]
\[ \displaystyle V(X)= \frac{1}{6} \left[ 15.37 + 8.53 + 3.69 + 1.17 + 6.66 + 25.81 \right] \]
\[ \displaystyle V(X) = \frac{61.23}{6} \approx 10.21 \]

La variance de cette série est donc environ égale à 10,21.

L’écart-type en statistiques descriptives

L’écart-type est un autre moyen de mesurer la dispersion des valeurs d’une série de nombres. La formule pour obtenir l’écart-type est celle de la racine carrée de la variance. Autrement dit, si on prend une série de \( n \) valeurs, \( x_1, x_2, \ldots, x_n \). Il y a donc \( n \) éléments dans la série et l’écart-type de cette série est donc donnée par la formule suivante :

\[ \displaystyle \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i – \bar{x})^2} \]

Les quartiles en statistiques descriptives

La notion de quartiles est aussi primordiale dans les statistiques descriptives et on te demandera souvent de donner les différents quartiles d’une série. On parle de quartiles, lorsqu’on sépare une série de nombres en quatre parties égales. Pour trouver les quartiles, on commence par trier la série par ordre croissant.

Le premier quartile \( Q_1 \) désigne les premiers 25% de la série, autrement dit la médiane de la première moitié. Le deuxième quartile \( Q_2 \) est la médiane. Le troisième quartile \( Q_3 \) désigne les 75% de la série, autrement dit la médiane de la moitié de droite.

Représentations graphiques des statistiques descriptives

Les deux représentations graphiques que tu dois connaître absolument sont les diagrammes en boîte et les histogrammes, mais il en existe une infinité.

Le diagramme en boîte, aussi connu sous le nom de box-plot, permet de visualiser la dispersion d’une série en identifiant la médiane, les différents quartiles ainsi que la plus petite et la plus grande valeur d’une série.

D’autre part, l’histogramme est un graphique avec un ensemble de barres plus ou moins grandes selon le nombre de fois où apparaît une valeur dans une série. Il permet de connaître la distribution d’une série de nombres.

Exercice d’entraînement sur les statistiques descriptives

Trois élèves de première se retrouvent et comparent leurs 12 notes en mathématiques de l’année. Matéo présente ses notes en maths. Ils décident de calculer le maximum de statistiques descriptives pour mieux comprendre les notes de Matéo.

Voici les notes de Matéo sur l’année de première :

\[ \displaystyle 13.5, 15, 11, 17, 14.5, 16, 12, 18, 13, 14, 16.5, 15.5 \]

Calcule l’espérance, la médiane, la variance, l’écart-type et le troisième quartile de cette série de notes.

Corrigé de l’exercice sur les statistiques descriptives

D’après l’énoncé, il y a 12 notes dans cette série. Pour la moyenne, on additionne toutes les notes et on divise par 12 :

\[ \displaystyle
\bar{x} = \frac{11 + 12 + 13 + 13{,}5 + 14 + 14{,}5 + 15 + 15{,}5 + 16 + 16{,}5 + 17 + 18}{12} = \frac{186}{12} = 15{,}5
\]

La moyenne des notes de Matéo est donc égale à 15,5.

On trie les notes dans l’ordre croissant pour simplifier les calculs suivants :

\[ \displaystyle 11,\ 12,\ 13,\ 13{,}5,\ 14,\ 14{,}5,\ 15,\ 15{,}5,\ 16,\ 16{,}5,\ 17,\ 18 \]

Il y a 12 éléments dans la série. Ainsi, la médiane est la moyenne des deux valeurs centrales :

\[ \displaystyle
\text{Médiane} = \frac{14{,}5 + 15}{2} = 14{,}75
\]

La médiane est égale à 14,75.

Pour la variance, on doit calculer :

\[ \displaystyle
V(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i – \bar{x})^2
\]

Or, après les calculs de la somme, on obtient :
\[ \displaystyle
\bar{x} = 15{,}5
\]
\[ \displaystyle
\sum (x_i – \bar{x})^2 = 76{,}25
\]
\[ \displaystyle
V(X) = \frac{76{,}25}{12} \approx 6{,}354
\]

La variance des notes de Matéo est donc environ égale à 6,35 (on arrondit souvent à deux nombres après la virgule pour simplifier les résultats.

Ainsi, l’écart-type vaut environ 2,52 car :

\[ \displaystyle
\sigma = \sqrt{\text{Var}(X)} \approx \sqrt{6{,}35} \approx 2{,}52
\]

Pour le troisième quartile, on cherche à calculer la médiane de la moitié de droite, autrement dit :

\[ \displaystyle
Q_3 = \frac{16 + 16{,}5}{2} = 16{,}25
\]

Donc, le troisième quartile des notes de Matéo est égale à 16,25.

Ce que tu dois retenir des statistiques

Voilà, tu connais maintenant tout sur les statistiques descriptives ! Tu es désormais capable de donner leur définition ainsi que les mesures indispensables et tu peux effectuer différentes opérations avec les statistiques descriptives ! Tu t’es même entraîné avec un exercice sur cette notion. J’espère que cet article t’a plu. Tu peux retrouver ici toutes nos autres ressources mathématiques et lire cet article sur les techniques de conversion des unités de longueur !

Tu veux plus d’informations et de conseils pour réussir tes examens et trouver ton orientation ? Rejoins-nous sur Instagram et TikTok !

Rejoins la communauté AuFutur !

Reçois directement dans ta boîte mail toutes les infos à connaître pour réussir  ton bac et préparer ton orientation !

Jette un œil à notre Guide du Bac 2025 👀

Nous t’avons concocté un guide exclusif du BAC 2025 👩🏻‍🎓

Tu y trouveras la réponse à toutes les questions que tu te poses. Calendrier, épreuves, coefficients, etc. Tout y est ! 

Alors n’attends plus être télécharge notre guide sans plus tarder 🏃🏻‍♀️