Aller au contenue
Retour aux domaines
Retour aux domaines

Données : Ensemble de données à une et à deux variables

Concepts clés

Types de données

  • Les données qualitatives impliquent des variables non numériques qui peuvent être classées en catégories, comme les types de sports, les moyens de transport ou les couleurs.
  • Les données quantitatives font référence aux variables numériques obtenues par le comptage ou par la mesure, et qui sont exprimées par un nombre ou une quantité. Il existe deux types de variables quantitatives, soit la variable quantitative discrète et la variable quantitative continue.
    • Les variables quantitatives discrètes
      • ont une valeur finie. Elles peuvent être comptées.
      • ne peuvent prendre que certaines valeurs d’un intervalle de nombres réels, ​généralement des nombres entiers (par exemple, le nombre de côtés d’un solide, le nombre de personnes dans une famille).
      • peuvent aussi prendre une valeur qui n’est pas un nombre entier (par exemple, la taille des souliers peut être \(7\) ou \(7\frac{1}{2}\)).
    • Les variables quantitatives continues
      • peuvent être mesurées.
      • peuvent prendre toutes les valeurs possibles d’un intervalle de nombres réels (par exemple, la masse d’un chien, le volume d’un cône).

Analyse de données

  • ​Pour qu’un échantillon soit représentatif d’une population, il doit être recueilli…
    • de manière appropriée : la méthode de sélection de l’échantillon doit être bien pensée pour assurer que chaque groupe de la population ait une chance égale ou proportionnelle d’être inclus, afin d’éviter les biais.
    • et de manière systématique : le processus de collecte de données doit suivre une procédure rigoureuse et cohérente pour garantir que l’échantillon reflète fidèlement la diversité et les caractéristiques de l’ensemble de la population.
  • L’analyse des mesures de tendance centrale et de la distribution d’un ensemble de données sert à tirer des conclusions pertinentes (par exemple, la moyenne est un bon indicateur, car l’étendue des données est petite ou la moyenne n’est pas un bon indicateur, car on remarque la présence de données aberrantes).
  • Le choix du type de diagramme ou de représentation graphique que l’on effectue pour visualiser les données doit être fait en fonction de la nature des données (quantitatives ou qualitatives) et de ce que l’on cherche à démontrer, à analyser ou à communiquer avec celles-ci.
  • Les modèles de régression sont des outils statistiques utilisés pour analyser la corrélation entre deux variables. Ils servent à déterminer si la variable dépendante est affectée par la variable indépendante et de quelle manière. La relation peut être représentée par un modèle linéaire (par exemple, une droite) ou non linéaire (par exemple, polynomiale, exponentielle, logarithmique).

Processus de modélisation mathématique

  • Le processus de modélisation mathématique comporte :
    • la formulation de questions et de suppositions;
    • la détermination de données pertinentes à collecter en fonction de la question analysée;
    • l’élaboration et la mise en œuvre d’un plan de collecte de données approprié;
    • la création d’un modèle mathématique adapté aux données et répondant à la question;
    • l’analyse, l’évaluation et la modification de ce modèle.

Titre du schéma : La modélisation mathématique.

Le schéma est formé de 4 cases dont certaines d’entre elles sont interreliées par des doubles flèches. Les cases 1, 2 et 4 se superposent à un cercle gris. Au-dessus des cases 1 et 2, il est écrit : « Situation de la vie quotidienne ». La case 1 s’intitule « Comprendre le problème ». Elle se lit comme suit. Première puce : « À quelles questions faut-il répondre? » Deuxième puce : « Quels sont les renseignements nécessaires? » Elle est interreliée à la case 2, qui s’intitule « Analyser la situation ». La case 2 se lit comme suit. Première puce : « Quelles sont les suppositions que je dois formuler à propos de la situation? » Deuxième puce : « Qu’est-ce qui change et qu’est-ce qui reste identique? » Elle est interreliée à la case 3, qui s’intitule « Créer un modèle mathématique ». La case 3 se lit comme suit. Première puce : « Quels représentations, outils, technologies et stratégies aideront à élaborer le modèle? » Deuxième puce : « Quels connaissances, habiletés et concepts mathématiques pourraient être utiles? » Elle est interreliée à la case 4, qui est placée sous les cases 1 et 2, auxquelles la case 4 est également interreliée. Celle-ci s’intitule « Analyser et évaluer le modèle ». Au-dessus de la case 4, il est écrit : « Modèle communiqué et mis en application. » La case 4 se lit comme suit. Première puce : « Ce modèle peut-il fournir une solution? » Deuxième puce : « Quels sont les autres modèles possibles? »


Types de données, ​types de diagrammes et représentations

Le tableau ci-dessous fournit un aperçu des types de données et des types de diagrammes, pour chaque année d’études, avec lesquels travailleront les élèves. Il est à noter que les diagrammes des années d’études précédentes sont toujours pertinents pour l’année d’études en cours selon les types de données analysées.

Année d’études Types de données Type de diagrammes et de représentation Mesures de tendance centrale et de dispersion
1re données concernant un seul élément d’information (source primaire)
2e données concernant deux éléments d’information mode
3e données qualitatives et quantitatives moyenne
4e données qualitatives et quantitatives (source primaire et secondaire) médiane
5e données qualitatives et quantitatives
6e données qualitatives et quantitatives, discrètes et continues étendue
7e données qualitatives et quantitatives, discrètes et continues (une variable)
8e
  • données qualitatives et quantitatives, discrètes et continues (deux variables)
  • données aberrantes
9e données qualitatives et quantitatives, discrètes et continues (deux variables) étendue interquartile

Réflexion

  • Comment les choix de diagrammes peuvent-ils influencer la manière dont les élèves interprètent et comprennent les données présentées?
  • Quels sont les effets de l’utilisation de données biaisées ou non représentatives? Comment peut-on sensibiliser les élèves à ce genre de questions?
  • Considérez des situations réelles dans lesquelles des personnes collectent des données.
    • Pourquoi pourrait-on collecter ces données?
    • Qui collecte ces données?
    • Qui utilise ces données?
    • À quoi servent ces données?