|
Définition |
Le
but principal de la statistique est de déterminer les caractéristiques d'une
population donnée à partir de l'étude d'une partie de cette population,
appelée "échantillon". Statistique nom
féminin (allemand Statistik ;
du latin status, état) Définition
Larousse |
Étapes de l'analyse statistique |
Cinq étapes typiques de la pratique de la statistique: 1
Définition des unités statistiques, des variables, sur
lesquelles on va opérer: caractères comme la température, la taille, la
rémunération, les notes … 2
Recueil des données: mesures, enquêtes, sondages,
échantillonnage … 3
Présentation des données sous forme de tableaux, de
courbes, de graphiques … 4
Caractérisation de ces données par des paramètres.
statistiques caractéristiques: moyenne, médiane, mode, écart-type … 5
Extraction des conclusions: bilan narratif,
modélisation, expression de tendances, test des hypothèses, recherche de lien
entre caractères, de corrélations … Le
traitement des données s'appelle la statistique
descriptive (étapes 1 à 4); l'interprétation des données s'appelle l'inférence statistique ou statistique inférentielle (étape 5). |
Jargon! |
|
Voir Suite
Anglais |
Statistics: figures giving information about something; the study of such
figures.
Statistic: a function of a sample; in other words, a quantity calculated from a
set of observations. Often a statistic is an estimator for a population
parameter. For example, the
sample mean, the sample median and the sample variance are each a statistic. The sum of
observations in a sample is also a statistic, but this is not an estimator. |
En savoir plus |
Statistiques
– Débutant
Probabilités
et statistiques – Index |
Cette page |
http://villemin.gerard.free.fr/Referenc/Vocabula/GlosS/Statisti.htm |
La
statistique est moins une science qu'un
art. Elle est la poésie des nombres.
Chacun y trouve ce qu'il y met. Albert Brie |
Voir Pensées & humour
Vocabulaire de base du domaine
de la statistique
Caractère
Variable |
Le caractère est la grandeur sur laquelle porte la
statistique: Âges dans une population, profondeurs dans une
mer donnée, notes dans une classe, rémunération des grands patrons, prix
d'achat d'un appartement dans une région … Caractère quantitatif: le prix d'un objet, la hauteur des arbres ou tout
autre critère d'étude en statistique auquel on peut donner une valeur; un
caractère quantitatif peut être: - soit discret
(ex: pointure des chaussures); - soit continu (ex:
tension mesurée aux bornes d'une pile). Caractère qualitatif: ce sont des noms et pas des nombres; ex: les
produits d'un magasin, le sexe d'une population, la couleur d'objets, la
nationalité …
Caractère est le mot général; un
caractère quantitatif est aussi
baptisé variable
statistique. |
Population Échantillon Effectif |
La population est l'ensemble des éléments
soumis à une étude statistique.
L'échantillon est l'ensemble des éléments
effectivement choisis pour contribuer à l'étude statistique.
L'effectif
d'un caractère
(ou d'une variable) est le nombre d'éléments pour lequel le caractère a une
valeur donnée.
L'effectif
total
est le nombre d'éléments soumis à la statistique; c'est la somme des
effectifs de toutes les valeurs du caractère.
L'effectif
cumulé d'un caractère est le nombre d'éléments pour lequel le caractère a une
valeur inférieure ou égale à une valeur donnée; c'est la somme des effectifs
de toutes les valeurs du caractère inférieures ou égales à une valeur donnée. Exemple: les chaussures de la
famille
L'effectif
d'une classe,
dans le cas d'un caractère continu, est l'effectif d'un caractère choisi dans
un intervalle donné (une classe). |
Série Étendue |
Une série statistique est la liste de toutes
valeurs étudiées.
L'étendue
de la série
est la différence entre la plus grande valeur et la plus petite. |
Fréquence |
La fréquence donne le taux de présence d'un
effectif par rapport à l'effectif total; c'est le quotient de l'effectif d'un
caractère donné sur l'effectif total. C'est
une valeur comprise entre 0 et 1 qui peut aussi être exprimée sous la forme
d'un pourcentage. Exemple: La
fréquence de la pointure 40 est de 1 sur 7 soit 0,14 ou 14%.
Pour une modalité (valeur) d'un caractère, la fréquence est
le rapport entre l'effectif de la modalité et l'effectif total. |
Moyenne Médiane Mode |
La Moyenne représente le caractère moyen; c'est
la moyenne arithmétique des caractères (longueur, salaire …). Exemple: Trois
individus de 1,70m, 1,73m et 1,92 m, la moyenne est 1,78 m (somme des 3
valeurs divisée par 3).
La Médiane partage la population en deux
parties de même effectif: 50% des individus ont une valeur du caractère
(taille, âge …) inférieure ou égale à la médiane, et 50% une valeur
supérieure ou égale à la médiane.
Mode: individu le plus
fréquent; en statistique, le mode (ou la classe modale) est la valeur (ou la classe
de valeurs) de X pour laquelle
l'effectif (ou la fréquence) est maximal(e). C'est la donnée la mieux
représentée. |
Variance
Écart-type |
Variance: différence entre la
moyenne des carrés E[X²] et carré de la moyenne E[X]²
Écart-type: racine carrée de la variance. Caractérise
la dispersion autour de la moyenne. Nombre positif noté (sigma). Ces
valeurs sont appelées paramètres de dispersion. Ils
permettent d'évaluer les écarts des valeurs des caractères par rapport à la
moyenne Plus
l'écart-type est grand plus la dispersion est grande. Note:
l'étendue est aussi un paramètre de dispersion. Quant à la moyenne, la
médiane, le mode et les quartiles,
ce sont des paramètres
de tendance. |
|
Distribution: Ensemble des valeurs,
modalités ou classes d'une variable statistique, et des effectifs ou
fréquences associées. La
distribution de probabilité est la distribution des valeurs (xi) de la variable aléatoire X et de leurs
probabilités (pi).
Loi de
probabilité:
une loi de probabilité décrit le comportement aléatoire d'un phénomène
dépendant du hasard. Ex: Loi
de Poisson.
Processus: Une loi de probabilité est une distribution définie par trois
paramètres:
un processus
aléatoire d'épreuve (la manière de s'y prendre, d'opérer les tirages, de
solliciter le hasard),
les résultats incompatibles deux à deux, et
les probabilités correspondantes: pi = Prob(xi). |