Tableau disjonctif complet

Une proposition de fusion est en cours entre Encodage one-hot et Tableau disjonctif complet.

Les avis sur cette proposition sont rassemblés dans une section de Wikipédia:Pages à fusionner. Les modifications majeures apportées, entre-temps, aux articles doivent être commentées sur la même page.

Vous venez d’apposer le modèle {{à fusionner}}, suivez ces étapes :

1.

Apposez le bandeau sur les autres pages à fusionner :

  • Encodage one-hot

Utilisez ce texte : {{à fusionner |Encodage one-hot |Tableau disjonctif complet}}

2.

Important : ajoutez une section dans Pages à fusionner en motivant votre proposition.

Pour créer la section :

Créer la section sur la page des Pages à fusionner

3.

Pensez à informer les contributeurs principaux de la page et les projets associés lorsque cela est possible.

Utilisez ce texte : {{subst:Avertissement fusion |Encodage one-hot |Tableau disjonctif complet}}

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Un tableau disjonctif complet (TDC) est un type de représentation de données qualitatives utilisé en analyse des données. Dans ce tableau, une variable qualitative à K {\displaystyle K} modalités est remplacée par K {\displaystyle K} variables binaires, chacune correspondant à une des modalités[1].

Dans la littérature anglophone sur l'apprentissage automatique, il est connu sous le nom de codage "one-hot" ("one-hot encoding").

Exemple

Une famille est constituée d'un père, d'une mère et d'un jeune garçon. On s’intéresse aux variables "sexe" et "couleur des yeux" de ce ménage.

Voici le tableau regroupant ces informations :

individu Sexe Yeux
père Masculin Marron
mère Féminin Bleu
enfant Masculin Vert

Le tableau disjonctif complet de cette population prend la forme suivante :

individu sexe F sexe M Yeux B Yeux M Yeux V
père 0 1 0 1 0
mère 1 0 1 0 0
enfant 0 1 0 0 1

Articles connexes

  • Tableau (statistique)
  • Tableau de contingence
  • Table de Burt

Notes et références

  1. Brigitte Escofier, « Une représentation des variables dans l’analyse des correspondances multiples », Revue de statistique appliquée, vol. tome 27, no no 4 (1979),‎ , p. 37-47 (lire en ligne [PDF])
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des probabilités et de la statistique
  • icône décorative Portail des données