Discrétisation avec Scikit-Learn

En science des données, la discrétisation désigne le procédé qui consiste à transformer une variable quantitative en une variable qualitative. Pour cela, la variable quantitative est découpée en intervalles (classes) qui deviennent désormais les modalités de la variable qualitative. Elle est communément utilisée comme une méthode de pré-traitement avant la mise en place de différents modèles.

Lire la suite


Liaison entre deux variables qualitatives avec Python

 


Cliquez pour accéder à l’article introductif de la série sur l’analyse bivariée.

Dans cet article, nous allons découvrir comment étudier la liaison entre deux variables qualitatives. C’est une étude indispensable pendant l’exploration des données dans un projet de Data Science.

Pourquoi est-il important de savoir étudier la liaison entre deux variables qualitatives ?

Lire la suite