Projet 3 de ma formation d'Ingénieur IA : Préparez des données pour un organisme de santé publique

Vincent RENARD de5a014066 Start the notebook 11 months ago
Vincent_RENARD_3_Pres 374223fd02 Start the notebook 11 months ago
data 03c4378d94 add data file 1 year ago
.gitignore 03c4378d94 add data file 1 year ago
README.md 2e831e32c0 Simplification 1 year ago
Vincent_RENARD_1_Notebook_P03.ipynb de5a014066 Start the notebook 11 months ago
Vincent_RENARD_2_Notebook_P03.html 374223fd02 Start the notebook 11 months ago
model.pkl 374223fd02 Start the notebook 11 months ago

README.md

Etapes du projet :

  • Explorer le dataset
  • Définir les variables utiles
  • Traiter les valeurs manquantes (3 méthodes différentes, médiane, mise à 0, IterativeImputer, KNN, suppression, …)
  • Detecter les outliers
  • Detecter les doublons
  • Graphs univariés
  • Graphs bivariés / multivariés (pairplot ou graphique variables numérique / numérique, graphique variables numérique / catégorielle, graphique variables catégorielle/ catégorielle, heatmap de corrélation)
  • ACP
  • ANOVA
  • Tests stats

Requirement :

  • Utiliser des fonctions
  • Au moins un graphique interactif

Résultats d'exploration préliminaires :

regression logistique pour prédiction du nutriscore