Sommaire

Projet 09 : Produisez une étude de marché avec R ou Python


Objectif : Une entreprise souhaite s'internationaliser, il faut produire une étude de marché qui nous permettra de sélectionner les pays qui représentent un intérêt particulier pour l'entreprise.

Import et préparation des données :

Dans un premier temps, nous allons importer nos données puis les préparer pour l'analyse.

Disponibilité alimentaire

Dépendance à l'importation de Volaille

Importation de Volaille

Ration de protéines Animales dans l'alimentation

PIB / Habitant

Population

Merge de nos différents dataframes :

On obtient un dataframe contenant 10 variables qui nous permettront d'effectuer une analyse et une classification des pays.

Classification Hiérarchique des Pays :

Nous allons calculer une matrice de corrélation pour nos variables afin de sélectionner celles qui seront utilisées pour l'analyse :

Au vu de ces résultats, nous allons sélectionner 6 variables pour notre analyse :

Clustering Hiérarchique :

Nous allons visualiser la distribution de nos différentes variables sur une heatmap afin de pouvoir se représenter les différentes tendances de nos clusters :

Nous voyons apparaître 6 Clusters. Afin de les départager et de choisir le cluster le plus pertinent dans notre cas, nous allons maintenant visualiser la distribution des différentes variables en fonction du cluster :

Selon notre classification hiérarchique, le cluster le plus pertinent semble être le Cluster 6. En effet, c'est le cluster qui importe le plus de Volailles tout en ayant un PIB / Habitant supérieur aux Clusters 1 et 2 qui ont pourtant une dépendance à l'importation plus élevée. Il paraît pertinent de favoriser des marchés représentant des volumes plus importants. Ce Cluster est composé des pays suivants :

Conclusion

Il apparaît important de noter que la distance à la France n'est pas prise en compte dans ce calcul. De ce fait une priorité peut être faite vers les pays européens afin de simplifier les contraintes de transport. Le choix se porterait donc sur :

Analyse en Composante Principale :

Réalisons une ACP sur nos données afin d'identifier les différents axes d'inertie :