Aller au contenu

Une typologie des communes françaises


Adrian

Messages recommandés

Posté

Réconcilier le vécu avec la statistique : une typologie des communes françaises

 

  Citation

Après avoir compilé plus de 400 variables sur les communes françaises, de 1968 à 2018, l'auteur a abouti à 22 catégories de territoires à l'échelle de la France métropolitaine, caractérisées par leurs profils démographiques, la structure de l'emploi, les revenus... Loin des oppositions binaires trop souvent esquissées à la hâte, l'analyse de ces catégories offre une vision à la fois détaillée et globale du territoire hexagonal, ses lignes de force et ses fractures.

Expand  

 

image.thumb.png.0b2ede00bed83e99a19915fe9eee6af0.png

 

A superposer avec la carte électorale !

  • Yea 3
Posté
  Le 03/10/2024 à 05:10, Mathieu_D a dit :

Oui parce que la les nuances de rose/violet c'est illisible.

Expand  

Cartographe, c'est un métier.

 

Par ailleurs, quel est le tâcheron inculte qui a décidé de trier la légende par ordre alphabétique plutôt que thématique ?

Posté

Dommage effectivement que la carte ne soit pas un chouia filtrable et zoomable, par ex. (elle n'est pas totalement illisible, mais pff c'est pas agréable).

Posté
  Le 03/10/2024 à 12:54, Alchimi a dit :

Dommage effectivement que la carte ne soit pas un chouia filtrable et zoomable, par ex. (elle n'est pas totalement illisible, mais pff c'est pas agréable).

Expand  

En même temps on a une impression random là hein.

Posté

Challenge intéressant de rendre ça lisible. Peut-être en première approche une petite PCA, avec différentes heatmaps pour les 2/3 premières composantes.

Posté
  Le 03/10/2024 à 16:47, Lancelot a dit :

Challenge intéressant de rendre ça lisible. Peut-être en première approche une petite PCA, avec différentes heatmaps pour les 2/3 premières composantes.

Expand  

Le clustering sous jacent est probablement fondé sur une CAH sur des axes d'une méthode factorielle. 

Quoique la mode en ce moment ce serait plutôt les axes d'une UMAP.

Posté
  Le 03/10/2024 à 18:01, Mathieu_D a dit :

Le clustering sous jacent est probablement fondé sur une CAH sur des axes d'une méthode factorielle. 

Quoique la mode en ce moment ce serait plutôt les axes d'une UMAP.

Expand  

Et le résultat est illisible alors que ma méthode le serait moins.

Posté
  Le 03/10/2024 à 18:21, Lancelot a dit :

Et le résultat est illisible alors que ma méthode le serait moins.

Expand  

C'est à dire représenter le nuage des points des communes dans le plan des premiers axes factoriels ça a bien un intérêt, mais représenter les clusters géographiques sur une carte ça en a encore plus. 

La représentation dans le plan factoriel c'est pour la stat' (je suis pour c'est mon kink), pour visualiser la matrice de similarité, mais la représentation géographique c'est opérationnel.

On a besoin de voir si les communes à l'intérieur des clusters sont proches géographiquement ou pas.

Et ça permet d'inférer sur des indicateurs non présents dans la base d'apprentissage.

Posté

Je pense que tu n'as pas compris, je propose des représentations en heatmap sur une carte de France. Par exemple trois cartes qui représentent les trois composantes principales (et on pourra alors spéculer à volonté sur ce qu'elles représentent). J'avais vaguement en tête des idées pour représenter deux composantes sur une même carte (techniquement avec HSV on pourrait en avoir 3?) mais je ne crois pas que ça se fasse beaucoup. L'idée est d'avoir des échelles identifiables au lieu de confettis aux couleurs arbitraires. Et si tu te retrouves malgré tout avec un effet confetti, tu isoles les composantes.

Posté

Ha tu veux faire un gradient sur les composantes. Oui pourquoi pas si l'explicabilité de la composante est bonne. Mais ça demandera plus de cartes.

 

A un moment il faut traiter le segment comme modalité quand même. L'aspect confetti a de l'importance, on veut voir si des communes proches géographiquement se comportent différemment ou pas.

 

(Après là on se permet de dénigrer un printscreen dégueu, mais avec de l'interactivité, même avec cette palette, ça doit bien passer.)

Posté

Mais c'est un exemple du type de format dont je parlais (l'étape supplémentaire d'un point de vue méthodologique est d'utiliser les composantes principales à la place de variables mesurées directement).

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant
×
×
  • Créer...