Election présidentielle de 2012

Les résultats détaillés des élections présidentielles de 2012 en France sont disponibles sur le site du ministère de l'intérieur. Malheureusement les données ne sont accessibles qu'en cliquant successivement sur un grand nombre de liens. J'ai donc écrit un petit script en perl qui se charge des clics pour récupérer les résultats de chaque commune et les stock dans un fichier. (On peut trouver des données par circonscription ici)

Pour information, vous pouvez télécharger le script. Il ne fonctionne plus car le site du ministère a changé depuis mais devrait pouvoir être corrigé assez rapidement. Ce script m'a permis de télécharger les résultats détaillés pour toutes les communes de France que vous pouvez télécharger ici : data_pres.zip. C'est un fichier CSV compressé qui contient pour chacune des communes et pour les deux tours, le nombre d'inscrits, de votants, d'abstention, de bulletins blancs ou nuls ainsi que le nombre de voix recueilli par chacun des candidats.

Pour faire de jolies cartes, il faut également connaitre les coordonnées des villes. On peut facilement trouver cette information, par exemple sur ce site. J'en ai également profité pour ajouter quelques données socio-économiques sur les villes en question toutes disponnibles sur le site de l'INSEE. Tout cela compilé par un nouveau script, dans un fichier similaire au précédent et disponible ici : data_pres_geo.zip.

On peut ensuite utiliser un logiciel tel que TileMill pour dessiner des cartes de résultats. Ci-dessous la carte qui montre les résultats du second tour, chaque point représente une ville, la taille du point est reliée au nombre d'habitants de la ville. Les points rouges représentent les villes où Hollande est arrivé en tête et les points bleus sont les villes où Sarkozy l'a emporté.

On voit qu'il y a certaines zones géographiques très marquées à droites et d'autres beaucoup plus de gauche. On remarque également que Hollande l'a emporté dans la majorité des grandes villes (C'est particulièrement clair en Alsace où les deux seuls points rouges sont Starsbourg et Mulhouse).

Ces données peuvent aussi être analysées plus précisément afin de déterminer les correlations entre les votes pour les différents candidats, où correler ces votes aux données socio-économiques. Je laisse ce soin aux experts en statistiques.

Bon, j'étais très fier de moi d'avoir passé tant de temps à faire tout ça, réccupérer les données, faire une carte, ... Mais j'aurais mieux fait de faire quelques recherches sur le net (ce que j'ai fait en écrivant cette page) et il s'avère que toutes ces données sont déjà disponnibles sur le site data-publica.fr et comme d'habitude, un type bien plus fort que moi avait déjà fait tout ça ! (Et bien mieux que moi...)