Carte d’évolution de la mortalité des plus de 65 ans en France. Période Février à Avril 2020
Présentation
Cette animation a été générée à partir des données open source de l’Insee listées ci-dessous. Il s’agit de la seconde génération de vidéo après celle sur la période Janvier à Mars 2020.
Elle représente l’évolution de la mortalité des plus de 65 ans en France sur la période Février à Avril 2020. La précision géographique est meilleure que le département (basée sur le découpage en communes). La variabilité géographique des valeurs est ainsi plus marquée et met en valeur de nouveaux évènements.
Pour cette période un zoom sur la région parisienne est également disponible :
L’échelle à gauche du graphique représente le code couleur avec une échelle en facteur multiplicatif. On y retrouve :
- la barre horizontale est le niveau de mortalité moyen par rapport aux 5 années précédentes ( uniquement période février à mai)
- l’ovale fixé sur la barre représente l’écart type, donc la variabilité des valeurs géographiquement
- la barres arrondie en haut le maximum de taux de mortalité
Analyse rapide
A noter : l’échelle de couleur est différente de la première vidéo. Certaines zones géographiques présentent une mortalité multipliée par ~x8 par rapport à la moyenne des 5 dernières années (~x4 sur la précédente vidéo).
Le pic de mortalité des plus de 65 ans est le 31 mars 2020 sur toute la France comme en région parisienne, ce qui est lié sans doute possible à l’épidémie de covid 19 :
La région de Mulhouse et la région parisienne présentent les plus importantes surmortalités comme on pouvait s’y attendre.
Néanmoins d’autres zones présentent une surmortalité à une moindre mesure mais remarquable :
- La région grand Est, et en particulier l’est de Metz (Freyming-Merlebach et alentours)
- La région de Lyon entre le 25 mars et le 8 avril
- Aux alentours de Morzine entre le 29 mars et le 7 avril
- Région d’Evreux entre le 1er Avril et le 10 Avril
Si l’on regarde de nouveau les zones présentant une surmortalité en fin mars, il semble qu’un schéma se dessine autour de certains axes autoroutiers : A4 Metz – Reims et A36 Mulhouse-Dijon.
Malheureusement la qualité des données open source se dégrade 15 jours environ avant la fin de période analysée. Dans ce cas la quantité de décès enregistrés s’amenuise jour après jour à partir du 15 avril. Pourtant ces données ont été mises à disposition le 15 mai.
A noter que les variation de mortalité au niveau des Sable d’Olonnes sont sans doute dûes à un problème de traitement (division par zéro), qui n’a pas encore été corrigé lors de la génération de ces cartes. C’est la seule zone qui est impactée par cette anomalie de calcul.
Les sources de données
- INSEE : Recensement de la population 2016
- Base des tableaux détaillés. https://www.insee.fr/fr/statistiques/4171341?sommaire=4171351
- POP1A – Population par sexe et âge regroupé. https://www.insee.fr/fr/statistiques/fichier/4171341/BTX_TD_POP1A_2016.zip
- decoupage-administratif-communal-francais-issu-d-openstreetmap
- Contour de l’europe
- Site Web de génération de fichiers JSON : https://geojson-maps.ash.ms/
- Données des décès en France :
-
- FIchers historiques et mensuels : https://www.data.gouv.fr/fr/datasets/fichier-des-personnes-decedees/
-
La méthodologie
Les données sont traitées de la façon suivante pour être affichées :
- population sommée temporellement sur 7 jours pour avoir une représentativité statistique minimale, la fenêtre temporelle est décalée jour après jour pour générer l’animation
- sur un regroupement initiale de communes proches permettant d’atteindre une population de référence minimale représentative (4 décès/semaine historiquement). La base de découpage est constituée de communes.
Au final ce sont 846 regroupements qui constitue la base d’affichage. La précision est donc bien meilleure qu’un découpage par département. Ces regroupements peuvent être très étendus géographiquement (densité de population faible par exemple), ou représenter une unique commune. - sur une référence de mortalité sur 5 ans issue d’une moyenne (2015 -2019) et uniquement les mois de février à Mai. Cela permet de lisser l’effet d’éventuelles épidémies de grippe ou autre qui auraient eu lieu sur cette période de référence. Cette référence ne bouge plus ensuite pour l’affichage temporel de la vidéo.
sur un « regroupement de regroupement » variable suivant la période d’analyse glissante et cela pour atteindre une population minimale de 20 décès sur la semaine, soit 5% d’erreur. On regroupe ainsi dynamiquement les communes avec une faible mortalité, en gardant la visibilité sur les communes avec forte mortalité. Ce regroupement se fait sur un critère de proximité (regroupement limitrophe) en privilégiant les éléments qui ont des taux de mortalité proche.
On aboutit dans cette vidéo à environ 130 à 160 « regroupements de regroupement » affichés suivant l’image
Les outils
J’ai développé le code sur Jupyter. L’installation sur serveur est expliquée ici.
La programmation est en Python.Utilisation des librairies numpy, pandas, geopandas, matplotlib.
Historiquement j’ai démarré ce sujet technique personnel pour analyser de la donnée domotique, mais les circonstances m’ont fait changer de voie.
Python génère des images qui sont ensuite rassemblées et interpolées par Image Magick sous linux puis la vidéo est générée par ffmpeg.
Postez un commentaire si vous souhaitez en savoir plus ou contactez moi. Le code est devenu au cours du temps assez complexe, peu lisible il faut bien le dire, donc difficile à présenter.
Je suis également à disposition pour générer d’autres animations si cela intéresse (zoom sur région, sur période, etc…)