Étude des Projets de Loi de Finances dans le temps

hackathon-juin-2018

#1

Il s’agit de pouvoir suivre les dépenses d’une politique publique donnée à périmètre constant, c’est-à-dire malgré les éventuels changements de nomenclature dans l’information.

En effet, les projets et rapports annuels de performances rassemblent déjà les données de programmation et d’exécution par mission, programme, action, etc. Or la terminologie et la nature de ces missions, programmes, et autres, changent dans le temps. Le défi consiste à permettre de produire des analyses malgré les évolutions de la maquette budgétaire (notamment l’ajout d’une action ou d’une sous-action à un programme, les ajouts ou suppressions de crédits en base, etc). Un exemple possible d’application consisterait à sélectionner une politique publique - identifiée, par exemple, par la mission ou le programme - choisir une année de départ de la comparaison et produire en sortie un support visuel - histogramme, courbe, etc - présentant l’évolution de la dépense par an.

Jeux de données utilisés

Les ressources des PLFs des années 2012 à 2018 sont disponibles sur data.gouv.fr

Un premier script de traitement des données (fonctionnant partiellement sur les données 2017) est disponible ici : https://github.com/project-orion/orion/blob/feature/size-modification-test/pipelines/plf/parsePLF.py

Chronologie des tâches

Besoins

  • data scientists
  • designers
  • développeurs
  • économistes
  • graphistes

#2

Ressource
Sur le site des performances publiques, les nomenclatures sont accessibles.
Depuis 2014 : la nomenclature est exprimée sous le format général (regroupé sur tous les ministères).
Pour 2013 et avant, la nomenclature est regroupée par ministère.


#3

Totalité des données : <a class=“attachment” href="/uploads/default/original
RE 2012 - 2018 avec la totalité des sous actions et le libellé de mission correct.zip (843,3 Ko)

:slight_smile:


#4

Git repo : https://github.com/alexis-thual/nomenclature-plf


#5

Voici les fichiers PAP et RAP 134 et 159 retraités.

Les actions des programmes sont identifiables par un code spécifique : =££££AAAA=PPP-XX

  • AAAA = année
  • PPP = programme de politique publique 134 ou 159
  • XX = action (remarque : 00 = programme)

Le texte qui décrit chacune des actions peut participer à enrichir l’analyse de la nomenclature.

T2017_P134_RAP_JPE - V2.txt (55,9 Ko)
T2017_P134_PAP_JPE - V2.txt (81,4 Ko)
T2017_P159_RAP_JPE - V2.txt (21,9 Ko)
T2018_P134_PAP_JPE - V2.txt (66,2 Ko)
T2017_P159_PAP_JPE - V2.txt (39,0 Ko)
T2018_P159_PAP_JPE - V2.txt (65,2 Ko)


#6

FastText French Pretrained embeddings : https://s3-us-west-1.amazonaws.com/fasttext-vectors/wiki.fr.vec


#7

Impecfect pairs for 2016 - 2017 imperfect pairs.txt (18,5 Ko)


#8

imperfect_pairs.csv (19,0 Ko)


#9

Voici le résultat pour 2017-2018 paires-libellés-différents-2017-2018.csv (17,8 Ko) (même méthode que précédemment, i.e. uniquement comparaison des libellés quelque soit leur place dans les arbres).


#10


#11

dataFin - Nomenclature PLF.pptx (938,9 Ko)