Newsroom

Contexte : Les données financières et de gestion des collectivités locales sont publiées par différents acteurs de la sphère institutionnelle (Ministère de l’économie et des finances, Ministère de l’intérieur, Cour des comptes, Observatoire des finances et de la gestion publique locales…).
Ainsi les sources sont dispersées sur différents sites.
De plus, les définitions des indicateurs ou agrégats diffèrent parfois selon l’organisme qui les valorise.

Défi :
D’une part, réaliser un répertoire des publications de la sphère institutionnelle et proposer l’adhésion à une newsletter informant des publications. Il s’agirait de répondre à la question « que trouver et où ? » , ce futur répertoire sera rattaché au site collectivites-locales.gouv.fr .
D’autre part, présenter l’ensemble des données financières d’une même collectivité issues des différents sites. Cette présentation pourra être affinée par thème.
Enfin, établir une comparaison des définitions des indicateurs et agrégats financiers ainsi qu’un glossaire comparatif des variables utilisées, présentes dans les différents fichiers.

Jeux de données utilisés

• Sites internet
• Balances comptables ;
• Définitions des indicateurs et agrégats.

Besoins

  • data scientists
  • designers
  • développeurs
  • économistes
  • ergonomes
  • graphistes
  • journalistes

Fichier Figma avec les maquettes / UI pour écrans suivants :

  1. Accueil
  2. Listing & filtres de recherche
  3. Popup téléchargement de données
  4. email notification de mise à jour de données (sur téléphone)

NEWSROOM-UI.zip (446,0 Ko)

Tableau correspondance SIREN par type de collectivité (de Charles, avec données La Poste, INSEE, DGCL, Banatic, OFGL…)

Codes collectivité.zip (549 Octets)

Actuellement, on a le plan comptable sous format pdf.

L’idée est de l’avoir sous un format de type wiki qui est une forme de site internet (le site sur lequel on est en est un exemple). Un non-informaticien peut l’alimenter (modification et archivage) de manière simple et l’informaticien a juste à le mettre en ligne afin qu’il puisse être consulté par tout le monde.


Une fois que ce site est en ligne, on peut cliquer sur un lien pour avoir le détail d’un compte

ou aller sur une page d’un autre site internet.

Bien sûr dans tous les cas on peut exporter la nomenclature au format pdf, csv ou json.

Pour résumer, l’avantage d’un wiki est que celui-ci peut être facilement mis à jour même par des non-informaticiens, la consultation est simple et une routine peut facilement créer un export sous différents formats (pdf, csv, json, etc.).

Plutôt que de parler de données, je préfère utiliser le terme de ressources. En effet, une ressource est constituée d’une donnée (qui peut être un document ou un lien vers une autre donnée) et de métadonnées qui décrivent la donnée. On peut lier plusieurs ressources entre elles afin de constituer un jeu de données (et non un jeu de ressources comme on pourrait le penser), à condition de créer en plus une ressource référente (ou catalogue) qui va lister l’ensemble des ressources constituant ce jeu de données.

Pour rappel, les métadonnées sont de quatre types :

  1. Administratif qui se subdivise en cinq
  • droit : elle détermine le type d’ouverture de la ressource (toutes les étapes d’accès protégés à l’open data). Dans notre cas, tout est en open data.
  • gestion des archives courantes et intermédiaire : car une ressource au bout d’un moment peut devenir obsolète et il faut mieux l’archiver que la supprimer.
  • identification : l’idée est de pouvoir identifier de manière unique chaque ressource. En Web sémantique (ou Web des données), on utilise le terme d’URI
  • provenance et contexte : il faut aussi gérer la vie de la ressource.
  • intégrité : pour être sûr que la même ressource n’a pas été modifiée entre deux dates.
  1. Structurel : ça permet de savoir où est la ressource aussi bien d’un point de vue physique que logique. Par exemple, sur quel ordinateur, sur quel disque dur et dans quel répertoire.
  2. Descriptif : c’est ce qu’on appelle la taxonomie. Par exemple, pour un fichier csv c’est le nombre de ligne, le poids du fichier, pour chaque colonne son libellé, sa position (A, B, C, ou D ou 1, 2, 3, ou 4), son type (alphanumérique, numérique, monétaire, date), son nombre de caractères maximum, etc.
  3. Technique : c’est le type de document (pdf, excel, csv, json, xml, tif, etc.)

Pour ceux qui veulent aller plus loin, voilà la source.