Article

Nouveaux jeux de données pour hacker la corruption

 

Nous avons annoncé il y a quelques semaines la mise à disposition d'ensembles de données pour notre évènement Hackons La Corruption.

Ces données n'étant malheureusement pas disponibles sous forme de données ouvertes, nous avons dû (avec l'aide de Nord Ouvert) "scraper" les ensembles de données à partir de divers sites gouvernementaux. Il en résulte que la matière première que nous avons mis à disposition reste un petit peu difficile d'accès pour tout le monde.

Heureusement, nous avons mis à profit le mini-hackathon organisé le samedi 18 pour générer des ensembles de données simplifiés à partir des données que nous avons déjà mis à disposition:

la particularité de ces ensembles de données est qu'il sont:

  • normalisés: il est possible de les croiser entre eux
  • simplifiés: des champs jugés moins importants ont été supprimers pour rendre les jeux de données plus complexes et plus facilement manipulables.

et voici quelques faits saillants que l'on peut lire directement dans les données:

  • le montant total des contrats pour lesquels nous avons des données est de 628 539 989 $ (628 millions de dollars)
  • le montant moyen des contrats est de 71 456 $
  • les trois plus importanges compagnies (en montant total) sont: 1) Groupe Lechasseur (7.2M$), Logibec Informatique (3.8M$), Construction et Pavage (3.2M$).
  • les trois organisations qui ont sous-traité les plus gros montants sont la Ville de Québec (15.9M$), la STM (13.8M$) et l'Université de Montréal (13.3M$).

et pour finir, les licenses Microsoft ont coûté 2.8M$ aux contribuables québecois. À vous de trouver maintenant des faits intéressants dans ces données!

blog comments powered by Disqus
Dernière mise à jour le: Aug 18, 2012