Skip directly to content

Liens vagabonds : Hackaton tout terrain, Datajournalisme en question, et données à gogo !

on ven, 03/16/2012 - 08:42

Par Julien Le Bot 

"La mode, c'est ce qui se démode", disait (grosso modo) Jean Cocteau. Est-il bien raisonnable de s'emballer pour toutes ces histoires de data ? Sans doute pas, pourrait-on penser en bon sceptique. Encore que. Sans mauvais jeu de mot, Tristan Tzara, docteur ès dadaïsme (à une lettre près, il était visionnaire !), expliquait bien que par principe, il ne faut accepter aucun système. Mais ensuite ? Les chiffres qu'on nous balance sont étourdissants : en 2011, c'est à dire en une année, nous [l'humanité, ndlr] aurions généré autant de données qu'entre la naisssance de l'écriture et 2003. Eh oui : il se passe donc quelque chose. Ce que tendrait à (dé-)montrer cette palanquée de liens vagabonds.     

Euphorie printanière ou accès de joie insensé : la cueillette ("zadigacisante") aux liens a été, à n'en pas douter, fabuleuse. A cet égard, le hackaton co-organisé à Paris par la mission Etalab et Google, dans le sillage de Dataconnexions, a  permis de réunir pas mal d'acteurs et de journalistes autour des questions que chacun se pose.     

Comment l'information (grand public) peut et doit être en mesure de s'adapter à ces enjeux ? Quels services peuvent être développés (quitte à rencoforcer les modèles économqiues des médias) ? Comment "visualiser" (ou donner un sens à) ces kilomètres (ou milliers de millions de milliards de Gigabytes) qui pourraient nos tomber dessus dans les années à venir ? A quelle moment est-on dans le traitement, dans l'analyse, ou dans la simple rhétorique ? C'est d'ailleurs l'un des difficultés consubstantielle à la définition d'un datajournalisme cohérent et vigilant : comme l'expliquait le statisticien Frank Barthé, en marge de l'atelier, il faudrait aussi mieux informer le public (de la façon dont le journaliste a pu travailler). De la même manière qu'un article de fond se doit d'être sourcé, il faudrait progresser sur la façon dont le public lui-même pourrait apprécier l'opportunité d'utiliser (et de croiser) des jeux de données pour montrer tel ou tel phénomène historique, culturel ou social.     

Au-delà, l'Open Data est-il pertinent à l'échelle locale et/ou hyperlocale ? Il ressort de l'analyse des jeux de données libérés - et passés au crible de leurs outils par l'équipe formidable des fondateurs de Qunb - que seuls 3500 jeux sont finalement réellement disponibles (si l'on enlève les doublons). Ensuite, tout n'est pas exploitable immédiatement : seuls 174 jeux sont structurés, contre 2836 qui ne le sont que partiellement, et 500 qui ne le sont pas du tout. Sur le front local, 122 jeux présentent une dimension locale. Mais peu de temps réel, et très peu de prospectif.

L'une des difficultés évidentes tient au fait que les données locales dépendent avant tout des collectivités... locales, c'est logique. Certes, le portail data.gouv.fr peut accueillir des jeux libérés (sur une base volontaire) par des collectivités, mais aucun format ni aucune norme ne sont imposés. Pour l'heure, personne ne semble vouloir proposer (ou mettre en place) un dispositif qui, pourtant, pourrait être salutaire : un cadre commun, avec des normes pré-déterminées, permettant aux collectivités intéressées de remplir progressivement,  sur la base du vlontariat toujours (respectons le principe de libre adminstration tout en encourageant les efforts communs), les champs ad hoc avec des données concordantes. Ce pourrait être un espace à part, sur data.gouv.fr, à vocation locale, permettant à tous ceux qui le souhaitent de créer un certain nombre d'applications à portées immédiate et quotidienne.

Inutile de préciser que, dans le prolongement de tout ça, se pose(ra) la question des capteurs en temps réel... Et de là à imaginer la possibilité de recueillir automatiquement les données récoltées chaque jour et chaque seconde par les capteurs de l'Institut de Radioprotection et de sûreté nucléaire (IRSN), c'est un autre cap à franchir. Le pouvoir (étatique) a ses raisons que la raison (démocratique) ne connaît pas.  

Sur ces quelques propos, bonne lecture ! 

1/ Open Data, Web sémantique, toussa :

[#TourDuPropriétaire mais #PasSeulement] Data-Publica : Inventaire des bâtiments publics : http://www.data-publica.com/content/2012/03/the-guide-to-every-french-publicly-owned-building-and-real-estate/ et http://www.data-publica.com/content/2012/03/presentation-atelier-google-opendata/

[#Ressources] Le tagging sémantique sur un blog du ministère de la Culture (Oui, c'est possible) : http://cblog.culture.fr/2012/03/13/hda-lab%C2%A0-experimenter-le-tagging-semantique

[#Hackaton] Retour sur l'Atelier OpenData : http://www.etalab.gouv.fr/article-retours-sur-l-atelier-open-data-google-dataconnexions-101641625.html

[#Satisfecit] : Et au Royaume-Uni ? http://www.cabinetoffice.gov.uk/news/open-data-innovation-community-francis-maude-speech

[#OrNoir] : Les "data", nouveau pétrole ? http://www.lepoint.fr/technologie/les-data-petrole-du-xxie-siecle-14-03-2012-1441346_58.php

2/ On ne badine pas avec la stratégie :

[#USA] Le NYT s'associe à Mozalla pour accroître son impact sur le web : http://www.journalismes.info/Le-New-York-Times-s-associe-a-Mozilla-Firefox-pour-accroitre-son-impact-sur-le-web_a3840.html

[#Urbanisme] Une plateforme en ligne à Stockholm pour comparer les services publics : http://www.innovcity.fr/2012/02/21/a-stockholm-une-plateforme-en-ligne-permet-aux-citoyens-de-comparer-les-services-publics/

[#Hyperlocal = #Hyperpratique] Foursquare se met à vous donner les horaires des commerces : http://www.presse-citron.net/foursquare-vous-renseigne-sur-les-horaires-des-commerces?utm_source=feedburner&utm_medium=twitter&utm_campaign=Feed%3A+Pressecitron+%28Presse-citron+-+Le+blog%29

3/ Bidouille-It-Yourself :

[#DataEnForme] De qui mettre en forme facilement des statistiques : http://www.samsa.fr/2012/03/13/outils-datawrapper-mettre-en-forme-facilement-des-statistiques-courbes-histogrammes-camemberts/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Samsa+%28Samsa+news%29

[#Vidéo] Un cours de Datajournalisme en ligne : http://datajournalism.stanford.edu/

4/ Us et coutumes (sur la Toile) :

[#NoComment] : Vos gueules les internautes, vraiment ? http://www.erwanngaucher.com/16032012Vos-gueules-les-internautes-,1.media?a=842

[#Régulation] Curation : Un code pour de bonnes conduites sur la Toile ? http://tempsreel.nouvelobs.com/vu-sur-le-web/20120314.OBS3764/un-code-de-la-curation-pour-une-bonne-conduite-sur-le-web.html

5/ Rien à voir avec la choucroute (mérite quand même le détour) :

[#Philo] Pourquoi on pédale dans le vite ? http://www.philomag.com/article,dossier,pourquoi-on-pedale-dans-le-vite,1718.php

[#Essai] La mondialisation, késazo ? http://www.laviedesidees.fr/Une-mondialisation-sans-monde.html

---

Crédit : @Zigazou76 (Licence Creative Commons)