ECRIT PAR | Philippe Toulemont

Le 1er Data Tuesday a eu lieu !

Logo Tuesday Le Data Tuesday est une initiative lancée par trois startups (Data PublicaCaptainDash et MFG Labs), et leurs quatre partenaires (Les Echos, Cap Digital, Systematic et EIT ICT Labs).Ce rendez-vous mensuel est dédié aux acteurs de la Data et leur permet de se rencontrer pour échanger et réfléchir sur trois sujets que sont la  Big Data, la Dataviz et l’Open Data.Ce premier rendez-vous s’est tenu hier et avait plus une vocation de « kick-off ».Sans thématique précise, cet évènement a su susciter la curiosité et attirer une audience importante : La salle d’ICT Labs était pleine !

La session a commencé par 3 présentations, mais suite à des problèmes de circulations je ne suis arrivé qu’à la fin de la seconde, qui abordait la problématique du Big Data et de sa manipulation par le grand public.
J’en retiendrai une phrase : « L’analyse du Big Data, c’est de l’avant-garde en mode bourrin« . Une phrase, certes un peu choc mais qui rappelle que pour manipuler des volumes aussi importants de données, il faut commencer par être humble et pragmatique en limitant ses axes d’analyse à deux ou trois dimensions.

Ensuite, quelques idées séduisantes ont été évoquées comme :
– La nécessité de désapprendre la loi normale.
– Les courbes de Gauss.
– La dictature des moyennes dans l’analyse des chiffres. Une très bonne illustration de celle-ci est qu’une personne qui se noie dans un trou d’eau se moque de savoir que la profondeur moyenne du lac fasse 60cm !
La volumétrie amenée par la Big Data oblige à circonvenir le périmètre de son analyse et à ne plus essayer de tout comprendre et tout résumer.

MFG Labs a présenté une autre image amusante… et pertinente sur les états de la Data:

  1. Solide: Les belles bases de données relationnelles.
  2. Liquide: Les fichiers XL, PDF…
  3. Gazeux: L’Open Data, le Big Data, les « trucs » informes qui trainent dans le nuage.

Suite à ces présentations a eu lieu un débat (peu houleux) dont sont sorties quelques thématiques clés:

  1. La traçabilité des données Open Data.
  2. L’ouverture des entreprises au monde de l’Open Data, avec la question de qui au sein de l’entreprise doit prendre en charge cette initiative.
  3. L’Open Data rendra-t-elle le monde plus beau ?

La question est maintenant de savoir si cette soirée doit se rebaptiser Open Data Tuesday. Heureusement, le cocktail qui a conclu la soirée laissait penser que non et que les différents acteurs présents voulaient y voir évoquer d’autres sujets.

On peut toutefois se demander si Big et Open Data vont facilement cohabiter avec les données classiques ou est-ce que deux univers totalement hermétiques sont en train de se créer, avec chacun ses spécialistes.
Quelques experts croient toutefois que les passerelles existent et tendent à se développer, poussées par des technologies comme Hive pour Hadoop.

A noter que l’évènement semble particulièrement propice au networking et que les discussions battaient leur plein.
Vous pouvez retrouver ici les présentations du Data Tuesday.

Suite au prochain numéro, le 6 décembre au 104 rue d’Aubervilliers dans le 19ème.