Du jeu de données au jeu avec les données

Vous le savez sûrement, le XXIe siècle est – entre autres – celui de la donnée. A l’heure des metrics en tous genres (pour la collecte), du numérique (pour le stockage et le maniement) et des réseaux (pour le partage et la diffusion), la data est partout, et prend de plus en plus de place dans nos vies. Les partis politiques et grandes entreprises tentent de prévoir le comportement du citoyen lambda à coup de big data, les institutions et les pouvoirs publics tendent doucement vers plus de transparence avec l’open data, n’importe qui peut en apprendre sur lui-même grâce aux nombreuses applications de quantified self qui inondent le marché… et les journalistes, dans tout ça ?

Pour ceux dont le métier est de transmettre l’information et d’expliquer le monde, manipuler des tableaux Excel de milliers de lignes et en tirer la substantifique moelle n’est pas la chose la plus simple qui soit. Le Data driven journalism (ou #DDJ, pour les adeptes de Twitter) demande de trouver les données, de les nettoyer et de les analyser. Mais le travail ne s’arrête pas là : il est ensuite nécessaire d’imaginer une forme pour pouvoir communiquer au public les informations cachées sous les chiffres. C’est notamment la raison d’être de la visualisation de données, ou #dataviz.

Les données visualisées peuvent être des images fixes, bien sûr. Donner à voir, en un graphique, la répartition d’un budget municipal ou l’évolution du nombre de victimes d’accidents de la route au fil du temps, peut être extrêmement parlant.

Pour permettre au public d’explorer en détail une base de données volumineuse ou complexe, il est aussi possible, grâce à la programmation, de la présenter sous forme interactive. L’utilisateur peut alors, en activant des filtres par exemple, afficher certaines données et en masquer d’autres.

La dataviz interactive des lycées d’Ile-de-France, par WeDoData et J++

Mais la raison d’être de cet article est de tenter de répondre à une question simple : pourquoi le ferait-il ?

J’ai récemment eu l’occasion de me poser cette question en discutant avec Alexandre Léchenet, du Monde.fr, d’un de ses récents travaux, effectué avec Hélène Bekmezian, sur le montant et la répartition de la réserve parlementaire. Les données y sont très nombreuses : plus de 10000 projets financés par des députés, sénateurs ou ministères, avec pour chacun le parlementaire impliqué, les sommes en jeu, le lieu de réalisation et la description du projet… En bref, une somme colossale d’informations mises à disposition du lecteur curieux.

Grâce à un champ de recherche, celui-ci peut en effet se plonger dans la base de données, et isoler les projets par zone géographique, par initiateur, par nom. C’est donc une ressource tout à fait passionnante… pour qui est déjà préalablement intéressé par la politique, la vie parlementaire ou l’utilisation de l’argent public. Vous me direz que ça devrait être le cas de tout bon citoyen, et je vous répondrai par le générique de Oui-Oui.

Yeah right

En attendant que l’humanité déménage en masse dans le pays du nain à grelot, et pour permettre à des travaux précieux comme celui de mes confrères de toucher une audience plus large, je m’interroge sur la pertinence d’utiliser ponctuellement le game design en tant qu’outil de médiation (en vérité, aujourd’hui encore, je n’ai pas trouvé d’idée de GD pour le boulot d’Alexandre et Hélène, alors si vous avez des idées, lâchez-les dans les comm’s).

On se met d’accord sur les termes

Avant d’aller plus loin, et pour répondre à ce « Qu’est-ce que le game design vient foutre dans cette histoire ? » que j’entends d’ici (ne niez pas, j’ai votre IP), petit pont lexical. Qu’est-ce qu’un jeu ? Eh non, un jeu, même un jeu vidéo, n’est pas forcément « Un divertissement pour ado attardé » (j’ai votre IP, je vous dis).

Un jeu, c’est :

  • une expérience interactive (sans le joueur, le jeu n’existe pas, alors que sans le lecteur, l’article existe – il est juste très très triste)
  • une expérience régie par des règles (dans un jeu, il y a des choses qu’on peut faire, et d’autres qu’on ne peut pas faire)
  • une expérience dans laquelle l’utilisateur a un objectif à atteindre (on sait pourquoi on joue, c’est même ce qui nous fait continuer à jouer)
  • une expérience dont le résultat varie en fonction des actions de l’utilisateur (cette variation est parfois mesurée par une donnée, le « score », mais ce n’est en aucun cas une obligation)

Les plus observateurs d’entre vous auront remarqué qu’un jeu, c’est avant tout une expérience. Voilà justement la dimension qui fait parfois, à mon humble avis, défaut aux projets journalistiques basés sur les données. C’est déjà très bien de permettre aux internautes de compulser librement les informations récoltées, mais même la meilleur volonté du monde ne résiste pas longtemps face à une trop énorme quantité de données. Une botte de foin, c’est grand, surtout quand on ne sait pas si on y cherche une aiguille ou un cure-dents.

Le résultat d’un trop grand nombre de données sur votre cerveau.

Pourtant, en se plongeant en profondeur dans la data, le journaliste a découvert que certains chiffres méritent une attention particulière. Il a déniché les quantités qu’il peut être intéressant de mettre en perspective, les tendances à relever, les exceptions notables… En bref, il sait ce qu’il « faut » chercher : il a identifié des objectifs cachés dans la base de données. Pourquoi ne pas aller encore plus loin, et proposer aux internautes de revivre la même expérience que lui par la manipulation ?

De là-haut je vois plus ma maison

C’est par exemple le sens de la Nukemap, un projet créé par Alex Wellerstein, passionné de bombes nucléaires devant l’éternel (tout existe).

Salut, New-York, on t'aimait bien !
Salut, New-York, on t’aimait bien !

Ce site est en fait un simulateur de bombe nucléaire, basé sur une gigantesque base de données. Il y est possible de créer de toutes pièces une bombe virtuelle, en exprimant sa puissance en équivalent de tonnes de TNT, et de la faire exploser n’importe où sur une Google map, pour voir quelles conséquences ça aurait : pertes humaines, blessés, aire d’effet, zone de propagation des retombées radioactives… C’est un outil intéressant, mais sans un minimum de scénarisation, un utilisateur moins passionné que Wellerstein ne pourrait pas en tirer beaucoup d’infos significatives.

C’est pourquoi l’auteur nous propose, via deux menus déroulants, de choisir parmi des listes de préréglages. Le lieu, d’abord, pourra ainsi être une grande ville contemporaine ou un des endroits de la planète qui a déjà connu une explosion atomique. Et la puissance de la bombe, elle, pourra correspondre à l’arme larguée sur Hiroshima, à la plus grosse ogive française, ou encore à la « Tsar bomba », mastodonte de l’armée soviétique.

Ainsi, les données représentées dans ce simulateurs deviennent tout de suite plus tangibles pour l’utilisateur. Les règles du jeu sont celles de la réalité simulée – on ne peut par exemple pas faire exploser de bombe d’une puissance supérieure à 100 mégatonnes, soit la limite des connaissances scientifiques humaines en matière d’armes nucléaires. Quant à l’objectif, il est suggéré par le dispositif : recréer toutes les conditions de l’attaque sur Nagasaki et voir combien de victimes elle ferait si elle avait lieu aujourd’hui, déterminer quelle cible serait la plus intéressante pour les États-Unis si nous étions encore en guerre froide, voir jusqu’où s’étendrait la contamination provoquée par une bombe nord-coréenne touchant Séoul… D’ailleurs, Wellerstein aurait pu pousser plus loin le concept en fixant des objectifs clairs, en relation avec les zones du globe où la tension nucléaire est vive aujourd’hui.

Bagarres sur la grande boucle

Sur un registre un peu moins explosif, j’ai récemment aidé WeDoData à produire, pour Radio France, une application de visualisation de données interactive sur les 100 éditions du Tour de France. Au menu : tous les tracés, les villes-étapes, les lieux mythiques, mais aussi les vainqueurs et leur palmarès sur cette course.

En cherchant une idée pour mettre en scène les informations relatives à chaque coureur, nous avons vite convenu que publier une simple fiche par cycliste n’intéresserait que les vrais passionnés du Tour, ceux pour qui les statistiques brutes font écho à des souvenirs puissants. Pour retenir l’attention du grand public, qui ne connait que les quelques noms des plus grandes stars de la petite reine, il fallait lui proposer une expérience. C’est ce que nous avons tenté de faire avec les « Duels de Légendes« .

Van Impe/Lambot, le match des seconds couteaux
Van Impe/Lambot, le match des seconds couteaux

Le principe de cette rubrique est simple : l’internaute y choisit un coureur et son adversaire parmi les 58 vainqueurs de l’épreuve (plus quelques « guest-stars » tels Virenque ou Poulidor), et l’application oppose les deux cyclistes dans une course virtuelle en six étapes. Elles représentent en fait des points de palmarès particulier : nombre de victoires finales, meilleure vitesse moyenne, nombre d’étapes gagnées… Et à chaque fois, les sportifs avancent plus ou moins vite l’un par rapport à l’autre selon les performances accomplies dans leur carrière. La dernière étape est particulière puisqu’elle concerne le dopage : si un coureur a été contrôlé positif et éliminé du Tour pour cette raison, il est de même éliminé de notre course virtuelle, même s’il avait pris le dessus sur son adversaire.

Voici donc un jeu, mais un jeu qui utilise les données réelles comme règles. Bien sûr, nous n’avons pas choisi les points de palmarès à comparer au hasard. Par exemple, si les coureurs contemporains ont une vitesse moyenne bien supérieure à celle de leurs ancêtres, ces derniers avaient l’habitude de boucler la course avec une avance sur le second très conséquente, ce qui n’est plus le cas de nos jours. Ainsi, notre application réserve son lot de surprises. Les monstres du cyclisme, Eddy Merckx en tête, écrasent la concurrence, mais on y apprend que Philippe Thys, triple vainqueur aujourd’hui oublié, ridiculise en matière de palmarès Bradley Wiggins, le champion de l’an dernier.

Data games! Data games everywhere!

Si les bases de données se prêtent bien à une translation vers le jeu, c’est avant tout parce que les jeux vidéo sont en premier lieu des machines à calculer appliquées : ils transforment des 1 et des 0 en histoires. La rhétorique du jeu vidéo (ou procedural rhetoric, comme la désigne le chercheur américain Ian Bogost), c’est l’art de faire passer un message ou une information à travers des manipulations symboliques basées sur des règles. Et que sont les données, sinon des symboles abstraits qui résument des réalités concrètes ? Un taux de chômage de 11%, une vitesse de 44,12 km/h, un budget de 815K€… tout l’intérêt du data game, c’est de créer des règles qui vont pousser le joueur à manipuler ces symboles et à en extraire du sens.

Mais quel sens ? D’après un groupe de chercheurs des universités de Malmö et Copenhague, qui a effectué un travail sur le sujet,  » A l’opposée des « serious games » et des jeux militants, un Data game n’est pas conçu pour enseigner une compétence particulière ou convaincre le joueur de quoi que ce soit. Il vise plutôt à lui donner les moyens d’explorer les données par lui-même, en gardant la trace des conséquences de ses actions.  » Et les chercheurs de donner quelques exemples de jeux imaginés par eux.

Dans le Monopoly, les rues sont rangées selon leur prospérité. Mais au fait, c’est quoi, la prospérité ?

Ils ont d’abord pensé à réutiliser les codes de jeux connus, comme le Monopoly, pour faire réfléchir le public. Dans l’Open Data Monopoly, le joueur commence par choisir une série d’indicateurs dans une liste (niveau moyen de revenu, d’éducation, taux de criminalité, diversité ethnique, niveau de bénévolat…) et par dire, pour chacun, s’il est selon lui un bon indice de prospérité – une notion finalement assez abstraite. Selon ces critères, le jeu génère alors un plateau de Monopoly dans lequel les rues sont remplacées par des villes anglaises connues, ordonnées selon leurs « performances » dans les indicateurs choisis. L’utilisateur a alors affaire à une représentation concrète – et éventuellement surprenante – de sa perception de la prospérité. Voudrait-il vraiment vivre dans la ville qui occupe la case « Rue de la Paix » ? Et si non, peut-il arriver à générer un autre plateau qui reflèterait mieux son désir, en revoyant la façon dont il a estimé les indicateurs ?

Petite parenthèse : il est intéressant de noter que The Landlord’s Game, le jeu qui a inspiré le Monopoly, était en fait un objet politique assez marqué. Ce jeu, inventé par Elisabeth Magie en 1904, a été conçu pour dénoncer l’enrichissement des propriétaires aux dépends des locataires (ce qui ne manque pas d’ironie quand le Monopoly actuel aurait plutôt tendance à célébrer les joies de la rente). Fin de la minute historique.

Mais les chercheurs de Malmö et Copenhague ont aussi imaginé des jeux dans lesquels les données sont vraiment au cœur du « gameplay ».

OpenTrumps, par exemple, est l’adaptation d’un type de jeu de bataille populaire dans les pays anglo-saxons. Sur chaque carte figure un pays, et une série d’indicateur démographiques, économiques et géopolitiques provenant d’une base de données des Nations-Unies (niveau de la dette à court terme, consommation d’eau…). Le but du jeu est, selon la carte que vous oppose votre adversaire, de choisir l’indicateur à comparer pour le surclasser. Dans OpenTrumps, la France est une carte imbattable en terme de revenus issus du tourisme, mais elle n’aura aucune chance face à la carte Japon si on compare le niveau de chômage… Evidemment, pour gagner à OpenTrumps, il faut connaître – ou au moins tenter d’estimer – les valeurs des indicateurs de la carte qu’on vous oppose. La perception de la base de données est donc l’élément qui donne son sel à l’expérience de jeu.

Au chapitre des autres idées proposées, on trouve OpenStreetRacer (qui vous propose de conduire une voiture sur des parcours « réels » basés sur OpenStreetMap), OpenDataCivilization (qui crée des cartes pour Civilization IV dans lesquelles toutes les infos, y compris la distribution des ressources naturelles, sont vraies), Flight Leader (qui vous met dans la peau d’un contrôleur aérien en récupérant les données des vols internationaux sur Flightradar24.com) et bien d’autres… Ce ne sont bien sûr que de rapides prototypes, mais ils ont le mérite de montrer un large spectre de ce qu’il est possible de faire en terme de data games.

Du reste, imaginer des jeux avec les données n’est pas qu’une affaire de chercheurs. Politiques, agences de com’, journaux en ligne (Guardian et New Work Times en tête) essaient de saupoudrer leurs outils de manipulation de #data avec un peu de game design pour proposer des expériences utilisateur plus satisfaisantes. J’ai rassemblé quelques exemples parmi les plus marquants que j’ai vu passer ces derniers temps dans la présentation ci-dessous (Romney Makes, le premier lien, n’est plus en ligne et c’est bien dommage, mais en gros c’était ce principe-là, en bien mieux fait) :

It’s all in the game yo

On peut dès lors se demander si tous les projets de visualisation de données interactives bénéficieraient d’un apport plus ou moins important de game design. Évacuons l’argument qui veut que certains sujet sont « trop sérieux pour en faire des jeux ». Nous parlons ici du jeu vidéo comme forme médiatique, et en tant que tel, rien ne le condamne à la trivialité. De la même manière qu’on peut faire des dessins animés ou des bandes dessinées portant sur une actu « lourde », le jeu vidéo peut lui aussi prétendre à autre chose que le simple divertissement.

 

Cela dit, il est toujours préférable de choisir une forme en accord avec le fond qu’on souhaite illustrer. Si le but de votre démarche, en tant que « data-driven journalist », est de fournir à vos lecteurs une ressource exhaustive et de leur permettre simplement de l’explorer, alors il ne sera probablement pas utile d’avoir recours au game design.

L’incroyable We are Data, modélisation interactive de toutes les données qui nous entourent quand on vit dans une grande ville comme Paris, est un bon exemple. Rien d’étonnant à ce que cette web app  ressemble à un jeu vidéo, puisqu’elle a été produite par Ubisoft et BetC pour promouvoir le prochain titre de l’éditeur, Watchdogs. Mais We Are Data n’est pourtant pas un « vrai » jeu : aucun objectif n’est proposé à l’utilisateur. Il peut bien sûr s’en fixer lui-même (trouver le quartier le plus pauvre de Paris, celui qui est le plus doté en caméras de sécurité, etc.), mais ce n’est pas le but premier de l’objet.

Objectif de design de We Are Data : nous faire prendre conscience de toutes les données qui nous entourent.
Objectif de design de We Are Data : nous faire prendre conscience de toutes les données qui nous entourent.

En revanche, si vous souhaitez permettre à l’internaute de comprendre par lui même les corrélations entre plusieurs données, alors le game design est votre ami. Dans un jeu, il y a le plus souvent un conflit, une opposition, un obstacle à comprendre pour mieux le surmonter. Comme le dit Sid Meier (un des plus célèbres game designer, auteur notamment de la série Civilization), le gameplay, c’est « une série de choix intéressants ». A vous de construire une expérience, en proposant des choix qui seront intéressants pour votre public. Ainsi, vous l’amènerez à explorer, à analyser et à comparer des éléments afin de prendre la meilleure décision possible pour atteindre l’objectif fixé. Ces éléments, ce sont les données que vous avez eu tant de mal à récupérer parce qu’elles étaient planquée au fin fond d’un site officiel ou mises à disposition en format jpeg, résolution 45 dpi. Ce serait dommage que vos lecteurs ne s’y intéressent pas parce que la forme sous laquelle vous les leur présentez les fait fuir, non ?

MaJ: une autre ressource sur le sujet, signalée par @Gameinsociety, aka Olivier Mauco : http://www.digra.org/wp-content/uploads/digital-library/09287.11403.pdf

6 réponses sur “Du jeu de données au jeu avec les données”

  1. Tout jeu propose un rôle précis, voleur, pirate de l’espace, survivant de l’apocalypse, soldat, chirurgien, etc. La question est alors de savoir comment rendre la profession de journaliste intéressante à jouer. N’est ce pas ? Si on englobe les dataviz d’une couche métaphorique à base de shooter j’ai peur qu’on perde le public cible et l’intérêt même de la data.
    Là comme ça ce que je trouverais cool ce serait qu’un site recense l’ensemble des dataviz disponibles et que chaque joueur inscrit monte en grade à force de découverte juteuse de façon à accéder à des dataviz plus balèzes et plus juteuses encore. Ce serait un genre de collaboration avec les journalistes pour rechercher les infos croustillantes. D’un côté les journalistes sont contents parce qu’ils chopent des infos sans passer trois plombes dans des fichiers Excel imbitable et de l’autre les joueurs jouent au journaliste et pourraient même avoir une petite citation. Bref c’est le truc que je trouve intéressant dans ce type de journalisme orienté data c’est qu’il peut permettre aux joueurs de jouer, simplement, au journaliste non pas dans un monde fictionnel mais sur des vraies données du monde réel.

    Sinon, très cool l’article.

    1. Merci du commentaire et de ton compliment, Simon.
      Je crois qu’il serait dommage de limiter les jeux sur les données au rapport que le journaliste a avec elles. Certes c’est une possibilité, et d’ailleurs le jeu que tu propose est un peu ce que le Guardian avait mis en place pour crowdsourcer les pages de rapport sur les dépenses des membres du parlement (http://www.guardian.co.uk/news/datablog/2009/jun/18/mps-expenses-houseofcommons).
      Mais les données portent sur plein de sujets différents, et elles existent même sans les journalistes pour s’y intéresser. Du coup, dans un jeu basé sur des données, l’internaute peut, selon les données, être premier ministre, flic, SDF, cuisinier… Et tant mieux !
      Je suis aussi d’accord avec toi que plaquer une couche de « jeu » artificiellement sur un set de données ne peut pas fonctionner. Il faut que les règles du jeu soient dictées par le contenu de la base de données, par les conflits qu’elle recèle.

      1. Si le but de ces jeux est d’amener les joueurs à approfondir un sujet d’actualité ou de leur fournir une dataviz alors le jeu n’est en fait pas absolument nécessaire il tend même à augmenter la distance entre l’info et le joueur par le challenge/obstacle/etc. Le cas de Romney Makes (ou de Duels de légendes) est cool parce qu’il n’y a pas de game design justement c’est simplement un travail de présentation, il n’y a pas de challenge. Par contre s’il s’agit d’engager un peu plus les internautes en leur permettant de trouver des infos inédites alors là je comprends que le jeu devienne un moyen idéal, le challenge étant directement lié à la base de données, mais j’ai du mal à concevoir ça comme autre chose qu’un jeu d’enquête, à la In Memoriam quoi.

        Donc pour résumer en gros je trouve qu’on a tendance à parler de jeu très vite alors qu’il n’y en a, souvent, pas, et pourtant je suis méga open sur la définition du jeu. Et je trouve aussi qu’il y a très peu de cas où faire un jeu vaut vraiment le coup nan ?

        Voilà merci pour ta réponse et désolé si il y a des questions cons mais j’aime bien l’idée des newsgames sans jamais avoir trop fouillé ni vu de truc vraiment convainquant. J’adore 12th September par exemple mais je trouve quand même ça un peu gadget disons.

        1. En fait, Simon, toute la question est justement « Qu’est-ce qui fait un jeu ? » Tu dis que tu es open sur la définition du jeu, peux-tu l’énoncer ? Pour toi, un jeu, c’est quoi ?
          Je donne « ma » définition dans mon article : un jeu est une expérience interactive, régie par des règles, dans laquelle l’utilisateur a un objectif à atteindre, et dont le résultat varie en fonction des actions du joueur. C’est pourquoi, d’après moi, le Duel de légendes est un jeu : l’objectif est de gagner la course, les règles sont qu’on peut choisir son représentant et son adversaire parmi une sélection d’environs 60 coureurs, et en fonction de ces choix, le résultat est bien différent. C’est un jeu très simple, effectivement, mais c’est le processus à l’œuvre qui m’intéresse: en choisissant tel coureur plutôt que tel autre, on a une idée à l’avance de si on va gagner ou perdre, et on est conforté ou détrompé par les datas. C’est en ce sens que le game design est utile à l’exploration de données : il permet au jouer de confronter ses supposition à la réalité des chiffres, et donc de modifier sa représentation mentale de la réalité qui se cache derrière la base de données.

          1. D’accord j’avais pas capté qu’il y avait cette notion de victoire derrière. Effectivement là comme tu me l’expliques il s’agit d’un jeu mais en même temps je me pose la question de savoir si le joueur joue vraiment à gagner ou ne joue pas plutôt à essayer plein de combinaisons de cyclistes possibles un petit peu comme on pourrait jouer à lancer des bombes à eau de tailles et formes différentes pour voir l’explosion sur le sol sans chercher à gagner… Ce qui me fait penser finalement que ça ressemble presque plus à un jouet dans ce cas là ce qui correspond plutôt bien à ma définition du jeu et qui est à mi chemin entre le jeu et la base de données. Pour le coup comme ça c’est cool effectivement. On reste dans ce gameplay de recherche et d’exploration (journaliste) avec en plus l’aspect expérimentation de la simulation des données.

            Merci pour les précisions !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.