Antidot participe au co-design de data.gouv.fr initié par la mission Etalab (1/2)

Qu’est ce que le « co-design » de data.gouv.fr ?

Le 10 avril 2013, la mission Etalab a lancé un processus de « co-design » afin de préparer une nouvelle version de la plateforme data.gouv.fr. Seize mois après l’ouverture de celle-ci, et après la nomination d’Henri Verdier à sa tête, Etalab a souhaité lancer une nouvelle étape du développement de data.gouv.fr, et associer  la communauté de l’open data à sa réflexion.

L’objectif affiché de ce « co-design » est de « recueillir toutes les suggestions des parties prenantes pertinentes, de repérer un maximum de compétences de notre écosystème et de produire un effort de prototypage rapide en public. »

Le contexte de la réponse d’Antidot

Antidot, en tant que fournisseur de solutions technologiques, est déjà partie prenante d’un certain nombre de projets Open Data ou Linked Data.

Nous le sommes du côté de la diffusion de données ouvertes, comme l’illustre la  plateforme ISIDORE du CNRS qui utilise nos solutions Antidot Information Factory et Antidot Finder Suite pour collecter, agréger, enrichir et exposer (via un moteur de recherche, une API et selon les principes du Linked Data) les données et métadonnées de la recherche francophone en Sciences Humaines et Sociales.

Home ISIDORE 450px

Nous sommes aussi acteur de l’Open Data du côté de la réutilisation des données ouvertes. S’il ne nous est pas possible aujourd’hui de divulguer des informations sur un certain nombre de projets que nous menons avec nos clients, notamment dans le secteur de la presse et des médias, vous pouvez consulter notre démonstration mettant en valeur les Monuments Historiques de France.

C’est donc bien volontiers que nous avons apporté notre pierre à cet édifice, en rédigeant une réponse argumentée au questionnaire posé par Etalab.

Préambule : deux axes fondamentaux

Avant d’entrer dans le détail de nos propositions, nous avons tenu à mettre l’accent sur deux axes fondamentaux qui seront au cœur de notre réflexion sur le futur de data.gouv.fr :

  • la notion de confiance dans les données ouvertes
  • l’intégration du portail data.gouv.fr dans l’écosystème du Web.

La confiance dans les données ouvertes

La confiance constitue la condition sine qua non à la réutilisation de données par des tiers. Elle se joue à deux niveaux : au niveau des données elles-mêmes et au niveau technique.

Le fait que les données soient publiées par Etalab, c’est-à-dire par un organisme public étatique, leur confère a priori un statut particulier. Bien sûr, certaines données ne sont pas exemptes d’erreurs mais, de par leur provenance des données, une  confiance intrinsèque permet d’en favoriser la réutilisation.

Cette confiance a priori doit conduire Etalab à garder un certain niveau d’exigence et de qualité vis-à-vis des jeux de données mis à disposition et des métadonnées qui les décrivent, car s’il est difficile et long de construire une confiance a posteriori, il l’est encore plus de retrouver une confiance perdue. Or cette notion de confiance doit aussi se traduire techniquement… et nous avons constaté qu’aujourd’hui toutes les conditions ne sont, hélas, pas encore réunies.

L’intégration du portail data.gouv.fr dans l’écosystème du Web

À travers les différentes questions posées par Etalab, c’est la nature même du portail data.gouv.fr qui est interrogée. Doit-il être :

  • un annuaire de liens vers des jeux de données existants ?
  • une plate-forme collaborative autour des données publiques en France ?
  • une plate-forme de valorisation des jeux de données existants ?
  • une plate-forme centrale qui accueille et expose elle-même toutes les données de manière brute pour l’ensemble des organismes publiques quelles que soit leur nature et leurs origines ?
  • une plate-forme de traitement, de mise en relation et d’enrichissement des jeux de données ?
  • un espace de rencontre, conseil et partage pour les producteurs et les consommateurs des données ?

Dans la mesure où l’Open Data est intrinsèquement lié au Web, nous considérons que le portail data.gouv.fr doit s’insérer dans l’écosystème du Web et profiter des bénéfices du milieu associé qu’il constitue. Il doit donc en respecter les principes et les standards, en particulier la mise en relation des contenus.

Ainsi,  si data.gouv.fr n’a pas vocation à devenir un point centralisateur de l’ensemble des données publiques, il doit constituer :

  • un « hub », fédérateur, favorisant la qualité, la visibilité, l’interopérabilité et la mise en relation des jeux de données d’ores et déjà mises à disposition, sans nécessairement les « republier »
  • une infrastructure technique pour traiter, enrichir, mettre en relation, accueillir et/ou héberger les jeux de données issus d’organismes publics (étatiques ou territoriaux) ne disposant pas des moyens nécessaires
  • un espace à disposition des organismes publics pour les accompagner dans une démarche de mise à disposition de leurs données, notamment sur les aspects juridiques et techniques ;
  • un espace de démonstration et de valorisation des initiatives existantes en termes de réutilisation des données et des technologies dans le domaine.

C’est sur la base de ces deux axes fondamentaux que s’articule notre réponse à Etalab.

À suivre

Dans un prochain billet, à paraître d’ici quelques jours, vous trouverez une synthèse de notre vision technologique et fonctionnelle des directions que pourrait prendre data.gouv.fr.

Et vous trouverez notre réponse complète sur notre site web, sous forme d’un document PDF disponible ici. Bonne lecture !

 

Au-delà du buzz et de la polémique sur Qwant

Je ne reviendrai pas ici sur le buzz et la polémique qui ont entouré le lancement en fin de semaine dernière de Qwant, un nouveau méta-moteur de recherche.

Je souhaite néanmoins vous faire part de l’opinion qui prévaut chez Antidot après cette affaire : il est vraiment regrettable que tous les médias, y compris les professionnels de l’IT, aient cédé à la facilité de faire de Qwant le nouveau  « Google français« . C’est un vrai souci pour les éditeurs de logiciels professionnels présents sur ce segment de marché : même quand on ne leur parle pas de Google et qu’on ne s’y compare pas, dès lors qu’il s’agit de technologies de moteurs de recherche les médias en reviennent au géant de Mountain View.

Antidot aussi en a fait l’expérience il n’y a pas longtemps avec cet article d’avril 2012 du Progrès de Lyon titré : « Fabrice Lacroix a bien failli créer le Google lyonnais » que vous pouvez lire en ligne ici et dont vous trouvez la reproduction ci-dessous.

Le Progrès 10 avril 2012

Si vous vous intéressez aux méta-moteurs et agrégateurs de recherches, je vous invite vivement à essayer le service Pickanewshttp://www.pickanews.com – un « moteur de veille » français disponible pour plusieurs langues et pays européens. Pickanews facilite la veille média sur une marque, une personne, un mot-clé et apporte un tableau de bord très riche qui permet de mesurer l’impact médiatique d’une marque ou d’une personne, en visualisant son évolution dans le temps, et avec la possibilité de le comparer à d’autres :

Pickanews dashboard

Pickanews utilise des technologies avancées de « speech to text » pour trouver des mots-clés prononcés dans des journaux d’info TV ou des émissions de radio. Avec en parallèle la recherche des ces mots-clés sur le web et les réseaux sociaux ainsi que dans toute la presse écrite, grand public et professionnelle, qui est numérisée et OCRisée chaque matin puisque c’est le métier de base du groupe PressIndex , acteur historique de la « pige presse » qui a créé Pickanews il y a 2 ans.

Pickanews lecteur audio

Le « speech to text » n’est évidemment pas parfait mais cela rend un vrai service. Vous pouvez consulter un exemple de veille effectuée avec Pickanews sur la marque « Qwant«  :

Pickanews-Qwant

Pickanews tire pleinement avantage des logiciels Antidot Information Factory, Antidot Finder Suite et Antidot Collaboration Services proposés par Antidot : ces solution sont fait leurs preuves, car c’est depuis 1999 que nous développons des technologies de moteurs de recherche et des solutions de valorisation de l’information et de navigation dans les données. Ces solutions sont aujourd’hui mises en œuvre avec succès par plus d’une centaine de clients de profils très divers, parmi lesquels figurent notamment TF1, Le Point, LexisNexis, Le Moniteur, Service-Public.fr, DecathlonPecheur.com, Discounteo, Oreca Store et bien d’autres que je ne peux tous citer et que je remercie de leur confiance.

Vous trouverez des explications techniques sur le service Pickanews sur cette page de notre site web et dans ce document PDF de 3 pages.

Et si vous avez un projet de moteur de recherche interne à votre entreprise,  ou de moteur de recherche pour votre site web, nous sommes à votre disposition pour vous apporter le meilleur de notre expertise et de nos technoogies !

 

Un nouveau portail pour notre documentation en ligne

Antidot met à disposition de l’ensemble de ses clients et partenaires un nouveau portail pour l’accès en ligne à la documentation de ses produits.

Ce portail documentaire a pour ambition de faciliter vos recherches et de simplifier votre navigation au sein de près de 2000 pages de Guides, Notes techniques et Notes de version :

Ce service vous est aujourd’hui ouvert en version beta. N’hésitez pas à nous faire part de vos retours : tous les commentaires et suggestions que nous recueillerons seront étudiés avec la plus grande attention.

Pour la petite histoire, ce portail documentaire est réalisé intégralement à partir de nos solutions dont il exploite les fonctionnalités avancées :

Il sera bientôt enrichi des fonctions d’alertes et d’annotation apportées par notre produit ACS – Collaboration Services.

Nous vous remercions de votre confiance.