<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog Antidot</title>
	<atom:link href="http://blog.antidot.net/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.antidot.net</link>
	<description></description>
	<lastBuildDate>Thu, 27 May 2010 08:37:02 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Du référentiel à l’ontologie</title>
		<link>http://blog.antidot.net/2010/05/17/du-referentiel-a-l%e2%80%99ontologie/</link>
		<comments>http://blog.antidot.net/2010/05/17/du-referentiel-a-l%e2%80%99ontologie/#comments</comments>
		<pubDate>Mon, 17 May 2010 17:36:31 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Technologie]]></category>
		<category><![CDATA[classes]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[référentiel]]></category>
		<category><![CDATA[taxonomie]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=102</guid>
		<description><![CDATA[Lors d’un précédent billet nous avons examiné les différents types de référentiels et la façon dont ils étaient exploités par les moteurs de recherche. Dans la continuité de notre tour d’horizon, nous allons maintenant aborder le lien entre référentiels et ontologies.
Comme nous l’avons vu, les référentiels servent à organiser du vocabulaire, c’est-à-dire des mots qui [...]]]></description>
			<content:encoded><![CDATA[<p>Lors d’un <a title="Réinventer les référentiels" href="http://blog.antidot.net/2010/03/25/reinventer-les-referentiels/" target="_blank">précédent billet</a> nous avons examiné les différents types de référentiels et la façon dont ils étaient exploités par les moteurs de recherche. Dans la continuité de notre tour d’horizon, nous allons maintenant aborder le lien entre référentiels et ontologies.</p>
<p>Comme nous l’avons vu, les référentiels servent à organiser du vocabulaire, c’est-à-dire des mots qui représentent eux-mêmes des personnes, des objets, des choses …<br />
Et c’est là que le bât blesse : les concepts décrits par ces mots sont sous entendus. Ce que décrivent les mots n’est pas  explicité et c’est au lecteur de le déduire.</p>
<p>Exemple :<br />
Si je vous dis « De Gaulle, Mitterrand, Chirac, Sarkozy » &#8230; vous répondez Président de la République.<br />
Si je  dis « Cresson, Fillon, Villepin, Jospin » … vous répondez Premier Ministre.<br />
Et pour « Laguiller, Bayrou, Accoyer, Strauss-Kahn », vous pensez personne-politique.</p>
<p>Dans un beau référentiel de type « taxonomie », ou système de classement, nous aurions pu ranger tout ça de la façon suivante :</p>
<p><code>Personnages politiques<br />
+ Président<br />
|     De Gaulle<br />
|     Mitterrand<br />
|     …<br />
+ Premier ministre<br />
|     Jospin<br />
|     Fillon<br />
|     …<br />
+ Autre<br />
|       Accoyer<br />
|       Strauss Kahn<br />
|       …<br />
</code></p>
<p>Cette taxonomie semble efficace et permet de ranger, classer et organiser les hommes politiques français. Mais si on regarde bien, cette solution a des limites.<br />
La hiérarchie semble décrire une spécialisation, allant du plus générique au plus spécifique :<br />
•	Président est une sorte de d’Homme Politique,<br />
•	Premier Ministre est une sorte d’Homme Politique.</p>
<p>Mais De Gaulle est une sorte de Président, ça ne va pas. Car &#8220;<em>De Gaulle <strong>est un </strong>Président</em>&#8221; et non pas « <strong>une sorte de</strong> ». On dirait en employant un vocabulaire plus technique et informatique que &#8220;<em>Président est une<strong> sous classe</strong> d’Homme Politique</em>&#8221; alors que &#8220;De Gaulle est une <strong>instance</strong> de Président&#8221;. Et ça n’est pas pareil. On constate donc que notre taxonomie mélange en fait les niveaux logiques : elle mixe les concepts et les objets.</p>
<p>On a également des cas plus complexes : Chirac fut Premier Ministre et Président. Faut-il dupliquer l’entrée et le mettre dans les deux branches de la taxonomie ? Mais comment être sûr qu’il s’agit de la même personne ?</p>
<p>Et bien une ontologie ça sert à résoudre tous ces petits problèmes en permettant de modéliser les types d’objets et la façon dont ils interagissent.<br />
On peut ainsi définir une classe &#8220;<em>Homme Politique</em>&#8220;, puis des classes &#8220;<em>Président</em>&#8221; et &#8220;<em>Premier Ministre</em>&#8221; comme sous classes de &#8220;<em>Homme Politique</em>&#8220;. On peut aussi préciser des règles qui décrivent des interactions entre les classes. Exemple : &#8220;<em>un Premier Ministre est nommé par le Président</em>&#8220;.</p>
<p>Voilà, une ontologie, ça sert à ça : à décrire des aspects du monde (la politique, les médicaments, les voitures, …) en modélisant les choses qui constituent le monde. Tout cela permet aux machines de manipuler ces concepts et de faire des opérations très poussées. On parle alors de raisonnement. Ainsi supposons que nous soumettions à une machine la phrase &#8220;<em>Nicolas Sarkozy vient de nommer François Fillon au poste de premier Ministre</em>&#8220;, celle-ci serait capable de déduire automatiquement que Nicolas Sarkozy est Président et François Fillon Premier Ministre. Elle pourrait également en déduire que ces deux personnalités sont des Hommes Politiques.</p>
<p>Et les référentiels dans tout ça ? Et bien nos référentiels contiennent des mots qui permettent de nommer les concepts et les objets eux-mêmes. Les mots permettent de faire le lien entre l’homme et la machine. Les mots sont des étiquettes posées sur les objets pour les identifier. Et lorsqu’une ontologie contient tout le vocabulaire nécessaire à ce qu’elle décrit et manipule , on parle de référentiel onto-terminologique.</p>
<p>Dans un prochain billet, nous verrons comment ces ontologies peuvent être exploitées par les moteurs de recherche.</p>
<p><em>Note pour les puristes : oui la modélisation indiquée ici est simpliste. Il faudrait séparer la modélisation des personnes et de leur fonction, et introduire les modes d&#8217;accès à la fonction et la dimension temporelle.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/05/17/du-referentiel-a-l%e2%80%99ontologie/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>AFS et la tablette</title>
		<link>http://blog.antidot.net/2010/04/09/afs-et-la-tablette/</link>
		<comments>http://blog.antidot.net/2010/04/09/afs-et-la-tablette/#comments</comments>
		<pubDate>Fri, 09 Apr 2010 15:13:41 +0000</pubDate>
		<dc:creator>Laurent Dosdat</dc:creator>
				<category><![CDATA[Tendances]]></category>
		<category><![CDATA[interface]]></category>
		<category><![CDATA[iPad]]></category>
		<category><![CDATA[tablette]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=75</guid>
		<description><![CDATA[Difficile d&#8217;ignorer la vague médiatique autour de la tablette. Qu&#8217;il s&#8217;agisse de celle d&#8217;Apple, HP, Plastic Logic ou Archos, 2010 sera l&#8217;année de la tablette.
Chez Antidot, si l&#8217;objet nous intrigue technologiquement, il nous intéresse particulièrement pour les évolutions d&#8217;usage qu&#8217;il introduit ou introduira sous peu.
Notre vocation est de faciliter l&#8217;accès à l&#8217;information pertinente. Jusqu’à présent, [...]]]></description>
			<content:encoded><![CDATA[<p>Difficile d&#8217;ignorer la vague médiatique autour de la tablette. Qu&#8217;il s&#8217;agisse de celle d&#8217;Apple, HP, Plastic Logic ou Archos, 2010 sera l&#8217;année de la tablette.<br />
Chez Antidot, si l&#8217;objet nous intrigue technologiquement, il nous intéresse particulièrement pour les évolutions d&#8217;usage qu&#8217;il introduit ou introduira sous peu.</p>
<div id="attachment_78" class="wp-caption aligncenter" style="width: 458px">
<table cellspacing="10" cellpadding="10">
<tbody>
<tr>
<td valign="center"><img class="size-full wp-image-78" title="Plastic Logic Flexible Screen" src="http://blog.antidot.net/wp-content/uploads/2010/04/AFS-tablette-PL2.png" alt="Plastic Logic Flexible Screen" width="200"/></td>
<td  valign="center"><img class="size-full wp-image-77" title="Plastic Logic Reader" src="http://blog.antidot.net/wp-content/uploads/2010/04/AFS-tablette-PL1.png" alt="Plastic Logic Reader" width="200"/></td>
</tr>
</tbody>
</table>
<p><p class="wp-caption-text">Plastic Logic : écrans souple et eReader - Crédit Plastic Logic</p></div></p>
<p>Notre vocation est de faciliter l&#8217;accès à l&#8217;information pertinente. Jusqu’à présent, l&#8217;outil privilégié a été le navigateur web sur un poste globalement fixe. La banalisation des smartphones, la croissance du trafic 3G et l’arrivée de la 4G (LTE) montrent que les frontières se déplacent et que l’accès en situation de mobilité devient une réalité. C’est dans ce contexte que les fameuses tablettes et autre e-reader arrivent, rendant plus évident encore le besoin de repenser l’accès rapide à l’information dans des interfaces plus « minimalistes ».</p>
<p>Nos clients, à commencer par ceux de l&#8217;édition et des médias, vont sans doute adapter leurs portails et leurs moteurs de recherche à ces nouveaux objets de mobilité.</p>
<p>Un avocat par exemple ne sera-t-il pas tenté d&#8217;accéder en ligne à la jurisprudence ou à toute l&#8217;information pouvant se révéler déterminante pour ses affaires et ses clients ? Par exemple s’il est désigné d’office pour une comparution immédiate. C&#8217;est déjà possible mais le format d&#8217;ordinateur et la connectivité vont évoluer et cela sera encore plus naturel demain.</p>
<p>Un médecin trouvera sans doute aussi plus agréable de faire ses visites avec la tablette pour mettre à jour directement les dossiers de ses patients plutôt que de le faire en 2 fois. Si la connexion sans fil est possible dans l&#8217;établissement médical, il aura en outre les encyclopédies médicales à portée de main sans surcharge de poids. Quant à l&#8217;urgentiste du futur, il accèdera au dossier médical patient à vitesse grand V sur un périphérique plus adapté.</p>
<div id="attachment_76" class="wp-caption aligncenter" style="width: 415px"><img src="http://blog.antidot.net/wp-content/uploads/2010/04/AFS-tablette-iPad1.png" alt="iPad" title="iPad - Credit Apple" width="300" class="size-full wp-image-76" /><p class="wp-caption-text">iPad - Crédit Apple</p></div>
<p>D&#8217;une certaine façon, la relation entre le professionnel et son client devrait être moins entravée par le fameux ordinateur vers lequel on se tourne pour saisir un formulaire ou un compte-rendu. Cela sera plus fluide aussi qu&#8217;avec un smartphone dont l&#8217;écran rend nécessairement pénible et lente la saisie.<br />
De nouveaux publics profiteront mieux du web car l&#8217;expérience de navigation et de consultation sera plus agréable, depuis un fauteuil dans le salon plutôt que dans le bureau.</p>
<p>L&#8217;internet mobile va sans doute connaître un nouveau bond en avant et avec lui, les besoins d&#8217;informations se feront toujours plus immédiats et surtout plus contextualisés. Certaines tablettes intègreront sans doute un GPS, un appareil photo et les recherches de jouets, d&#8217;articles de sport ou d&#8217;activités touristiques se feront avec des attentes différentes. C&#8217;est déjà possible avec les smartphones mais il y a fort à parier que l&#8217;évolution de l&#8217;écran du périphérique amène un confort qui décuple l&#8217;usage.</p>
<p>Ces différents exemples sont issus de projets en cours chez Antidot. Ils illustrent combien la future tablette a de grandes chances d&#8217;avoir un succès rapide.</p>
<p>Vous l&#8217;aurez deviné, nous sommes très enthousiastes et totalement acquis en tant qu&#8217;amateurs de belles technologies mais surtout en tant que professionnels de l&#8217;information.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/04/09/afs-et-la-tablette/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Réinventer les référentiels</title>
		<link>http://blog.antidot.net/2010/03/25/reinventer-les-referentiels/</link>
		<comments>http://blog.antidot.net/2010/03/25/reinventer-les-referentiels/#comments</comments>
		<pubDate>Thu, 25 Mar 2010 19:47:12 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Retour d'expérience]]></category>
		<category><![CDATA[Tendances]]></category>
		<category><![CDATA[annotation]]></category>
		<category><![CDATA[auto complétion]]></category>
		<category><![CDATA[catégorisation]]></category>
		<category><![CDATA[extension sémantique]]></category>
		<category><![CDATA[plan de classement]]></category>
		<category><![CDATA[recherches connexes]]></category>
		<category><![CDATA[référentiel]]></category>
		<category><![CDATA[taxonomie]]></category>
		<category><![CDATA[terminologie]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=50</guid>
		<description><![CDATA[Dans un contexte où la recherche en texte intégral et l’avènement du Web 2.0 remettent en cause l’utilité et donc l’existence même de référentiels, ceux-ci sont obliger d'évoluer pour survivre. Cependant ces référentiels sont très utiles aux bons moteurs de recherche qui savent les exploiter pour réaliser de nombreuses fonctions dont nous donnons dans ce billet un aperçu [...]
]]></description>
			<content:encoded><![CDATA[<p>Lors d’un <a title="Avenir des référentiels" href="http://blog.antidot.net/2010/03/10/les-referentiels-ont-il-un-avenir/" target="_blank">billet précédent</a>, nous avons soulevé la question de l’avenir des référentiels dans un contexte où la recherche en texte intégral et l’avènement du Web 2.0 remettent en cause l’utilité et donc l’existence même de référentiels.</p>
<p><strong>Ce que sont les référentiels</strong></p>
<p><strong>Référentiel</strong> : données structurées qui sont de référence (donc qui font autorité) et qui permettent à des applications de fonctionner ensemble.</p>
<p>Les plus connus sont certainement les <strong>référentiels terminologiques </strong>: dictionnaires, thésaurus, listes de synonymes…  Ils contiennent du vocabulaire, ils font référence pour l’orthographe et la définition des mots et ils permettent aux hommes de communiquer ensemble en définissant un sens commun au langage. Pas de doute, ils répondent à la définition : ce sont des référentiels.</p>
<p>Ces référentiels terminologiques peuvent être :</p>
<ul>
<li>généralistes comme les dictionnaires : <a title="Littré" href="http://francois.gannaz.free.fr/Littre/accueil.php" target="_blank">Littré</a> : 78423 entrées, <a title="Larousse en ligne" href="http://www.larousse.fr/dictionnaires" target="_blank">Larousse</a> : 135 000 entrées, <a title="Wiktionnary" href="http://fr.wiktionary.org/" target="_blank">Wiktionnaire</a> ;</li>
<li>encyclopédiques : <a title="Rameau" href="http://rameau.bnf.fr/" target="_blank">Rameau</a>, le répertoire autorité-matière édité par la <a title="BNF" href="http://www.bnf.fr" target="_blank">BNF</a> (100 000 noms communs) ;</li>
<li>spécialisés : <a title="Eurovoc" href="http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/menu!prod!MENU?langue=FR" target="_blank">Eurovoc</a> le thésaurus multilingue édité par l’UE, <a title="Geonames" href="http://www.geonames.org/" target="_blank">Geonames</a> pour les noms géographiques (8 millions d’entrées), <a title="Termsciences" href="http://www.termsciences.fr/" target="_blank">Termsciences</a> pour le vocabulaire scientifique (190 000 concepts, 650 000 termes)</li>
<li>métiers : <a title="Gemet" href="http://www.eionet.europa.eu/gemet/index_html?langcode=fr" target="_blank">Gemet</a> dans l’environnement (200 000 descripteurs) ; <a title="MeSH" href="http://extranet.inserm.fr/information-scientifique-et-technique/le-mesh-bilingue" target="_blank">MeSH</a>, <a title="SNOMED" href="http://www.nlm.nih.gov/research/umls/Snomed/snomed_main.html" target="_blank">SNOMED-CT</a>, <a title="WHOART" href="http://en.wikipedia.org/wiki/WHOART" target="_blank">WHOART</a>, <a title="CIM 10" href="http://fr.wikipedia.org/wiki/Liste_de_codes_CIM-10" target="_blank">CIM-10</a>, <a title="CCAM" href="http://www.codage.ext.cnamts.fr/codif/ccam/index_presentation.php?p_site=AMELI" target="_blank">CCAM</a>, <a title="MeDRA" href="http://www.meddramsso.com/" target="_blank">MeDRA</a>, … en santé.</li>
</ul>
<p>Les <strong>systèmes d’information</strong> des entreprises <strong>regorgent</strong> également <strong>de référentiels</strong> qui parfois ne se savent pas eux-mêmes :</p>
<ul>
<li>les <strong>annuaires</strong> (LDAP, ActiveDirectory) utilisés pour la sécurité sont des référentiels de personnes, de groupes et de rôles ;</li>
<li>les <strong>CRM</strong> (gestion de la relation client) sont aussi des référentiels de contacts, de clients, de secteurs ;</li>
<li>les <strong>ERP</strong> (gestion de la production) sont des référentiels de produits, de catégories, de références ;</li>
<li>les <strong>arborescences</strong> de fichiers, les structures même des sites web sont des plans de classement.</li>
</ul>
<p><strong>De l&#8217;usage des référentiels par les moteurs de recherche </strong></p>
<p>Qu’ils soient techniques, ou conçus pour faciliter l’usage (classer, trier), ces <strong>référentiels</strong> sont très <strong>utiles aux <a title="AFS" href="http://www.antidot.net/fr/Technologie/AFS" target="_blank">bons moteurs de recherche</a></strong> qui savent les exploiter pour réaliser de <strong>nombreuses fonctions </strong>:</p>
<ul>
<li><strong>Extension sémantique </strong>: il s’agit d’élargir la recherche par mot clé de l’utilisateur en élargissant la recherche à des termes plus spécifiques ou a des synonymes. A la recherche « voiture », il est de bon ton de remonter des documents parlant également de « cabriolet » et d’ « automobiles ». Cette fonctionnalité est essentielle quand il s’agit de faire correspondre du vocabulaire technique avec celui des utilisateurs plus grand public.</li>
<li><strong>Auto complétion </strong>: les suggestions de recherche proposées à l’utilisateur alors qu’il saisit les premiers caractères peuvent pour partie provenir des référentiels, ce qui a pour effet d’améliorer considérablement la qualité de sa requête.</li>
<li><strong>Suggestions de recherches connexes</strong> : ces expressions affichées en marge des réponses afin de proposer à l’utilisateur des recherches similaires sont habituellement générées par analyse des contenus et des requêtes des utilisateurs. Ces suggestions peuvent être avantageusement contrôlées sur la base de la terminologie de référentiel métier afin d’en accentuer l’intérêt et le centrage sur le corpus.</li>
<li><strong>Catégorisation </strong>: afin d’assurer une continuité entre l’univers informationnel de l’entreprise (la façon dont les données sont rangées dans le SI) et le moteur de recherche, ce dernier doit catégoriser les données de façon similaire et donc exploiter les plans de classement existants.</li>
<li><strong>Recherche à facettes </strong>: les filtres actifs présentés à l’utilisateur en marge des réponses afin qu’il affine sa recherche par clics sont la plupart du temps issus de référentiels (listes d’autorité, plans de classement) qui doivent être familiers à l’utilisateur pour rendre évident le sens du filtre.</li>
<li><strong>Annotation automatique </strong>: il s’agit là d’analyser automatiquement les données afin de les caractériser par des mots significatifs. Cette opération « autrefois » réalisée manuellement (indexation manuelle pour créer les fiches bibliographiques) peut être largement automatisée sur la base de l’analyse du texte intégral. Cette fonction permet par exemple de générer le « nuage de mots » significatif d’un document ou d’un ensemble de documents.</li>
</ul>
<p><strong>Bonnes pratiques</strong></p>
<p>Comme on le voit, loin d’être détrônés par l’annotation libre, les référentiels apportent aux moteurs des données essentielles que la <a title="Folksonomie" href="http://fr.wikipedia.org/wiki/Folksonomie" target="_blank">folksonomie</a> ne saurait fournir, et il faut donc voir ces approches « Web 1.0 » et « Web 2.0 » comme complémentaires.</p>
<p>Il est cependant nécessaire que les référentiels évoluent afin de s’adapter à l’usage qu’en fait l’informatique. En particulier les référentiels terminologiques qui ne doivent plus être pensés pour l’indexation manuelle, mais comme matière première des moteurs et autres outils de traitement de l’information.</p>
<p>Quant aux <strong>bonnes pratiques</strong>, nous n’en préconiserons que 6 :</p>
<ol>
<li>Evitez les gros référentiels généralistes fourre tout. Ils sont générateurs de trop de bruit.</li>
<li>Préférez les petits référentiels métiers centrés sur des thématiques et des usages spécifiques. Ils n’en seront que plus faciles à maintenir.</li>
<li>Réutilisez au maximum des référentiels terminologiques existants, publiés par les organismes de normalisation ou les groupements professionnels.</li>
<li>Enrichissez-les avec votre vocabulaire maison spécifique que vous maintiendrez séparément dans un esprit « Small is beautiful ».</li>
<li>N’oubliez pas que votre système d’information regorge de référentiels. Identifiez les.</li>
<li>Et enfin, n’oubliez pas vos utilisateurs : construisez des petits plans de classements adaptés à leurs usages, et s&#8217;il y a plusieurs besoins, pas de problème, construisez plusieurs taxonomies. Cette multiplicité ne fait pas peur aux moteurs, et vos utilisateurs vous remercieront.</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/03/25/reinventer-les-referentiels/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Les référentiels ont-il un avenir ?</title>
		<link>http://blog.antidot.net/2010/03/10/les-referentiels-ont-il-un-avenir/</link>
		<comments>http://blog.antidot.net/2010/03/10/les-referentiels-ont-il-un-avenir/#comments</comments>
		<pubDate>Tue, 09 Mar 2010 22:07:12 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Retour d'expérience]]></category>
		<category><![CDATA[Tendances]]></category>
		<category><![CDATA[indexation]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[référentiel]]></category>
		<category><![CDATA[thésaurus]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=45</guid>
		<description><![CDATA[Thésaurus, listes d’autorité, plans de classement… depuis bien longtemps les référentiels ont prouvé leur utilité dans le domaine documentaire. Ils ont été le fondement de la gestion et de l’organisation de l’information dans les cellules documentaires, les bibliothèques, chez les éditeurs de contenus. L’avènement de l’informatique et d’Internet a sensiblement modifié leur usage et a [...]]]></description>
			<content:encoded><![CDATA[<p><a title="thésaurus" href="http://fr.wikipedia.org/wiki/Th%C3%A9saurus" target="_blank">Thésaurus</a>, listes d’autorité, plans de classement… depuis bien longtemps les référentiels ont prouvé leur utilité dans le domaine documentaire. Ils ont été le fondement de la gestion et de l’organisation de l’information dans les cellules documentaires, les bibliothèques, chez les éditeurs de contenus. L’avènement de l’informatique et d’Internet a sensiblement modifié leur usage et a nécessité une refonte de leur format et parfois de leur contenu.</p>
<p>Jusqu’au jour où le Web 2.0 est venu remettre en cause leur existence. Avec la « <a title="Folksonomie" href="http://fr.wikipedia.org/wiki/Folksonomie" target="_blank">folksonomie</a> », c’est l’utilisateur qui tagge, qui étiquette, qui décrit. Chacun annote comme il veut et classe comme il l’entend. L’ordre né de l’entropie. Une vraie révolution copernicienne.</p>
<p>« Le pouvoir au peuple ! à bas la dictature des référentiels ! ». En des temps pas si lointains où tout était politique, le référentiel aurait-il été qualifié de bourgeois ? Outil d’asservissement de l’utilisateur ignorant des choses subtiles de la classification et de l’indexation, réservé à une élite sachante ?</p>
<p>La recherche en texte intégral n&#8217;est-elle pas la solution idéale ? Le Graal qui délivre la connaissance ? Après Google qui met à mal les cellules de veille, Internet va-t-il tuer les référentiels ? Le référentiel a-t-il vécu ? Il est vrai que si l’on regarde de près des services comme Flickr ou Delicious, les résultats sont plutôt probants.</p>
<p>Lors de la conférence que nous tenons à <a title="Antidot Documation 2010" href="http://www.documation.fr/site/FR/Zoom_Exposant,C1578,I1129,Zoom-77e2cfec5bf071610936eae865290d64,FromOut-ListGlob.htm?KM_Session=911914ecd54478c85221a66a2846cbe6" target="_blank">Documation</a> le <a title="Conférence Antidot Documation 2010" href="http://www.documation.fr/site/FR/Zoom_Evenement,C1129,I1114,Zoom-f1a32576f02313bd7bc3190031317194.htm?KM_Session=5eda01e82ab13ba3a57f18aa29b5f70f" target="_blank">17 mars à 14h30</a>, nous aborderons ce sujet en détail et essayerons de comprendre l’intérêt des référentiels à l’heure du Web 2.0 et de la montée en puissance du Web Sémantique (Web 3.0).</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/03/10/les-referentiels-ont-il-un-avenir/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Des lettres et des chiffres</title>
		<link>http://blog.antidot.net/2010/02/10/latent-dirichlet-allocation/</link>
		<comments>http://blog.antidot.net/2010/02/10/latent-dirichlet-allocation/#comments</comments>
		<pubDate>Wed, 10 Feb 2010 16:28:30 +0000</pubDate>
		<dc:creator>Jérôme Mainka</dc:creator>
				<category><![CDATA[Technologie]]></category>
		<category><![CDATA[bayes]]></category>
		<category><![CDATA[catégorisation]]></category>
		<category><![CDATA[Latent Dirichlet]]></category>
		<category><![CDATA[LDA]]></category>
		<category><![CDATA[modèles]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[probabilités]]></category>
		<category><![CDATA[recherche d'information]]></category>
		<category><![CDATA[sémantique]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=37</guid>
		<description><![CDATA[L’analyse formelle en bout de course
« Au commencement était le Verbe… et le Verbe s’est fait chair. » Puis les hommes se sont mis à assembler des mots entre eux pour s’exprimer. Le langage, cette fonction qui nous semble tellement élémentaire, a été l’un des premiers grands chantiers de l’Intelligence Artificielle. En effet, dès la fin des [...]]]></description>
			<content:encoded><![CDATA[<p><strong>L’analyse formelle en bout de course</strong></p>
<p>« Au commencement était le Verbe… et le Verbe s’est fait chair. » Puis les hommes se sont mis à assembler des mots entre eux pour s’exprimer. Le langage, cette fonction qui nous semble tellement élémentaire, a été l’un des premiers grands chantiers de l’Intelligence Artificielle. En effet, dès la fin des années cinquante, l’<a title="IBM - Expérience de Georgetown" href="http://en.wikipedia.org/wiki/Georgetown-IBM_experiment" target="_blank">expérience de Georgetown</a>, menée notamment par IBM, a suscité un espoir démesuré : « within three or five years, machine translation would be a solved problem ». Cet espoir fut à la hauteur de la désillusion provoquée par les faibles résultats constatés.</p>
<p>Cinquante ans plus tard, où en sommes-nous ? La description formelle des langues pour leur utilisation dans des systèmes automatisés a montré ses limites. L’utilisation exclusive de grammaires formelles est incapable de saisir la complexité d’une langue. La principale difficulté réside en un seul mot : ambiguïté. Les rustines techniques ne manquent pas pour tenter de contourner le problème et les années soixante-dix et quatre-vingt ont été particulièrement riches dans la mise en place de systèmes de règles sémantiques, supposées permettre une plus grande précision dans l’analyse de la langue. Ces systèmes n’ont pourtant apporté que des améliorations marginales dans le traitement automatisé de la langue.</p>
<p><strong>L’arme fatale</strong></p>
<p>En fait, la « <a title="Silver Bullet" href="http://en.wikipedia.org/wiki/Silver_bullet#Idiomatic_usage" target="_blank">balle d’argent</a> » semble avoir été tirée par un curieux fusil que le monde de l’informatique et de l’IA semblait avoir négligé : la <a title="Probabilité" href="http://fr.wikipedia.org/wiki/Probabilit%C3%A9" target="_blank">probabilité</a>. Avec l’introduction de modèles de langue probabilistes, Google, pour sa première participation en 2008, a classé son système de traduction automatique à la première place de toutes les tâches de la campagne <a title="NIST 2008" href="http://www.itl.nist.gov/iad/mig/tests/mt/2008/doc/mt08_official_results_v0.html" target="_blank">Open Machine Translation</a> du <a title="NIST" href="http://www.nist.gov" target="_blank">NIST</a> (arabe vers anglais, chinois vers anglais, ourdou vers anglais, anglais vers chinois).</p>
<p>En à peine vingt ans, les techniques probabilistes ont propulsé les capacités des systèmes de traduction automatiques à des hauteurs que quarante ans de systèmes formels n’avaient fait qu’entrevoir.</p>
<p><strong>Le LDA pour les nuls</strong></p>
<p>Ces résultats ont encouragé les chercheurs à appliquer le paradigme probabiliste à d’autres tâches au sein du traitement automatique du langage. Et l’un des concepts les plus prometteurs dans ce domaine est le <a title="Latent Dirichlet Allocation" href="http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation" target="_blank">LDA</a>, ou <em>Latent <a title="Dirichlet" href="http://fr.wikipedia.org/wiki/Dirichlet" target="_blank">Dirichlet</a> Allocation</em>. Nous nous plaçons cette fois-ci dans le cadre d’un grand nombre de documents, ce qu’on appelle un <a title="Corpus" href="http://fr.wikipedia.org/wiki/Corpus" target="_blank"><em>corpus</em></a>. Chaque document est vu comme un <em>sac de mots</em>. Le paragraphe précédent peut par exemple être vu comme un document dans lequel le mot « automatiques » apparaît 1 fois, et le mot « systèmes », 2 fois. On voit qu’il est assez trivial de considérer un document comme une distribution de probabilité sur l’ensemble des mots. Si j’ai le document « a b a c », je peux considérer ce document comme une distribution des mots « a », « b », « c »  et « d » avec les probabilités 2/4, 1/4,  1/4 et 0.</p>
<p>L’idée de LDA est qu’au lieu de considérer un document comme une distribution sur des mots, on le considère comme une distribution de probabilité sur des <em>topics</em> (sujets), eux-mêmes vus comme des distributions sur les mots. Je ne rentrerai pas dans les détails du modèle et je me contenterai de l’illustrer sur un cas concret.</p>
<p><strong>Un exemple de LDA</strong></p>
<p>J’ai effectué un LDA sur la presse quotidienne nationale sur la période du 18 au 23 janvier 2010, à partir de l’excellent site <a title="Pikanews" href="http://www.pikanews.com" target="_blank">Pikanews</a>. Le résultat de l’algorithme du LDA appliqué à ce corpus génère un ensemble de topics, caractérisés eux-mêmes par des mots. Voici un extrait de ces topics générés :</p>
<table border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td width="76" valign="top">
<p align="center"><strong>Topic 92</strong></p>
</td>
<td width="69" valign="top">
<p align="center"><strong>Topic 103</strong></p>
</td>
<td width="80" valign="top">
<p align="center"><strong>Topic 68</strong></p>
</td>
<td width="92" valign="top">
<p align="center"><strong><em>Topic 48</em></strong></p>
</td>
<td width="109" valign="top">
<p align="center"><strong><em>Topic 90</em></strong></p>
</td>
</tr>
<tr>
<td width="76" valign="top">Renault</p>
<p>Flins</p>
<p>Clio</p>
<p>Carlos Ghosn</p>
<p>Usine</p>
<p>Turquie</p>
<p>Bursa</p>
<p>Production</p>
<p>Automobile</td>
<td width="69" valign="top">Numérique</p>
<p>Apple</p>
<p>Google</p>
<p>Mobile</p>
<p>Microsoft</p>
<p>Opérateurs</p>
<p>Taxe</p>
<p>Iphone</p>
<p>ARCEP</td>
<td width="80" valign="top">Haïti</p>
<p>Port au Prince</p>
<p>Séisme</p>
<p>Haïtiens</p>
<p>ONU</p>
<p>Humanitaire</p>
<p>Blessés</p>
<p>Secours</p>
<p>Morts</td>
<td width="92" valign="top"><em>Barack Obama</em></p>
<p><em>Démocrates</em></p>
<p><em>Massachusetts</em></p>
<p><strong><em>Sénat</em></strong></p>
<p><em>Scott Brown</em></p>
<p><em>Républicains</em></p>
<p><em>Maison blanche</em></p>
<p><em>Ted Kennedy</em></p>
<p><em>Congrès</em></td>
<td width="109" valign="top"><em>Scrutin</em></p>
<p><em>Réforme</em></p>
<p><em>Collectivités</em></p>
<p><em>Conseiller territorial</em></p>
<p><em>Élus</em></p>
<p><strong><em>Sénat</em></strong></p>
<p><em>Départements</em></p>
<p><em>Collectivités locales</em></td>
</tr>
</tbody>
</table>
<p>On constate par exemple que le mot « Sénat » se retrouve dans deux topics différents.</p>
<p>Dans l’extrait suivant, le mot « sénat » apparaît dans le contexte de l’élection du Massachusetts :</p>
<p><em>La détermination de l&#8217;administration Obama à brider Wall Street risque toutefois de butter contre une nouvelle réalité politique : comme pour le projet d&#8217;une taxe spéciale sur les banques, ces mesures doivent être approuvées par le Congrès. Et le revers électoral subi par les démocrates, mardi, dans l&#8217;Etat du Massachusetts leur a fait perdre la majorité qualifiée au <strong>Sénat</strong>. Une majorité pourtant indispensable afin de faire adopter leurs projets sans risquer une obstruction républicaine.</em></p>
<p>Alors que dans l’extrait suivant le mot « Sénat » est raccroché au projet de réforme des collectivités territoriales :</p>
<p><em>Après avoir sillonné les fédérations UMP pendant des semaines pour promouvoir la réforme territoriale, Dominique Perben ne cache pas sa déception : le texte que les sénateurs ont commencé à examiner hier, en séance plénière, est, selon lui, bien en deçà des ambitions du projet gouvernemental. Invité du « Talk Orange-Le Figaro », il a regretté en particulier que « le texte du <strong>Sénat</strong> soit très en retrait sur les métropoles ».</em></p>
<p>L’analyse effectuée par le LDA, sans aucune intervention humaine, sans aucune modélisation <em>a priori</em> ni connaissance linguistique autre que l’isolation de <a title="token" href="http://en.wikipedia.org/wiki/Lexical_analysis#Token" target="_blank"><em>tokens</em></a> (mots) à l’intérieur d’un texte, est remarquable. Le LDA identifie automatiquement l’usage du mot « Sénat » dans différents contextes. On voit l’intérêt que l’on pourrait retirer d’une telle analyse dans le cadre, par exemple, de la désambigüisation de termes ou de fonctions.</p>
<p>Le LDA sert d’ailleurs déjà de socle à différents traitements classiques dans le traitement automatique du langage : clusterisation, catégorisation automatique, annotation morpho-syntaxique, etc. Les études publiées depuis environ cinq ans à ce sujet montrent que le gain apporté par la démarche est souvent très significatif. Assistera-t-on à la même explosion des performances de ces outils que celle dont a bénéficié la traduction automatique ?</p>
<p>En tout cas, chez <a title="Antidot" href="http://www.antidot.net/" target="_blank">Antidot</a>, nous y croyons. Nous travaillons sur le sujet depuis un moment déjà,  et la prochaine version d’AFS &#8211; la v7 qui sortira en avril 2010 &#8211; inclut les premiers résultats de nos recherches. Si vous voulez en savoir plus, venez nous rendre visite sur le salon <a title="Antidot à Documation" href="http://www.documation.fr/site/FR/Zoom_Exposant,C1578,I1129,Zoom-77e2cfec5bf071610936eae865290d64,FromOut-ListGlob.htm?KM_Session=911914ecd54478c85221a66a2846cbe6" target="_blank">Documation</a>. Croyez-moi, c’est bluffant !</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/02/10/latent-dirichlet-allocation/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Le prix de la chose</title>
		<link>http://blog.antidot.net/2010/01/06/le-prix-de-la-chose/</link>
		<comments>http://blog.antidot.net/2010/01/06/le-prix-de-la-chose/#comments</comments>
		<pubDate>Tue, 05 Jan 2010 22:25:06 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Antidot]]></category>
		<category><![CDATA[Retour d'expérience]]></category>
		<category><![CDATA[licence]]></category>
		<category><![CDATA[logiciel]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[prix]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=31</guid>
		<description><![CDATA[Avec l’arrivée prochaine d’une nouvelle version de notre solution AFS et avec le changement d’année, donc d’exercice commercial, se pose immanquablement la question de la grille tarifaire.
La difficulté pour un éditeur de logiciels comme Antidot n’est pas tant de fixer un prix que de définir les variables qui permettent de calculer une valeur. Quelles sont [...]]]></description>
			<content:encoded><![CDATA[<p>Avec l’arrivée prochaine d’une nouvelle version de notre solution AFS et avec le changement d’année, donc d’exercice commercial, se pose immanquablement la question de la grille tarifaire.</p>
<p>La difficulté pour un éditeur de logiciels comme Antidot n’est pas tant de fixer un prix que de définir les variables qui permettent de calculer une valeur. Quelles sont les métriques à utiliser, sachant que les objectifs sont :</p>
<ul>
<li><strong>Clarté de l’offre </strong>: le prix doit être compréhensible et sa variation doit pouvoir être anticipée par le client.</li>
<li><strong>Progressivité</strong> : en fonction de la richesse fonctionnelle, du volume, de l’usage, du nombre d’utilisateurs, de la valeur créée, …</li>
<li><strong>Adaptabilité</strong> : l’offre doit être suffisamment modulaire pour que le client ne paye que ce qui est nécessaire à son besoin.</li>
</ul>
<p>Les pratiques du marché, en tout cas en ce qui concerne les moteurs de recherche, sont variées mais pas forcément adaptées à l’environnement actuel.</p>
<p>Dans un contexte où les technologies évoluent très vite, les métriques basées sur le matériel ou la volumétrie sont dépassées. Ainsi :</p>
<ul>
<li> La tarification au serveur, au processeur ou au gigahertz n’est plus envisageable avec la généralisation des multi-cœurs et la diversité des plateformes.</li>
<li>La tarification au volume indexé (compté en volume de données ou en nombre de documents) est également difficile à appliquer : une image pèse lourd mais n’a que peu d’information à fournir ; un catalogue très complexe de 100 000 produits ne pèse que quelques dizaines de mégaoctets, soit moins qu’un gros fichier PDF. La disparité informationnelle et l’écart de valeur entre les sources sont des obstacles insurmontables.</li>
<li>Un prix basé sur la taille de l’index de recherche est &#8216;créatif&#8217; mais il ne répond pas du tout au critère de clarté et de lisibilité de l’offre. Il est trop dépendant de la technologie et il est incertain : en effet le changement d’un paramètre de configuration peut faire varier la taille de l’index généré de façon sensible, de même qu’un changement de version logicielle peut du jour au lendemain ajouter 30% à la facture.</li>
</ul>
<p>A l’opposé de ces « métriques techniques », il y a la tarification basée sur l’usage ou la valeur créée. Cette approche demande une analyse, une connaissance et une segmentation très fine des marchés. Et là aussi les écueils sont nombreux :</p>
<ul>
<li>Un prix au nombre d’utilisateurs n’est pas adapté dans les environnements Web, et la transposition en nombre de sessions simultanées ne convient pas pour les architectures SOA à base de Web Services.</li>
</ul>
<ul>
<li>La tarification au pourcentage du chiffre d’affaires ressemble par trop à une dime, et ne convient qu’aux logiciels qui structurent l’entreprise et sont à la base de sa génération de valeur.</li>
<li>En outre, le risque existe qu’une telle tarification soit ressentie comme un prix à la bonne mine du client, laissant la porte ouverte à toutes les dérives commerciales possibles.</li>
</ul>
<p>Et si l’on ajoute à cela des modes d’utilisation du logiciel variés, allant de la classique licence et son support pour les logiciels installés sur le site du client,  au mode ASP (le fameux SaaS, où le logiciel est vendu comme un service), la complexité n’est que plus grande.</p>
<p>Je ne sais pas si la définition d’une grille tarifaire est un art, comme certains le prétendent, mais c’est en tout cas un sacré casse-tête. Voilà en tout cas un problème que ne connaît pas le logiciel libre et qui ne doit pas m&#8217;empecher de vous souhaiter à tous une excellente année 2010 !</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2010/01/06/le-prix-de-la-chose/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Le sens de la sémantique</title>
		<link>http://blog.antidot.net/2009/11/24/le-sens-de-la-semantique/</link>
		<comments>http://blog.antidot.net/2009/11/24/le-sens-de-la-semantique/#comments</comments>
		<pubDate>Tue, 24 Nov 2009 21:25:04 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Technologie]]></category>
		<category><![CDATA[Tendances]]></category>
		<category><![CDATA[indexation sémantique]]></category>
		<category><![CDATA[web of data]]></category>
		<category><![CDATA[web sémantique]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=24</guid>
		<description><![CDATA[Une très grande confusion règne autour du mot « sémantique » qui est utilisé à toutes les sauces dès qu’il s’agit de moteurs de recherche, et force est de constater que les discours marketing des acteurs ne vont pas dans le sens de la clarté.
Tout d’abord, il y a l’indexation sémantique : celle qui consiste, lors de [...]]]></description>
			<content:encoded><![CDATA[<p>Une très grande confusion règne autour du mot « sémantique » qui est utilisé à toutes les sauces dès qu’il s’agit de moteurs de recherche, et force est de constater que les discours marketing des acteurs ne vont pas dans le sens de la clarté.</p>
<p>Tout d’abord, il y a l’<strong>indexation sémantique </strong>: celle qui consiste, lors de l’analyse d’un document, à rattacher chaque mot à un concept sous-jacent. Ainsi, par exemple, pour le mot <em>jaguar</em>, il faut déterminer s’il s’agit du félin, de la voiture ou de l’avion. Et ça, c’est compliqué. Tout d’abord, il faut une &#8220;liste&#8221; de concepts cibles (le sens du truc qui est derrière le mot) pour pouvoir transformer le mot en concept. Il faut donc avoir modélisé tous les concepts… Autant dire que c’est peine perdue : cela sous entendrait que tout le monde pense de la même façon et se représente le monde à l’identique. Ensuite, il ne faut pas se tromper lors de l’analyse : faux amis, ambiguïté… Et d’ailleurs, tout ça est tellement compliqué que ça n’a jamais marché. C’est sans doute une des grandes errances et un Graal illusoire des moteurs de recherche des années 80-90. Les grands acteurs de ce domaine se sont dès lors fixé des objectifs plus modestes, mais dont les résultats sont plus probants : extraction d’<a href="http://fr.wikipedia.org/wiki/Entit%C3%A9s_nomm%C3%A9es  ">entités nommées</a>, data mining, etc.</p>
<p>Puis il y a l’<strong>extension sémantique</strong>. Là, plus de concepts, mais seulement des vocabulaires : dictionnaires de synonymes, thésaurus, taxinomies. Le principe est simple : élargir la recherche de l’utilisateur exploitant les synonymes (même sens), les <a href="http://fr.wikipedia.org/wiki/Hyperonyme">hyperonymes</a> (sens plus large : véhicule est hyperonyme de voiture et camion) et les <a href="http://fr.wikipedia.org/wiki/Hyponyme">hyponymes</a> (sens plus réduit). Et donc, si l’utilisateur cherche une <em>chemise verte</em>, il est de bon ton de lui remonter aussi des <em>chemises kaki</em> ou <em>émeraude</em>. C’est ça l’extension sémantique : étendre la recherche de l’utilisateur en appliquant des dictionnaires. Et si possible uniquement du vocabulaire spécifique à domaine et à un objectif fonctionnel afin de ne pas introduire de bruit. Cette méthode, associée à des traitements linguistiques de type <a href="http://fr.wikipedia.org/wiki/Lemmatisation">lemmatisation</a>, a largement pris le pas sur les autres car elle offre à la fois de bonnes performances tout en garantissant un coût de mise en œuvre et de maintenance réduit. C&#8217;est d&#8217;ailleurs le choix d&#8217;<a href="http://www.antidot.net">Antidot</a> pour <a href="http://www.antidot.net/fr/Technologie/AFS">AFS</a>.</p>
<p>Je passe à regret aujourd’hui sur l’<strong>indexation sémantique latente </strong>(LSI : Latent Semantic Indexing) qui est une approche mathématique permettant de générer automatiquement lors de l’indexation l’ensemble des concepts d’un corpus et de les relier à des mots et des documents caractéristiques. Ce sujet intéressant fera très certainement l’objet d’un prochain billet.</p>
<p>J’en arrive enfin au <strong>web sémantique</strong>. Et c’est certainement là que règne la plus grande confusion. Car contrairement à ce que le mot « sémantique » laisse suggérer, il ne s’agit pas pour les moteurs de recherche de découvrir les concepts et le sens caché des textes. Bien au contraire. Il s’agit d’expliciter manuellement le sens des informations afin que les ordinateurs puissent les exploiter de façon automatique, sans ambigüité et à grande échelle. Prenons un exemple : sur le site web d’un restaurant on trouve l’information &#8220;<em>ouvert tous les jours sauf le lundi hors période scolaire&#8221;</em>. On note que cette phrase est déjà ambiguë pour un humain (&#8221;<em>hors période scolaire</em>&#8221; s’applique-t-il à &#8220;<em>tous les jours</em>&#8221; ou à &#8220;<em>sauf le lundi</em>&#8221; ?) mais elle est franchement inexploitable en tant que telle par un moteur de recherche qui vient lire cette page. L’idée sous jacente au<a href="http://fr.wikipedia.org/wiki/Web_s%C3%A9mantique"> web sémantique</a> est donc qu’il faut ajouter dans la page web des informations formelles (grâce à des balises invisibles à l’utilisateur) afin que les logiciels de recherche puissent collecter cette information et l’exploiter.</p>
<p>Le <strong>web sémantique</strong> est très loin de l’indexation sémantique et des promesses de l’intelligence artificielle des années 80. Pas d’analyse du sens caché, pas de réponse miracle à une question exprimée en langage naturel. Mais c’est sans doute en cela qu’il va tenir ses promesses. Et comme l&#8217;avoue Tim Berners Lee, le mot web sémantique est mal choisi (par lui même) car sujet à trop d’incompréhension, et il suggère d’employer maintenant l’expression « web of data » : le web des données.</p>
<p>C’est vrai que ça fait moins rêver… mais comme les mots ont un sens, autant le respecter !</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2009/11/24/le-sens-de-la-semantique/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Joyeux anniversaire Antidot !</title>
		<link>http://blog.antidot.net/2009/11/08/joyeux-anniversaire-antidot/</link>
		<comments>http://blog.antidot.net/2009/11/08/joyeux-anniversaire-antidot/#comments</comments>
		<pubDate>Sun, 08 Nov 2009 09:42:05 +0000</pubDate>
		<dc:creator>Fabrice Lacroix</dc:creator>
				<category><![CDATA[Antidot]]></category>
		<category><![CDATA[anniversaire]]></category>
		<category><![CDATA[web sémantique]]></category>

		<guid isPermaLink="false">http://blog.antidot.net/?p=20</guid>
		<description><![CDATA[8 novembre 1999 – 8 novembre 2009 : Antidot a 10 ans.
C’est peu, à l’aune de cette ère économique, mais déjà beaucoup à l’échelle de l’Internet, dans une époque où tout évolue si vite et où l’accélération des technologies ne se dément jamais. En 10 ans nous avons déjà connu deux crises majeures : l’éclatement de la [...]]]></description>
			<content:encoded><![CDATA[<p><strong>8 novembre 1999 – 8 novembre 2009 : Antidot a 10 ans.</strong></p>
<p>C’est peu, à l’aune de cette ère économique, mais déjà beaucoup à l’échelle de l’Internet, dans une époque où tout évolue si vite et où l’accélération des technologies ne se dément jamais. En 10 ans nous avons déjà connu deux crises majeures : l’éclatement de la bulle Internet et la récession de 2008. Et notre histoire s’inscrit dans cette réalité technologique et économique.</p>
<p>L’idée initiale qui a motivé la création d’<a title="Antidot" href="http://www.antidot.net" target="_blank">Antidot</a> en 1999 était de développer et de fournir aux portails Internet un moteur de recherche en marque blanche. Notre objectif était d’amener un service clé en main à nos clients. Dans la dynamique très forte de cette époque de pionniers, nous avons pu lancer notre activité en autofinançant notre démarrage.</p>
<p>En 2001, avec l’éclatement de la bulle, le marché s’est transformé et nous avons dû revoir notre positionnement : nous avons décidé d’exploiter notre savoir-faire et nos acquis technologiques pour servir le marché des entreprises, en construisant une plateforme de recherche d’information ouverte et déclinée en solutions adaptées à des besoins métier.</p>
<p>Mais l’histoire n’est pas une ligne droite et on dit que votre passé vous rattrape toujours. Celui d’Antidot est une grande force : notre expertise cumulée du Web et des solutions pour entreprise nous place aujourd’hui dans une situation privilégiée. L’émergence des technologies du <a title="Semantic Web" href="http://www.w3.org/standards/semanticweb/" target="_blank">Web Sémantique</a> (Web of Data, ou encore Web 3.0) nous a permis de réaliser la synthèse de nos compétences. A travers notre programme de recherche et des projets clients, nous sommes devenu l’acteur « solution de recherche » le plus avancé dans le domaine. Les 10 ans qui viennent prennent tout leur sens à la lumière des 10 années écoulées et le Web Sémantique dessine le futur d’Antidot.</p>
<p>De cette histoire riche, nous avons tiré des enseignements majeurs que nous avons érigés en principes :</p>
<ul>
<li>Rien n’est jamais acquis. La pérennité d’Antidot dépend de notre capacité d’innovation et de l’énergie mise à se réinventer chaque jour.</li>
<li>Le client prime. Le service, la proximité et l’engagement à délivrer sont le credo et la raison d’être de l’entreprise.</li>
</ul>
<p>Depuis 1999 notre offre et nos produits ont évolué, pour autant notre mission et nos valeurs sont restées les mêmes : fournir des solutions créatrices de valeur pour nos clients, avec des équipes tournées vers l’accompagnement et le résultat. Plus que jamais, pour les 10 ans à venir, nos solutions seront dédiées à rendre l’information plus vivante et plus intelligente.</p>
<p>Aujourd’hui, nous tenons sincèrement à remercier nos clients et nos partenaires, qui nous accompagnent dans notre développement et nous accordent leur confiance.</p>
<p><strong>Joyeux anniversaire Antidot !</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.antidot.net/2009/11/08/joyeux-anniversaire-antidot/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
	</channel>
</rss>
