2.2.ScreenshotNestlé

Moteurs de recherche : faites la chasse aux requêtes sans réponse ! [2/3]

Nous avons vu dans un précédent billet comment traiter automatiquement les erreurs de saisie et fautes de frappe.

Examinons maintenant un autre cas de figure :

2. Les requêtes utilisant un vocabulaire différent du vôtre

Dans ce cas l’utilisateur ne s’est pas trompé dans sa requête, mais a utilisé un vocabulaire qui n’est pas celui de vos documents ou fiches produits. Plusieurs scenarii sont possibles :

a. L’utilisation de synonymes ou abréviations

Les utilisateurs peuvent utiliser des mots différents de ceux de vos fiches, pourtant ils désignent la même chose : « gratte » au lieu de « guitare » pour un musicien de rock, « voiture » ou même « bagnole » pour « automobile », « loi Aubry » ou « loi des 35 heures » pour « loi n° 98-461 ».

Une solution basique serait de surcharger manuellement vos documents avec les différentes formes possibles des mots utilisés : cela fonctionnerait, mais c’est loin d’être la solution optimale.

Utilisez plutôt un dictionnaire de synonymes. Démarrez avec une simple liste à plat de mots ou d’expressions et listez les synonymes métier, les abréviations fréquemment employées… Ces équivalences seront appliquées automatiquement par le moteur de recherche pour optimiser la réponse à vos utilisateurs.

Chez Decathlon le terme « hula-hoop » désigne aussi un « cerceau » :

2.1.ScreenshotDecathlonCliquer pour agrandir l’image

Vous n’avez pas besoin de constituer la liste d’une seule traite, commencez par une première base, que vous enrichirez au fur et à mesure.

 

b. L’utilisation de concepts parents

Vos utilisateurs peuvent parfois utiliser des termes plus larges que ceux très spécifiques utilisés dans vos contenus. Mais on ne peut pas parler de synonymes au sens strict. Un utilisateur peut par exemple chercher « voiture » là où vos documents mentionnent des « cabriolets », ou encore chercher « sport de raquette » quand vos documents évoquent spécifiquement le « tennis », le « badminton » ou le « ping pong ».

Dans ce cas là, il est préférable de passer par un dictionnaire de concepts hiérarchisé, ou thesaurus.

A la différence de la liste de synonymes mentionnée plus haut, le thesaurus sert à organiser des termes de manière hiérarchique avec plusieurs niveaux d’information. On parle dans ce cas de concepts parents ou enfants.

Les moteurs de recherche utilisent ces dictionnaires pour répondre de manière précise à des requêtes larges ou floues, mais en aucun cas ils ne doivent répondre de manière générique à une requête très précise : il faut en effet prendre comme hypothèse que l’utilisateur qui cherche un terme très précis souhaite justement obtenir un contenu adapté.

Sur le site « Croquons la vie » de Nestlé, les « snacks » désignent les « burgers » , « tartines » et « croque-monsieur » :

2.2.ScreenshotNestléCliquer pour agrandir l’image

Les moteurs de recherche de dernière génération savent prendre en compte les niveaux de hiérarchie dans le classement par pertinence de leurs résultats.

Ainsi un moteur de recherche efficace, comme Antidot Finder Suite, va d’abord proposer des fiches qui contiennent exactement le mot recherché avant de proposer d’autres fiches qui contiennent des concepts enfants.

c. Compréhension du langage naturel

Dans d’autres cas les utilisateurs vont, en plus des mots clés significatifs, utiliser des expressions pour mieux qualifier leurs requêtes : « Inférieur à un certain prix », « Postérieur à une certaine date »… et se retrouvent sans réponse alors que avez du contenu adapté.

Prenons l’exemple suivant d’un site de e-commerce: si un visiteur saisit « Chaussures à moins de 100 euros« , cette requête risque de ne pas donner de résultats parce qu’il n’y a probablement pas de fiches de chaussures contenant « à moins de ». Et elle ne proposera pas des chaussures à 50 euros, parce que leur fiche ne contient pas « 100 ».

Il est facile pour nous humains, dotés d’un cerveau très puissant, d’interpréter la recherche et de se rendre compte qu’en fait la recherche porte simplement sur des chaussures, avec un filtre sur leur prix. Mais c’est bien plus compliqué lorsqu’il s’agit de l’expliquer au moteur de recherche !

Il existe donc, pour gérer ce genre de cas, des modules de réécriture qui servent à identifier certaines formes de requêtes et à les transmettre au moteur de recherche avec la syntaxe qu’il sait gérer au mieux.

Dans notre cas, l’expression « à moins de 100 euros » se retrouve réécrite en filtre : « prix < 100 », permettant ainsi au moteur de trouver les résultats pertinents.

 

d. Information existante mais pas sous forme de mots-clés

Dans certains cas, l’information recherchée est présente dans vos contenus, mais pas sous forme de plein texte.

Dans un catalogue de produits alimentaires par exemple, des clients peuvent rechercher le mot-clé « bio ». Mais si l’information n’existe que sous forme de case à cocher Oui / Non dans le catalogue, le moteur ne va pas retrouver le mot-clé en tant que tel dans les fiches des produits.

Le client n’aura donc pas de résultats alors qu’il existe de nombreux produits susceptibles de l’intéresser.

Dans ce cas, un traitement est à prévoir en amont. Il faut prévoir des mécanismes d’enrichissement de vos contenus qui ajoutent les mots-clés nécessaires à vos fiches avant leur indexation. Ces traitements peuvent directement être pris en charge par le moteur de recherche.

Nous verrons la semaine prochaine comment traiter les cas de requêtes sans réponse qui subsisteraient encore après mise en oeuvre des bonnes pratiques que nous vous avons présentées.

 

1.3.ScreenshotCultura

Moteurs de recherche : faites la chasse aux requêtes sans réponse ! [1/3]

L’objectif premier d’un moteur de recherche est de répondre de manière juste et précise aux requêtes de ses utilisateurs, en leur apportant les documents les plus pertinents.

Les requêtes sans réponses sont très déceptives et peuvent dans certains cas détourner les utilisateurs de votre site. Toutefois, ces requêtes infructueuses ne sont pas une fatalité, et voici quelques conseils pour optimiser vos réponses afin d’augmenter la satisfaction de vos utilisateurs !

Il existe plusieurs types de requêtes sans réponse qui concernent pourtant des documents/produits que vous proposez :

1. Les requêtes avec fautes d’orthographe

Elles constituent une grande partie des requêtes sans réponses. L’utilisation d’un module de correction orthographique s’avère donc incontournable.

Les correcteurs orthographiques de pointe ne se basent pas sur des dictionnaires mais sur une analyse statistique de vos contenus. Ils sont ainsi capables de suggérer des corrections de noms propres, abréviations et autres néologismes en prenant en compte ce qui se trouve vraiment dans vos documents ou fiches produits.

Vous pouvez soit proposer une correction à vos utilisateurs, soit exécuter automatiquement la recherche avec le mot corrigé.

Voici un exemple avec le Conseil Supérieur de l’Audiovisuel, dont le moteur de recherche Antidot Finder Suite suggère la correction orthographique du nom de son président Olivier Schrameck en laissant le visiteur relancer sa requête :

1.1.ScreenshotCSACliquer pour agrandir l’image

Autre exemple avec  Damart : notre moteur de searchandising  AFS@Store a été paramétré pour corriger la faute d’orthographe et relancer automatiquement la recherche :

1.2.ScreenshotDamartCliquer pour agrandir l’image

Dans les deux cas, n’oubliez pas de mentionner la requête originale ainsi que la requête corrigée, pour mieux informer vos utilisateurs.

Un autre moyen d’éviter les requêtes sans réponses dues à des fautes d’orthographe est l’usage d’un module d’auto-complétion tolérant aux fautes d’orthographe. L’utilisateur se voit proposer des suggestions de recherche dès les premières lettres saisies, et s’il en sélectionne une, sa requête sera naturellement bien formulée.

Avec l’auto-complétion de Cultura, qui utilise aussi AFS@Store, peu de chances que l’utilisateur se trompe en cherchant Michel Houellebecq :

1.3.ScreenshotCulturaCliquer pour agrandir l’image

Les suggestions d’auto-complétion peuvent être éditorialisées, elles vous permettront de mettre en valeur certaines requêtes, et donc de promouvoir les documents ou produits associés. C’est donc une solution doublement utile !

Nous verrons dans un prochain billet un autre cas de figure : comment trouver des résultats à une recherche pour laquelle l’utilisateur emploie des mots spécifiques qui ne figurent pas parmi les documents indexés…

À suivre la semaine prochaine !

 

Musées en France : musée des Augustins à Toulouse

Open Data et Web Sémantique : tous les musées en France

Nous vous invitons aujourd’hui à découvrir une nouvelle application web. Réalisée sur leur temps libre par Julien Homo et Gautier Poupeau, deux collaborateurs d’Antidot experts du web sémantique, cette application participe au concours organisé par le Ministère de la Culture et de la Communication et l’association Wikimedia France autour des données du projet SemanticPedia.

Cette application est une nouvelle version de l’application « Musées de France », une réalisation didactique qui nous a permis de présenter sur ce blog les possibilités de nos logiciels Antidot Information Factory (AIF) et Antidot Finder Suite (AFS).

Mais assez parlé : à vous maintenant d’utiliser l’application « Musées en France » pour découvrir la richesse de notre patrimoine muséographique !

Musées en France : musée des Augustins à Toulouse

Exemple : la fiche du musée des Augustins à Toulouse

Et si vous voulez en savoir plus, nous levons aussi le voile sur le pourquoi et le comment de cette réalisation.

Bonne visite virtuelle !

Mise à jour du 30 avril 2014 : Cette application a été récompensée du prix Semanticpedia. Bravo à Gautier et Julien !

prixSemanticpedia