25 Jun 07 |
Category: Uncategorized
De nombreuses sociétés annoncent régulièrement avoir mis au point l’arme absolue pour contrer Google. Il ne se crée ainsi pas moins d’un moteur de recherche généraliste chaque jour dans le monde, parfois à grand renfort de capital risque et de communication.
Jusqu’à maintenant toutefois, personne ne semble encore en mesure de contexter l’hégémonie du géant de Mountain View. Revue de détail de deux de ces outsiders particulièrement médiatisés mais dont l’avenir semble loin d’être assuré : Megaglobe et Powerset.
- Megaglobe
Annoncé depuis de nombreux mois à grand renfort de communiqués de presse parfois maladroits, le moteur de recherche Megaglobe est enfin disponible en version beta, plus d’un an après sa sortie annoncée initialement en juin 2006 (url : beta.megaglobe.com, password : welcome).
Si cette version beta fait taire les mauvaises langues en prouvant que Megaglobe existe bel et bien, l’exécution relève malheureusement de l’artisanat plus que d’un véritable effort de recherche et développement…
En effet, d’innombrables requêtes restent sans réponse, ce qui témoigne de la taille risible de l’index, alors même que l’exhaustivité constitue souvent pour un internaute le premier critère de jugement de la qualité d’un moteur.
Par ailleurs, des doublons (liens rigoureusement identiques) apparaissent parfois dans les listes de résultats (cf. flèches rouges sur la copie d’écran ci-dessous), chose à peine croyable quand on sait que ce problème était déjà résolu par les premiers moteurs de recherche il y a plus de 12 ans maintenant !

Si on ajoute que l’interface est dépourvue de toute fonctionnalité innovante (et même basique comme la version en cache des pages), on aboutit à un moteur à oublier au plus vite, d’autant plus que le temps de réponse n’a rien de “googlesque” (cf. flèche verte sur la copie d’écran ci-dessous).
- Powerset
L’autre arlésienne des moteurs de recherche web est l’américain Powerset, qui s’appuie sur une technologie de NLP (Natural Language Processing) développée par le PARC (Palo Alto Research Center) de Xerox et a levé pas moins de 12,5 M$ en novembre 2005.
Ses fondateurs entretiennent un secret paranoïaque autour de la sortie de ce moteur censé renvoyer Google aux oubliettes.

Seul problème, les technologies employées dans ce moteur et censées donner du sens à l’information en contextualisant la requête (le Saint Graal des moteurs de recherche) ne peuvent au final pas lui conférer d’avantage concurrentiel décisif pour deux raisons :
1. L’utilisation de la recherche en language naturel dans un contexte de recherche sur Internet a toujours échoué jusqu’à maintenant car les internautes sont familiarisés avec la syntaxe de Google qui ne s’embarrasse pas de subtilités (saisie d’un à trois mots-clés au maximum, comportant par ailleurs souvent des fautes d’orthographe que le moteur se charge de corriger).
Or, tant que les claviers régneront sans partage sur l’interface homme-machine, il sera illusoire d’exiger des internautes qu’ils saisissent des phrases entières dans les moteurs de recherche…
2. Beaucoup plus ennuyeux, la recherche en language naturel n’est par nature pas multilingue, contrairement aux contenus du web. Cette technologie repose en effet sur une analyse grammaticale des textes qui est bien entendu différente pour chaque langue.
Ce principe impose à Powerset, qui ne fonctionnera à priori qu’en anglais, d’ignorer les milliards d’utilisateurs pour lesquels l’anglais n’est (au mieux) qu’une seconde langue. Comment donc dans ces conditions prétendre au titre de moteur de recherche universel ?
L’intention est toutefois louable et il n’est pas exclu que Powerset apporte une plus-value importante sur certaines requêtes particulières, sans toutefois pouvoir se substituer aux moteurs existants pour les recherches de tous les jours.
En tout état de cause, Google a décidément encore de (très) beaux jours devant lui !