Retrouvez motrech sur son nouveau site http://motre.ch/

2 mai 2005

Jérôme "Non, yé né pas yanyé"

En 1997 (bientôt 10 ans), au début de ma thèse, je rédigeais au fond d'un laboratoire du CEA, un état de l'art sur les moteurs de recherche. Ce document intitulé "Les principaux problèmes de la recherche d'information sur Internet" fut à l'époque largement commenté, référencé et utilisé.

J'analysais dans ce document, des outils de recherche d'une autre époque: ALIWEB, Alta Vista, EuroFerret, Excite, ... (il n'était pas encore question de Google, Yahoo! et encore moins MSN Search).

J'analysais tous ces outils selon quatres axes:
  1. La collecte des documents
  2. L'indexation des documents
  3. La recherche des documents-réponses
  4. La présentation des résultats
J'y décortiquais chacun des moteurs de l'époque selon ces quatre axes, et montrait les lacunes de ces différents outils concernant le traitement du langage:
"Actuellement, en 1997, comme nous l'avons souligné tout au long de ce document, les robots généralistes de recherche d'information sur Internet utilisent:
  • Le traitement de chaîne.
  • La logique booléenne, les opérateurs de proximité, d'adjacence et de troncature.
  • Le "relevance ranking".
C'est à dire des techniques développées pour les premiers systèmes de recherche datant des années 60-70 : Cela montre clairement qu'aujourd'hui, les spécialistes du WWW redécouvrent le domaine de la recherche documentaire.
Extrait de la conclusion du document "Les principaux problèmes de la recherche d'information sur Internet"


Trève de nostalgie, et revenons au présent.
Aujourd'hui, qu'est-ce qui a réellement changé?
Les leaders ont changé de nom, le marketing c'est énormément renforcé, le marché c'est structuré, les moteurs tendent à se "portailiser", à proposer de plus en plus de services connexes, mais au fond, en terme de recherche d'information, en terme de technologies du langage, ont-ils réellement progressé en presque dix ans?

Finalement, malheuresement, paradoxalement ...
Non, les principaux outils de recherche actuels n'ont fondamentalement pas évolué en presque 10 ans!


Note: Le document mentionné ici, "Les principaux problèmes de la recherche d'information sur Internet" sera très prochainement de nouveau disponible en ligne dans une version légèrement modifiée dans sa forme

3 commentaires:

Kesako a dit…

:-)
Alors là, je dois dire que j'adore le titre !!! :-)))))))))
Excellent ! ;)

Miss Tics a dit…

Bien vu ! Et Bien dit !

Anonyme a dit…

check out
www.exalead.com
to see what's changing in the search world

Enregistrer un commentaire