Retrouvez motrech sur son nouveau site http://motre.ch/

24 févr. 2005

Jérôme Motrech dopé aux Yahourts



Je l'ai fait! Preuve à l'appui, voici ce que vous obtenez avec Google lorsque vous effectuez une recherche sur les termes "yahoo yahoourt":



Quelle satisfaction! Moi qui annonçais dans mon tout premier billet sur ce blog que c'est l'excellent blog aixtal de Jean Véronis qui m'avait donné l'envie de me lancer dans l'aventure du blog. Et bien maintenant je le dépasse... :-)

Mais revenons sur les faits. Le 11 Février, Jean Véronis publie un billet intitulé "Lexique: Yahoo et les yahoourts" portant sur la recherche des orthographes du terme yahourt sur Yahoo. Le 15 Février, alors que je publiait un billet sur quelques tests de Y!Q, j'ai trouvé plutôt sympa de faire référence au billet de Jean Véronis en intitulant le mien "Test - Yahoo pédale dans le yahoourt...".

Plusieurs choses m'inquiètent pourtant sur le résultat que j'obtiens:
      Le blog motrech a un misérable PageRank de 0, alors que celui d'aixtal est de 4 !
      La fréquence d'utilisation des termes est plutôt en faveur de Jean Véronis:
      • J'utilise dans mon billet les termes Yahoo 8 fois, et Yahoourt 2 fois.
      • Jean Véronis utilise les termes Yahoo 7 fois et Yahoourt 3 fois (plus Yahoourts une fois).
      De plus, Jean Véronis dans son billet utilise abondamment le champ lexical faisant référence aux produits lactés, alors que mon billet n'en parle presque pas.

Quoi qu'il en soit, il me semble indéniable que le billet de Jean Véronis soit plus pertinent sur la question ""yahoo yahoourt" que le mien!
Ce classement en faveur de mon billet proviendrait-il uniquement du titre? Mon billet s'intitule "Test - Yahoo pédale dans le yahoourt..." (yahoourt au singulier), alors que celui de Jean Veronis s'intitule "Lexique: Yahoo et les yahoourts" (yahoourt au pluriel).
Si tel est le cas, je conseil aux ingénieurs de Google de baisser légèrement (beaucoup?) la pondération accordée au titre d'un document, et chose plus complexe, d'analyser les documents dans leur globalité et non comme une suite de termes à indexer. En prenant en compte le champ lexical d'un document, et même celui du site complet, on améliorerait considérablement la pertinence des résultats des moteurs de recherche.
J'en profite donc pour revenir sur les propos de François Bourdoncle qui avaient déclenché quelques "vives" réactions sur la liste motrech lors de son interview à 01.Net: "La guerre technologique des moteurs est terminée".
Encore une fois, je vais clamer haut et fort que NON! Elle me semble loin d'être terminée lorsque je constate de tels résultats sur le plus populaire des moteurs de recherche...

2 commentaires:

Jean Véronis a dit…

Oui, mais je suis premier sur

yahoo yahoourts;-)

Jérôme Charron a dit…

Je sais, je sais... mais ce billet va certainement très bien me positionner sur yahoo yahoourts;-)

yahoo:9
yahoourt:8
yahoourts:3

à suivre...

Enregistrer un commentaire