Retrouvez motrech sur son nouveau site http://motre.ch/

25 févr. 2005

J2J2 Brève - Retour vers le Passé...

En fouillant dans les archives de la liste motrech, voici ce que je découvre avec stupéfaction dans mon deuxième mail adressé à la liste, datant du 30 Juin 1998 (et oui, bientôt 7 ans déjà!):
[...]
Pour commencer, je vous suggère une lecture très intéressante d'un papier
présenté à la 7ème conférence W3 (http://www7.conf.au/) qui c'est tenue à
Brisbane en Australie du 14 au 18 Avril 98 :

The Anatomy of a Large-Scale Hypertextual Web Search Engine - Sergey Brin,
Lawrence Page
http://www7.conf.au/programme/fullpapers/1921/com1921.htm
[...]
Note: Il semble que le serveur de la 7ème conférence W3 mentionné ci-dessus ne fonctionne pas. Vous pourrez cependant facilement retrouver cet article sur le Net, ou bien le récupérer ici.

Ca vous dit quelque chose?




Heu... non, avec ces photos là ce sera certainement plus facile...



Certainement déjà le début de ma "Google Addiction"...
Mais pourquoi n'ai-je pas été plus attentif à leurs travaux ????????



Quoi qu'il en soit, on peut re-découvrir sur ce papier l'architecture générale de Google, qui n'a certainement pas beaucoup bougé 7 ans plus tard. Ainsi, on voit clairement, comme nous le pensions avec Jean Véronis qu'il y a deux bases de données: Le Repository qui contient les documents récupérés mais qui ne sont pas encore indexés, et les Barels qui contiennent les documents indexés. Ainsi, le nombre de pages indiqué dans les résultats de Google serait l'addition des documents du Repository et des Barels.

Notons que c'est une architecture assez intuitive pour un moteur de recherche (pour qui souhaite un minimum parallèliser les tâches) qui pourrait aujourd'hui encore être utile à qui souhaiterais se lancer dans la grande aventure de la création d'un moteur...



Complément d'information apporté par Mathias Géry sur la liste motrech:
Pour poursuivre ce retour vers le passé : est-ce que vous avez utilisé google à l'époque stanford ?
Je crois bien que les pages ont disparu du web, par contre on peut les retrouver avec waybackmachine:
Et comme on peut le constater sur l'image ci-dessous, il y avait déjà l'esprit Google à l'époque...



0 commentaires:

Enregistrer un commentaire