Retrouvez motrech sur son nouveau site http://motre.ch/
25 févr. 2005
J2J2 Brève - Retour vers le Passé...
En fouillant dans les archives de la liste motrech, voici ce que je découvre avec stupéfaction dans mon deuxième mail adressé à la liste, datant du 30 Juin 1998 (et oui, bientôt 7 ans déjà!):
Ca vous dit quelque chose?
Heu... non, avec ces photos là ce sera certainement plus facile...
Certainement déjà le début de ma "Google Addiction"...
Mais pourquoi n'ai-je pas été plus attentif à leurs travaux ????????
Quoi qu'il en soit, on peut re-découvrir sur ce papier l'architecture générale de Google, qui n'a certainement pas beaucoup bougé 7 ans plus tard. Ainsi, on voit clairement, comme nous le pensions avec Jean Véronis qu'il y a deux bases de données: Le Repository qui contient les documents récupérés mais qui ne sont pas encore indexés, et les Barels qui contiennent les documents indexés. Ainsi, le nombre de pages indiqué dans les résultats de Google serait l'addition des documents du Repository et des Barels.
Notons que c'est une architecture assez intuitive pour un moteur de recherche (pour qui souhaite un minimum parallèliser les tâches) qui pourrait aujourd'hui encore être utile à qui souhaiterais se lancer dans la grande aventure de la création d'un moteur...
Complément d'information apporté par Mathias Géry sur la liste motrech:
[...]
Pour commencer, je vous suggère une lecture très intéressante d'un papier
présenté à la 7ème conférence W3 (http://www7.conf.au/) qui c'est tenue à
Brisbane en Australie du 14 au 18 Avril 98 :
The Anatomy of a Large-Scale Hypertextual Web Search Engine - Sergey Brin,
Lawrence Page
http://www7.conf.au/programme/fullpapers/1921/com1921.htm
[...]
Note: Il semble que le serveur de la 7ème conférence W3 mentionné ci-dessus ne fonctionne pas. Vous pourrez cependant facilement retrouver cet article sur le Net, ou bien le récupérer ici.
Ca vous dit quelque chose?
Heu... non, avec ces photos là ce sera certainement plus facile...
Certainement déjà le début de ma "Google Addiction"...
Mais pourquoi n'ai-je pas été plus attentif à leurs travaux ????????
Quoi qu'il en soit, on peut re-découvrir sur ce papier l'architecture générale de Google, qui n'a certainement pas beaucoup bougé 7 ans plus tard. Ainsi, on voit clairement, comme nous le pensions avec Jean Véronis qu'il y a deux bases de données: Le Repository qui contient les documents récupérés mais qui ne sont pas encore indexés, et les Barels qui contiennent les documents indexés. Ainsi, le nombre de pages indiqué dans les résultats de Google serait l'addition des documents du Repository et des Barels.
Notons que c'est une architecture assez intuitive pour un moteur de recherche (pour qui souhaite un minimum parallèliser les tâches) qui pourrait aujourd'hui encore être utile à qui souhaiterais se lancer dans la grande aventure de la création d'un moteur...
Complément d'information apporté par Mathias Géry sur la liste motrech:
Pour poursuivre ce retour vers le passé : est-ce que vous avez utilisé google à l'époque stanford ?Et comme on peut le constater sur l'image ci-dessous, il y avait déjà l'esprit Google à l'époque...
Je crois bien que les pages ont disparu du web, par contre on peut les retrouver avec waybackmachine:
- l'interace d'interrogation de google en 98
- le matos de l'époque, qu'ils avaient récupéré à droite et à gauche
Inscription à :
Publier les commentaires (Atom)
Membres
Chercher
Archives
Derniers Billets
Les sites amis
Derniers Visiteurs
Catégories
- 2001
- 2008
- 2018
- 2D
- 3D
- abondance
- addict-o-matic
- adobe
- aixtal
- ajax
- alexa
- altavista
- alternatif
- alternative
- amazon
- anatomie
- annuaires
- aol
- apple
- ask
- astuces
- audio
- auteur
- avis
- baidu
- bart
- bègues
- bêta
- bientôt web
- blinkx
- blogoscopie
- bonne année
- boss
- browserank
- cartographie
- cashback
- clavier
- clir
- collarity
- commoncraft
- couleur
- cours
- critiques
- cuil
- culture
- dapper
- depression
- docjax
- don organe
- doona
- duplication
- dyslexiques
- ebay
- écologie
- éducation
- emilie ogez
- enfants
- enquête
- enterprise search
- entreprises
- errorkey
- évènement
- evri
- exalead
- eye tracking
- facesearch
- faits marquants
- FAQ
- fêtes
- findloo
- firefox
- first click free
- fizy
- flash
- forum
- fracture numérique
- france
- france telecom
- fsb
- gammafiles
- glue
- goopilation
- graphe social
- hadoop
- hadopi
- hakia
- hurisearch
- i-expo
- icones
- iconlook
- idée labs
- image
- images
- inovall
- inquisitor
- intelways
- interlingue
- internet explorer
- interview
- jamesoo
- jean véronis
- jinni
- job
- kallout
- kartoo
- keyboardr
- kindernet
- kosmix
- kumo
- labs
- langage naturel
- leapfish
- live search
- localisation
- lucene
- lucky
- lycos
- marissa mayer
- matt cutts
- médias sociaux
- megaupload
- métamoteur
- microblogging
- microformat
- microsoft
- mindomi
- mobilité
- mokhles
- mondes virtuels
- moodstream
- moteur de recherche
- moteur recherche
- moteurs de recherche
- motrech
- mots-clés
- multimatch
- musées
- musique
- navigation
- newssift
- nielsen
- nostalgie
- nutch
- oamos
- opthink
- orange
- pagerank
- passé
- pdf search engine
- personalisation
- pertinence
- pew internet
- photos
- piithie
- pipl
- plugin
- powerset
- présentation résultats
- profiling
- prospective
- quaero
- rapidshare
- recherche
- recherche avancée
- recherche d'information
- recherche information
- recherche sémantique
- recherche sociale
- reconnaissance de la parole
- reconnaissance des formes
- reconnaissance des images
- référencement
- reherche actualités
- rentrée
- répertoires
- robots balises html exclusion protocole
- rpm2
- search 2009
- searchcube
- searchme
- searchmonkey
- searchwiki
- sémantique
- seo
- similarr
- simpsons
- sinequa
- sites web
- snappyfingers
- social computing
- social search
- socialmention
- soldes
- solr
- spam
- spffy
- suggestion
- sun
- taille web
- taux rebond
- texcoop
- timeline
- tineeye
- tinyeye
- torrent
- tourisme
- traduction
- true-knowledge
- tutoriel
- twingly
- ujiko
- utilisation
- vacances
- velocity
- veosearch
- video
- videosurf
- vie privée
- vista
- vivisimo
- web 3.0
- web invisible
- web search
- web sémantique
- web3
- whatever
- wikia
- wikio
- wikio labs
- wikipedia
- wolfram
- wordle
- yahoo
- yahoo boss
- yandex
- yos
- youtube
A propos de ce blog
Le blog motrech existe depuis le mois de Février 2005. Tout comme la liste du même nom, il est (bien sur!) consacré aux moteurs de recherche.
Propulsé à l'origine par Jérôme Charron, Emilie Ogez a embarquée à bord en Avril 2008.
0 commentaires:
Enregistrer un commentaire