Retrouvez motrech sur son nouveau site http://motre.ch/

14 oct. 2005

Jérôme Vivre sans Google?

Lundi soir, gare de Lyon-Part-Dieu, je m'engouffre dans le métro lyonnais et redescend cinq stations plus loin, au Stade de Gerland. Direction l'hôtel pour un repas rapide, la prise de quelques notes pour ne pas trop perdre le fil le lendemain, quelques lignes de code pour Nutch, et ... dodo. Le lendemain, douche, petit-dej et un peu de marche à pied pour rejoindre l'ENS-lsh. J'arrive dans la salle, Olivier et Jean sont déjà là, nous discutons pendant que la salle se remplie et que les autres intervenants arrivent...

Mardi dernier se tenaient à l'ENS-lsh une journée organisée par l'association DocForum sur le thème "Peut-on vivre sans Google?".

Fabuleuse journée.

Beaucoup de choses très intéressantes ont été évoquées. Ceci n'est absolument pas un compte-rendu, mais plutôt les quelques notes qu'il me reste en tête après avoir laissé reposer un peu mes idées. Vous pouvez également consulter le Petit compte-rendu de la journée "Peut-on vivre sans Google?" de Sébastien ou encore le texte de ce qu'avait prévu de présenter le grand absent de cette journée.

Je regroupe ici les différentes idées échangées selon les cinq thèmes essentiels qui ont émergés lors de cette journée:
  • Le business,
  • la confidentialité,
  • les moteurs thématiques,
  • le Web 2.0
  • l'avenir.

Business
Franck (que je me félicite d'avoir suggéré comme intervenant, cette journée sans lui aurait été très différente) nous rappelle à juste titre que Google c'est avant tout une machine à dollars (oui, je sais, je suis trop idéaliste pour accepter cette idée). Et Fabrice de reprendre un peu plus tard: D'un point de vue financier, pourquoi Google aurait-il intérêt à ajouter de nouvelles fonctionnalités à son moteur?
En effet, lorsqu'on domine plus de 80% du marché, pourquoi innover? Lorsque, la pompe à $ est en marche, et débite à plein régime, pourquoi prendre le risque de faire baisser son débit? La situation quasi monopolistique de Google l'empêche d'innover, puisque le coût d'intégration d'une nouvelle fonctionnalité à son moteur ne pourra jamais être couverte par les revenus supplémentaires générés par cette nouvelle fonctionnalité. Exemple: Imaginons que Google (avec 80% de part de marché) génère 80$/an par le biais de son moteur, et que l'intégration d'un nouvelle fonctionnalité lui coûte 2$/an. Il faudrait alors pour que cet investissement soit rentable que les revenus du moteur dépassent à 82$/an, c'est à dire que sa part de marché dépasse 82%. Or il est très difficile de gagner 2 points de part de marché, lorsqu'on en possède déjà 80. Bilan: Pourquoi, tant qu'il n'y a pas de vraie concurrence, apporter de nouvelles fonctionnalités? (C'est exactement la même situation que celle d'Internet Explorer avant que Firefox ne vienne changer la donne). Bref, le monopole tue l'innovation, car, rappelez vous, tout ça n'est finalement que du business, rien de plus.
A propos de business, et en regardant de plus prêt celui de Google, nous sommes arrivés à la conclusion que le modèle économique de Google est finalement extrêmement fragile. Il ne repose que sur l'affichage de publicités adaptées au contenu (AdSense) ou de mots achetés (AdWords). Bref, des systèmes potentiellement faillibles, sur lesquels les annonceurs ont peu de contrôle: Google exploite l'ignorance de ses annonceurs.

Confidentialité et vie privée
Par le biais d'approches très diverses, nous étions tous à peu prêt d'accord sur le risques de l'hégémonie de Google. L'accent a été mis sur les dangers d'un accès à l'information sur Internet dominé par l'industrie américaine, mais également sur les risques concernant la protection de la vie privée.
L'exemple donné par Franck est saisissant: Ouvrez un email sur GMail. Regardez maintenant à droite de cet email. Que voyez-vous? Des pubs. Ok, il faut bien financer le service. Mais rien ne vous choque? Regardez bien. Oui, tout à fait. Les pubs sont en rapport avec le sujet du mail. Cela ne vous choque pas plus que ça. Bon. Maintenant, sortez de la matrice pour quelques instants. Revenez dans la vraie vie, et imaginez. Imaginez que votre facteur ouvre votre courrier, le lise, et glisse dans chaque enveloppe des publicités en rapport avec son contenu. Cela vous parle un peu plus? Cela vous choque? Vous trouvez ça inacceptable? Et bien c'est ce que fait Google avec vos emails.....

Moteurs thématiques et sectoriels
Fabrice a présenté ce qu'étaient les moteurs thématiques. Une excellente présentation qui a achevé de me convaincre de leur utilité et de leur avenir très prometteur. Les deux idées essentielles que Fabrice a développée sont à la fois l'exploration beaucoup plus profonde des sources d'information dans un moteur thématique que dans un moteur généraliste, mais surtout la valeur ajoutée des moteurs thématiques transformant l'information en objets métiers manipulables. L'exemple qu'il donne d'un moteur touristique illustre très bien ses propos.
Imaginez que vous deviez organiser un voyage en utilisant les moteurs généralistes: Vous recherchez un hôtel: plusieurs millions de réponses, vous recherchez un restaurant, encore plusieurs millions de réponses, vous recherchez des sorties, visites, activités et ce sont encore plusieurs millions de réponses. Il faut ensuite croiser toutes ces réponses afin d'organiser votre séjour. Tâche fastidieuse! Un moteur thématique va vous permettre de formuler une demande précise sur vos besoins: "Je veux passer une semaine du 10 au 16 octobre à Chartres en hôtel et réserver un restaurant différent chaque soir, ainsi qu'organiser quelques visites de monuments". Le moteur thématique va alors rechercher les hôtels disposant de chambres libres à Chartres pendant la période demandée. Rechercher pour chacun des soirs de votre séjour les restaurants de la région ayant encore des couverts disponibles et enfin rechercher les visites ouvertes au public à cette saison. Il peut finalement croiser tous les objets ainsi récupérés, les confronter, les organiser, les manipuler et vous fournir en réponses diverses suggestions de séjours... Pas mal non?
(Message personnel: Fabrice, si tu recherches quelqu'un en télétravail, ou bien si tu veux ouvrir une antenne Antidot sur la région parisienne: jerome [point] charron [à] gmail [point] com).

Web 2.0
Franck, Sébastien et moi même avons beaucoup insisté sur les mutations en cours. Mutations prenant aujourd'hui la dénomination très controversée de Web 2.0, mais mutations beaucoup plus larges qui vont modifier de manière profonde et significative notre utilisation du Web ainsi que notre poste de travail. Du WebTop de Franck, sorte de boite renfermant un WebOS jusqu'à mon Wiikle (convergence du Web 2.0, du Wiki, du Web et du Desktop), les deux approchent se rejoignent pour doucement faire pénétrer les technologies Web au coeur même de notre poste de travail ("le navigateur en tant que plate-forme").
Les moteurs devront s'adapter, les moteurs changeront. Ils deviendront ce qu'il sont finalement vraiment: un Service Web, bref, une API.
Parmi les aspects du Web 2.0, les concepts de folksonomie, de tagging et de micro-formats sont certainement ceux qui sont revenus le plus souvent: Ce sont de nouvelles manières de décrire et de structurer l'information, nouvelles manières mettant au centre l'individu et ses réseaux. Au delà des blogs, les moteurs de recherche vont devoir intégrer ces nouvelles méta-informations dans leurs processus d'indexation et de recherche.

L'avenir
Chose qui m'a beaucoup fait sourire à la fin de cette journée: Sans même nous être concertés, en utilisant des chemins et une argumentation totalement différentes, Jean et moi même en sommes venus à la même conclusion, la seule entité, aujourd'hui capable de concurrencer Google est belle et bien Microsoft. Au delà du futur concurrent de Google, l'avenir semble se dessiner selon cinq axes essentiels:
  • L'utilisation de la linguistique dans les processus d'indexation et de recherche. Les moteurs généralistes que nous connaissons aujourd'hui utilisent des technologies des années 70! Je le soulignais déjà en 1998 dans "Évaluation/Comparaison des outils de recherche sur Internet", depuis, rien n'a changé, et Jean et Armelle se sont fait un devoir bien justifié de nous le rappeler.
  • L'amélioration de la présentation des résultats. Pourquoi toujours des clones de Google? Pourquoi les interfaces ne sont-elles pas plus visuelles? (J'ai toujours été étonné de ne pas voir une plus grande utilisation du FishEye).
  • L'amélioration de l'utilisation du clustering. En effet, les algorithmes de clustering sont aujourd'hui bien connus, mais il faudrait étendre leur utilisation. Comme l'a souligné Jean à plusieurs reprises, il est incroyable qu'un de ses billets soit le premier sur Google sur la recherche "vernis à ongles". Il suggère donc d'être en mesure de calculer le score d'une page, non seulement en fonction du contenu de celle-ci (et de ses liens), mais également en fonction de l'adéquation qu'il existe entre la question et l'ensemble du site auquel appartient une page. C'est en effet une très bonne idée qui améliorerait certainement beaucoup les résultats. Reste dans un premier temps à définir la notion de site... car si celle de la page n'est déjà pas si évidente qu'il n'y paraît, celle du site me semble encore bien plus complexe (quoi qu'il en soit, c'est tout de même une excellente idée qu'il conviendra de creuser dans Nutch).
  • La lutte contre le spam.
  • La prise en compte des méta-données afin de mieux qualifier l'information (attention au spam) : Description, keywords, dublin-core, micro-formats, ...

Un grand merci donc à tout le monde, et au plaisir d'une prochaine rencontre hors de la matrice. Pour l'heure, après une bière bien agréable avec Jean (qui finalement, tout comme Franck et Sébastien vit plutôt bien la rupture), je remonte dans le train, direction Jouy 28...


TAGS : , , , , , , ,


3 commentaires:

Miss Tics a dit…

Merci pour ce passionnant compte-rendu qui soulève des points que je n'avais pas forcément songé à creuser... Au plasir de vous relire, tous...

Jérôme Charron a dit…

La miss avait réclamée un compte-rendu, je ne pouvais que m'exécuter...

Anonyme a dit…

Merci pour ce compte rendu. Je suis cependant trés décu que vous n'ayez pas ou trés peu d'esprit critique quand aux dangers du monopole de google en terme de censure et de sélection de l'information sur le moteur de recherche. En effet, la masse des gens ne se contente t-elle pas de regarder les dix premiers résultats de n'importe qu'elle recherche? Evitons que google ne devienne dieu.

Enregistrer un commentaire