Retrouvez motrech sur son nouveau site http://motre.ch/

15 mai 2006

J2J2 Nitot ni trop peu

Fidèle lecteur du Standblog depuis déjà bien longtemps, j'ai été dégouté scotché d'y lire ceci...
Microsoft construit un "cluster" comme celui de Google. La puissance de Google est la combinaison d'intelligence, de logiciel, d'un nombre inouï de serveurs (plusieurs centaines de milliers), d'une bande passante phénoménale et d'une marque reconnue. Microsoft a les moyens d'investir pour essayer de concurrencer Google, mais il n'y a probablement pas d'autre entreprise au monde qui puisse dépenser autant. D'après Greg Linden (ancien d'Amazon), même Yahoo ne pourrait pas suivre dans une telle course à l'armement. Voilà qui démontre bien que le rêve d'un moteur de recherche Libre utilisable par le plus grand nombre est irréalisable.

Sortant de la plume d'un des acteurs les plus en vue du monde libre francophone, ce genre de phrase sans aucune nuance me déçoit énormément!

Quel manque d'idéalisme pour un représentant d'un produit phare de l'open source...
...
Qui aurait imaginé il n'y a pas si longtemps qu'Internet Explorer perdrait des parts de marché?
Qui aurait parié que cette concurrence viendrait de l'open source?
Qui aurait osé rêver que ce concurent serait construit sur une souche de Netscape?
Personne! ... ou si peu...

Je rappellerais simplement que d'un point de vue culturel un moteur de recherche libre est aujourd'hui une nécessité.

7 commentaires:

Anonyme a dit…

Le billet que vous citez a été écrit le 4 mai. Dès le lendemain, j'écrivais ceci :

Plusieurs lecteurs m'ont fait remarquer que la solution était probablement un changement d'architecture et un passage au peer-to-peer. Un tel moteur existerait, indique JF Hovinne, et il s'appellerait Yacy. dans ce domaine, je serais vraiment ravi de me tromper, mais je ne crois pas en son avenir. Cela dit, je me suis déjà planté de nombreuses fois, et si on m'avait dit il y a 5 ans que Wikipedia serait un succès, je ne l'aurais pas cru (merci Alex de me l'avoir rappelé). Rappelons à tout hasard que le trimestre dernier, Google a investi 345 millions de dollars dans son datacenter. Vu leur taux de croissance, ça va finir par faire près de deux milliards de dollars sur l'année 2006 rien qu'en investissement, sans compter les frais de fonctionnement, si j'ai bien suivi. Mise à jour : Bertrand Lemaire me rappelle l'existence d'un moteur de recherche P2P français, Net2Map

Encore une fois, je serais ravi de me tromper, car je pense, moi aussi, qu'un moteur Libre est important.

Anonyme a dit…

Un moteur de recherche libre et performant libre est très certainement possible, d'ailleurs tu travailles dessus non ? ;)

Mais est-il possible pour un moteur libre de disposer des ressources hardware qu'ont Google et Cie pour faire un grand moteur généraliste mondial ?

J2J2 a dit…

Tristan, j'ai effectivement lu ta réaction du lendemain. Elle ne me semble en rien tempérer tes propos du 4 mai. Surtout que je ne suis vraiment pas convaincu par les approches P2P pour un moteur de recherche: C'est une approche qui semble au premier abord séduisante, mais elle n'apporte au final pas de solution pour le moment. Les initiatives de moteurs de recherche P2P sont pourtant nécessaire afin de déffricher le terrain et peut-être trouver une solution miracle.
Quoi qu'il en soit, merci pour ta réponse. Je ne pouvais pas ne pas réagir à ton post (même tardivement), d'autant que les commentaires sur Standblog sont fermés... ;-)

julien, cf les raisons pour lesquelles je ne crois pas au P2P (pour les moteurs de recherche)...

sébastien, oui, je pense qu'il serait possible de créer un moteur libre si par exemple nos dirigeants commençaientt par ne pas dilapider des sommes considérables dans des financements qui ne mèneront à rien: Quaero!

A ce sujet, j'aime beaucoup la conclusion de Loïc Le Meur au sujet de Quaero: "S'il y avait une menace possible vis à vis de Google, elle serait open-source"

Anonyme a dit…

Le problème, c'est autant celui du matériel (le nombre de serveurs est fonction du nombre d'utilisateurs) que de bande passante (laquelle est fonction du nombre de pages indexés).

Pour Google, qui indexe 8 milliards de pages à chaque passage, c'est monstrueux. Il faut savoir que s'il devait mettre 1 seconde par page, il lui faudrait près de 300 ans pour rafraichir l'index ! (je cite cela de mémoire). Bref, il faut une puissance de calcul (on parle ici de centaines de milliers de serveurs) et une bande passante phénoménale que seuls Microsoft et Google (et peut-être Yahoo) sont capables de financer (j'estime à 2 milliards l'investissement par an pour Google sur 2006 rien que pour son datacenter)...

C'est le genre de chose qu'un projet Libre, à l'heure actuelle, est incapable de faire.

Notons bien que ça n'est pas quelque chose qui me réjouit, hein... Le logiciel Libre est viable quand il s'agit de mutualiser des coûts de développement et de profiter des coûts nuls de duplication du logiciel terminé. Mais un moteur de recherche, c'est pas essence ultra-centralisé. A moins, justement, qu'il soit basé sur technologie peer-to-peer. A ce moment là, c'est chaque noeud, chaque utilisateur, qui paye une partie de la puissance CPU et de la bande passante nécessaire au fonctionnement du projet. On n'est pas encore à un niveau correct technologiquement pour que le moteur peer-to-peer fonctionne. Mais s'il y a un avenir pour un autre modèle, ce sera celui là. Peer-to-peer, et Libre (très probablement).

Anonyme a dit…

Effectivement Jérôme, si l'état finance derrière pourquoi pas. Mais faut pas rêver malheureusement...

Quand à Loic Le Meur, hum il devrait mieux se limiter aux blogs AMHA...

Anonyme a dit…

Justement, le financement de l'état (sur plusieurs années ?), s'il était investit dans sa totalité, serait à peu près comparable à l'investissement que Google a réalisé le trimestre dernier... Google n'est capable d'offrir gratuitement le moteur de recherche que grace à un business model basé sur la publicité qui s'est avéré extremement lucratif. Un moteur de recherche Libre pourquoi pas, mais qui tourerait sur quelle "grid", avec quels revenus ?

J2J2 a dit…

Tristan, Google n'indexe pas 8 milliards de pages à chaque passage... Comme je l'écrivais dans un précédent billet, l'art du crawl est bien plus délicat et complexe que celà...
Une bonne illustration en est l'excellente expérience menée sur un an par Drunk Men Work Here (via affordance.info).
Je suis en revanche tout à fait d'accord avec toi, pour offrir un moteur de recherche libre, il y a deux problèmes à résoudre:

1. La solution logicielle (sur laquelle nous bossons dur, et je pense que nous avons vraiment quelque chose de bien) qui permet finalement à n'importe qui de mettre en place un moteur de recherche (Corporate, Intranet, Thématique ou même généraliste)

2. La solutions matérielle pour le déployement. Au niveau métériel, bien sur, il faut un investissement minimum (avec un cluster de 5000 PCs, tu peux déjà proposer quelque chose de très sérieux). La maintenance d'un moteur de recherche demande beaucoup de travail, et c'est là que l'aspect libre peut intervenir dans le déployement: maintenance de l'index, maintenance/surveillance des stratégies de crawl, sélection/validation/pondération humaine des sites indexés, on peut tout imaginer avec des gens motivés...

Bref, il y a encore beaucoup de chemin à parcourir: Disposer d'une solution qui peut scaler dans les mêmes proportions que Google était une première étape à franchir... Il faut maintenant paufiner la solution technique, mais la prochaine étape sera certainement de voir comment mettre en place un moteur à but non-lucratif... Il y a des marketeux et des commerciaux prêts à relever ce genre de challenge dans la salle?

En tout cas, merci pour tes réactions (je suis preneur de toute suggestion, idée, critique), mais par pitié, n'enterres pas trop tôt la possibilité d'un moteur libre basé sur une technologie open source...

Enregistrer un commentaire