22 mai 2008
Un lifting pour motrech

Je ne sais pas si c'est l'arrivée d'Emilie, ou le beau temps et l'éclosion des bourgeons, mais il semblait comme une évidence que ce blog devait subir une petite opération de chirurgie esthétique.
Nous l'avons voulu clair, limpide, sobre. Comment trouvez-vous ce relooking ? Pour les connaisseurs des moteurs de recherche, ça devrait vous rappeler quelque chose... Alors ? alors ? de quel site nous sommes nous TRES largement inspiré ?
17 mai 2008
Chercher avec Addict-o-matic, c'est sympa !

Addict-o-matic, j'aime beaucoup. Si ce moteur de recherche au nom qui ressemble à Lavomatic n'innove pas concernant le mode de recherche (il permet de faire une recherche simultanée dans plusieurs sites), il innove en proposant une page de résultats tout en Ajax où l'on peut déplacer et paramétrer des blocs comme sur Netvibes.
Jérôme : D'accord, mais d'un point de vue utilisateur, ça apporte quoi réellement ?
Emilie : la possibilité via cet outil de faire de la veille instantanée sur un mot-clé donné, comme le souligne Eric, et ce uniquement dans certaines sources, par exemple les sites de vidéos comme Truveo Video Search et YouTube, et depuis un seul endroit.Vu sur Presse Citron.
16 mai 2008
SearchMonkey : Yahoo! se lance sur le web 3.0
Yahoo! SearchMonkey est ouvert aux développeurs depuis hier soir (webrankinfo, electronlibre, secrets2moteurs).
J'ai eu le temps de le tester un peu hier soir (une petite application shopreflex) et de parcourir la documentation.

Il y a beaucoup à dire, mais comme les lecteurs de blogs n'aiment pas les longs billets je vais essayer de synthétiser:
J'ai eu le temps de le tester un peu hier soir (une petite application shopreflex) et de parcourir la documentation.

Il y a beaucoup à dire, mais comme les lecteurs de blogs n'aiment pas les longs billets je vais essayer de synthétiser:
- SearchMonkey permet d'ajouter des informations aux résultats de Yahoo Search!
- Le développement d'une application SearchMonkey est vraiment très simple (quelques minutes si on connait bien XML, XSL et XPath)
- Un très grand nombre de schémas de méta données sont pris en charge : Dublin Core, Microformats, RDF, ...
Le développement d'une application se résume à extraire des informations structurées de vos pages et à les faire correspondre au vocabulaire relativement riche proposé par Yahoo!
Bref, avec SearchMonkey, Yahoo! permet d'augmenter la visibilité de votre site, d'améliorer l'expérience utilisateur mais aussi (et surtout du point de vue de Yahoo!) de structurer l'information sur le web par un processus collaboratif (tous les développeurs d'application SearchMonkey aident sans le savoir à structurer la base de données de Yahoo!) plutôt qu'un processus centralisé qui serait voué à l'échec devant l'ampleur de la tâche.Là où certains ne croient plus en Yahoo!, où d'autres se battent sur le terrain des réseaux sociaux, Yahoo! tente de dessiner le web 3.0 pour s'y imposer comme leader.
Vous l'aurez compris, je suis très enthousiaste et déjà séduit par SearchMonkey. Si en plus Yahoo! parvenait à masquer les aspects techniques de sa solution en utilisant une interface à la croisée de Yahoo! Pipes et de Dapper, ils proposeraient là une solution incroyablement puissante.
Bref, avec SearchMonkey, Yahoo! permet d'augmenter la visibilité de votre site, d'améliorer l'expérience utilisateur mais aussi (et surtout du point de vue de Yahoo!) de structurer l'information sur le web par un processus collaboratif (tous les développeurs d'application SearchMonkey aident sans le savoir à structurer la base de données de Yahoo!) plutôt qu'un processus centralisé qui serait voué à l'échec devant l'ampleur de la tâche.Là où certains ne croient plus en Yahoo!, où d'autres se battent sur le terrain des réseaux sociaux, Yahoo! tente de dessiner le web 3.0 pour s'y imposer comme leader.Emilie : je ne suis pas une spécialiste de développement et je ne me permettrais donc pas de faire des commentaires sur ce point. Par contre, je note que ce service offre deux choses aux développeurs, qui me semblent essentielles : d'une part, la possibilité de personnaliser la présentation des résultats, d'autre part, la possibilité d'ajouter une dimension sociale aux sites. C'était indispensable ? Inévitable ?
Vous l'aurez compris, je suis très enthousiaste et déjà séduit par SearchMonkey. Si en plus Yahoo! parvenait à masquer les aspects techniques de sa solution en utilisant une interface à la croisée de Yahoo! Pipes et de Dapper, ils proposeraient là une solution incroyablement puissante.
Emilie : quelques questions... La sortie de SearchMonkey va t'elle avoir une influence sur les sites Web, quant à l'utilisation de micro-formats ? Doit-on s'attendre à une amélioration de la recherche chez Yahoo ?
La recherche par mots-clefs a t'elle de l'avenir ?
La recherche par mots-clefs atteint-elle ses limites ? Je viens de tomber dessus sur cet un article qui date du 26 avril !!! J'ai pris un peu de retard dans la lecture de mes flux RSS. Désolée si vous l'avez déjà lu :(

L'article de TechCrunch revient sur le tableau réalisé par Novak Spicak dans lequel est représentée l'évolution de la recherche par mots-clefs depuis les prémices du Web jusqu'à ajourd'hui. Il met en parallèle l'efficacité des recherches avec l'augmentation phénoménale des données numériques. Et la conclusion c'est que quand nous aurons des milliards et des milliards de pages, la recherche par mot-clef ne suffira plus. Une façon pour lui de mettre en avant la nécessité de passer à des techniques de recherche différentes, comme la recherche basée sur le sens ! Et pour cause, il est le CEO et le fondateur de la startup sémantique Radarnetwoks.
Du coup, de moteurs de recherche comme Powerset, évoqué ici, ont de fortes chances d'empreinter la route du succès... en récupérant des internautes déçus par les recherches classiques ?

L'article de TechCrunch revient sur le tableau réalisé par Novak Spicak dans lequel est représentée l'évolution de la recherche par mots-clefs depuis les prémices du Web jusqu'à ajourd'hui. Il met en parallèle l'efficacité des recherches avec l'augmentation phénoménale des données numériques. Et la conclusion c'est que quand nous aurons des milliards et des milliards de pages, la recherche par mot-clef ne suffira plus. Une façon pour lui de mettre en avant la nécessité de passer à des techniques de recherche différentes, comme la recherche basée sur le sens ! Et pour cause, il est le CEO et le fondateur de la startup sémantique Radarnetwoks.
Jérôme : Encore la sémantique ? Les machines capables d'accéder au sens ? Désolé mais c'est encore de la science-fiction. En revanche la structuration des informations comme les micro-formats me semble être la solution à moyen terme pour améliorer la recherche... Mais comment structurer toute cette informations ? Yahoo! A son idée...
Du coup, de moteurs de recherche comme Powerset, évoqué ici, ont de fortes chances d'empreinter la route du succès... en récupérant des internautes déçus par les recherches classiques ?
15 mai 2008
Powerset est lancé
Le moteur de recherche sémantique/en langage naturel Powerset vient d'être lancé.
Présenté comme un potentiel "Google killer", on ne peut se faire pour l'instant qu'une petite idée de ses capacités vu qu'il ne permet de rechercher que dans les articles de Wikipédia. Les réactions sont plutôt positives...
Voici quelques articles où les auteurs parlent de Powerset, des tests qu'ils ont faits et disent ce qu'ils pensent de ce moteur de recherche : TechCrunch France, Accessoweb, Abondance, NetEco, Clubic... Les autres articles sont sur Wikio.

Alors, la linguistique peut-elle rivaliser avec Google ? En termes de qualité, de rapidité... ?
Emilie : Tiens, au fait, pourquoi n'utilise t'on pas le qualificatif "linguistique" ? On parle de moteur de recherche sémantique, mais dire qu'il y a de la sémantique sous-entend qu'il y a aussi de la syntaxe, non ? Et je trouve que "langage naturel" est une bien grande expression !
Jérôme : Effectivement, on s'empresse souvent de parler de sémantique et donc de sens, alors que les moteurs sont encore très loin d'accéder au niveau linguistique : Syntaxe, morphologie, grammaire propres à la langue.
Présenté comme un potentiel "Google killer", on ne peut se faire pour l'instant qu'une petite idée de ses capacités vu qu'il ne permet de rechercher que dans les articles de Wikipédia. Les réactions sont plutôt positives...
Voici quelques articles où les auteurs parlent de Powerset, des tests qu'ils ont faits et disent ce qu'ils pensent de ce moteur de recherche : TechCrunch France, Accessoweb, Abondance, NetEco, Clubic... Les autres articles sont sur Wikio.

Alors, la linguistique peut-elle rivaliser avec Google ? En termes de qualité, de rapidité... ?
Jérôme : J'ai toujours été convaincu que oui. Maintenant reste à le prouver! Beaucoup de bonnes choses dans powerset. L'outil me semble un peu compliqué et l'interface un peu lourde. Mais j'ai été assez surpris par exemple lors de la recherche sur French Paradox de constater que Powerset me surlignait le passage : "the French tend to eat higher levels of animal fat". PowerSet mériterait de longs tests et un long billet, mais pour le moment, la base est un peu trop restreinte. A suivre de très prêt en tout cas !
Emilie : "PowerSet mériterait de longs tests et un long billet". Oui, tout à fait !
13 mai 2008
Voulez-vous travailler chez Google ?
Voici les résultats d'un sondage réalisé il y a quelques semaines par le site Search Engine Roundtable :
Et vous ?
Je vois par ailleurs une question connexe : pourquoi vouloir travailler chez Google ?
Et vous ?Je vois par ailleurs une question connexe : pourquoi vouloir travailler chez Google ?
- parce que c'est une entreprise innovante
- parce que c'est une entreprise en haut de la vague
- pour les avantages proposés aux salariés
- etc.
Jérôme : Heu... parce que je suis un méchant vilain hacker et qu'en travaillant chez Google je sais que j'aurais accès à la plus grosse base de données mondiale : quel terrain de jeu fabuleux pour un hacker, non ?
Yahoo propose Glue page en Inde : pourquoi ?
Yahoo propose aux utilisateurs de son portail indien de recourir à Glue page. Pour l'instant en bêta, cette page agrège les résultats de recherche trouvés via les différents services détenus par la société américaine et d'autres sources. Parmi elles (les sources), on peut ainsi trouver par exemple Yahoo! Images, Yahoo! Actualités, Yahoo! QR mais aussi les vidéos de YouTube.
Je repense à un article du Journal du Net où il était présenté plusieurs versions de Google dans le monde. On peut noter, à l'instar de l'auteur de l'article, quelques points communs (simplicité, dépouillement et efficacité) mais aussi des spécificités locales. Par exemple, sur la homepage Google Corée, la page s'organise en quatre zones et non trois. Par ailleurs, "L'espace situé en haut à gauche sur les autres versions et qui énumère les cinq principales rubriques du moteur n'existe plus. Au lieu de cela, elles se retrouvent sous la forme de pictos (reprenant en cela le modèle de Yahoo), entre la marque Google et la fenêtre de recherche."
Jérôme : J'aime assez ce genre d'approche entre moteur de recherche et portail. Approche assez "intelligente" pour modifier les informations présentées en fonction de la recherche. Essayez par exemple les recherches Carla Bruni et Nicolas Sarkozy, les sources utilisées sont radicalement différentes : Très intéressant! Essayez une recherche plus générique comme motrech, et vous retombez sur la recherche standard. Bravo Yahoo! je trouve que le Glue devrait prendre.
- Ce concept n'est pas nouveau, on l'a déjà vu ailleurs (par exemple sur des sites comme TubeSurf ; vous en connaissez d'autres ?)
- Ca me semble sympatique toutefois je suis déçue par le fait qu'on ne puisse pas personnaliser un peu plus les blocs (ils sont fixes)
Jérôme : Emilie, tu es une geek! Crois-tu vraiment que Madame Michu ait besoin de personnaliser la page?Pour finir, une petite question... Pourquoi avoir choisi le portail indien et pas un autre pour "tester" Glue page ? Comment est fait ce choix ?
Emilie : Euh... pas vraiment. Tu as raison. Mais on peut essayer d'aider Madame Michu à trouver plus efficacement ce qu'elle recherche...
Je repense à un article du Journal du Net où il était présenté plusieurs versions de Google dans le monde. On peut noter, à l'instar de l'auteur de l'article, quelques points communs (simplicité, dépouillement et efficacité) mais aussi des spécificités locales. Par exemple, sur la homepage Google Corée, la page s'organise en quatre zones et non trois. Par ailleurs, "L'espace situé en haut à gauche sur les autres versions et qui énumère les cinq principales rubriques du moteur n'existe plus. Au lieu de cela, elles se retrouvent sous la forme de pictos (reprenant en cela le modèle de Yahoo), entre la marque Google et la fenêtre de recherche."
12 mai 2008
Petit organigramme des moteurs de recherche

Vu sur Webilus qui décrit le schéma ainsi : "Voici un récapitulatif simple des principaux moteurs de recherche et des services qui les utilisent. Loin d’être complet, cette illustration a le mérite de rappeler que Google n’est pas le seul moteur de recherche du marché"
Jérôme : Là où Yahoo! propulse les vieux moteurs de recherche (que plus personne ne connaît), Google se focalise sur les FAIs et donc sur la page d'accueil de la plupart des internautes. Une stratégie bien plus intelligente ! Quant aux autres... ils ont le mérite d'exister...
10 mai 2008
Le taux de rebond en questions

Dans notre précédent billet sur le taux de rebond, nous constations un phénomène étrange : le taux de rebond est plus élevé pour le moteur le plus pertinent (selon les chiffres des différentes études de Jean Véronis).
Comment expliquer cela?
Que disent les experts ?
Nous avons implicitement postulé que plus le taux de rebond est élevé, plus l'utilisateur est insatisfait du résultat proposé par le moteur. Mais est-ce bien réel finalement ? Petit tour du côté de la documentation de Google Analytics :
Taux de rebond : "Pourcentage de visites d'une seule page, c'est-à-dire le pourcentage des visites lors desquelles l'internaute a quitté votre site dès la page d'entrée".
En effectuant une recherche sur le web à propos du taux de rebond, même constat, tous les spécialistes SEO affirment que le taux de rebond est un indicateur du degré de satisfaction de l'utilisateur (taux de rebond élevé = résultat non pertinent).
Aurions-nous fait un contres-sens ?
Pourrions-nous plutôt voir un taux de rebond élevé comme un niveau de satisfaction élevé ? En effet, l'utilisateur a été très satisfait par la page retournée et il n'a donc aucune raison de rester sur le site. Il consulte la page et retourne à ses occupations. Dans ce cas, le taux de rebond est très élevé et pourtant l'utilisateur est satisfait et donc le résultat retourné par le moteur est pertinent.
Emilie : c'est effectivement une bonne manière d'envisager les choses. Un internaute recherche une information précise. Il la trouve sur un site où l'a mené un des résultats du moteur de recherche qu'il a utilisé. Pourquoi y rester alors ? Il y a, me semble t'il, deux cas de figure : soit l'internaute quitte le site après qu'il avoir lu l'information recherchée (il a obtenu ce qu'il voulait), soit il reste sur le site car il le trouve intéressant et qu'il peut lui apporter d'autres informations. C'est ce qui m'arrive de temps en temps. Et souvent, j'ajoute le flux RSS des billets à mon espace Netvibes.
Le taux de rebond vraiment exploitable ?
Alors, comment interpréter réellement le taux de rebond ? Je me demande finalement s'il est possible d'en faire quoi que ce soit :
- Il dépend sans aucun doute de la pertinence de la réponse retournée par le moteur de recherche
Emilie : à noter qu'il arrive qu'il y ait un décalage entre le titre de l'article et son contenu. Il laisse supposer sur la page des résultats du moteurs de recherche qu'on est tombé sur l'article, le document idéal... et puis, au final, rien de génial.
- Il dépend de la capacité du site visité à capter l'attention de l'internaute (et donc à visiter plusieurs pages)
Emilie : c'est l'une des règles à suivre quand on veut augmenter le trafic de son site. Il faut trouver les moyens de garder les "premiers" visiteurs, et ensuite de les faire revenir.Et pourtant...
Si on croise les données du taux de rebond avec le nombre de pages vues, on constate bien une énorme différence entre les moteurs (je ne prends ici que les données de staragora, car shopreflex est un cas particulier). De plus, en ne prenant les données que d'un seul site, nous écartons les différences dûes à la capacité du site à capter l'internaute, cette capacité est la même pour tous les moteurs) :
- Google : 65.26% - 2.75 pages vues
- Voila : 50.00% - 3.50 pages vues
- Yahoo : 34.62% - 9.46 pages vues
Emilie : je suis 100 % d'accord avec toi.
L'impasse !
Le taux de rebond semblerait donc être effectivement très représentatif de la pertinence des résultats des moteurs de recherche. Nous revenons donc à notre point de départ : comment expliquer des différences si importantes avec les études en aveugle réalisée par Jean Véronis ?
Nouvelles perspectives
Maintenant que ces différentes questions me trotent dans la tête depuis quelques jours, j'en viens à imaginer deux facteurs essentiels qui biaisent nos résultats :
Les données que j'utilise sont des données réelles, c'est à dire que Google représente environs 80 % du nombre de pages vues à partir des moteurs de recherche : il a une représentativité écrasante par rapport aux autres moteurs. En d'autres termes, je ne suis pas certain que le nombre de données récoltées pour les autres moteurs soient suffisantes.
Emilie : difficile de comparer ce qui n'est pas comparable...Enfin, et surtout, ce que m'inspire ces résultats est que les usagers des différents moteurs ne sont pas les mêmes. Ils ne font pas le même usage des moteurs de recherche. Je serais tenté de dire que les utilisateurs de Yahoo utilisent son moteur pour trouver un point d'entrée (les restes de l'annuaire de Yahoo ?) alors que les utilisateurs de Google recherchent une information précise ? (merci à Vincent au passage pour avoir écouté et approuvé mes théories ce midi). Ce ne sont que des hypothèses, mais une chose est presque certaine, les utilisateurs des différents moteurs ont des usages et des attentes très différents (ce qui rejoint d'une certaine manière le commentaire laissé par Jean sur le dernier billet).
Emilie : une petite étude auprès d'utilisateurs des deux moteurs de recherche ?!Et vous qu'en pensez-vous ? Constatez-vous les mêmes mesures sur vos sites ?
Inscription à :
Messages (Atom)
Chercher
Archives
Derniers Billets
Derniers Visiteurs
Catégories
A propos de ce blog
Le blog motrech existe depuis le mois de Février 2005. Tout comme la liste du même nom, il est (bien sur!) consacré aux moteurs de recherche.
Propulsé à l'origine par Jérôme Charron, Emilie Ogez a embarquée à bord en Avril 2008.
