Requêtes et algorithmes


Les moteurs utilisent de façon systematique les metadatas (non ce n’est pas que des metadatas du <HEAD> dont je parle, cf Historique des moteurs de recherche« ) pour compenser leurs faiblesses en analyse de texte.

 

Cependant les metadatas seuls ne suffisent pas à déterminer ce qu’est un résultat pertinent pour l’internaute (notion de pertinence qui de plus change d’un utilisateur à l’autre). C’est pourquoi les moteurs créent sans cesse de nouveaux filtres afin de diminuer la masse d’informations à traiter au pire, et pour mettre certains résultats en valeur au mieux.

 

A ce titre la formulation de la requête elle même donne lieu à une catégorisation qui va déclencher une pondération plus forte de certains critères et en atténuer d’autres.

 

Les requêtes des internautes peuvent être divisées en 5 grandes familles de requêtes.

 

- Navigationnelles : l’internaute connait déjà le nom de domaine qu’il veut atteindre, mais au lieu de la taper directement dans la barre d’adresse, il le tape dans la box du moteur. Les requêtes navigationnelles représentent entre 20 et 25% des recherches effectuées par les internautes, ceci explique sans doute pourquoi le nom de domaine reste un critère très bien pondéré par Google (le sitelink n’est qu’un symptôme d’une requête navigationnelle, n’en deplaise aux chasseurs de trustrank).

 

- Informationnelles : le but est de trouver un panel de sites répondant à un thème plus ou moins large. Ce sont les requêtes les plus courantes, celles où les ORs vont tenter de mixer dans leurs résultats sites Authorities et Hubs (et de fait c’est la niche la plus souvent exploitée par les référenceurs).

 

- Transactionnelles : l’internaute cherche à acheter, l’analyse plain text s’oriente sur les catalogues, la popularité est très bien pondérée.

 

- Solutionnelles : il s’agit d’une réponse à une question précise, la popularité est mise de coté au profit du plain text (et les forums ont souvent la vedette).

 

- Evenementielles (ou QDF pour « Query Deserve Freshness ») : alors que google a tendance à privilégier les « pages qui ont fait leur preuve », s’il arrive à déterminer que la requête concerne un sujet d’actualité il indiquera dans ses résultats des pages très fraîchement mises à jour, comme des articles de blogs ou tirés de GoogleNews.

 

En fonction du type d’expressions clés que l’on veut positionner, on peut orienter le profil de son site pour correspondre à la famille de requête correspondante.

Certes, la famille « informationnelle » est là plus fréquente et n’est pas détaillée ici. Déjà parce que se sont des requêtes qui contraignent le moteur à la diversité, ensuite parce que je ne fais pas ce blog pour donner des recettes « clés en main » ;)

 

La formulation de la requête est néanmoins une piste rarement évoquée dans les forums connus (et de leurs leaders d’opinion, malgré leurs milliers de posts au compteur), elle a pourtant tout à fait sa place dans les critères à prendre en compte lors de l’optimisation d’un site.

 

Enfin, elle ne peut être ignorée quand, pour comprendre le fonctionnement d’un moteur, on se base sur quelques expressions tests : ces expressions ne sont pas neutres ! Si a cela on rajoute le classement par thématique et les variations de pondération des différents critères qui en découle, voici qui relative nombre de tests…

 

A Lundi prochain :)

 

Jeffer


6 Comments, Comment or Ping

  1. Belle approche :-)

    octobre 7th, 2008

  2. Très bien cette classification, cela peut meme faire une feuille de route pour tout site, d’être capable de repondre a toutes ces attentes dans sa thématique

    octobre 17th, 2008