Je n’apparais pas sur Google


En fait le titre de cet article devrait être : “mon super site qui a une ergonomie (au choix ou tout réuni) ludique, pratique, conceptuelle, orginale, intuitive, n’apparait pas sur Google”. Car cet article s’adresse à vous !
Mais bon ca faisait un titre un peu long :)

 

Cet article ne s’adresse par contre pas à la foule des sans imagination qui ont conçus des sites de merde, simplement parce qu’à force de vanité imprudente de leurs potes ils ont finalement réalisé que oui, il y avait un paquet de blé à se faire sur le net, et que oui on pouvait aussi parvenir à en gagner en procédant comme un porc.

 

Vous avez un beau site mais pour Google c’est une page blanche (ou quasi). Vous vous adressez à une boite de référencement la bouche en coeur et voici ce que vous allez entendre : “facteurs bloquants ceci…non prise en compte cela…faut refaire vot’site en prenant compte des contraintes des moteurs de recherche mon bon monsieur (ou ma bonne madame, pour ma bonne demoiselle me contacter).
Et ca, sans un trémolo dans la voix : par ce genre de réplique, notre référenceur est persuadé d’être pro :x

 

Et voilà comment au fur et à mesure le “beau web” ainsi que tout ce terreau culturel qui nous permet de saisir le sens des choses de manière intuitive (car humaine) disparaît aujourd’hui au profit d’un formatage de l’information imposé par le diktat des moteurs.

 

On peut objecter qu’il y a des sites superbes très biens positionnés par les ORs. Certes, on peut faire de beaux sites search friendly. Mais si comme moi vous êtes un passionné d’art et que vous adorez surfer sur des sites d’artistes (peintres, photographes, sculpteurs…), alors vous savez qu’il existe des schémas de sites qui n’ont rien à voir avec l’ossature des sites “compatibles moteurs”. Ces sites sont très, très, très nombreux, et parfaitement invisibles via les requêtes google type.

 

En fait, quelqu’un qui se sert uniquement de Google pour trouver des sites n’a aucune idée de l’ampleur de l’exclusion concernant les sites de gens qui ont une vraie sensibilité visuelle. L’artiste en Art graphique est la 1ere victime de cette exclusion. En effet celui-ci veut que sa vision esthétique soit présente aussi dans la présentation des ses oeuvres sur le Web. Mais même si son talent lui permet d’être intuitivement compris par l’être humain, les ORs sont dans la majorité des cas complètement largués.

 

C’est logique, on ne peut pas leur en faire reproche.

 

Mais si ce qui compte est la satisfaction de l’internaute, on se doit de pallier aux déficiences intrinsèques des ORs afin de permettre au beau web de bénéficier lui aussi de sa place au soleil.

 

C’est pourquoi je reviens à la charge aujourd’hui pour t’annoncer très clairement à toi, qui lit ces lignes et qui est dans le cas de figure que je viens de décrire, qu’il existe des référenceurs pro dont le boulot est de t’affranchir complètement des problématiques de visibilité de ton site sur Google.
Lâche toi, surprend même ton visiteur si tu l’oses ! Les bots ne sont pas des visiteurs comme les autres et à ce titre ils bénéficieront d’un traitement à part.

 

Ami référenceur “éthique”, pose toi les 2 questions suivantes :
Une page a un contenu très intéressant. Néanmoins l’ergonomie propre à sa thématique, qui facilite la bonne compréhension de ce contenu pour l’internaute, n’est par contre vraiment pas optimisée en terme de référencement. Maintenant tu cloak la page non pas pour changer quoique ce soit au contenu, mais juste pour changer la disposition de ce contenu afin que sa présentation soit optimisée pour les moteurs. Une analyse en terme de “nombre de mots de la page” ne décelera aucune différence entre les deux versions, c’est juste leur disposition qui a changée.
1) Auras tu enfreint la morale qui dicte les guidelines de Google ?
2) Le contenu qu’a l’internaute sous les yeux aura-t-il perdu de sa qualité ?

Ni l’un ni l’autre.

 

Il existe des référenceurs pro qui cloak en toute impunité depuis des années. Et ne croyez pas qu’il s’occupent de vulgaires MFA de plusieurs dizaines de milliers de pages, car là le mot “impunité” est certainement de trop. Mais un bon et beau site ne fait simplement pas l’objet d’un spam report (surtout qu’avec un cloaking bien fait il n’y a rien de tangible à reporter).

 

Alors, toi qui a un beau site et dont les seules visites sont les tiennes et celles que tu obtiens en offrant ta carte de visite, laisse toi tenter, vient goûter à cette formidable caisse de résonnance qu’est l’Internet français 2009, et ce sans compromis !

 

Pour franchir le pas de suite : tu vas sur la page “à propos” et tu contactes les contributeurs de ce blog. On ne te promet pas d’avoir le temps à te consacrer nécessaire, mais on pourra toujours t’orienter vers des bons qui l’ont.

 

A la semaine prochaine j’espere, 2 fois que je rate un Lundi ces derniers temps, je vais tacher à ce que ca ne devienne pas une habitude.
Sinon on se retrouvera sur referenceurd1lundisur2.blogue.fr, mais ca fait un ndd peu long :)

 

Jeffer



L’odeur de l’internaute


Pas de billet la semaine dernière pour cause de gastro (je vous passe les détails?).

 

Ce billet n’aurait pas été possible sans les informations que m’a communiqué il y a quelques temps Turillo : merci vieux briscard, et au plaisir de te lire peut être un jour ici même :)

 

L’odeur de l’internaute serait un concept à l’étude depuis kkes années déjà au Googleplex.

 

Il est possible qu’il en soit toujours au stade théorique, ou testé seulement de manière ponctuelle, ou encore mis en application sur le .com seulement. Ceci reste cependant un point de vue intéressant pour appréhender comment Google envisage de réussir sa quête en matière de pertinence des résultats.

 

Google catégorise tout ce qu’il peut afin d’améliorer l’efficience de sa pondération et d’économiser ses ressources. Il catégorise les sites, il catégorise les requêtes, il catégorise les liens…il lui manquait de catégoriser l’internaute.

 

Quelques rappels avant d’aller plus loin :

 

- Google developpa ses algos “”Query Deserve Freshness” suite à la gigantesque panne de courant qui frappa New York en  2003. En effet les Googleboys notèrent un afflux sans précédent de requêtes (en rapport avec la panne de courant sur la Cote Est) jusqu’alors peut tapées. Ce genre de pic ne peut être interprété que d’une façon : il concerne un événement d’actualité majeur (ce qui implique de fournir des résultats tirés de sites d’actualités, de blogs et forums à l’internaute plutôt que des annuaires ou des wiki-like).

 

- Google dispose en effet aujourd’hui de statistiques de masse qui lui permettent d’avoir une vision sur la noosphère comme jamais une société privée n’en a disposé. De ces milliards de requêtes, des innombrables metadatas qu’il collecte via ses outils gratuits (cf Historique des moteurs de recherche), les googleboys peuvent aujourd’hui déterminer les grands schémas comportementaux de notre inconscient collectif. Les gros chiffres ne mentent pas.

 

- Webmasters, Google ne vous fait pas confiance, et ne fait pas confiance à votre site. Conséquence, il préfère écouter ce que les gens disent de votre site plutôt que ce que votre site dit de lui même. De plus, il peut aujourd’hui juger votre site à l’aune de ces vérités statistiques, rendues fiables par son hégémonie.

 

Néanmoins, faire du cas par cas avec des données de masse, c’est un peu comme sculpter une figurine avec un marteau pilon. La grande majorité de nos requêtes sont suffisamment spécifiques pour demander une analyse comportementale subtile.

 

C’est là que le concept de l’odeur de l’internaute intervient, et il se résume très simplement :

 

Toutes les informations que Google arrive à collecter sur nous sont anonymes mais sont quand même tagguées via un numero d’identifiant unique. Google peut ainsi mettre en place une grille d’analyse de différents profils d’internaute : l’internaute féru d’High tech, de cinema, de cyber-achat etc.
Une valeur plus ou moins élevée est alors donnée à l’internaute en fonctions des profils établis. Les sites que l’internaute visitera bénéficieront d’une partie de cette valeur.
Cette “odeur” s’estompera avec le temps, mais sera réactualisée si cet internaute revient régulièrement sur le site.

 

Alors, après le PR des sites, le PR des internautes (voire Trustrank) ?

 

Une chose est sûre : même la méthodologie la plus solide pour analyser les résultats (pour une bonne base : des algorithmes et des thématiques) est mise de temps en temps en défaut par des sites positionnés de manière incompréhensible. Certains évoquent un facteur purement aléatoire pour expliquer ces incohérences, mais peut être est-ce justement ces données comportementales - gros volume de données donnant une moyenne fiable et “odeur de l’internaute” - qui constituent ces variables qui nous échappent ?

 

Il reste cependant très dur d’en évaluer l’impact, et il est quasi impossible de déterminer si cet impact est systématique, ciblé ou ponctuel.
De plus, à part essayer d’obtenir et de fidéliser un nombre conséquent d’internautes leader d’opinions, au niveau magouilles pour en tirer un bénéfice en terme de positionnement, il n’y a pas grand chose à explorer.
En conclusion, on pourrait de prime abord penser que pour un moteur de recherche, la quête de la pertinence est un effort de R&D toujours plus important pour permettre un jour à un programme de tirer du sens d’un texte. Néanmoins il semble probable que seule une Intelligence Artificielle pourrait se montrer réellement à la hauteur de la tâche.

 

“Heureusement” face à la propagation de l’Internet dans les pays industrialisés ou en fort développement, et le fait que tout y est potentiellement archivable et analysable, une alternative s’est offerte pour reconnaître l’information signifiante sans avoir à la comprendre.
Pour cela Google dispose de deux leviers : les données sur le comportement humain via des statistiques de masse, et une capacité de profiling très aboutie.

 

En clair, Google pourrait bien être tenté de renoncer à comprendre pour singer l’humain qui comprend…et dans l’état actuel de notre technologie il a peut être raison.

 

On peut continuer à crier au loup sur cette volonté d’en savoir toujours plus sur nos us & coutumes de la part du grand G, c’est d’ailleurs devenu un sport international. L’objectif est pourtant noble : avoir un outil de recherche pertinent.
Certes il y a tous les enjeux d’une publicité de plus en plus ciblée en filigrane, mais à ce niveau nous devrions plus nous offuscer de ce genre de chose.

 

Bonne semaine à tous et à toutes !

 

Jeffer

 

[Pour ceux qui sont interessés par l'Intelligence Artificielle, un document inédit de Jean Philippe de Lespinay vous passionnera sans doute : l'Intelligence Artificielle raisonnante : fini les intermédiaires entre utilisateurs et ordinateurs.]



Des algorithmes et des thématiques.


Suivant le chiffre d’affaire généré par un secteur, l’environnement concurrentiel des mots clés qui y sont associés varie de “quasi inexistant” à “saturé”. En fonction du poids de la concurrence, une optimisation plus ou moins poussée est nécessaire.

 

Il est normal que les ORs n’adoptent pas les mêmes grilles d’analyse pour (par exemple) des sites de vente en ligne et des sites universitaires, et n’appliquent pas le même traitement dans un cas ou dans l’autre. Ce qui sera bien vu ici pourra être sans conséquence voire pénalisant ailleurs.

 

Pour le référenceur, il s’agit donc de déterminer qu’elles sont les moyens nécessaires à mettre en oeuvre, ce qui se fait en fonction de la concurrence, et selon quels procédés ils seront appliqués, ce qui se fait selon la thématique.

 

Les actions effectuées sur le site auront pour but de lui faire acquérir un statut d’authority via l’optimisation de l’arborescence, des pages et du contenu. Vient ensuite le travail sur sa notoriété qui sont les actions hors site : la soumission auprès de certains annuaires, la création éventuels de blogs, le recours à son propre réseau de site, l’échange de liens…

 

Au fur et à mesure du temps et de l’expérience, le référenceur peut s’essayer à lister les grandes thématiques (tourisme, vente en ligne, sport, actualités, sexe, communauté, etc.) avec leurs spécificités. Pour ce faire une grille de lecture des résultats lui est nécessaire.

 

En effet, il ne suffit pas de plagier le site positionné en 1er dans les résultats, Google préférant donner des résultats variés. Pour avoir un site “bien vu” par Google, il faut procéder à une étude sérieuse des 20 premiers résultats donnés sur un grand nombre de requêtes afin de dégager deux familles de sites :
- ceux dont on serait satisfait de voir la présence si on était Google, et
- ceux qui n’ont rien à y faire
Les sites de la seconde catégorie peuvent mettre en évidence les failles des algorithmes qui les ont positionnés. Ils seront à étudier très minutieusement.
Les sites de la 1ere catégorie offriront du contenu à reprendre (et à re-rédiger) en cas de contenu faible de la part du site client.

 

 

Au départ, pour obtenir ce “grand nombre de requêtes”, il faut donc un thésaurus le plus exhaustif possible de l’activité du site, sa thématique et ses objectifs de communication.

 

C’est à partir de ces informations que va commencer l’appréciation du scoring à atteindre pour réaliser les objectifs de positionnement.

 

 

Les différents critères d’évaluation du scoring : l’approche globale.

 

Le nombre d’occurrences sans les guillemets.

 

C’est un indicateur grossier, car pour peu que les deux mots clés de l’expression soient usuels, le nombre d’occurrences peut être très élevé sans pour autant dénoter d’un environnement concurrentiel difficile. A l’inverse certaines occurrences faibles mais sur un marché réduit et précis vont peut être renvoyés peu de résultats mais qui seront tous tirés de sites optimisés pour les moteurs. Ce critère seul ne suffit pas, il n’est là que pour permettre un ratio avec le critère suivant.

 

Le nombre d’occurrence avec les guillemets.

 

Ici par contre tous les résultats indiqués peuvent être considérés comme des concurrents directs, et même un chiffre aussi réduit que quelques dizaines de milliers correspond à quelques dizaines de milliers de pages à dépasser, ce qui peut s’avérer ardu.

 

Le ratio entre le nombre d’occurrences sans les guillemets et avec.

 

Cela donne une idée du “bruit” autour de l’expression. Plus le ratio est élevé et plus le bruit est important : les résultats donnés ont bien les deux mots clés de l’expression dans leurs pages, mais ces mots sont éloignés l’un de l’autre. Le fait de les avoir simplement contigus sur le site client sera bien sûr un avantage.

 

La présence de nombreux annuaires dans les résultats.

 

Qu’il y ait 1 ou 2 annuaires dans les résultats est normal, au dessus c’est un signe que la thématique a attiré l’attention de “pure players”, et que la difficulté à positionner le site sera accrue.

 

Le nombre d’adwords affichés en résultats.

 

Même si Google se défend de mélanger ses bases de données dédiées aux Adwords et ses bases de données dédiées aux résultats naturels, le nombre important d’adwords correspondant à une requête est un indicateur suffisamment révélateur pour qu’il puisse le prendre en compte pour déterminer si une requête concerne un marché porteur de business ou non.

 

La présence de blogs, de sites persos, de forums.

 

C’est un facteur indiquant le besoin purement informatif que Google attribue à la requête (cf Requêtes et algorithmes pour avoir une idée du profil de sites privilégiés par Google selon le type de requête), ce qui donne une indication sur la reactualisation nécessaire du contenu et le poids attribué à l’analyse textuel pour rester positionné.

 

Des résultats avec le nom de domaine à la racine ou non.

 

Si en 1ere page de résultats il n’y en a aucun qui soit sous forme http://www.nomdedomaine.com/rep/page.html mais que ce soit seulement des ndds à la racine, c’est en général signe que le marché est suffisamment trusté et concurrentiel pour que l’indice de popularité soit plus important que le plain text. Si jamais des résultats trouvés un peu plus profondément dans l’arborescence sont indiqués, alors l’optimisation plain text devrait suffire même avec un indice de popularité faible.
Attention, certains sites sont tellement bien pondérés qu’un simple répertoire peut avoir le même poids qu’un ndd à la racine !

 

 

Les différents critères d’évaluation du scoring : les 1ers résultats.

 

En plus de cette approche globale, chaque site peut être analysé plus précisément :

 

- Via google, avec la commande “site:ndd.com ndd” qui indique le nombre de pages présentes dans la base. On peut aussi taper “site:ndd.com mots clés”, ce qui donne une idée de l’entendue des efforts fournis par ce site pour être positionner sur ces mots clés.

 

- Analyse des backlinks (ancre, IP du site, PR de la page…il existe plein d’outils ! Si vous voulez indiquer les votres…)

 

- Comparer les résultats via les différents data centers de Google : http://www.seocritique.com/datacentertool/

 

- Connaître l’âge du site via http://web.archive.org/collections/web/advanced.html. Ce critère est important car l’âge du site aujourd’hui est un critère de poids pour Google.

 

- Regarder la version cache de google : celle-ci indique la date du dernier crawl, de plus avec l’option “texte seulement” il permet de détecter un éventuel texte caché et donne une idée précise de la structure de la page.

 

- Analyser la structure du site avec Xenu : à l’origine conçu pour repérer les erreurs 404, il dresse une cartographie précise du site et de ses titres.

 

- GRKDA est un logiciel qui dissèque le contenu textuel d’une page (pourcentage des mots, emplacements etc.).

 

 

Bonne année à tous, avec pleins de sous (bien sûr) et une santé à toute épreuve (surtout !) :)

 

Jeffer



C’est la Crise


Eh oui, c’est comme ça qu’on nous présente 2009. Google se séparerait de 10 000 employés en intérim (Quoi! Il y a des emplois précaires chez Google? Incroyable!) et Microsoft taillerait du côté de MSN. Quand à Yahoo… Ai-je vraiment besoin d’en parler?

 

Le contexte est morose. Néanmoins, et bien que cela ne changera rien pour vous, l’équipe du Référenceur du Lundi se joint à moi pour vous souhaiter une pas trop mauvaise année 2009.

 

J’ai profite pour remercier les sites qui nous ont fréquemment cités et liés en 2008, comme Secrets2Moteurs, Oseox, VDP Digital, le forum Twiger, Ajblog, le blog de Wizishop, Wedbconseils.com, Discodog, Costaud.net, ainsi que tout ceux que j’oublie (désolé, venez m’insulter dans les commentaires de ce billet). Les hyperliens, c’est un peu comme si tous les sites de la Terre se donnaient la main.

 

Pour 2009, nous essayerons d’être encore plus dérangeants et agitateurs, c’est promis!

 

Et si vous sentez que vous avez l’âme d’un SEO Warrior, venez faire un petit “cross-blog” chez nous!

 

ApocalX



Vacances


La dreamteam part en vacances.

 

Nous espérons que vous avez apprécié la mise en bouche et que vous êtes maintenant en appétit, car l’année prochaine va être saignante !

 

Bonne fêtes à tous :)

 

Jeffer, ApocalX, Easyguy, Refmond

 

PS : on vous épargne la récap’ des “grands moments 2008″ ainsi que les “prévisions du futur 2009″, cadeau !