|
Les news et dossiers YBET sur l'informatique. le
11-10-2009, dans la partie Internet
Les liens aident-ils au référencements, pénalités de Google
En septembre 2008, un gros post sur le forum de
référencement Webrankinfo.com
faisait suite à une série d'articles sur ce site reprenant les causes
de pénalités de positionnement des sites sur Google. On se rappelle des
pages constituées uniquement de liens, du duplicate content, des fautes
d'orthographe plus ou moins SEO, ...
L'équipe d'YBET s'est remis aux études pendant ces
vacances, de nouveau aider par d'autres webmasters pour refaire un tour du sujet
mais aussi pour voire d'autres problèmes qui apparaissent. Je rappelle que
cette série d'articles ne tient compte que de sites plus ou moins sanctionnés,
pas pour des sites standards.
D'abord, quand est-il des causes trouvées l'année
passée et suivant ce que les webmasters ont fait pour "sortir", quels
sont les résultats (probants ou non):
- le duplicate content continue à sanctionner des sites, c'est
probablement moins flagrants tout simplement parce que la majorité des
sites qui n'ont pas corrigé sont depuis belle lurette passés dans le fin
fond du classement, seuls quelques petits nouveaux dont le webmaster n'a pas
trop compris se retrouve finalement pris dans l'engrenage. Est ce que
corriger à remis les pages (sites) à flot? Difficile de donner une
réponse catégorique. D'abord, Google mémorise les pages et semble les
resanctionner juste après les avoir refait passée. Deuxièmement parce que
corriger du duplicate content sur des pages entières en sachant que 5 mots
à la suite suffisent est plutôt difficile (y compris avec CopyScape, le
site permettant de détecter ces copies de phrases). Dans l'ensemble, les
sites totalement corrigés sont finalement revenus à peu prêt (juste à
peu prêt). Une solution de renommer les pages et de corriger a été
bénéfique pour quelques uns mais d'autres sont repassés en gardant les
mêmes adresses de pages.
- les pages ne reprenant que des liens restent pour la plupart dans
le creux. Sauf que des pages principales (principalement la page d'entrée
d'un site) ne reprenant quasiment que des liens sont aussi passées à
la trappe dans certains cas. Ce problème avait déjà été détecté
l'année passée pour les petits sites de vente en ligne.
- Les fautes d'orthographe plus ou moins volontaires semblent
toujours un peu égratignée par Google mais un peu moins. Par contre,
les fautes de conjugaison semblent nettement moins sanctionnées.
- Un PR grisé signe de sanction? Google a nettement modifié la
communication, des pages complètement grisées passent maintenant en
positionnement mondial et d'autres avec du PR pas du tout. Dans ce sens, un
PR grisé ne signifie plus automatiquement pas sanctionnée, même si les
pages avec un PR grisés sont plus souvent sanctionnées. Les outils
webmasters de Google donnaient aussi des indications lorsque la page
n'était ni reprise comme recevant des liens internes ou en envoyant. Google
les reprend maintenant, impossible d'utiliser cette méthode pour détecter
quoi que ce soit actuellement. En modifiant les méthodes de détections,
Google a finalement complètement caché les pages pénalisées.
Pas très optimiste pour le référencement, ...
Pourtant, il reste une cause de déclassement de l'année dernière qui n'est
pas reprise ci dessus, les liens amicaux (et souvent mis juste pour faire
monter la page qui reçoit les liens). C'est cette partie qui va nous
intéresser cette année.
1. C'est quoi un lien amical?
Depuis déjà des années, on sait que pour
positionner une page sur les moteurs de recherche, un lien reprenant les mots
vers une page fait monter la page (c'est la base des annuaires). Le truc est de
ne pas toujours utiliser les mêmes mots pour ne pas avoir l'air de passer en
force (suroptimalisation). On sait aussi que les liens venant d'autres sites, si
possible de pages sur le même sujet sont mieux vues que ceux venant du même
site, de nouveau sans trop en faire.
L'année passée, on avait vu qu'une page qui donnait
un lien clairement fait pour faire monter une autre page sur une requête se
faisait déclassée directement (peu de textes avec un beau lien). On avait vu
aussi que Google reprenait des groupes de sites et les associait entre-eux.
Prenons un webmaster qui a 10 sites, sans forcer, chaque site recevait déjà 9
liens externes. On imagine un réseau de 1000 sites pour comprendre que les
grosses régies avait nettement plus facile de mettre un site bien référencé
en ligne que le pauvre Webmaster solitaire.
2. Qu'est ce qui peut permettre à Google de déduire que les sites font
partie du même groupe de sites?
Une partie des tests de cette année reprend cette
idée mais comment Google ressemble les sites entre eux? Les solutions possibles
de regroupement sont
- même adresse IP d'hébergement avec pas trop de site (un
mutualisé reprend souvent quelques milliers de sites, un serveur dédié
beaucoup moins).
- même Whois (donc propriétaire). L'année passée, on se disait d'ailleurs
que si le moteur de recherche voyait le même webmaster, il ne devait pas
sanctionner le lien (c'était l'année passée).
- même compte adsense (la régie publicitaire de Google). Comme les
revenus sont pour la même personne ou société, de fortes chances pour que
les sites soient également du même webmaster
- même compte webmaster pour des sites. Comme le propriétaire doit
être authentifié par une balise ou un fichier dans le répertoire du site,
le propriétaire du compte Google doit obligatoirement avoir l'accès aux
codes FTP pour le transfert
- même compte analytics, la plate-forme de statistique de Google
pour les sites Internet.
Ces idées conduisent à des tests en cours de
quelques sites sur un serveur dédié à part, sans publicités ni compte
webmaster avec le Whois caché (le propriétaire est donc inconnu).
Pourtant, en avril - mai 2009, des sites ont
commencés à être déclassés sur certaines requêtes importantes sans
réelles raisons (les nôtres aussi d'ailleurs) sur des pages qui n'étaient pas
touchées avant.
Durant la période estivale, de nouvelles pénalités
peut-être mais qui touchent cette fois des groupes de sites complets et plus
des requêtes.
Ceci est une partie des résultats actuels mais sans
reprendre un site caché qui ne fait (normalement pas) partie du même groupe de
sites avec aucune des conditions ci-dessus avec les autres. C'est d'ailleurs
pour la suite de tests en cours que les autres sites restent liés entre-eux.
3. Deux sites liés (et plus).
YBET gère plusieurs sites Internet dont (de nouveau)
celui-ci et un dictionnaire hébergé sur materiel-informatique.be et un très
vieux site plus mis à jour (la version YBET hébergé sur skynet.be). Ils sont
tous liés plus ou moins par des pages internes de même sujet, en plein dans le
contenu ou en lien complémentaires mais reliés. Le premier et le troisième
envoient un lien vers le deuxième en page d'entrée.
La question est: est-ce qu'envoyer un lien vers
une page équivalente d'un site lié peut déclasser les pages et quelles pages
(au passage, est-ce que ça pourrait aussi déclasser une page qui n'est pas
liée, comme on sait que l'algorithme de positionnement de Google se méfie de
plus en plus des liens). On va voire. Les tests de suivis se font sur les deux
premiers sites, c'est le positionnement sur des recherches en 1 mots sur
Google.fr avec deux sites .be (donc géolocalisés sur la Belgique et
désavantagés mais qui passent finalement pas trop mal). Le choix de la version
français de Google est délibérée pour ne pas trop faire intervenir le
troisième (et dans le futur, voire ce qui va se passer avec le quatrième
inconnu).
Le petit logiciel utilisé pour afficher les
positionnements est celui de webmaster-rank.info, un programme à installer sur
son propre ordinateur (pour ne rien perturber, désolé de ne pas mettre un lien
malgré cet excellent outils).
4. Petite étude sur une recherche , corrections et positionnement
Voici le graphe de positionnement des deux sites sur
une grosse requête (la même) sur les deux sites principaux. Comme on le voit
clairement, les deux sites sont pénalisés sur la recherche le même jour à
peu de chose prêt avec une brusque descende. Présentes largement sur Google.be
sur la requête (les deux sur la première page), ils ont aussi complètement
disparus sur les 50 premières places. Au passage, à part sur une requête en
deux mots reprenant le mot, les sites sont aussi pénalisés sur toutes les
pages sur les requêtes reprenant ce mot.


Quelques semaines sans réactions, puis on a repris
notre petite feuille Excel pour noter nos différentes modifications. La
première idée est venue de duplicate entre le premier site et le troisième
(et oui, la vieille version du premier) et on a simplement effectué des
redirections entre les pages du vieux et du principal. La principale raison est
cette requête également touchée mais d'autres pages qui ont été
déclassées d'un coup sec.

ou celle-ci.

Ces deux pages étaient effectivement en grosse
partie en duplicate (mais comme Google semblait pas trop bouger), les
redirections ont été effectuées le 10/07/2009 pour la première requête et
le 28/06 pour la deuxième. Dans le première cas, quelques jours plus tard, la
page revient (mal mais revient). Dans le deuxième cas, la page ayant totalement
disparue des résultats de Google (même plus en cache), revient également dans
les résultats (également plutôt mal placée mais présente). C'est la même
chose sur d'autres recherches liées à YBET.be mais pas toutes. Donc le
duplicate n'est pas la seule raison. Une demande de réexamen du site
ybet.be par Google mi-juillet donne comme réponse passe partout: votre site
n'est pas sanctionné (ben voyons). Pourtant ça donne l'idée d'un changement
ou plutôt d'un durcissement de l'algorithme de Google. Si le vieux site
n'intervient plus trop dans le déclassement du premier avec un Whois différent
(forcément), sans contenu identique puisque la page n'existe plus, qu'elle
peut-être la raison de déclassement?
On va reprendre la première recherche. ybet.be envoi
un lien vers le deuxième avec comme texte dictionnaire informatique
technique, je laisse deviner quelle est la recherche que le site essaye (en
plus du nom de domaine) .... (dictionnaire technique a été longtemps
positionné mais est-ce intéressant). Par contre, le premier se positionne
depuis des années sur magasin informatique (ce n'est pas un site de vente
en ligne) et pour le premier, une grosse descende, pour le deuxième,
complètement disparu.
Les sites sont liés ...? On va voire. Modification
du texte du lien pour reprendre dictionnaire technique vers le deuxième ... et
pour celui qui envoi le lien, remontée sur magasin (faible mais remontée),
pourtant pas très significatif (seulement revenu sur la recherche en deux mots
en fin de deuxième page). Voyons maintenant pour le positionnement de celui qui
reçoit le lien. En premier, le nom de domaine (reprenant le mot principal)

Et oui, changement effectué vers le 25 juillet,
après la descende. Modifié le lien en supprimant le mot clé et redescende
(mais en laissant le lien), le temps pour Google de repositionner et 80 places
de remontées. Aucunes autres modification sur les textes des autres liens des
deux autres sites. En deuxième, pour en rajouter une couche, ... La descende de
la première recherche est à peu prêt là (3 places) à la même date avec
d'autres aussi, seule la remontée est plus tard (à partir du 21/08).

Dire que les deux sites sont liés et que la
modification du lien entre en jeux est discutable pour le deuxième site,
puisque ces remontées peuvent être liées à d'autres facteurs (à partir de
septembre, la structure du site va être complètement modifiée). Pourtant, on
va voire des positionnements dans l'autre sens, un site avec des petites pages
qui renvoie un lien très amical vers .... une page d'un site avec un contenu
nettement plus complet, c'est la suite.
<<< L'informatique vu par des techniciens? (28-06-2009) - Les liens aident ou non au référencement? (11-10-2009) >>> Proposée le 11-10-2009
|
Insérer un commentaire sur cet article
|
|