Développement du design web et création du site internet optimisé pour le référencement. Déploiement de solutions open source. Respect des standards du web W3C et d'accessibilité.

V.2.0

Référencement : phase de crawl

Comments :2
Tags: , , , ,

En 2010 le web comprend plus de 213 millions de sites – source netcraft. Le nerf de la guerre s’intensifie autour des moteurs de recherche pour trouver l’info pertinente.

Comprendre dans sa globalité le fonctionnement d’un moteur de recherche classique permet de comprendre bon nombre de contraintes liées au référencement.

Le moteur de recherche procède en différentes étapes effectuées chacune par des composants spécialisés :

  • phase de crawl
  • phase d’indexation
  • phase recherche et restitution de résultats

La phase de crawl

Elle est réalisée par les robots des moteurs appelés crawler ou spider (spider signifie araignée en anglais).Ils parcourent sans cesse la toile internet. Ces robots suivent les liens des pages, ils analysent le code de chacune pour récupérer des informations. Ces informations sont ensuite disponibles pour la phase d’indexation. Le spider ‘ne voit pas la page’ web comme un être humain. Il ne voit pas les éléments graphiques, images, animations, etc. C’est une des raisons pour lesquelles le référenceur insiste parfois lourdement sur l’absence du contenu textuel de la page plutôt que de s’émerveiller sur sa beauté graphique.

Le contenu textuel est totalement exploitable par les moteurs de recherche. Le spider est un lecteur avide et assidu de votre code HTML (Hyper Text Markup Language). Apportez de temps à autres quelques modifications au contenu de vos pages pour ne pas le lasser !

Dans notre prochain article nous aborderons les phases d’indexation, de recherche et restitution de résultats.