Notre magasin

Rue Albert 1er, 7

6810 Pin - Chiny

Route Arlon - Florenville

(/fax: 061/32.00.15

La formation INTERNET YBET Informatique

FORMATIONS

Le MAGASIN YBET

PRODUITS et SERVICES

Formation INTERNET à Pin

Activités et présentation

 

Définitions INTERNET

Rayon d'action  

 

Dépannage PC informatique

Un DJ? Sono AFTER TWO Support technique
YBET informatique CONTACT  

4. Les moteurs de recherche, annuaires

4.1. Introduction - 4.2. Les types de moteurs de recherche - 4.3. Google - 4.4. MSN - 4.5. Autres moteurs de recherche généralistes - 4.6. Moteurs de recherche spécifiques

1. Introduction

INTERNET rassemble quantité de sites sur une multitude de sujets. La difficulté reste de trouver les informations, ce que l'on recherche, dans l'ensemble des pages publiées. C'est le but de ce chapitre de la formation INTERNET: le fonctionnement des moteurs de recherche.

Rien n'est défini quand à l'organisation des sites, de leurs pages ou du contenu sur INTERNET. Il n'y a aucune organisation ou hiérarchie comme dans une bibliothèque par exemple. Deux solutions sont développées sur Internet pour faciliter ces recherches, les moteurs de recherche et les annuaires. Un moteur de recherche lit chaque site Internet (ou plutôt les pages) et indexe les mots inclus dans le texte. Un annuaire est une collection de sites repris dans différentes rubriques. La grosse différence entre les 2 provient de la manière d'indexer les sites. Le moteur de recherche (Google, MSN, Yahoo, ...) lit régulièrement les pages des sites et tient donc compte des modifications, ajouts et suppressions de pages, l'annuaire est plus statique et s'intéresse aux pages d'entrées des sites. Dans les 2 cas, le site renvoie comme réponses les sites correspondants au texte recherché.

Un moteur de recherche est divisé en trois parties: un programme appelé robot (ou bot) qui scanne les pages pour rentrer les données, une base de donnée pour stocker les informations (à de rares exceptions près, exclusivement des textes) et une interface (une page Internet) permettant de faire des recherches d'informations dans la base de donnée. Cette recherche affiche les sites correspondant aux termes demandés par le navigateur suivant un certain ordre qui dépend de divers paramètres (importance du site, nom, nombre de fois que le mot est repris dans la page, ..) et dans certains cas les sites qui payent (liens sponsorisés).

Souvent les moteurs sont installés sur une catégorie de sites que l'on appelle portal (ou portail). Un portal ressemble un moteur de recherche et des pages reprenant l'actualité du moment sur divers sujets (MSN est de ce type). Ce qui suit devrait permettre de mieux utilisé les moteurs de recherche et pour d'autres d'améliorer le référencement d'un site Internet.

Dans le cas d'un annuaire, la manière d'entrer les données (l'adresse du site ou des pages) dans la base de donnée est différente, elle se fait via un formulaire. La vérification de la qualité du site se fait généralement manuellement par le Webmaster de l'annuaire. En ce sens, la qualité des sites repris dans les annuaires est meilleure. Par contre, un annuaire ne pointe que vers la page d'entrée du site référencé.

2. Les types de moteurs de recherche et annuaires.

Avant d'analyser quelques moteurs, différençons les moteurs de recherche selon leur fonctionnement dans la rentrée des données.

2.1. Annuaire

Rentrée des données directement via la page d'entrée. Un annuaire utilise une page d'entrée sur la quelle celui qui veux référencer (mettre dans la base de donnée) son site (et ou ses pages) rentre manuellement quelques renseignements: l'adresse du site ou de la page, un titre, une courte description et quelques mots clés comme ci-dessous:

NOM - PRENOM - ADRESSE MAIL 

coordonnées de la personne qui référence
Société Nom de l'entreprise ou organisation du site
URL du site Adresse du site
Titre du site : une phrase courte commençant uniquement avec une majuscule
Courte description une phrase d'environ 25 mots décrivant le site, son contenu et les services proposés aux internautes. Si vous mettez une liste de mots clés, votre site sera sûrement refusé par tous les outils de recherche !
Mots clés : généralement 6 mots clés pour améliorer le référencement. mettez les mots les plus évidents correspondant à votre site

Les renseignements fournis sont minces, tout au plus une trentaine de mots différents. De plus, les mots peuvent être totalement différents du véritable contenu du site (pensez site pas trop "propres") même si la majorité d'administrateurs d'annuaires vérifient le site. Ces termes permettent souvent le référencement de ... l'annuaire sur ces mots.

2.2. Moteur de recherche par lecture du site.

Pour ce type de moteur, vous ne devez inscrire que l'adresse de départ du site (celle de sa page d'entrée). Le robot associé va "lire votre site internet" et enregistrer les textes présents sur la page d'entrée et les sous pages liées (on parle de référencement de site internet). Lors d'une recherche par l'internaute, le moteur va rechercher dans sa base de donnée les pages qui utilisent ce mot. Nous y reviendrons lors de la conception d'un site, mais les liens doivent être prioritairement des TEXTES et pas des images ou des boutons. Chaque page d'un site est dissociée des autres.

Chaque page web possède une entête invisible à l'écran pour le surfeur reprenant différentes informations. C'est ce que l'on appelle des META. Dans ces META, on retrouve le titre de la page, une liste de mots clés, une description, le programme qui est utilisé pour créer cette page, le langage par défaut de la page, ...

Les moteurs de recherche utilisent (en tout ou en partie) ces META pour le référencement Internet: TITLE (titre de la page), DESCRIPTION (remplaçant la courte description ci-dessus de 80 caractères maximum) et KEYWORD (une liste de mots clés allant jusqu'à 800 caractères). Pour la liste des Meta

2.3. Les Meta moteurs.

Certains sites ou programmes ne fonctionnent pas vraiment comme des moteurs de recherche, mais le but est la même, rechercher des informations sur Internet. Ces sites ou programmes proposent votre recherche sur différents moteurs de recherche (qui font le travail de recherche) et font une synthèse des résultats obtenus. Le plus célèbre, c'est un programme, est Coppernic, en version gratuite ou pro avec quelques options supplémentaires.

3. Google

Google est le moteur le plus utilisé des moteurs de recherche (environ 75 % des recherches francophones). Il existe pour pratiquement tous les pays (france, Belgique, Allemagne, Etats-Unis, Rwanda, ...). Pour choisir la version du pays, il suffit de changer l'extension (http://www.google.be pour la Belgique et http://www.google.fr pour la France). La base de donnée est la même quelque soit le pays mais la page d'entrée change. Les pages du pays sont depuis peu favorisées par rapport aux autres sites, mais partiellement. 

Par exemple, la version belge propose comme option: recherche sur le WEB (le monde entier), pages Francophones (toutes les pages en Français) ou pages sur des sites Belges. Par contre, la version française propose: sur le Web, pages francophones ou France. 

moteur de recherche GOOGLE

Même si Google analyse la page d'entrée d'une manière spéciale, il propose la page la plus pertinente lors d'une recherche et pas forcément celle d'entrée du site (index.htm).

Le pays d'un site est déterminé par l'extension du nom de domaine (exemple YBET.be est automatiquement repris comme site belge) ou suivant le pays d'hébergement du site (l'endroit où se trouve physiquement le serveur) dans le cas des extension internationales de type Com, net, info, ...

Outre le contenu de la page, GOOGLE utilise le pagerank pour déterminer la position d'un site pour une recherche (même si celui afficher dans la barre d'outils n'est plus forcément le réel). Le pagerank (PR) est une sorte de compteur de lien pointant vers une page donnée, il tient compte du nombre mais également du PR de la page qui envoie le lien. Pour juger de la pertinence d'une page sur une requête, Google utilise un mélange subtil entre les mots repris dans le titre de la page, le contenu et les liens qui pointent vers cette page.

3.1. Utilisation.

Lors d'une recherche, vous pouvez taper un ou plusieurs mots. Dans les mots, les caractères accentués et majuscules sont pris en compte (é, è, ë, ê, à, ...). Vous pouvez taper plusieurs mots pour affiner vos recherches. L'emplacement des mots dans la phase de recherche change légèrement les résultats, mais en gros laisse les mêmes sites aux premiers emplacement.

A. Utilisation du signe -

Essayons une recherche: "Lambermont". Cette recherche donne sur le Web 9560 résultats, pas pratique. En suivant les réponses, on retrouve des boulevards Lambermont, des rue du village de Lambermont près de Vervier, …

Essayons de taper "Lambermont Florenville". Automatiquement, Google reprend uniquement les sites reprenant Lambermont et Florenville. On ne retrouve plus que 253 résultat.

En progressant dans les résultats, on s'aperçoit vite que des sites n'ayant rien à voire apparaissent dans la liste, notamment une flopée de site "Annuaire …" Pour les supprimer de la liste, il suffit de taper "Lambermont Florenville –annuaire". Le signe - devant un mot permet de supprimer ce mot dans les recherches. Ceci vous permettra de retrouver le site du télévie de Lambermont (http://www.village-lambermont.be).

Prenons un autre exemple, je recherche informatique. En tapant ce mot dans n'importe quel moteur de recherche, la liste devient rapidement immense. Supposons que nous nous intéressons plus précisément aux systèmes d'exploitation. Recherchons informatique système exploitation, on n'obtient plus que … 157.000 résultats. Encore un peu beaucoup. Supposons que nous cherchons pour les PC. Rajoutons ce mot dans la liste et nous retrouvons 55.700 résultats (version française). Dedans, on retrouve encore des MAC et bien tapons au complet:

"informatique système exploitation PC –mac" . On vient de perdre une bonne dizaine de milliers de résultat non probants. Forcément, avec une telle recherche, vous pouvez encore cherchez longtemps.

B. Utilisation des guimets "

Nous souhaitons que la suite de mots soient effectivement repris dans l'ordre dans la recherche. Essayons Patrick Lejeune. cette recherche donne 96500 résultats. Par contre, la recherche "patrick lejeune" ne donne plus que 149 résultats.

C. Utilisation de la calculatrice de Google.

Lors de la recherche, si vous tapez un calcul, google vous renvoie le résultat. Par exemple la recherche 10*23 renvoie 230

D. Utilisation de la traduction.

Google permet également la traduction de sites en langues étrangères. S'il rencontre un site en anglais, il offre la possibilité d'une traduction vers le français du début de la page.

4. MSN.

MSN est le portal (il présente diverses informations comme l'actualité) de Microsoft. MSN est également présent dans une multitude de pays. La page d'accueil et la base de donnée changent suivant le pays. Ceci n'est pas la seule distinction avec GOOGLE. Un site référencé sur MSN.FR ne sera pas référencé sur MSN.BE, ...

A la différence de GOOGLE, MSN utilise les META KEYWORDS (mots clés) pour l'indexation. Un de mes concurrent utilisait d'ailleurs cette fonction pour être référencé dans MSN.FR. La pertinence des recherches est nettement supérieure à Google depuis quelques années.

MSN a modifié son fonctionnement mi-2004 pour se rapprocher de Google.

4.1. Utilisation de MSN

Les caractères accentués sont remplacés par le caractère non accentué (ex: é, è, ê, ... sont remplacés par e).

Quelques particularités. Vous pouvez utiliser le - ou la fonction NOT (en majuscule). La recherche Lambermont -Annuaire est donc identique à Lambermont NOT annuaire. Remarquez que le - est collé au mot à supprimer, le NOT n'est pas collé.

Utilisation de la fonction OR (ou).

Cette fonction n'existe pas sur Google. Pour rechercher tous les sites parlant de formations ou de cours, tapez: cours OR formation. L'utilisation de plusieurs mots peut s'avérer spéciales. Par exemple, ybet chiny OR Florenville recherche YBET couplé avec le mot Chiny + les sites sur Florenville. L'utilisation de parenthèses est conseillée. YBET (Chiny OR Florenville) recherche les sites reprenant le mot YBET + soit Chiny, soit Florenville.

5. Autres moteurs de recherche.

Yahoo, Quant sont également des moteurs de recherche généralistes.

Une large partie des portals de recherche utilisent néanmoins GOOGLE (http://www.skynet.be, http://www.free.fr, ...)

6. Moteurs de recherche et annuaires spécialisés.

Une large gamme de moteurs de recherche et annuaires sont spécialisés pour les sociétés immobilières, plantes, ... Les sites sont inscrits généralement suivant la méthode du formulaire de référencement. La liste est importante et dépasserait le cadre de cette formation.

7. Référencement Internet et positionnement

Le référencement consiste à créer un site Internet pour qu'il soit visible (trouvable) dans les moteurs de recherche. Je ne rentrerais pas trop dans les détails au niveau de ce chapitre mais les techniques utilisées sont en partie reprises. Chaque page du site doit être crée en fonction du visiteur, mais les mots et les techniques vont aussi utiliser les particularités de chaque moteur de recherche. Sachant que Google et Yahoo donnent de l'importance au titre de la page, à la description et au contenu, pour que le site soit visible sur une recherche donnée, les mots clés sur lesquels vous souhaitez être présents doivent automatiquement être repris dans le texte avec les mots les plus importants dans le titre. Le titre doit donc être différent d'une page à l'autre puisque chaque page d'un site est vue individuellement. Ceci peut sembler logique mais n'est pas souvent correctement perçu par les créateurs de sites. Nous en reparlerons dans un chapitre ultérieur sur le référencement.

Puisqu'on parle de moteurs de recherche

Les gros sont connus (Google, Bing (Microsoft) ou yahoo mais aussi Baidu (chine) ou yandex (russe)). Reste les autres: j'oublie un paquet de robot qui ne sont pas dédié à un moteur de recherche (mais à des ventes de "services") mais quelques petits qui travaillent gérés par de petites entreprises: je vous conseille de les essayer. Ils n'ont pas les mêmes moyens mais sont souvent pertients (et pas forcément pour vous espionner comme le font ceux déjà mentionnés

Je sais que les problèmes techniques de connection Internet au magasin sont souvent: "j'ai pas accès à Google" mais Google n'est pas Internet ... juste un moteur de recherche comme d'autres (avec juste plus de moyens financiers).

Sur le sujet

La suite de la Formation INTERNET > 5. Messagerie, outlook express

Vous êtes ici > YBET.BE > Cours INTERNET > 4. Les moteurs de recherche

Mise à jour: 30/09/2015

Le site YBET informatique (formations et cours, infos, se dépanner, ...)