|
|
Le référencement en juin 2000
80% de intemautes accèdent aux sites Internet par des requêtes auprès des outils de recherche. L'apparition des sites sur les résultats d'une requête sur un annuaire du type Yahoo ou sur un moteur de recherche du type Altavista est donc primordiale. Plus précisément, alors que les études sur le net affluent, il apparaît que les internautes sont atteints de flemmite aiguë: ils consultent à peine les résultats au-delà de la troisième page. Il en résulte une immense bagarre entre les acteurs d'un marché qui est, hélas pour la pérennité de ce rapport, voué à de multiples et douloureuses mutations. Mais cet état de fait est une constante sur le marché de l'lnternet: demain, rien ne sera plus comme avant et l'on raisonne désormais en dog years. Ce rapport dresse un rapide bilan d'un mois de stage au sein de la société EEC, spécialisée en conception, réalisation et référencement de sites web. A ceux qui le parcourront, je suggère humblement de commencer par la fin (!), c'est-à-dire les sites mentionnés en annexe. Sur le net, la connaissance s'acquiert d'abord en surfant. Aux autres, je souhaite une bonne lecture. L'actualité de ce mois de juin 2000 est dominée par deux événements apparemment antinomiques: la création de l'IPEA (Internet Positioning European Association), association censée organiser la profession de référenceur (et donc lui octroyer un espace médiatique) et l'attaque médiatique de Netbooster, une des sociétés phare en matière de référencement, immédiatement mise à mal par ses confrères. Au-delà de l'aspect purement commercial de cet échange de propos acerbes via les forums , cette actualité illustre la situation actuelle du référencement sur le net, que je vais tenter de vous résumer en quelques mots. On recense aujourd'hui près d'un milliard de pages sur la toile mondiale. Les moteurs les plus exhaustifs en recensent à peine 20% (bien qu'ils annoncent des chiffres supérieurs). Au-delà de ces chiffres astronomiques, I'arbre cache
la forêt, peuplées des espèces suivantes: - le nombre exponentiel de pages rend toute indexation auprès des outils de recherche aléatoire; - les professionnels du référencement acquièrent un savoir-faire qui déjoue les spiders (robots des moteurs) et travestit les résultats; - La nétiquette est mise à mal et les résultats des requêtes affichent des sites qui n'ont rien à voir avec les mots tapés par l'internaute. Cependant, I'avenir du net n'est pas si sombre qu'il n'y paraît. En effet, les outils de recherche travaillent à des méthodes d'indexation plus astucieuses, qui privilégient: - la popularité d'un site (le nombre de liens qui pointent vers l'URL du site) - L'indice de clic, système de type DirectHit qui se souvient des liens choisis par les internautes sur les moteurs et qui mesure le temps passé entre un clic et un éventuel retour de I'internaute sur la page de résultats pour en mesurer la pertinence. De plus, une nouvelle génération de moteurs apparaît, avec des ressources affinées: - Google, le moteur privilégié des internautes en ce premier semestre 2000, a été choisi par Yahoo.com (39 millions de visiteurs uniques en ce mois de juin 2000) comme outil de recherche . La particularité de Google est son temps de réponse, très rapide et sa capacité à présenter un extrait du site. - les moteurs spécialisés (sur les femmes, les formations, le golf... ou tout sujet vertical); - AskJeeve, qui propose une réponse manuelle à une requête formulée sous forme de phrase (non testé par votre rédacteur); - Subjex, qui permet de dialoguer avec le moteur de recherche et ainsi d'affiner la recherche. - Webrain, qui propose des réponses en 3D. Des listes de moteurs sont accessibles aux adresses suivantes: Abondance Par ailleurs, I'annexe 2 recense certaines sources d'information incontournables sur le net.
Quel est le quotidien d'un référenceur ? Cette question lourde de sens implique une certaine connaissance des techniques du référencement, expliquées au chapitre 4 de ce rapport. Le métier est naissant et pragmatique. Il n'existe en effet pas de formation ou de parcours qui mène au profil de référenceur. C'est l'expérience qui prime, avec cependant un certain nombre de requis, qui tiennent aux tâches assignées à un référenceur: - méthode et rigueur: la gestion d'un projet de référencement se fait sur plusieurs mois, car la position d'un site face à une requête est une donnée volatile, soumise aux attaques des sites concurrents. Les tests, validations, soumissions et analyses sont fréquentes et astreignantes - esprit d'analyse: le référencement nécessite une approche analytique du processus, dont chaque étape conditionne l'autre (on peut le schématiser par un entonnoir, du plus général (" je veux arriver en tête sur la requête immobilier - bon courage -) au plus particulier (" j'arrive (entre autres) en tête sur la requête location de bungalows à Palavas - ce qui correspond de plus en plus à la réalité des requêtes). - goût pour les chiffres: le ranking est le maître mot du référenceur. Apparaître en première page (soit dans les 10 ou 15 premiers résultats) est son credo. Les chiffres sont omniprésents et ne laissent que peu de place à toute interprétation. Le débat actuel se pose d'ailleurs sur la capacité des acteurs à garantir l'apparition en première page d'une requête sur un moteur de recherche. - maîtrise de l'anglais: le référencement, comme beaucoup de métiers sur le web, n'est pas né en France et tant pour les sources d'information que pour le métier en lui-même, c'est l'anglais qui prime (une évidence...) - capacité de travail: des heures passées à torturer une machine pour hisser un site vers le sommet des index www.altavista.com, et encore, ça ne marche pas toujours... L'humilité est également un des atouts du référenceur, qui peut heureusement compter sur les forums, plutôt actifs jusqu'à présent. - capacité à convaincre: Il n'en reste pas moins que cette machinerie, qui s'apparente quelquefois à une arrière-cuisine, a de quoi dérouter les clients, pour lesquels l'opacité du discours. du référenceur semble cacher une mauvaise foi, voire une langue de bois. Les techniques de référencement sont aujourd'hui plus empiriques qu'industrielles et le référenceur ne peut s'engager sur un résultat: Avant son récent accord (il y a 3 jours) avec Inktomi, Lycos n'indexait plus de nouvelles pages depuis octobre 1999: impossible de lui soumettre une URL, donc de voir apparaître son site. Face à un client qui mesure l¹investissement de Lycos dans l¹achat de spots télévisés (à 20h30 sur les chaînes nationales), il est difficile de tenir un discours selon lequel ce moteur est en fait " en berne " depuis plusieurs mois. - capacité conceptuelle: Le processus de référencement met en ¦uvre des techniques, mais requiert avant tout de maîtriser l'ensemble du processus, qui débute par le choix des thèmes du référencement. On est loin du travail de production pure, mais de cette phase stratégique dépendra la réussite du projet: Il est impossible aujourd'hui de référencer un site dans la rubrique "immobilier", trop investie. En revanche, les internautes adoptent aujourd'hui des comportements plus intelligents et les requêtes se complexifient (du type "appartement terrasse sur avenue arborée"). La tendance est à la spécialisation, donc à la force du concept, qui primera sur l'apparition "brute", qui n'est cependant pas à négliger. Comme tout métier naissant, celui de référenceur apparaît donc comme un fourre-tout, appelé à se spécialiser, à l'image des ergonomes apparus il y a peu de temps. Aujourd'hui, un référenceur passe le plus clair de son temps à soumettre des pages HTML aux moteurs de recherche. Son métier ne se limite cependant pas à de la production. Il doit également faire preuve d'un certaine maturité, alimentée par une veille permanente (les forums et news) et une capacité à défendre son travail face aux clients.
Le processus de référencement se déroule suivant un schéma simple, présenté par de nombreux sites et sur lequel toute la profession s¹entend:
Les techniques qui sous-tendent cette méthodologie s'appuient sur des compétences et un processus, repris ci-après. Les techniques employées dans le cas d'une soumission à un moteur et à un annuaire sont différentes. Dans le cas d'une soumission à un moteur, la méthodologie est suivie dans son intégralité. La soumission à un annuaire est moins complexe, mais nécessite du temps car elle implique de choisir manuellement les rubriques dans lesquelles le site sera indexé. La définition des thèmes du référencement est une étape stratégique qui conditionne tout le processus de référencement. Cette étape prend corps dans l'impossibilité d'apparaître " par défaut " sur une requête large du type immobilier. Elle est également justifiée par la formulation des requêtes des internautes, plus fine. Il est donc nécessaire de définir des thèmes (location et vente d'appartements, locations saisonnières, conseil en gestion de patrimoine, Š) sur lesquels porteront les efforts de référencement. Cette étape se fait en collaboration avec le client, qui la valide.
b. Choix des mots et phrases clé Les thèmes donnent lieu à un choix de mots et phrases clé, qui seront intégrés dans les balises META des pages HTML soumises aux moteurs. Pour les annuaires, le site sera proposé dans les rubriques ad hoc, agrémenté de phrases clé. Il existe plusieurs techniques de recherche de mots clé. L'objet n'est pas de les lister. Chacun adoptera la recherche sémantique qui lui convient. Je citerai quelques ressources (gratuites) en ligne: Une technique consiste à procéder par cercles concentriques, en listant dans chaque cercle les mots qui se réfèrent au concept. Ex: Cercle 1 : Achat de maisons > Cercle 2 : Villa bord de mer / Villa avec jardin paysager / Villa avec piscine / Maison avec patio / Maison avec terrasse ombragée, ... La production de phrases clé répond au besoin de décrire brièvement le contenu du site (cette phrase apparaît sous l'intitulé du site). Lors de la production des phrases clé, il est nécessaire de produire 3 phrases clé de 25, 50 et 75 mots, pour répondre aux besoins propres de chaque outil de recherche. Quelques règles sont à suivre: - veiller à ne pas décrire un site sous la forme d'un slogan (du type le seul site qui vous donne toutes les meilleures ressources du web mondial). La phrase serait réécrite ou votre site serait tout simplement refusé - cela semble évident, mais ne choisissez pas des mots clé qui ne décrivent pas votre site, c'est du spamming. - Il est interdit de citer ses concurrents Ces restrictions relèvent du bon sens et de la nétiquette. Si vous restez dans la norme, vous ne risquez rien, si ce n'est de ne pas être référencé. C'est pourquoi certains trucs (qui sont par ailleurs cités dans les sites de référencement) vous permettront d'apparaître dans les listes de moteurs. Ces trucs ne sont pas éternels. Les moteurs et les référenceurs jouent encore à cache-cache ! En voici quelques-uns: - concevez de phrases cohérentes et si possible non modifiables, afin qu'elles soient reprises en l'état par les annuaires (sans réécriture) - vous pouvez répéter un mot-clé sous trois formes: minuscules, majuscules, nom propre. En ce (joli) mois de juin, le plus bel exemple de spamming nous est fourni par Françoise de Panafieu, dont le site officiel de candidature à la Mairie de Paris présente un florilège des exemples de spamming. Les mots-clé étaient en effet: francoise, gaulliste, séguin, seguin, chirac, panafieu, rpr, rassemblement pour la republique, 2001, député, pamela anderson, municipales, paris, élections, arrondissements, candidat, politique, bertrand delanoë, affaires, tiberi, environnement, culture, urbanisme, logement, université, justice, transports, mairie, femme. A ne pas reproduire ! Les mots et phrases clé seront ensuite intégrées dans les balises META, situées dans le head de la page HTML.
Nous entrons de plein pied dans la production de contenu. La création de pages HTML répond au besoin de multiplier les portes d'entrée vers votre site en "dupliquant" la page la plus populaire, car la plus visitée: votre page d'accueil. Cette technique débouche sur deux types de pages, les pages fantômes et les pages satellites. Les pages fantômes sont des pages vides (ou qui contiennent des mots justifiant artificiellement du contenu de votre site), mais qui ne s'afficheront jamais. Des scripts de redirection sont inclus dans le corps de la page, afin de rediriger l'internaute vers la page d'accueil. Le moteur indexe une page qui n'a d'objet que de multiplier les portes d'entrée vers le site. Cette technique est appelée à disparaître, car les programmateurs des moteurs en ont marre de se faire avoir et développent de ce fait des techniques qui contrent les scripts de redirection. A l'avenir, seuls les programmateurs Perl pourront contourner cet écueil. Cette technique est à la limite du spamming, même si elle n'est pas décrite comme telle. Deuxième type de page, les pages satellites sont des copies conformes de la page d'accueil, du moins dans le body. Pour ce qui est du head, chaque page satellite reprend les mots et phrases clés définies auparavant. Ainsi, pour notre exemple, les pages s¹intituleront Villa_bord_de_mer.html, Villa_avec_jardin_paysager.html, etc. Le titre de la page importe peu, c'est plutôt le contenu des balises META qui requiert notre attention. Dans la pratique, nous obtiendrons une page HTML qui ressemble à cela:
On note une démultiplication des mots clé (avec et sans accent, en majuscule et en minuscules, en périphrases) et une base de redirection refresh, qui oriente l¹internaute vers la page http://www.monsite.com. Les "<br>" excluent le titre annonces, immobilieres, paris en bas de page, donc le rend invisible à l¹affichage. Cette opération est à réitérer autant de fois que de thèmes listés.
La soumission aux moteurs s¹effectue grâce à un logiciel de soumission automatisée, du type TopDogg, ou WebPosition, qui permet de soumettre automatiquement les pages créées à une liste de moteurs. L'autre alternative consiste à soumettre les pages crées manuellement, c'est-à-dire en suivant la procédure du moteur en ligne. Dans la pratique, le moteur de recherche identifie la ressource utilisée pour soumettre un site, et privilégie les soumissions manuelles (càd non automatisées). Cependant, les volumes d'informations générées par les soumissions aux moteurs ne permettent pas une indexation manuelle. Il convient donc de procéder par étape, en respectant un calendrier (les soumissions en volume aboutissent souvent à une exclusion pure et simple du site de la base du moteur). En ce qui concerne les annuaires, la procédure de soumission ne peut être automatisée, puisqu'il faut déterminer soi-même les rubriques qui accueilleront le site. En conclusion, les techniques de soumission des mots et phrases clés aux moteurs ainsi que la soumission manuelle des phrases clés aux annuaires sont gourmandes en temps et s'avèrent pénible à gérer au quotidien, en raison des contraintes liées aux outils de recherche. Cette phase est par ailleurs aléatoire, car seuls l'expérience et le savoir-faire permettent d'affiner l'approche du référenceur. Enfin, les délais d'indexation varient très fortement d'un moteur à l'autre et la tentation de recommencer la soumission est souvent grande. On considère qu'un délai de un mois et demi est raisonnable, sauf cas exceptionnel (Lycos, cité ci-dessus). Cette phase consiste à multiplier les tests sur les moteurs, afin de vérifier l'apparition du site sur les requêtes. La vérification tient compte du délai de latence propre à chaque moteur et s'effectue à travers les logiciels TopDogg, ou WebPosition.
L'analyse de l'indexation se fait par vague, correspondant aux vagues de soumission. Elle s'effectue à travers les fichiers log générés par le serveur qui héberge les pages. Une étude des fichiers log permet notamment de connaître la provenance des internautes, à travers deux paramètres: - origine du surf (adresse tapée par l'internaute ou lien depuis un moteur identifié) - requête formulée par l'internaute en cas de provenance depuis un moteur de recherche La mise en perspective des fichiers log antérieurs aux soumissions et de ceux issus de soumissions valident l'indexation et permettent de procéder aux correctifs éventuels. Cette ultime phase clôt (provisoirement) le travail de référencement. Le référencement étant une donnée volatile, il y a de grandes chances pour que cette position soit " soufflée " par un concurrent dans les jours qui suivent. La vie est une perpétuelle course. Pour les curieux (ou ceux que mon discours n'ont pas convaincu),
deux adresses de cours en ligne: auxquelles on peut rajouter les contenus des professionnels du référencement qui disposent d'un site didactique .
Les enjeux du référencement sont énormes. Aujourd'hui encore, les internautes utilisent massivement les outils de recherche pour parvenir à un site. Les algorithmes développés par Google ou dolphinsearch remettent en cause le traitement "en volume" de certaines bases (du type Inktomi). Ainsi, on privilégie aujourd'hui la qualité d'un site et son indice de popularité (nombre et qualité des liens qui pointent vers ce site) à une indexation de pages HTML en masse. Ce discours laisse augurer d'une organisation plus intelligente de l'information sur Internet, notamment relayée par les agents intelligents, du type Copernic. L'enjeu d'une apparition en première page d'Altavista n'en reste pas moins évident. Pour preuve l'inflation des budgets consacrés par les entreprises à la recherche de visibilité sur le net. Il n'est pas rare aujourd'hui de consacrer 100 KF à une campagne de référencement sur un an. Les enjeux économiques assignés à cette recherche de visibilité imposent aux acteurs de ce marché d'offrir des garanties à leurs clients. Or, la tendance n'est pas à l'accroissement des techniques mais à la " débrouillardise". On cherche aujourd'hui autant à appliquer un savoir-faire qu'à déjouer les techniques de ranking des moteurs. Parmi les techniques employées par les développeurs Perl, le cloaking est aujourd'hui considéré comme du spamming. La profession n'a donc pas trouvé son juste équilibre et cherche à fonder son approche sur la maîtrise de techniques reconnues. Souhaitons que ces techniques aboutissent rapidement, car les intérêts en jeu ont récemment connu une réelle inflation.
Un mois de référencement, quelques connaissances glanées ici et là, m'ont conforté dans l'idée qu'lntemet est toujours un media en cours de structuration. Parmi les techniques de netmarketing, le référencement absorbe des moyens grandissants, alors que les autres techniques (affiliation, forums, conférences de presse virtuelles, netlinking, benchmarking) connaissent un rythme et un niveau d'investissement inférieurs. Il y a donc fort à parier que ce marché connaîtra des mutations importantes, afin de répondre aux besoins de notoriété et de promotion formulés par les entreprises et que le net peut véhiculer. L'apparition récente du référencement payant (199 $ contre une garantie d'apparition) ne semble pas plus rapporter la majorité des suffrages qu¹offrir une solution à long terme. Parmi les réponses fournies par les acteurs, citons trois voies qui augurent d'un développement harmonieux: - I'avènement des moteurs intelligents, au détriment des moteurs "quantitatifs"; - la maîtrise des techniques de référencement et le respect de la nétiquette; - la structuration de l'offre des prestataires et les garanties qu'ils apportent. De ces évolutions naîtra le juste équilibre entre les capitaux investis et les résultats obtenus, garants du développement harmonieux de cette technique de netmarketing. Annexe 1 - Les forums Essentiels Secondaires
Annexe 2 - Sources d'information Liste de l'atelier Paribas Il en existe bien d'autres, notamment listés sur l'excellente adresse http://www.zdnet.fr/life/mag/top50.html
Annexe 3 - Sites pro Abondance, site phare du référencement
Annexe 4 - Le référencement All HTML - Référencez
vos concurrents ! Astuces Contenus Faq All HTML FAQ Réf Test indexation Utilitaires |