Le 5 août 1991, quelques mois avant ma naissance, Tim Berners-Lee rend publique son invention, appelée « World Wide Web », et encourage quiconque souhaite la découvrir à télécharger le tout premier prototype de « navigateur » web au monde. Le web en tant qu’entité publique a donc trente ans.

Tim Berners-Lee vante la simplicité avec laquelle l’on peut, avec World Wide Web, accéder à n’importe quelle information depuis un seul et même programme : son navigateur. Grâce aux liens hypertextes (hyperliens en abrégé), la navigation d’une page à l’autre se fait en un clic.

Le principe, qui à l’époque était encore un sujet de recherche, semble cependant s’être usé avec le temps. Trente ans après, la nature de notre navigation web a changé : le nombre de sites que l’on visite se réduit et le temps passé sur un site, lui, augmente.

L’hypertexte par le passé : l’explorationL’une des premières études scientifiques de nos comportements de navigation, menée en 1998, faisait une hypothèse forte : la navigation hypertexte servirait principalement à faire une recherche d’information sur un site. À explorer, en somme, l’arborescence du site en cliquant. Les moteurs de recherche n’étaient pas encore très efficaces et Google Inc. venait tout juste de s’inscrire au registre des entreprises. Encore en 2006 (d’après une autre étude parue l’année suivante), il semblerait que les internautes ne passaient par un moteur de recherche qu’une fois sur six pour lancer une session de navigation, qui était alors suivie en moyenne d’une douzaine de clics.

Bateau de jade, Chine. Metropolitan Museum of Art, archive.org

Aujourd’hui, comme la majorité des internautes, votre premier réflexe est très certainement de « googler » ce que vous cherchez, court-circuitant la recherche (parfois fastidieuse) de clic en clic. Souvent, le premier résultat de votre recherche est le bon. Parfois même, Google affiche l’information recherchée directement dans la page de résultats. Il n’y a alors plus aucun clic, donc plus aucune navigation hypertexte en jeu.

Pour pouvoir mesurer ce déclin de l’hypertexte de 1998 à aujourd’hui, j’ai moi aussi effectué une (modeste) analyse du comportement de navigation, d’après l’historique de navigation de huit personnes sur une période de deux mois (avril-mai 2021). Ces personnes m’ont fourni leur historique volontairement (aucun bout de code n’est caché dans leurs pages web, contrairement à ce que font d’autres algorithmes d’analyse de navigation) et les noms des sites web visités ont été anonymisés (www.facebook.com devient *.com). La synthèse des motifs récurrents que l’on peut voir dans ces historiques de navigation montre non seulement l’importance des moteurs de recherche, mais aussi la concentration de nos navigations sur un petit nombre de sites.

L’hypertexte aujourd’hui : la croisière 

Tout le monde n’utilise pas le web avec la même intensité. Certains des historiques analysés viennent de personnes passant la grande majorité de leur temps devant l’écran (moi, par exemple). Ces historiques, contiennent entre 200 et 400 clics par jour, soit un toutes les 2-3 minutes pour une journée de 12h. En comparaison, les personnes qui n’utilisent leur navigateur que pour un usage personnel font en moyenne 35 clics par jour. Si l’on prend une moyenne quotidienne de 2h30 de navigation, un·e internaute effectue un clic toutes les 4 minutes.

Comment s’articulent ces clics au cours d’une session de navigation ? Un chiffre semble montrer la persistance de l’hypertexte dans nos habitudes : ¾ des sites web que nous visitons sont issus d’un clic sur un hyperlien. Plus exactement, seulement 23 % en moyenne des sites sont des sites « sources », provenant de la page d’accueil, d’un marque-page ou d’une suggestion du navigateur.

Cependant, lorsqu’on regarde le nombre de pages visitées par site web, la dynamique est différente. En effet, la plupart des pages visitées viennent des mêmes sites. En moyenne, 83 % des clics effectués se font au sein d’un même site. Ce chiffre est relativement stable sur l’ensemble des huit historiques analysés ; le minimum est à 73 %, le maximum à 89 %. Typiquement, on passe d’une page Facebook à l’autre ou d’une vidéo YouTube à l’autre.

Il y a donc une dichotomie entre sites « principaux », sur lesquels l’on s’attarde, et sites « secondaires », que l’on consulte occasionnellement. Les sites principaux sont très peu nombreux : 10 maximum, soit à peine 2 % de l’ensemble des sites visités par une personne. La plupart des personnes dans l’analyse n’ont que 2 sites principaux (peut-être Google et YouTube, si l’on se réfère aux statistiques des sites les plus visités en France).

Sur cette base, on peut tirer le portrait-robot d’une navigation hypertexte, trente après la démocratisation du principe. Une session de navigation commence typiquement par un moteur de recherche, duquel on accède à une multitude de sites. Pour la plupart de ces sites, on les consulte une fois avant de repartir de son moteur de recherche. Pour les quelques sites principaux de sa navigation, on y accède toujours via son moteur de recherche, mais une fois sur le site, on y effectue de nombreuses actions avant d’arrêter la session.

Le schéma ci-dessous résume le portrait-robot que je viens de faire. Les sites qui initient une session de navigation sont en jaune, les autres en bleu. Par analogie avec la navigation exploratoire des années 90, la navigation d’aujourd’hui ressemble plutôt à une lente croisière sur quelques plates-formes seulement, très probablement des plates-formes sociales comme YouTube et Facebook.

Un graphe de navigation simplifié ; un nœud du graphe représente un site web (jaune pour un site initiant une session de navigation, bleu pour les autres sites) et une arête représente un ou plusieurs clics depuis un site vers un autre (épaisseur proportionnelle au nombre de clics). Victor CharpenayFourni par l’auteur

Le phénomène qui veut que notre navigation se concentre sur une poignée de sites n’est pas propre au web. C’est une des nombreuses instances de la loi de Pareto, qui stipulait à l’origine que la majorité des richesses produites étaient détenues par une minorité d’individus. On retrouve cette loi statistique dans de nombreux cas d’étude socio-économique.

Mais ce qui est intéressant ici, c’est de voir que le phénomène de concentration s’intensifie. L’étude de 1998 donne une moyenne entre 3 et 8 pages visitées par site. Celle de 2006 mentionne 3,4 visites par site. La moyenne que j’obtiens en 2021 est de 11 visites par site.

Équiper son navigateur d’un « hublot »

Le principe de la navigation hypertexte est aujourd’hui largement dévoyé par les grandes plates-formes du web. La majorité des hyperliens entre sites web – par opposition à l’autoréférencement (des liens pointant d’un site web vers lui-même, en bleu sur le schéma ci-dessus) – ne servent plus aux humains à naviguer, mais aux machines à installer automatiquement des bouts de code-espion sur nos navigateurs. Serge Abiteboul et Pierre Senellart expliquent plus en détail comment se prémunir contre cette surveillance et partir à la recherche de nos données perdues.


À lire aussi : À la recherche des données perdues


Il y a parmi les chercheur·e·s une petite communauté qui voit encore l’intérêt de l’hypermédia sur le web, notamment lorsque les internautes ne sont plus des humains, mais des bots ou « agents autonomes » (qui sont programmés pour explorer le web plutôt que de rester sur un même site). D’autres initiatives tentent de redonner aux internautes (humains ou bots) plus de contrôle sur leur navigation, à l’image de Solid, le nouveau projet de Tim Berners-Lee.

À titre individuel, vous pouvez inspecter votre propre navigation web pour y déceler des habitudes (et éventuellement, les changer). L’extension de navigateur Web Navigation Window sert à ça, elle est disponible en ligne pour Chrome et pour Firefox – si vous le souhaitez, vous pouvez vous aussi contribuer à étoffer mon analyse en soumettant votre historique (avec anonymisation des noms de sites) à travers l’extension. Pour le faire, vous n’aurez qu’à suivre le bon hyperlien.

Auteur

  1. Enseignant-chercheur au laboratoire d’informatique, de modélisation et d’optimisation des systèmes (LIMOS), Mines Saint-Etienne – Institut Mines-Télécom