Internet donne l’illusion que tout est là, pour toujours. Chaque jour, des milliards de pages web, de vidéos, de tweets ou d’articles sont publiés. On s’imagine que tout ce contenu restera accessible indéfiniment. En réalité, ce n’est pas le cas.

Une étude récente du Pew Research Center, menée entre 2013 et 2023, montre à quel point le web est fragile.

Un quart du web a déjà disparu

D’après les données recueillies, 25 % des pages web publiées entre 2013 et 2023 ne sont plus accessibles aujourd’hui. Cela signifie qu’une page sur quatre a été supprimée ou déplacée, sans redirection.

Plus on remonte dans le temps, plus les pertes sont importantes. Ainsi :

  • 38 % des pages de 2013 sont désormais introuvables.
  • Pour les pages publiées en 2023, ce chiffre tombe à 8 %, mais ce n’est qu’une question de temps.

Le web n’est pas une bibliothèque figée. C’est un espace vivant, en perpétuel changement. Et dans cette évolution, de nombreux contenus disparaissent sans laisser de trace.

Lire Aussi : Connaissez-vous la théorie de l’Internet mort ?

Des liens cassés sur tous les types de sites

Le phénomène ne concerne pas seulement les pages entières. Il touche aussi les liens hypertextes présents sur les sites, qui redirigent parfois vers… rien du tout.

L’étude du Pew Research Center a analysé plusieurs millions de pages sur différents types de plateformes. Voici les résultats :

  • 23 % des pages de sites d’actualités contiennent au moins un lien brisé.
  • 21 % des pages de sites gouvernementaux affichent également des liens morts.
  • Sur Wikipédia, ce sont 54 % des pages qui ont au moins une référence menant à une page disparue.

Autrement dit, même si la page principale est encore là, une grande partie des ressources citées ne l’est plus. Cela pose un vrai problème pour la vérification des sources, notamment dans les articles de presse ou les contenus encyclopédiques.

Des tweets qui s’effacent en quelques jours

Les réseaux sociaux n’échappent pas à cette « disparition numérique ». Bien au contraire. Sur X (ex-Twitter), le contenu s’efface encore plus vite que sur le web classique.

L’étude a suivi près de 5 millions de tweets publiés entre mars et avril 2023. Trois mois plus tard, 1 tweet sur 5 avait disparu.

Voici pourquoi :

  • 60 % des tweets disparus l’étaient à cause de comptes supprimés, suspendus ou devenus privés.
  • Les 40 % restants ont simplement été supprimés par les utilisateurs.

Et ce n’est pas tout. La vitesse à laquelle ces tweets disparaissent est impressionnante :

  • La moitié des tweets supprimés sont effacés dans les 6 premiers jours.
  • 90 % d’entre eux ne sont plus accessibles après 46 jours.

Quelques tweets finissent par réapparaître, si le compte repasse en public ou est réactivé. Mais c’est rare : seulement 6 % des tweets effacés sont revenus en ligne.

Lire Aussi : WikiTok : un coin du web libre de tout algorithme

Qui est le plus concerné ?

Tous les tweets ne disparaissent pas avec la même fréquence. L’étude a remarqué que certains profils sont plus concernés :

  • Les comptes jeunes, créés récemment.
  • Les comptes non vérifiés.
  • Ceux avec peu d’abonnés.
  • Les profils sans photo ou sans biographie.
  • Les tweets écrits en turc ou en arabe, qui sont supprimés dans plus de 40 % des cas.

Cela montre que le risque de disparition n’est pas uniforme. Certains contenus sont bien plus éphémères que d’autres, en fonction de qui les publie ou de la langue utilisée.

Ce que l’on perd quand le contenu disparaît

Cette étude soulève une vraie question : que reste-t-il de la mémoire du web ?

Les journalistes, les chercheurs, les citoyens s’appuient sur des liens pour informer, vérifier, comprendre. Si ces liens disparaissent, la fiabilité de l’information est mise en danger. On se retrouve avec des pages orphelines, des citations sans sources, des références impossibles à consulter.

Le web évolue, mais il oublie vite. Et cet oubli, souvent invisible, efface une partie de notre histoire numérique.