Ca a commencé par une injonction

Je devais tout recommencer. Mon premier reportage ne convenait pas.

Tour T1 de la BnF, celle du dépôt légal

Je vous parlerai de dépôt légal. Un bien joli terme n’est-ce pas, pour désigner une entreprise d’archivage pour les siècles et les siècles. Celle de tout document diffusé, produit ou édité sur le territoire national, au-delà d’un certain nombre de copies. Valable pour les livres, les films, l’audiovisuel, à peu près toute la production des mass media, et des autres, et même celle qui est autoproduite, pensez aux ouvrages auto-édités, 20%, désormais, des 2000 livres qui arrivent chaque semaine dans le 13e, à la bibliothèque François Mitterrand, la nationale de France.

« Révélateur des tendances de la vie sociale et culturelle, et de l’édition »

Parole de haut-gradé dans l’institution BnF, Hélène Jacobsen, qui dirige les 155 personnes du service du dépôt légal. Et on n’en doute pas, quand on voit les assemblages hétéroclites poussés dans les chariots qui passent de salle en salle, aussi bien des livres de coloriage que des livres d’art, des ouvrages techniques et des fictions. On n’en doute plus quand on voit la salle des périodiques, où ce sont tous les journaux papier qui arrivent, quotidiens, hebdos, mensuels, petites annonces, comics, bref ce qui est publié avec une périodicité.

Ma vie sociale et culturelle, à moi, elle a beau nécessairement se dérouler physiquement, avec des objets bien réels sous les mains et les yeux, elle n’en a pas moins sa source ailleurs, et son commentaire et sa trace. Ici, sur la Toile.

Qu’à cela ne tienne, depuis 2006 et la loi DADVSI, plus connu pour le monstre qu’elle a depuis enfanté, la HADOPI, le dépôt légal a été élargi aux « documents électroniques ». Bref la Toile — sous le jargon technocratique sans doute nécessaire à la forme salariée du travail. Mais pas tout, pas de panique. Mon dieu c’est vrai qu’il y a des horreurs sur cette Toile. Elle est sale, par endroits, infestée de pédopornographes, et puis il y a de grosses araignées qui tiennent des places fortes, bien nettes, trop nettes pour être honnêtes, sans doute.

C’est encore loin d’être parfait, mais à l’Ina et à la BnF, les institutions en charge du dépôt légal du web, on s’efforce d’en garder le meilleur, pour nos enfants qui fréquenteront des « bibliothèques digitales », comme dit Brewster Kahle, le fondateur d’Internet Archive, pionnier et militant du libre (de droit, d’accès, etc.).

En attendant de pouvoir faire plus, sont collectés, à la manière de Google pour son moteur de recherche, grâce à des robots — des crawler :

  • à peu près 2 millions de sites à la BnF (tout le .fr enregistré à l’AFNIC), 20 000 fréquemment, 70 quotidiennement.
  • 8000 à l’Ina (tout ce qui a un lien avec l’audiovisuel, y compris un lien indirect, comme un blog de journaliste télé ou radio), et là c’est toutes les deux heures pour les homepage.

Voilà le corpus. On peut bien s’interroger d’instinct sur les critères de cette nécessaire sélection, toujours est-il que c’est là que les ennuis commencent. Je vous raconte pas le bazar technologique que ça implique. Pas encore.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s