KaFkaïens n°16 - Représentation des savoirs sur Internet

 

Internet a souvent été présenté, notamment dans les argumentations commerciales, comme une bibliothèque universelle qui permettrait d'accéder simplement à tout type de savoir. Si vous avez déjà cherché une information donnée sur le réseau avec les outils du grand public, vous savez que c'est faux.

Sur Internet, les savoirs ne sont pas égaux : sur-représentation des uns, absence des autres, absence d'index et de catalogue, nous sommes loin d'une vraie bibliothèque, d'autant plus que la divulgation du savoir n'est pas nécessairement souhaitée par ceux qui alimentent le réseau. Quels qu'ils soient, les savoirs sont souvent incomplets, tronqués, voire falsifiés .

Les moyens les plus connus d'accéder à l'information, objet d'une guerre commerciale sans merci, sont de moins en moins fiables, d'une part parce qu'ils atteignent leurs limites techniques et ne peuvent plus rendre compte de l'ensemble de l'information, et d'autre part parce qu'ils sont saturés à dessein d'informations parasites. Ils dessinent in fine une image d'Internet très éloignée de l'outil idéal, objet de toutes les promesses .

Or pour les nouveaux internautes, cette image déformée est la première perçue, et leur pratique d'internet s'en trouve biaisée. En agissant sur cette image, c'est à dire sur les moyens d'accès à l'information, l'on pourrait encore changer cet état de fait. Mais cela est-il possible dans cet univers hautement emblématique du libéralisme qu'est devenu Internet ?

Redonner une crédibilité aux portails en redéfinissant les acteurs qui les animent, définir des sous-réseaux thématiques,... de nombreuses solutions existent pourtant. Elles sont largement utilisées par les internautes chevronnés et par les créateurs de sites pour lesquels Internet a encore un sens dépourvu de toute dimension commerciale .

Face à la machine de guerre commerciale qui modifie le visage d'Internet, la communauté des internautes fondateurs est impuissante, même si elle ne veut pas le reconnaître. Face à cette machine inhumaine engendrée par le processus de mondialisation qu'elle illustre parfaitement, c'est au pouvoir politique de réagir .

 

Le Corpus d'information sur Internet est extrêmement important, parce que la structure même du réseau n'exerce aucun contrôle sur la répartition et l'organisation de cette information. Dans cette anarchie, seules les règles techniques de fonctionnement sont fixées : cohabitation des protocoles, nommage des sites, formats de données sont des exemples de règles qui régissent chaque jour notre rapport au réseau. Mais il n'existe pas de structure globale pour représenter l'organisation de l'information.

Nous savons que les liens lient entre eux les sites sur Internet. Dès lors, l'élément le plus simple d'indexation est la liste des liens qui mènent d'un site donné à une série d'autres sites. Qui n'a jamais apprécié la liste soigneusement établie d'un passionné, où l'on découvre de nombreux sites pertinents, ou bien la liste des ressources proposée par un ministère public ? Cet élément d'indexation est parfois riche, parfois très réduit, mais il n'est évidemment pas un index du réseau : peut-on imaginer que l'enchaînement de ces éléments dessine une sorte de liste de liens qui pourrait être considérée comme un index ? Evidemment non, puisque la croissance de cette méta-information est soumise aux mêmes règles que l'information : croissance non-contrôlée, non dirigée, sans exhaustivité.

Cette absence d'index n'est pas un gage d'efficacité et de créativité comme le sous-entend la rhétorique libérale. Si les créateurs de sites qui apportent richesse et nouveauté à Internet avaient les moyens de promouvoir rapidement leur site grâce à un index, ils se précipiteraient dessus plutôt que de devoir engager la longue et fastidieuse opération de référencement.
La définition d'un index est d'ailleurs un sujet récurrent, et les échecs relatifs des fondateurs du réseau (par exemple le système
Gopher, et son index Veronica) n'empêchent pas les nouvelles tentatives, souvent très riches et précises (par exemple, le projet Open Directory) mais dont aucune ne comporte les principales caractéristiques d'un index : être exhaustif et transparent (donc de caractère public). Par ailleurs, les bibliothécaires regroupés en association (anglophone) promeuvent des entreprises visant à établir l'index le plus large possible, tout en reconnaissant que l'exhaustivité n'est pas atteignable.

Pas d'index sur Internet signifie également que l'on est incapable de connaître la répartition des savoirs sur le réseau. Il ne faut pas être grand clerc pour deviner que l'information prépondérante est sans doute de nature informatique. Les informaticiens aiment bien se regarder le nombril numérique. Mais peut-on connaitre à un instant donné la quantité d'information relative à la médecine, à la physique quantique ou à la fabrication de yaourt ? Non, évidemment. Savoir ce que l'on peut trouver sur le réseau, connaître sa géographie sont des gageures. La cartographie du réseau donnent d'ailleurs naissance à de très nombreux projets.

Nous ne savons pas ce qui est sur le réseau, et nous ne savons pas si ce qui y est est pertinent, valide, biaisé ou pas. Comme nous l'exposions dans l'article consacré à la pertinence de l'information sur Internet, le réseau manque cruellement de référents de confiance.Comment apporter foi par exemple à un article trouvé sur le serveur d'une université ? Le simple nom du serveur de l'université n'est pas équivalent à son imprimatur pour les documents écrits : les révisionnistes de l'université de Lyon publient par exemple sur leurs espaces personnels de serveur des thèses qu'ils ne peuvent pas publier avec l'estampillage de l'université.

Ce qui manque à la consultation sans distinction d'information, c'est souvent le background culturel qui permet de juger : dans une bibliothèque, il est toujours possible d'obtenir un conseil pertinent, mais sur le réseau ? Je ne dis pas qu'il n'est pas possible d'avoir une aide, puisqu'il en est du réseau comme de toutes les ressources d'informations : un document trouvé peut toujours être soumis à la sagacité d'un professeur, d'un ami, d'un collègue, voire d'un inconnu sur un forum. Mais pas plus que vous il ne pourra juger de la pertinence de l'information, quand un bibliothécaire sait lui d'où viennent les ouvrages qu'il vous commente.

 

Les moyens les plus répandus d'accéder à l'information sur le réseau sont les moteurs de recherche et les annuaires. Par ces moyens, on accède à l'information du web et dans une moindre mesure des newsgroups. Pour le nouvel internaute, le web est d'ailleurs la source presque exclusive d'information, les autres grands domaines d'Internet restant Terrae Incognitae.

Les annuaires fonctionnent par catalogage de sites choisis et catégorisés, et ont donc en principe des bases d'information plus réduites que les moteurs de recherche. La plupart des annuaires ont d'ailleurs ajouté un de moteur de recherche à leurs services (comme Yahoo qui utilise Google).

Les moteurs de recherche fonctionnent sur le principe d'index régulièrement mis à jour, dans lequels des millions de pages sont répertoriées. Faire une recherche sur un moteur, cela signifie faire une recherche dans son index. La pertinence du contenu de cet index est donc cruciale.

Or aucun moteur ne peut se targuer d'indexer l'ensemble du web, et aucun ne cherche à le faire. Plusieurs articles ont d'ailleurs démontré que les moteurs les plus performants ne pouvaient indexer guère plus que le sixième du web, comme cet article paru sur Nua, site portail pour tous les études portant sur Internet.

Par contre, les plus grands se livrent une guerre sans merci par communiqués de presse interposés sur le petit jeu de "celui qui a le plus gros index". Les moteurs de recherche ont un but commercial : générer le plus de traffic possible sur leur site pour maximiser leurs recettes publicitaires. Ce but commercial avoué jette immédiatement un doute sur la qualité des résultats fournis par les moteurs ; les rumeurs de démarchage des sociétés de moteurs auprès des sociétés voulant afficher leurs sites web en première place dans les résultats ont longtemps courues le web. L'information fournie par les sociétés de moteurs à propos de leur qualité de résultats est certainement plus commerciale que réaliste. Evidemment, plusieurs sociétés ont songé à tirer profit de cette lutte des moteurs. Des sites comme Search Engine Watch se sont fait une spécialité de surveiller les moteurs sous tous leurs aspects, à commencer par leur fréquentation respective.

Dans les moteurs de recherche, le processus de collecte est automatique : des robots parcourent les pages présentes sur le web pour les ajouter aux index. La qualité de l'information présente dans les index dépend donc du soin apporté par les concepteurs des sites visités à l'élaboration de la structure de leurs pages (et de certaines informations cachées qu'elles contiennent). Bien sûr, cette méthode est la porte ouverte aux excès : et dans le web commercial, tous les coups sont permis. Les "spécialistes" du référencement ont donc mis au point des techniques qui permettent de renforcer artificiellement la visibilité d'un site dans un moteur de recherche. Et voilà comment tous les index se retrouvent surchargés d'information parasite, et voilà pourquoi la plupart des recherches trop rapidement formulées échouent, provoquant lassitude et désintérêt chez les nouveaux internautes.

Au final, ces moteurs de recherche présentent au premier abord une image déformée et biaisée d'internet. Cettte image est de nature essentiellement commerciale que ce soit par les moteurs eux-même, surchargés de publicité, que par les résultats qu'ils renvoient. On est alors très loin d'une bibliothèque universelle.

 

Qui sont les nouveaux venus sur Internet ? En majorité des personnes du grand public, attirées par le battage effectué autour du nouvel outil de communication. Sans rentrer dans le détail de leur répartition sociale, on sait que cette nouvelle génération d'entrants sur le réseau est généralement aisée, d'âges et de profession très divers, mais qu'elle fait preuve d'assez vastes lacunes concernant le maniement de l'informatique et surtout des concepts du réseau. Attirés par la lumière en quelque sorte. Parallèlement, le flux de connaisseurs (relatifs) restent relativement constant (c'est à dire qu'il augmente avec la croissance de sa population), qu'il s'agisse des étudiants ou des nouveaux travailleurs (i.e. travaillant dans un domaine lié à Internet).

La population qui vient à Internet par son travail ou par ses études n'est pas celle qui a le plus de problème à utiliser le réseau : les nouveaux arrivants sont formés par leur ainés (professeurs ou collègues de travail) et possèdent donc une idée de ce qu'est le réseau avant même de l'utiliser. Ils savent ce qu'ils peuvent trouver, et ils connaissent avec plus ou moins d'acuité les moyens de trouver l'information qui les intéressent. Certains n'utilisent le réseau que pour la stricte application de qu'on leur enseigne (ou demande) et ne pensent pas à y trouver d'autres informations, par exemple relatives à leurs centres d'intérêts. Ceux-là n'ont peut-être qu'une version limitée du réseau. Mais la majorité ont une vision globale de ce qu'est le réseau qui leur permet de comprendre les tenants et les aboutissants d'une recherche fructueuse ou infructueuse, et de la validité ou pas d'une information.

Les personnes du grand public qui viennent à Internet pour tous un tas de raisons sont d'abords des cibles publicitaires : le fournisseur d'accès qui va leur permettre de connecter leur petit ordinateur (voire de leur fournir un ordinateur connecté) pense avant tout à les rendre captifs de son portail, dans lequel il peut distiller à loisir publicité ciblée et offres alléchantes.
Pour cela, le fournisseur va rendre disponible à travers ses interfaces les services d'Internet : client mail personnalisé, moteurs de recherche, forums de discussion...

Et le but est atteint quand l'internaute pense qu'Internet, c'est justement le portail de son fournisseur. C'est le cas de la majorité des internautes. Et cela correspond à un travestissement de la réalité : plus qu'ailleurs, les acteurs commercial du réseau jouent sur le non-dit, sur l'aspect mystérieux de la technique et sur l'ego des acheteurs pour leur imposer des contraintes dont ils pourraient s'affranchir. Le petit garagiste qui volait son client en ne précisant pas les effets secondaires d'une réparation, en s'abritant derrière la mécanique ou en affirmant abusivement la supériorité d'un modèle n'est pas si loin que ça ! En fournissant des solutions captives, les fournisseurs privent même l'internaute de découvrir qu'il est captif : il aurait tôt fait de réclamer sa liberté, comme les clients du premier fournisseur d'accès, dont les mails ne pouvaient passé un temps qu'être échangés entre internautes passant par ce fournisseur. Il s'agissait là d'un véritable tentative d'accaparation du réseau grand public.

Pour changer cet état de fait, il faudrait que les internautes puissent comprendre ce qu'est le réseau auquel ils se connectent autrement que par les explications de leurs fournisseurs. Dans une société qui se voudrait dotée d'un futur numérique, c'est évidemment aux politiques de remédier à cela. L'école nous apprend par exemple à comprendre les mécanismes du monde, et à savoir reconnaître les charlatans qui viennent ensuite nous vendre du faux ou du miraculeux : elle devrait faire la même chose pour ce qui est peut-être le futur de notre société. Nouvelle jungle marquée de l'empreinte du plus extrême des libéralismes, Internet attend encore sa révolution laïque et humaniste.

 

Lorsque l'on commence à connaître le réseau et les méthodes de recherche de l'information, il devient très facile de trouver les pages les plus intéressantes, les plus pertinentes. Pour que les débutants puissent trouver rapidement ce qu'ils recherchent, ou tout du moins des pages d'une valeur suffisante pour qu'ils se sentent confortés dans l'idée qu'ils sont sur la bonne voie de recherche, il leur faudrait connaître des points d'entrée satisfaisants. Et c'est justement ces points d'entrée qui leur font défaut, les privant de toute référence efficace, et les conduisant même parfois au découragement.

Pourtant, les points d'entrée efficaces et pertinents ne manquent pas. Plutôt qu'un portail généraliste à but ouvertement commercial (donc visant à maximiser son audience), plutôt qu'un moteur de recherche acceptant toutes les informations et présentrant un fatras de références totalement inégales sans contrôle aucun, l'internaute débutant a tout intérêt à utiliser ces annuaires non commerciaux qui foisonnent sur les sujets les plus divers. Tous ces annuaires sont soit maintenus par des bénévoles, soit issus de services publics. Ils sont le plus souvent parfaitement objectifs et précis parce que leur existence repose sur la passion de leur auteurs (pour les bénévoles) ou sur la notion de service public, et qu'ils ne dépendent de rien d'autre pour leurs choix et leurs ambitions.

Très loin du web commercial, semblable dans la démarche aux fondateurs du web et aux tenants du logiciel libre, ces annuaires, ces portails, ces sites dans leur ensembles représentent sans doute le meilleur du web. Mais l'internaute débutant n'a pas les moyens d'accéder à ces sites de manière simple et directe, justement parce l'internet qui le touche, ou plutôt le service qui lui apporte l'internet est avant tout un service commercial. Par exemple, combien d'internautes français connaissent le portail du service public, point d'entrée extrêmement efficace s'il en est ?

Les structures permettant de naviguer dans ce web alternatif existent ou se mettent en place. Groupé autour du manifeste du web indépendant, les acteurs du portail des copains proposent par exemple un regroupement de sites associatifs, parmi lesquels on retrouve la fine fleur du web citoyen et anti-commercial (Le Menteur , le Scarabée, Uzine). D'autres structures sont encore à inventer. Pourquoi ne pas imaginer un sous-réseau dans lequel on pourrait naviguer une fois que l'on y est entré : des adresses avec des terminaisons particulières, ou bien un groupement de sites qui aurait tous la même page d'entrée comportant un moteur de recherche dans leur groupement, ou un annuaire des sites. En gros, quelque chose qui guiderait l'internaute vers autre chose que l'exposition à des bandeaux publicitaires.

Rien ne s'oppose pourtant à l'émergence d'un nouvel accès à ce web, d'un nouvel acès permettant à la population de profiter du meilleur du web au lieu d'en subir le pire. Rien ne s'oppose non plus à ce qu'il y ait des mini-réseaux, des annuaires efficaces et des acteurs désintéressés. Rien ne s'y oppose, si ce n'est le manque de volonté politique pour créer cet accès, pour créer ce nouveau réseau.

Internet représente une incroyable nouveauté dans les sociétés humaines. C'est la première fois qu'un élément susceptible de changer profondément la vie de tous apparaît et se développe aussi vite. Le rythme de développement du réseau est très rapide, plus rapide que celui des autres facteurs influant sur nos sociétés. Trop rapide également pour les institutions politiques, structures régulatrices de nos sociétés. Si rapide en fait qu'un fossé s'est creusé entre la réalité du monde du réseau et la perception qu'en ont les politiques.

Plus important, Internet a une potentialité de modification de votre vie ordinaire dont les gens prennent conscience plus vite qu'ils ne s'équipent : tous le monde comprend l'importance que cela peut avoir, avant même que de désirer accéder au réseau. Cette explosion du rôle de la communication dont Internet est l'agent principal modèle notre paysage culturel actuel. Et le déséquilibre entre ce désir anticipé et la réalité creuse un peu plus le fossé.

Les relations visibles des institutions politiques (et suivant, de la justice) avec le réseau sont tout d'abord marquées par les fariboles démagogiques issues des habituelles craintes (Internet ne serait que le refuge des néo-nazis et des pédophiles), conduisant à des premières annonces à tendance nettement sécuritaires, voire totalitaires. Les études plus approfondies ont mis du temps à apparaître, au rythme propre des missions politiques (donc aux échéances forcément plus longues), et le retard ne s'est donc pas comblé. Ce retard est évidemment structurel, il ne saurait être inversé que si les institutions politiques sont à l'origine des modifications du réseau au lieu de s'adapter à ses conséquences.

Il ne faut pas s'y tromper : la mondialisation actuellement en marche, à laquelle des associations de citoyens tentent de s'opposer pour limiter la société de consommateurs inhumains qu'elle nous prépare, cette mondialisation est à déjà à l'oeuvre sur le réseau. Internet a valeur de test et d'exemple. Laisser les acteurs commerciaux phagocyter le réseau, c'est admettre que la mondialisation est inéluctable et que les règles qui s'y appliquent seront demain celles de nos sociétés.

La revendication libertaire qui a soufflé un temps sur Internet n'est aujourd'hui que le paravent du libéralisme le plus étriqué d'esprit. Les acteurs commerciaux reprennent d'ailleurs à leur compte cet état d'esprit jusque dans leur publicité (tel opérateur d'accès présente par exemple son offre sous l'aspect d'une révolution prônée par Zapata, Gandhi, Lénine et Che Guevara) bouclant ainsi un boucle nauséabonde. L'état d'esprit libertaire initial ne manquait pas d'ailleurs d'être décliné à la sauce américaine, avec un fond de sauce individualiste au goût amer.

Pour que cela puisse s'arrêter, il faut laisser le politique faire intrusion dans le réseau. Internet ne doit pas être une jungle, Internet doit être régulé au niveau international. Pour que les intérêts nationaux ne soient pas les seuls moteurs de ce changement, ce devrait être à l'ONU de légiférer, en créant une cour chargé de le faire. Internet pourrait être le premier champ d'application d'une legislation mondiale positive issue d'un gouvernement mondial que tout homme sensé appelle de ses voeux. Et pour débuter dans ce difficile chemin, l'accès à Internet (droit d'accès ET structure technique) devrait être inscrit dans les droits et les devoirs des pays adhérants à l'ONU.

http://kafkaiens.free.fr/