Une étude pointe la redondance des sujets sur les sites internet d’informations. Bakchich en publie de larges extraits et un petit exemple illustre avec le crash d’un avion entre Rio et Paris
Le drame de l’Airbus AF447 a été l’occasion d’illustrer le théorème selon lequel la pluralité des médias en ligne peut générer l’unicité de l’information. Alors que les premières dépêches d’agence tombaient, dans la journée du 1er juin, sur les fils, les sites d’infos, tous en cœur, commençaient leur travail d’agrégations et de mise en ligne. Ainsi, tous les sites d’informations en ligne, à l’exception de Médiapart, Slate et Bakchich faisaient leur une sur le sujet jusqu’à la fin de la journée.
Seuls problème, aucune information fiable n’a pu être donnée dans la journée du 1er juin par les autorités sur les causes du drame.
Le ballet de bâtonnage de dépêches pouvait s’ouvrir, et les internautes de lire les mêmes informations parcellaires, provenant pour l’essentiel des mêmes sources (AFP, AP, Reuters) sur au moins huit supports différents.
Paradoxe du Net, c’est lors d’événements de cette ampleur que ces journaux, vivant pour partie grâce à la publicité, réalisent de gros scores d’audiences.
Cette répétition infinie sur les principaux site d’informations a été soulignée par une étude récente . Bakchich en publie de larges extraits.
Le 9 mai 2009, les universitaires Franck Rebillard, Emmanuel Marty et Nikos Smyrnaios, rendaient public le résultat de leurs travaux sur les médias en ligne français [1] Extraits.
« Le pluralisme sur le web est supposé découler de la multiplicité des sources d’information disponibles, comme le laissent penser les récents rapports publics consacrés à ces questions (Lancelot, 2005 ; Tessier, 2007). Puisque l’offre de contenus d’actualité sur la toile émane d’une diversité d’acteurs – appartenant au secteur professionnel du journalisme ou non (blogueurs, rédacteurs « citoyens »), intégrés à l’équipe rédactionnelle d’un média existant par ailleurs (journal, radio, télévision) ou exclusivement numérique (Internet pure player) – il en est automatiquement déduit une substantielle pluralité des contenus offerts à l’internaute. Or, une étude plus approfondie fait apparaître une piste d’investigation inverse : la multiplicité des espaces de publication sur l’internet pourrait favoriser le pluralisme autant qu’une certaine redondance des informations en circulation. En effet, nombre d’articles publiés sur des sites de presse en ligne, fondés dans bien des cas sur des dépêches d’agence, se voient par exemple compilés par des agrégateurs ou commentés sur des blogs (Rebillard, 2006).
Nous rendons compte ici de certains résultats obtenus sur la base d’un corpus de plus de 80 sites représentatifs des différentes catégories d’espaces de publication en ligne. Une analyse de contenu semi-automatisée de leurs titres a été déployée pendant le mois de novembre 2008. Elle visait à saisir la quantité de sujets abordés au cours d’une journée, et surtout l’importance relative de chacun d’entre eux au sein de l’agenda médiatique numérique.
Pour réaliser une mesure du pluralisme des sujets traités au sein de nos échantillons de données, nous avons appliqué au cas de l’information journalistique des formules déjà expérimentées pour calculer le degré de diversité d’autres types de contenus culturels et médiatiques, comme cela a été fait par exemple dans le secteur du livre (Benhamou, Peltier, 2006). Notre étude reprend donc des axes conceptuels déjà éprouvés, à travers les notions de variété et d’équilibre de l’information. La variété correspond au nombre de sujets au sein de l’échantillon considéré, l’équilibre est pour sa part déterminé par la répartition des sujets entres les différents articles.
Notre échantillon présente une grande variété de sujets abordés, mais qui sont très inégalement représentés. Quelques sujets agglomèrent des quantités conséquentes d’articles (plusieurs centaines), tandis que la majorité des sujets ne connaît de traitement que dans un seul article. La production de l’information telle que nous l’avons mesurée sur la toile affiche donc une structure relativement constante, partagée entre une concentration extrême des articles sur un nombre réduit de sujets et une dispersion très forte des articles restants sur presque autant de sujets isolés.
Cette première analyse quantitative a permis d’offrir, à propos d’échantillons de données conséquents (plus de 2000 articles par jour collectés sur une soixantaine de sites) une représentation chiffrée de la production des informations d’actualité sur internet. Celle-ci apparaît donc à la fois comme variée (plus de 300 sujets) et comme très inégalement répartie : aux côtés de quelques sujets omniprésents, quantité de sujets n’émergent que par la grâce d’un article ou d’une poignée d’articles. Si bien qu’un grand pluralisme (forte variété des sujets) voisine sur la toile avec une redondance prononcée de l’information (concentration extrême sur les sujets dominants).
La représentation graphique de la distribution des sujets fait apparaître une structure très inégalitaire, proche de la distribution de Pareto suivant la règle classique dite des 20/80 (20% des sujets génèrent 80% des articles).
Par ailleurs, au regard de nos résultats, on peut affirmer que les sujets occupant le plus d’espace en termes de diffusion et de choix éditoriaux sont également ceux qui sont exprimés de la manière la moins créative au niveau des titres, avec une très forte récurrence de formulations longues similaires.
On aurait pu penser que les sujets sur-traités tirent de ce sur-traitement une certaine diversité dans la manière dont ils sont appréhendés et mis en mots : c’est loin d’être le cas. Ces résultats nous permettent de poser l’existence d’une corrélation entre redondance éditoriale et redondance lexicale. Pour le dire autrement, toute information semble d’autant moins riche lexicalement qu’elle est importante éditorialement. L’élection de Barack Obama en constitue un bon exemple : largement sur-traité, ce sujet est principalement abordé à travers la reprise de formules stéréotypées. On peut alors poser l’hypothèse de l’existence d’un lien entre des informations dominantes et des sources dominantes, caractérisées par une intense activité de diffusion d’articles en même temps qu’une forte redondance dans les sujets et leur formulation.
Les sources apparaissant comme les plus redondantes en termes à la fois de choix de sujets et de reprise de formulations stéréotypées sont les trois portails MSN Actualités, Yahoo Actualités et Orange Actualités, ainsi que l’AFP. Ce résultat vient confirmer l’importance de l’espace occupé par ces sources et illustre leur politique de flux continu d’information, qui privilégie la réactivité plutôt que la créativité. Viennent ensuite de manière encore très significative les sites de télévisions françaises, particulièrement France 2 et France 3, très proches des modèles proposés par l’AFP (TF1 et France 24 apparaissant comme moins redondantes en comparaison) ainsi que la radio RTL.
Du côté de la diversité, les sources les plus remarquables sur les deux journées sont assez logiquement situées à l’étranger : il s’agit d’Afrique en ligne, Canoë (Canada) et Ria Novosti (Russie). Viennent ensuite, parmi les sources situées en France, quatre types de médias qui se distinguent par leur production originale de titres : il s’agit, dans l’ordre, du site participatif Agoravox, du webzine d’opinion Bakchich, de la version internet du magazine d’opinion Politis, d’un autre site participatif Le Post, et de certains blogs. Viennent seulement ensuite les déclinaisons numériques de la presse plus traditionnelle avec Le Journal du Dimanche, Le Point, Les Echos ; et dans une moindre mesure, par ordre décroissant Libération, L’Humanité et Le Monde, qui restent dans une identité lexicale assez affirmée.
Enfin certaines sources apparaissent au carrefour de la diversité et de ce que l’on appelle la « banalité lexicale », c’est-à-dire « un recours massif aux mots les plus fréquents » (Marchand, 2008). Cette position est flagrante pour le Nouvel Observateur, mais c’est également le cas dans une moindre mesure pour 20Minutes, Métro, RFI, et RMC.
A la lumière d’études de nature socio-économiques préalables qui montrent une tendance à la recherche de productivité dans les rédactions numériques des groupes de presse (Estienne, 2007 ; Rebillard et al., 2007), on peut alors émettre l’hypothèse d’un tropisme de certains sites pour le journalisme « assis » (desk), via la ré-écriture de dépêches ou d’articles produits par des tiers, au détriment d’un travail d’élaboration de contenus originaux, passant lui plutôt par la voie du journalisme « debout ». A cet égard, et pour renforcer cette hypothèse d’un lien entre conditions pratiques de production (liées aux modèles économiques des différents médias) et formules éditoriales et lexicales adoptées, il est intéressant de noter qu’hormis le Nouvel Observateur, les médias concernés par cette caractéristique sont des radios et des titres de presse gratuite. Les contenus et leur environnement : une interaction continue
Des liens peuvent alors se dessiner entre la disparité des conditions de production du contenu, l’enjeu, la nature et enfin les attentes liées à la consommation de ce contenu, qui diffèrent sensiblement selon les types de source.
L’hypothèse de l’existence de ces liens entre en résonance avec la notion de « contrat de communication médiatique » avancée par Charaudeau (1997). Réactivité et exhaustivité pour l’AFP, les agrégateurs et les sites de médias audiovisuels ; créativité et re-traitement réflexif ou critique pour les pure-players et les indépendants (professionnels ou non), voilà les deux pôles du continuum redondance-pluralisme.
En ce qui concerne les blogs, leurs spécificités langagières et communicationnelles ont déjà été explicitées et interprétées. Elles semblent liées au rôle, joué par ceux-ci, de re-médiation et de re-traitement subjectivé de l’information première (Serfaty, 2006). Les autres types de source se situent entre ces deux pôles dans une position intermédiaire : équilibre plus ou moins précaire entre alignement sur la concurrence et stratégies de distinction pour la presse traditionnelle, procédés de retraitement rapide et minimal de l’information pour les gratuits et certaines radios, telles peuvent être les valeurs implicitement partagées par les producteurs et les consommateurs de l’information en ligne, partage cristallisé dans cette disparité de contenus ».
Réactivité et exhaustivité plutôt que créativité. La presse papier va mal, mais qu’en est-il de la presse en ligne ?
Pour télécharger l’intégralité des travaux de MS Rebillard, Marty et Smyrnaios, cliquez ici
Pour découvrir comment travaille ce que l’on a baptisé les « OS de l’infos », c’est ici
Et pour en savoir plus sur la catastrophe aérienne, c’est ci-dessous :
A lire ou relire sur Bakchich.info
A voir ou revoir sur Bakchich.tv
[1] Franck Rebillard, Emmanuel Marty et Nikos Smyrnaios, « Does the Long Tail apply to online news ? A quantitative study of french speaking news websites », Communication lors du colloque New Media and Information, Athènes, 6-9 mai 2009.