Comment Neutral news veut analyser la propagation des fake news

Les fake news se propagent en partie sur Facebook. [BigNazik [Shutterstock]

Baptisé Neutral news, cet outil dopé à l’intelligence artificielle agrège en continu les contenus de 6 500 médias internationaux. Le projet a déjà convaincu le ministère des Affaires étrangères. Un article de notre partenaire, La Tribune.

Elles se propagent à vitesse grand V. Les fake news, ces fausses nouvelles virales popularisées lors du Brexit en 2016 et amplifiées lors de l’élection présidentielle américaine, sont rapidement devenues un fléau pour les réseaux sociaux et l’information. La plupart des processus électoraux ou mouvements sociaux sont désormais accompagnés de leur lot de fake news sur Internet.

Pour percer le mystère de leur propagation, trois étudiants de l’EPITA (École pour l’informatique et les techniques avancées, basée aux portes de Paris) ont créé Neutral News. Dopé à l’intelligence artificielle et au machine learning, cet outil d’analyse des contenus sur Internet permet de détecter les fake news pour les signaler aux lecteurs.

« Initialement, nous voulions agréger le plus de contenus possibles sur une seule et même plateforme pour contextualiser l’information tout en proposant différents points de vue, qu’ils soient politiques ou géographiques », explique Jonas Bouaziz, 21 ans, en charge de l’analyse des données pour Neutral News.

Repéré lors d’un concours organisé par Microsoft en mars dernier, les trois étudiants sont ensuite entrés en contact avec le ministère des Affaires étrangères, qui est devenu leur premier partenaire.

« Nous avons alors recentré notre outil sur la détection de fake news pour répondre aux besoins spécifiques du ministère, qui souhaite par exemple connaître les processus de propagation de ces contenus », poursuit Jonas Bouaziz. Toujours en cours de développement, une version bêta de Neutral News a été livrée fin novembre au ministère des Affaires étrangères.

Contre la prolifération des fake news, l'UE suggère plus de transparence

Le groupe d’experts de la Commission européenne sur les fake news veut que les réseaux sociaux, comme Facebook ou Twitter, soient plus transparents sur leurs revenus publicitaires.

Des « centaines de milliers d’articles analysés par jour »

Capable de scanner « plusieurs centaines de milliers d’articles par jour » pour repérer les fake news, les contenus de 6.500 médias, issus de 191 pays, sont agrégés en continu pour réaliser une veille de l’actualité.

« Actuellement, Neutral News est capable d’analyser plusieurs centaines de milliers d’articles par jour » issus de la presse gratuite en ligne, chiffre Jérémie Zimmer, 21 ans, en charge de l’intelligence artificielle pour Neutral News. Les textes des articles sont ensuite analysés via une multitude de critères : sémantique, syntaxique, URL des pages… Neutral News est également capable d’analyser le pourcentage de plagiat d’un article. L’outil a été développé à partir de logiciels open source – mis à disposition de tous librement sur des plateformes dédiées, et donc le code informatique peut être modifié.

Le but : proposer un indice de fiabilité au lecteur. L’article est-il similaire à d’anciennes fake news en termes de vocabulaire ou de ponctuation ? Provient-il d’une source identifiée comme fiable ? Autant de questions à répondre pour juger de la véracité de l’information. « Si l’outil considère que l’information est potentiellement manipulée, alors l’article sera affiché sur la plateforme avec un signe « attention » à côté du titre. Nous voulons un outil transparent, donc les critères qui laissent à penser que c’est une fake news seront également détaillés », affirme Arnaud Henric, 22 ans, chargé de l’interface utilisateur pour Neutral News.

Au-delà des ‘fake news’: options stratégiques pour les médias avant les européennes

La Commission européenne vient de publier un plan d’action à court terme sur la désinformation. Or la viabilité du secteur des médias est à peine abordée, écrit un groupe de députés européens et d’experts des médias.

Traduction en huit langues

L’utilisateur pourra choisir les filtres de son choix : langues, sources, sujets (politique, économie…), fiabilité, géographie (national ou international) … « Il n’y a pas de censure de l’information, ni de fil personnalisé. Tous les articles agrégés sont traités exactement de la même façon », souligne Jonas Bouaziz. « L’idée est d’ouvrir le contenu au maximum pour ne pas enfermer les lecteurs dans des bulles. »

Un reproche régulièrement fait au fil d’actualité de Facebook, dont l’algorithme met en avant les informations partagées par ses contacts identifiés comme semblables. L’utilisateur se retrouve ainsi « enfermé » dans un cercle sans débat idéologique. Sur Neutral News, la Une de la plateforme affichera les 20 derniers articles agrégés selon les filtres sélectionnés par l’utilisateur.

Pour relier les articles les uns aux autres, et retracer la propagation d’un contenu, Neutral News recourt à la technique d’analyse lexicale, dite « lemmatisation ». Elle permet de donner une forme neutre à un mot. Par exemple, un verbe conjugué sera passé à l’infinitif.

« Nous nous sommes amusés à construire notre propre dictionnaire pour pouvoir traduire les articles en huit langues (anglais, espagnol, italien, russe, français, néerlandais, portugais et allemand). Nous ne voulions pas dépendre d’outils tiers, comme Google traduction », affirme Jonas Bouaziz. Il est ensuite possible de tracer une timeline (en fonction de l’heure de publication) et une carte (en fonction des coordonnées géographiques attribuées à l’article).

Bruxelles brandit la menace d'une loi contre les fake news

L’exécutif européen a menacé d’introduire une loi sur les fake news d’ici fin 2018 si les géants du net de mettent pas les bouchés doubles dans la lutte contre  la désinformation.

Trouver un business model

À terme, les trois étudiants aimeraient développer leur outil à partir des retours d’expérience des journalistes sur la pertinence des informations.

« Notre outil repose sur du machine learning. Plus nous aurons de retours sur la fiabilité des informations, plus nous pourrons améliorer notre algorithme pour nous caler sur les nouvelles tendances de fake news », détaille Jérémie Zimmer.

Si l’outil peut intéresser les organisations publiques et les médias, un développement dédié aux entreprises privés est également envisageable. « Techniquement, il serait possible de faire des analyses de réputation pour des personnes ou des marques données. Notre intelligence artificielle se livre à deux niveaux d’analyse : le texte stricto sensu, puis le sentiment dégagé par le contenu. Par exemple, notre outil va scanne les adjectifs utilisés pour savoir s’ils sont mélioratifs ou péjoratifs », explique Jérémie Zimmer. Les étudiants planchent actuellement sur la détermination d’un business model viable pour pouvoir développer leur outil.

Subscribe to our newsletters

Subscribe

Envie de savoir ce qu'il se passe ailleurs en Europe? Souscrivez maintenant à The Capitals.