*.*.*
close

Rallier ChatGPT à leur cause : le fantasme des politiques

Fox News  23 août 2023




Les IA génératives penchent-elles à droite ou à gauche ? Est-il possible de les influencer ? La question intéresse beaucoup les sphères politiques. Les modèles de langage de grande taille, LLM en anglais, sont des réseaux de neurones profonds entraînés sur de grandes quantités de texte non étiqueté. Il leur faut donc des données sur lesquelles les entraîner. GPT-4 d’OpenAI a été formé sur 40 téraoctets comprenant Common Crawl, un contenu massif de 15 millions de sites Web aspiré depuis avril 2019, les dialogues des vidéos YouTube, le code de GitHub, Wikipedia et certains romans gratuits d’auteurs non publiés. Les contenus qui ont servi à entraîner GPT-4 n’appartiennent donc pas à OpenAI, et cela a déclenché une bataille féroce.Certains médias ont déjà conclu des accords pour l’utilisation de leurs archives, comme l’Associated Press en juillet. Des groupes, comme Axel Springer, sont allés plus loin, avec l’intégration de tous leurs articles passés et à venir directement dans le jeu d’entraînement du modèle. Un accord chiffré à plus de 10 millions de dollars par an. Enfin, d’autres ont choisi la voie judiciaire. Fin décembre, le New York Times a déposé plainte pour violation du droit d’auteur sur des millions d’articles. Dans sa plainte, le quotidien américain dit avoir contacté Microsoft et OpenAI en avril pour faire part de ses préoccupations concernant l’utilisation de sa propriété intellectuelle et explorer une résolution à l’amiable, sans succès. C’est la première organisation de grande taille à s’engager dans cette bataille. Elle ne sera sans doute pas la seule. Le PDG de Condé Nast a récemment déclaré lors d’une audition au Sénat américain que de nombreux outils d’intelligence artificielle avaient été construits avec des ressources volées. En septembre dernier, la société Microsoft a annoncé que si les clients utilisant ces outils étaient confrontés à des plaintes pour atteinte au droit d’auteur, elle les indemniserait et couvrirait les frais juridiques associés.En attendant de négocier des accords de licence avec OpenAI ou d’obtenir gain de cause devant les tribunaux, les entreprises de médias imposent un blocus numérique. Les données recueillies par la start-up Originality AI sur 44 sites importants d’information montrent que 39 d’entre eux, dont des généralistes comme le New York Times, le Washington Post, le Guardian, des magazines comme The Atlantic ou des sites spécialisés comme Bleacher Report, bloquent les robots d’exploration du Web. Plus largement, le GPTBot d’OpenAI n’est pas le bienvenu sur 1,6 % du million de sites Internet les plus visités. Mais les principaux médias d’information de droite interrogés, dont Fox News ou Breitbart, ne bloquent pas les robots d’exploration. Pas plus que le média The Free Press, de la nouvelle égérie de la droite conservatrice américaine Bari Weiss, médiatisée pour son combat avec son ancien employeur, le New York Times.Est-ce une stratégie pour influencer les IA ? L’explication la plus plausible est qu’une partie de ces médias n’ont pas eu le temps ou les moyens de se pencher sur la question. Certains ont d’ailleurs bloqué leur site aux robots d’exploration peu de temps après la publication de l’étude d’Originality AI. Mais la question intéresse la sphère conservatrice, qui accuse régulièrement les LLM de pencher à gauche. Même Grok, le LLM anti-“woke” d’Elon Musk, a été critiqué par des conservateurs qui le jugeaient trop progressiste, ce dont le patron de X s’est excusé en blâmant le contenu d’Internet.Les IA génératives sont pourtant loin d’être binaires. D’une part, le contenu produit par les médias ne constitue qu’une goutte d’eau dans l’océan des connaissances ingérées par les LLM. D’autre part, les modèles passent ensuite généralement par une phase de réentrainement basée sur les évaluations d’employés humains, ce qu’on appelle le renforcement à partir de rétroactions humaines, ou RHLF. Un exemple ? Lors d’une récente audience du Sénat sur l’intelligence artificielle, la sénatrice républicaine Marsha Blackburn a récité un poème généré par ChatGPT faisant l’éloge du président Biden, avant d’affirmer qu’il était impossible de générer une ode similaire à Trump. En réalité, c’est tout à fait faisable. ChatGPT n’est pas si dogmatique qu’on veut le laisser croire.*Robin Rivaton est directeur général de Stonal et membre du conseil scientifique de la Fondation pour l’innovation politique (Fondapol)



Source link : https://www.lexpress.fr/economie/high-tech/rallier-chatgpt-a-leur-cause-le-fantasme-des-politiques-DNJ2WANYTNFNNBHPHU6GRX2XS4/

Author : Robin Rivaton

Publish date : 2024-02-04 08:30:00

Copyright for syndicated content belongs to the linked Source.

Tags :L’Express

..........................%%%...*...........................................$$$$$$$$$$$$$$$$$$$$--------------------.....