Modèles à faible coût de Deepseek AI soupçonnés d'utiliser les données OpenAI, déclenchant l'ironie en ligne

Auteur: Alexander Apr 10,2025

L'émergence de Deepseek IA, un modèle développé par le chinois, a suscité une controverse et une préoccupation importantes au sein de l'industrie de la technologie américaine. Le suspicion selon lequel Deepseek a peut-être utilisé les données d'Openai pour former ses propres modèles a conduit à une forte réaction des dirigeants de l'industrie et des personnalités politiques. Donald Trump a qualifié Deepseek de "réveil" pour le secteur technologique américain, en particulier après que Nvidia ait connu une baisse stupéfiante de 600 milliards de dollars après un effort de 16,86% dans son cours de bourse - la plus grande perte d'une journée dans l'histoire de Wall Street. D'autres géants de la technologie comme Microsoft, Meta Plateformes, la société mère de Google Alphabet et Dell Technologies ont également vu leurs valeurs boursières diminuer, reflétant des angoisses de marché plus larges concernant la menace concurrentielle posée par Deepseek.

Le modèle R1 de Deepseek, construit sur l'Open-source Deepseek-V3, prétend offrir une alternative rentable aux modèles d'IA occidentaux comme Chatgpt, nécessitant apparemment beaucoup moins de puissance de calcul et ayant été formé pour seulement 6 millions de dollars. Cette affirmation a non seulement contesté les investissements élevés que les entreprises technologiques américains font en IA, mais ont également conduit Deepseek jusqu'au sommet des tableaux de téléchargement d'application gratuits américains au milieu des discussions sur son efficacité.

En réponse à ces développements, OpenAI et Microsoft examinent si Deepseek a utilisé l'API d'Openai pour intégrer les modèles d'Openai dans les soirs, une pratique connue sous le nom de distillation, qui viole les conditions de service d'Openai. OpenAI a souligné son engagement à protéger sa propriété intellectuelle et collabore avec le gouvernement américain pour protéger ses modèles avancés de l'exploité par les concurrents et les adversaires.

La situation a attiré l'attention sur la question plus large des données de formation de l'IA et du droit d'auteur. OpenAI a précédemment reconnu la nécessité d'utiliser du matériel protégé par le droit d'auteur pour former des modèles comme Chatgpt, arguant que limiter les données de formation aux travaux du domaine public ne répondrait pas aux besoins contemporains. Cette position a alimenté les débats en cours et les batailles juridiques, tels que le procès intenté par le New York Times contre Openai et Microsoft pour la prétendue "utilisation illégale" de son contenu, et un autre par 17 auteurs, dont George RR Martin, accusant Openai de "vol systématique à l'échelle de masse".

Au milieu de ces controverses, l'ironie de la position d'Openai n'est pas passée inaperçue. Les critiques, y compris les relations publiques technologiques et l'écrivain Ed Zitron, ont souligné l'hypocrisie d'Openai se plaignant de l'utilisation des données lorsqu'il a lui-même été accusé d'utiliser le contenu Internet protégé par le droit d'auteur pour développer Chatgpt. Cette situation souligne le paysage complexe et controversé du développement de l'IA, où les problèmes de propriété intellectuelle, d'utilisation des données et de concurrence internationale se croisent.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.