I modelli a basso costo di DeepSeek AI sospettati di utilizzare i dati aperti, scatenando ironia online

Autore: Alexander Apr 10,2025

L'emergere di Deepseek AI, un modello sviluppato in cinese, ha suscitato significativi controversie e preoccupazioni nel settore tecnologico degli Stati Uniti. Il sospetto che DeepSeek potrebbe aver utilizzato i dati di Openai per addestrare i propri modelli ha portato a una forte reazione da parte dei leader del settore e dei personaggi politici. Donald Trump ha etichettato DeepSeek come "sveglia" per il settore tecnologico degli Stati Uniti, soprattutto dopo che Nvidia ha sperimentato un calo incredibile di $ 600 miliardi di valore di mercato a seguito di un crollo del 16,86% nel suo prezzo delle azioni, la più grande perdita di un giorno nella storia di Wall Street. Anche altri giganti tecnologici come Microsoft, Meta Platforms, la società madre di Google Alphabet e Dell Technologies hanno visto diminuire i loro valori di serie, riflettendo ansie di mercato più ampie sulla minaccia competitiva posta da DeepSeek.

Il modello R1 di DeepSeek, basato sull'apertura open source Deepseek-V3, afferma di offrire un'alternativa economica a modelli di intelligenza artificiale occidentale come Chatgpt, secondo quanto riferito che richiede una potenza di calcolo significativamente inferiore e essendo stato addestrato per soli $ 6 milioni. Questa affermazione non solo ha sfidato i pesanti investimenti che le aziende tecnologiche americane stanno facendo in AI, ma ha anche portato DeepSeek in cima alle classifiche di download di app gratuite statunitensi tra le discussioni sulla sua efficacia.

In risposta a questi sviluppi, Openai e Microsoft stanno studiando se DeepSeek abbia usato l'API di Openai per integrare i modelli di Openi nella propria, una pratica nota come distillazione, che viola i termini di servizio di Openi. Openi ha sottolineato il suo impegno a proteggere la sua proprietà intellettuale e sta collaborando con il governo degli Stati Uniti per salvaguardare i suoi modelli avanzati dall'essere sfruttato da concorrenti e avversari.

La situazione ha attirato l'attenzione sulla questione più ampia dei dati di addestramento dell'IA e del copyright. Openai ha precedentemente riconosciuto la necessità di utilizzare materiali protetti da copyright per formare modelli come Chatgpt, sostenendo che limitare i dati di formazione alle opere di dominio pubblico non soddisferebbe le esigenze contemporanee. Questa posizione ha alimentato i dibattiti in corso e le battaglie legali, come la causa intentata dal New York Times contro Openi e Microsoft per il presunto "uso illegale" del suo contenuto e un altro di 17 autori, tra cui George RR Martin, accusando Openi di "furto sistematico su scala di massa".

Tra queste controversie, l'ironia della posizione di Openi non è passata inosservata. I critici, tra cui Tech PR e lo scrittore Ed Zitron, hanno sottolineato l'ipocrisia di Openi che si lamentano dell'uso dei dati quando è stata accusata di usare contenuti Internet protetti da copyright per sviluppare CHATGPT. Questa situazione sottolinea il complesso e controverso panorama dello sviluppo dell'IA, in cui si intersecano questioni di proprietà intellettuale, utilizzo dei dati e concorrenza internazionale.

DeepSeek è accusato di usare il modello di Openi per addestrare il suo concorrente usando la distillazione. Credito di immagine: Andrey Rudakov/Bloomberg tramite Getty Images.