Os modelos de baixo custo da AI Deepseek suspeitavam de usar dados do Openai, provocando ironia online

Autor: Alexander Apr 10,2025

O surgimento da AI Deepseek, um modelo de desenvolvimento chinês, provocou controvérsias e preocupações significativas no setor de tecnologia dos EUA. A suspeita de que a DeepSeek possa ter utilizado os dados do OpenAI para treinar seus próprios modelos levou a uma reação acentuada de líderes da indústria e figuras políticas. Donald Trump rotulou Deepseek como um "despertar" para o setor de tecnologia dos EUA, especialmente depois que a Nvidia experimentou uma queda impressionante de US $ 600 bilhões em valor de mercado após uma queda de 16,86% em seu preço das ações-a maior perda de um dia na história de Wall Street. Outros gigantes da tecnologia como Microsoft, Meta Plataformas, a empresa controladora do Google, Alphabet e Dell Technologies, também viram seus valores de ações diminuirem, refletindo ansiedades mais amplas sobre a ameaça competitiva representada pela DeepSeek.

O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, afirma oferecer uma alternativa econômica aos modelos ocidentais de IA como o ChatGPT, exigindo significativamente menos poder de computação e sendo treinado por apenas US $ 6 milhões. Essa alegação não apenas desafiou os pesados ​​investimentos americanos de tecnologia de tecnologia está fazendo na IA, mas também levou a Deepseek ao topo das paradas de download de aplicativos gratuitos nos EUA em meio a discussões sobre sua eficácia.

Em resposta a esses desenvolvimentos, o OpenAI e a Microsoft estão investigando se o DeepSeek usou a API do OpenAI para integrar os modelos do OpenAI em sua própria, uma prática conhecida como destilação, que viola os termos de serviço da OpenAI. A Openai enfatizou seu compromisso de proteger sua propriedade intelectual e está colaborando com o governo dos EUA para proteger seus modelos avançados de serem explorados por concorrentes e adversários.

A situação chamou a atenção para a questão mais ampla dos dados de treinamento e direitos autorais da IA. O Openai já reconheceu a necessidade de usar materiais protegidos por direitos autorais para treinar modelos como o ChatGPT, argumentando que limitar os dados de treinamento aos trabalhos de domínio público não atenderia às necessidades contemporâneas. Essa postura alimentou debates em andamento e batalhas legais, como o processo movido pelo New York Times contra o Openai e a Microsoft para o suposto "uso ilegal" de seu conteúdo e outro por 17 autores, incluindo George RR Martin, acusando o Openi de "roubo sistemático em uma escala de massa".

Em meio a essas controvérsias, a ironia da posição de Openai não passou despercebida. Os críticos, incluindo o Tech PR e o escritor Ed Zitron, apontaram a hipocrisia do OpenAI reclamando do uso de dados quando foi acusado de usar conteúdo da Internet com direitos autorais para desenvolver o ChatGPT. Essa situação ressalta o cenário complexo e controverso do desenvolvimento da IA, onde questões de propriedade intelectual, uso de dados e competição internacional se cruzam.

A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.