Lar Notícias Os modelos de baixo custo da AI Deepseek suspeitavam de usar dados do Openai, provocando ironia online

Os modelos de baixo custo da AI Deepseek suspeitavam de usar dados do Openai, provocando ironia online

Autor: Alexander Apr 10,2025

O surgimento da AI Deepseek, um modelo de desenvolvimento chinês, provocou controvérsias e preocupações significativas no setor de tecnologia dos EUA. A suspeita de que a DeepSeek possa ter utilizado os dados do OpenAI para treinar seus próprios modelos levou a uma reação acentuada de líderes da indústria e figuras políticas. Donald Trump rotulou Deepseek como um "despertar" para o setor de tecnologia dos EUA, especialmente depois que a Nvidia experimentou uma queda impressionante de US $ 600 bilhões em valor de mercado após uma queda de 16,86% em seu preço das ações-a maior perda de um dia na história de Wall Street. Outros gigantes da tecnologia como Microsoft, Meta Plataformas, a empresa controladora do Google, Alphabet e Dell Technologies, também viram seus valores de ações diminuirem, refletindo ansiedades mais amplas sobre a ameaça competitiva representada pela DeepSeek.

O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, afirma oferecer uma alternativa econômica aos modelos ocidentais de IA como o ChatGPT, exigindo significativamente menos poder de computação e sendo treinado por apenas US $ 6 milhões. Essa alegação não apenas desafiou os pesados investimentos americanos de tecnologia de tecnologia está fazendo na IA, mas também levou a Deepseek ao topo das paradas de download de aplicativos gratuitos nos EUA em meio a discussões sobre sua eficácia.

Em resposta a esses desenvolvimentos, o OpenAI e a Microsoft estão investigando se o DeepSeek usou a API do OpenAI para integrar os modelos do OpenAI em sua própria, uma prática conhecida como destilação, que viola os termos de serviço da OpenAI. A Openai enfatizou seu compromisso de proteger sua propriedade intelectual e está colaborando com o governo dos EUA para proteger seus modelos avançados de serem explorados por concorrentes e adversários.

A situação chamou a atenção para a questão mais ampla dos dados de treinamento e direitos autorais da IA. O Openai já reconheceu a necessidade de usar materiais protegidos por direitos autorais para treinar modelos como o ChatGPT, argumentando que limitar os dados de treinamento aos trabalhos de domínio público não atenderia às necessidades contemporâneas. Essa postura alimentou debates em andamento e batalhas legais, como o processo movido pelo New York Times contra o Openai e a Microsoft para o suposto "uso ilegal" de seu conteúdo e outro por 17 autores, incluindo George RR Martin, acusando o Openi de "roubo sistemático em uma escala de massa".

Em meio a essas controvérsias, a ironia da posição de Openai não passou despercebida. Os críticos, incluindo o Tech PR e o escritor Ed Zitron, apontaram a hipocrisia do OpenAI reclamando do uso de dados quando foi acusado de usar conteúdo da Internet com direitos autorais para desenvolver o ChatGPT. Essa situação ressalta o cenário complexo e controverso do desenvolvimento da IA, onde questões de propriedade intelectual, uso de dados e competição internacional se cruzam.

A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.