No momento, você está visualizando DEEPSEEK: Por que esta startup de IA da China é vista como ameaça real às big techs
A DeepSeek é uma startup com fundação 2023 por Liang Wenfeng, chefe do fundo hedge quantitativo orientado por IA High-Flyer. - Foto: Reprodução.

DEEPSEEK: Por que esta startup de IA da China é vista como ameaça real às big techs

A DeepSeek, startup de IA chinesa chamou a atenção dos mercados depois que seu app concorrente do ChatGPT se tornou um dos mais baixados do mundo

DeepSeek, uma startup chinesa de inteligência artificial (IA) com pouco mais de um ano de existência, causou admiração e consternação no Vale do Silício depois de demonstrar modelos inovadores de IA que oferecem desempenho comparável ao dos melhores chatbots do mundo, aparentemente por uma fração do custo.

O surgimento do DeepSeek pode oferecer um contraponto à crença generalizada de que o futuro da IA exigirá quantidades cada vez maiores de potência e energia para ser desenvolvido.

As ações globais de tecnologia caíram à medida que o entusiasmo em torno da inovação da DeepSeek aumentava. Os investidores começavam a digerir as implicações para seus rivais sediados nos EUA e seus fornecedores de hardware.

O que é a DeepSeek?

DeepSeek é uma startup com fundação 2023 por Liang Wenfeng, chefe do fundo hedge quantitativo orientado por IA High-Flyer. A empresa desenvolve modelos de IA que são de código aberto, o que significa que a comunidade de desenvolvedores pode inspecionar e melhorar o software.

lançamento no início de janeiro.

O aplicativo se distingue de outros chatbots, como o ChatGPT, da OpenAI, por articular seu raciocínio antes de fornecer uma resposta a uma solicitação.

A empresa afirma que sua versão R1 oferece desempenho equivalente ao da versão mais recente da OpenAI e concedeu licença para que indivíduos interessados em desenvolver chatbots usando a tecnologia possam se basear nela.

Como o DeepSeek R1 se compara à OpenAI ou à Meta AI?

Embora não tenha sido totalmente detalhado pela empresa, o custo de treinamento e desenvolvimento dos modelos do DeepSeek parece ser apenas uma fração do que é necessário para os melhores produtos da OpenAI ou da Meta Platforms (META).

A eficiência muito melhor do modelo coloca em questão a necessidade de grandes gastos de capital para adquirir os mais recentes e poderosos aceleradores de IA de empresas como a Nvidia (NVDA).

Isso também amplia a atenção sobre as restrições de exportação dos EUA de tais semicondutores avançados para a China. Eles tinham a intenção de evitar um avanço do tipo que o DeepSeek parece representar.

A DeepSeek afirma que o R1 está próximo ou é melhor do que os modelos rivais em vários benchmarks importantes, como o AIME 2024 para tarefas matemáticas, o MMLU para conhecimento geral e o AlpacaEval 2.0 para desempenho de perguntas e respostas.

Ele também está entre os melhores desempenhos em uma tabela de classificação afiliada à UC Berkeley chamada Chatbot Arena.

O que causa preocupação nos EUA?

Washington proibiu a exportação de tecnologias de ponta, como semicondutores de GPU, para a China, em uma tentativa de impedir os avanços do país em IA, a principal fronteira na disputa entre os EUA e a China pela supremacia tecnológica.

Mas o progresso do DeepSeek sugere que os engenheiros de IA chineses conseguiram contornar as restrições, concentrando-se em maior eficiência com recursos limitados.

Embora ainda não esteja claro a que quantidade de hardware avançado de treinamento de IA a DeepSeek teve acesso, a empresa demonstrou o suficiente para sugerir que as restrições comerciais não foram totalmente eficazes para impedir o progresso da China.

Quando o DeepSeek despertou o interesse global?

A DeepSeek, startup desenvolvedora de IA tem sido observada de perto desde o lançamento de seu modelo mais antigo em 2023. Então, em novembro, ela deu ao mundo um vislumbre de seu modelo de raciocínio DeepSeek R1, projetado para imitar o pensamento humano.

Esse modelo sustenta seu aplicativo de chatbot móvel, que, juntamente com a interface da web em janeiro, ganhou fama mundial como uma alternativa muito mais barata à OpenAI, e o investidor Marc Andreessen o chamou de “momento Sputnik da IA”.

O aplicativo móvel DeepSeek teve download 1,6 milhão de vezes até 25 de janeiro. Além disso, ficou em primeiro lugar nas lojas de aplicativos para iPhone na Austrália, Canadá, China, Cingapura, EUA e Reino Unido. Assim, de acordo com dados do rastreador de mercado App Figures.

Quem é o fundador da DeepSeek?

Nascido em Guangdong em 1985, Liang é bacharel e mestre em engenharia eletrônica e da informação pela Universidade de Zhejiang. Ele fundou a DeepSeek com 10 milhões de yuans (US$ 1,4 milhão) em capital registrado, de acordo com o banco de dados da empresa Tianyancha.

O gargalo para novos avanços não é a captação de mais recursos, disse Liang em uma entrevista ao canal chinês 36kr, mas as restrições dos EUA ao acesso aos melhores chips.

A maioria de seus principais pesquisadores eram recém-formados das melhores universidades chinesas. Isso, de acordo com ele, enfatizando a necessidade de a China desenvolver seu próprio ecossistema doméstico, semelhante ao que foi construído em torno da Nvidia e seus chips de IA.

“Mais investimento não leva necessariamente a mais inovação. Caso contrário, as grandes empresas assumiriam o controle de toda a inovação”, disse Liang.

Qual é a posição da DeepSeek no cenário de IA da China?

Os líderes tecnológicos da China, desde o Alibaba Group e a Baidu até a Tencent Holdings, investiram muito dinheiro e recursos na corrida para adquirir hardware e clientes para seus empreendimentos de IA.

Juntamente com a startup 01.AI de Kai-Fu Lee, a DeepSeek se destaca por sua abordagem de código aberto. Assim, projetada para recrutar o maior número de usuários rapidamente antes de desenvolver estratégias de monetização sobre esse grande público.

Como os modelos da DeepSeek são mais acessíveis, ela já desempenhou um papel importante ao ajudar a reduzir os custos para os desenvolvedores de IA na China. Onde os maiores participantes se envolveram em uma guerra de preços que viu sucessivas ondas de cortes de preços no último ano e meio.

Quais são as implicações para o mercado global de IA?

O sucesso da DeepSeek pode levar a OpenAI e outros fornecedores dos EUA a reduzir seus preços para manter sua liderança estabelecida.

Ele também questiona os grandes gastos de empresas como a Meta e a Microsoft (MSFT). Cada uma das quais se comprometeu a investir US$ 65 bilhões ou mais este ano, em grande parte em infraestrutura de IA. Isso, se modelos mais eficientes puderem competir com um gasto muito menor.

Isso agitou os mercados acionários globais. Pois os investidores venderam empresas como a Nvidia e a ASML Holding, que se beneficiaram da crescente demanda por serviços de IA. As ações de empresas chinesas ligadas à DeepSeek, como a Iflytek subiram.

Desenvolvedores de todo o mundo já estão experimentando o software da DeepSeek e procurando criar ferramentas com ele.

Isso poderia acelerar a adoção de modelos avançados de raciocínio de IA. E, ao mesmo tempo poderia gerar uma preocupação adicional sobre a necessidade de barreiras de proteção para seu uso. Os avanços do DeepSeek podem acelerar a regulamentação para controlar como a IA tem desenvolvimento.

Quais são as deficiências do DeepSeek?

Por fim, como todos os outros modelos chineses de IA, o DeepSeek se autocensura em tópicos considerados sensíveis na China.

Ele desvia as perguntas sobre os protestos da Praça da Paz Celestial em 1989 ou questões geopoliticamente preocupantes, como a possibilidade de a China invadir Taiwan.

Em testes, o bot do DeepSeek é capaz de dar respostas em detalhes sobre figuras políticas como o primeiro-ministro indiano Narendra Modi. Mas se recusa a fazê-lo sobre o presidente chinês Xi Jinping.

É provável que a infraestrutura de nuvem do DeepSeek tenha testes por sua súbita popularidade. A empresa passou por uma breve interrupção em 27 de janeiro. Ainda terá de gerenciar ainda mais tráfego à medida que usuários novos e antigos fizerem mais consultas ao seu chatbot.

Fonte: bloomberg