DeepSeek lança modelo de IA “topo de linha” um ano depois de chocar o mundo

Blog

Um ano depois de sacudir o Vale do Silício com sua tecnologia, a chinesa DeepSeek colocou no ar versões de prévia de um novo modelo de inteligência artificial considerado seu carro-chefe — e já o vende como “a plataforma open source mais poderosa do mercado”, em um recado direto para rivais como OpenAI e Anthropic.A startup apresentou as séries V4 Flash e V4 Pro, dizendo que os modelos têm desempenho de ponta em testes de programação e trazem avanços importantes em raciocínio e em tarefas feitas por agentes autônomos. Segundo a empresa, eles chegam com mudanças na arquitetura e melhorias de otimização, detalhadas em uma publicação no Hugging Face. A DeepSeek destacou uma técnica batizada de Hybrid Attention Architecture, que, de acordo com a companhia, melhora a capacidade do modelo de lembrar perguntas e respostas ao longo de conversas longas. A janela de contexto também foi ampliada para 1 milhão de tokens — o que permite enviar bases de código inteiras ou documentos muito extensos em um único prompt.Leia tambémMeta assina acordo multibilionário com Amazon para usar chips em IAControladora do Facebook usará dezenas de milhões de núcleos da AWS para sustentar agentes de IA em contrato plurianual que prevê expansão conforme avanço das capacidades da MetaModelo poderoso de IA da Anthropic dispara alarme global e corrida por segurançaGovernos e instituições financeiras correm para reforçar defesas, enquanto cresce a preocupação com o poder concentrado em poucas empresasO V4 surge mais de um ano depois de a DeepSeek, sediada em Hangzhou, ter disparado uma venda de ações que apagou mais de US$ 1 trilhão em valor de mercado com o lançamento do R1, um modelo aberto que imita o processo de raciocínio humano. O R1 chegou a rivalizar com sistemas de IA de ponta de empresas como a OpenAI, mas teria sido desenvolvido a uma fração do custo dos concorrentes americanos.Na bolsa chinesa, as ações de fabricantes locais de chips dispararam nesta sexta-feira, com investidores apostando que o novo modelo deve sustentar a demanda por semicondutores produzidos na China. Em uma postagem no WeChat, a DeepSeek reconheceu que a capacidade de serviço da linha V4 Pro ainda é “extremamente limitada”, por causa da falta de infraestrutura computacional. A expectativa da empresa é que o custo de uso dos modelos caia de forma relevante depois da entrada em operação, no segundo semestre, de clusters equipados com chips Ascend 950, da Huawei Technologies Co. A startup também negocia com Tencent e Alibaba sua primeira rodada de captação com investidores externos.A nova família de modelos é mais um salto em escala e eficiência — duas marcas da trajetória da DeepSeek — e aumenta a pressão competitiva sobre os rivais. Depois do R1, gigantes de tecnologia e investidores chegaram a repensar a lógica de despejar bilhões de dólares em projetos de IA. Esse movimento, porém, perdeu força: empresas americanas de tecnologia devem investir algo em torno de US$ 650 bilhões em 2026 só em infraestrutura de IA e data centers.O sistema de 1 trilhão de parâmetros da DeepSeek usa a técnica Mixture-of-Experts (mistura de especialistas), que aciona apenas uma parte dos “experts” do modelo em cada tarefa, ativando no máximo 37 bilhões de parâmetros por requisição. Com isso, o custo de inferência fica bem abaixo do de outros modelos de fronteira com escala semelhante.Segundo a empresa, o DeepSeek-V4 Pro custa só uma fração do que cobram os principais laboratórios dos EUA. Os tokens de entrada — o texto enviado pelo usuário — saem a US$ 1,74 por milhão, enquanto os tokens de saída — a resposta do modelo — custam US$ 3,48 por milhão. No Claude Sonnet 4, modelo topo de linha da Anthropic, o milhão de tokens de entrada custa US$ 3, e o de saída, US$ 15.A combinação de arquitetura e técnicas coloca a DeepSeek em confronto direto com os modelos mais recentes de OpenAI, Google e Anthropic. Nesta sexta, a startup afirmou que supera o desempenho de sistemas como o GPT-5.2, da OpenAI, em benchmarks padronizados, mas admitiu que o V4 ainda está de 3 a 6 meses atrás dos modelos mais avançados do mercado.Mesmo assim, a empresa faz questão de dizer que não está jogando apenas o jogo da “força bruta”, e sim o da redução de custos. O V4 foi desenhado para rodar em infraestrutura mais barata, o que pode apertar ainda mais o cerco a outras empresas chinesas de IA, como a MiniMax.“Minimax e Zhipu, por serem provedoras independentes de modelos, sempre vão ficar expostas à concorrência, principalmente de grandes plataformas de internet ou de nuvem, que têm muito mais alcance e distribuição”, disse Vey-Sern Ling, diretor-gerente do Union Bancaire Privée. “No fim das contas, a diferença de desempenho entre modelos tende a ficar imperceptível para a maioria dos usuários.”O avanço da DeepSeek no ano passado desencadeou uma corrida em torno da IA na China, com gigantes como Alibaba e Baidu despejando no mercado serviços baratos de inteligência artificial. Rivais como ByteDance, Zhipu e Minimax correram para revisar e relançar seus modelos nas semanas que antecederam abril, numa tentativa de não ficar para trás.Com o estrelato, veio também o escrutínio. Líderes de empresas de tecnologia e autoridades dos EUA acusam a DeepSeek de usar técnicas e hardwares proibidos para treinar seus sistemas.OpenAI e Anthropic já afirmaram que a DeepSeek recorreu à “destilação” — processo em que a saída de outros modelos de IA é usada para treinar um sistema com capacidades semelhantes. As duas empresas americanas dizem ter detectado esse tipo de uso vindo da startup chinesa, e a OpenAI começou a levantar o assunto nos bastidores logo após o lançamento do R1.Há ainda a suspeita de que a DeepSeek tenha acesso a chips de IA da Nvidia que estão na lista de componentes vetados para a China. Segundo pessoas a par do tema, o governo americano acredita que a startup usou processadores Blackwell, da Nvidia — efetivamente proibidos para o mercado chinês — em um data center na região da Mongólia Interior.© 2026 Bloomberg L.P.The post DeepSeek lança modelo de IA “topo de linha” um ano depois de chocar o mundo appeared first on InfoMoney.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *