Conheça o DeepSeek: a revolucionária inteligência artificial de chatbot da China.

A sleek, modern chatbot interface on a computer screen, with vibrant colors and digital elements representing artificial intelligence, surrounded by a soft glow, photorealistic, 4K, HDR, cinematic lighting, ultra detailed, award-winning photography.

Lançamento das Novas Versões do Chatbot DeepSeek

A startup chinesa DeepSeek recentemente lançou duas novas versões do seu chatbot de inteligência artificial: DeepSeek-R1 e DeepSeek-R1-Zero. Esses modelos modernos são baseados na versão anterior, DeepSeek-V3, que se destacou no final do ano passado. Desde seu lançamento, o DeepSeek rapidamente conquistou uma fatia significativa no mercado global de IAs, o que gerou um efeito dominó nas ações de grandes empresas do setor tecnológico.

O diferencial do DeepSeek é, sem dúvida, o seu custo de produção. Enquanto seus concorrentes investem bilhões em desenvolvimento, a startup revela ter gasto apenas US$ 6 milhões (aproximadamente R$ 35,4 milhões). Esse valor reduzido é resultado de uma combinação de código aberto e técnicas inovadoras de aprendizado por reforço, que priorizam eficiência e otimizam o uso de hardware, minimizando a necessidade de equipamentos caros.

Outro aspecto importante é o contexto econômico que permitiu o surgimento do DeepSeek. As restrições impostas pelos Estados Unidos na exportação de chips avançados para a China tornaram-se um desafio, mas também uma oportunidade. Entre 2022 e 2024, foram implementados bloqueios expressivos que dificultaram a obtenção de semicondutores. Para driblar essa realidade, a equipe chinesa se uniu, explorando novas abordagens tecnológicas que suprimem a necessidade de componentes escassos.

Como Funciona a Tecnologia do DeepSeek?

A DeepSeek foi fondada em 2023 por Liang Wenfeng, em Hangzhou, e já começou com uma vantagem significativa: um estoque de cerca de 50 mil chips Nvidia A100, que agora estão sob restrições de exportação. A tecnologia desenvolvida pela empresa combina esses chips sofisticados com modelos mais acessíveis, permitindo execução de tarefas complexas a um custo reduzido.

Os testes de desempenho demonstram que o DeepSeek é capaz de resolver questões de matemática, programação e compreender a linguagem natural com resultados comparáveis aos melhores sistemas do mercado. A empresa divulgou que, em 22 benchmarks independentes, o DeepSeek superou seus concorrentes em 13 deles, o que confirma suas capacidades impressionantes.

Levantando outros dados com relação ao DeepSeek-V3, o sistema foi alimentado com um banco de dados que contém 14,8 trilhões de tokens, completando essa fase de treinamento em apenas 55 dias. É interessante notar que, em ciência de dados, 1 milhão de tokens equivalem a cerca de 750 mil palavras. Além disso, a arquitetura da IA conta com 671 bilhões de parâmetros, uma medida crucial para a eficácia do modelo, estabelecendo uma comparação positiva, especialmente quando colocada ao lado do Llama 3.1, que possui apenas 405 bilhões de parâmetros.

Embora o número de parâmetros esteja frequentemente associado ao desempenho, é importante notar que a eficácia também depende da otimização. Modelos mais robustos, embora mais potentes, exigem hardware igualmente avançado. Se não houver um equilíbrio correto, a velocidade de resposta do sistema pode ser comprometida, o que é um ponto crucial a ser considerado pelos desenvolvedores.

Efeitos no Mercado e Desdobramentos do Lançamento

O impacto do lançamento do DeepSeek foi tão significativo que, na segunda-feira, 27, o aplicativo teve que ser retirado do ar temporariamente devido à alta demanda, levando a empresa a limitar a criação de novas contas. A ascensão do DeepSeek também expôs um novo desafio para outras empresas de tecnologia que haviam projetado uma dependência crescente de chips avançados para impulsionar suas inovações em IA. O resultado? Quedas nas ações de gigantes do setor, como Nvidia, Microsoft e Apple, que se viram diante da realidade de um mercado que mudou rapidamente.

As diferentes versões introduzidas, DeepSeek-R1 e DeepSeek-R1-Zero, atendem a propósitos distintos. A primeira, R1, é ideal para realizar tarefas complexas, como elaboração de conteúdos, tradução técnica, resolução de problemas complicados e análises aprofundadas, mantendo a capacidade de lembrar interações anteriores mesmo em diálogos longos. Por outro lado, o modelo R1-Zero é otimizado para tarefas mais simples e diretas, sendo adequado para respostas rápidas, geração de textos curtos e classificação de informações.

Compartilhe nas Redes: