Destaques

DeepSeek compartilhará código de modelo de IA: ‘Progresso pequeno, mas sincero

A startup chinesa DeepSeek disponibilizará publicamente o código de seus modelos, anunciou na sexta-feira, reforçando seu compromisso com a inteligência artificial de código aberto.

A empresa disse em uma publicação na plataforma de mídia social X que abrirá cinco repositórios de código-fonte na próxima semana, descrevendo a medida como “um progresso pequeno, mas sincero”, que será compartilhado “com total transparência”.

+ 7 pontos para entender como a DeepSeek pode mudar o jogo na corrida da IA

“Esses humildes blocos de construção em nosso serviço online foram documentados, implantados e testados em campo na produção”, afirmou a publicação.

A DeepSeek abalou a indústria global de IA no mês passado quando lançou seu modelo de raciocínio R1 de código aberto, que rivalizava com os sistemas ocidentais em desempenho e era desenvolvido a um custo menor.

O comprometimento da empresa com o código aberto a distinguiu da maioria das empresas de IA na China, que, assim como suas rivais nos EUA, se inclinam para modelos de código fechado. O discreto fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista a um meio de comunicação chinês em julho passado que a empresa não priorizou a comercialização de seus modelos de IA e que havia soft power a ser obtido com o código aberto.

“Ter outros seguindo sua inovação dá uma grande sensação de realização”, disse Liang em julho.

“Na verdade, o código aberto é mais um comportamento cultural do que comercial, e contribuir para isso nos traz respeito”, acrescentou.

O código-fonte aberto recém-lançado fornecerá infraestrutura para dar suporte aos modelos de IA que a DeepSeek já compartilhou publicamente, com base nas estruturas de modelos de código-fonte aberto existentes.

O anúncio foi feito depois que a DeepSeek lançou na terça-feira um novo algoritmo chamado Native Sparse Attention (NSA), projetado para tornar o treinamento e a inferência de longo contexto mais eficientes.

A base de usuários do DeepSeek explodiu desde o mês passado. Na China, é o serviço de chatbot mais popular, com 22,2 milhões de usuários ativos diários em 11 de janeiro, superando os 16,95 milhões de usuários do Douban, de acordo com o Aicpb.com, um site chinês que rastreia produtos de IA.

Leave a comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

You may also like

Destaques

Nem Rússia se levantou por Venezuela entre parceiros do Brics ante restrição de Lula

Brasil pediu análise “cautelosa” de vontade de Maduro de ingressar no grupo e freou adesão; blog antecipou posição do presidente
Destaques

Reunião do G20 apresentará ações de prevenção de desastres climáticos em periferias brasileiras

Grupo de Trabalho de Redução do Risco de Desastres se reúne nos dias 30 e 31 de outubro e 1º