A OpenAI lançou o o3-mini, um novo modelo de raciocínio simulado, e isso mexeu com o mercado! Será que ele consegue superar a concorrência chinesa, a DeepSeek? Vamos descobrir!
Após a DeepSeek desafiar a posição de destaque da OpenAI no mercado de modelos de IA, a empresa respondeu com o lançamento do o3-mini. Disponível gratuitamente para todos os usuários, sem necessidade de assinatura, ele promete revolucionar o que modelos menores podem alcançar.
Mais rápido, melhor, mais forte
O o3-mini oferece três níveis de “esforço de raciocínio”, permitindo ajustar a precisão e a velocidade de resposta. O nível mais baixo tem precisão similar ao o1-mini em testes de matemática e codificação. Já o nível mais alto iguala ou supera o desempenho do modelo o1 completo.
Testes internos mostraram uma redução de 39% em erros graves em comparação com o o1-mini. Os usuários também preferiram as respostas do o3-mini em 56% das vezes. Apesar disso, a versão intermediária do o3-mini é 24% mais rápida que o o1-mini, com tempo médio de resposta caindo de 10,16 segundos para 7,7 segundos.
A OpenAI destaca que o o3-mini inclui um protótipo de função de busca que encontra respostas atualizadas com links para fontes relevantes na web.
Capacidades de Codificação Aprimoradas
A OpenAI afirma que o o3-mini apresenta melhorias significativas em relação aos modelos anteriores, especialmente nas capacidades de codificação. Isso representa um avanço importante na área.
Usuários com assinatura OpenAI Plus, Team ou Pro verão o o3-mini substituir o o1-mini a partir de hoje. Usuários Plus e Team terão limite de 150 mensagens por dia, aumento em relação ao limite de 50 mensagens do o1-mini.
Usuários sem assinatura paga também terão acesso ao modelo através do ChatGPT, selecionando “Razão” em um menu suspenso. Esta é a primeira vez que a OpenAI disponibiliza um modelo de raciocínio simulado para usuários gratuitos.
E a capacidade de aprendizado autônomo?
Um documento adicional detalha os testes e medidas de segurança do o3-mini. Testes incluíram tópicos como armas químicas e biológicas e avaliação de persuasão, comparando-se a textos escritos por humanos.
No entanto, a OpenAI alerta que o o3-mini ainda apresenta baixo desempenho em avaliações de capacidade de auto-aperfeiçoamento. Ele obteve nota zero em um teste que avaliava a automação do trabalho de um engenheiro de pesquisa da OpenAI em termos de codificação.
O modelo foi treinado em dados públicos e conjuntos de dados personalizados, com rigorosa filtragem para garantir a qualidade dos dados e mitigar riscos.
Em resumo, o o3-mini representa um avanço significativo da OpenAI, oferecendo um modelo de raciocínio potente e acessível. Apesar de suas limitações em auto-aperfeiçoamento, ele demonstra um grande potencial e promete ser uma ferramenta valiosa para diversos usuários.
Compartilhe suas experiências com o o3-mini!