Olá, pessoal! Já imaginou um futuro onde a inteligência artificial (IA) generativa fosse mais rápida, barata e segura? Pois é, essa é a visão do CEO da IBM, e eu vou te contar tudo sobre isso!
Modelos de IA menores e mais específicos: o futuro da inteligência artificial
Segundo Arvind Krishna, CEO da IBM, o foco da empresa está em modelos de IA generativa (genAI) menores e mais especializados. Ele acredita que essa abordagem resolve problemas importantes de custo, velocidade e segurança.
Por que modelos menores?
Atualmente, apenas 1% dos dados corporativos são acessados por modelos genAI. Isso acontece por falta de integração entre data centers, serviços em nuvem e ambientes de borda (edge). Modelos menores, focados em tarefas específicas (RH, vendas, varejo, manufatura), são a solução. Eles são mais precisos, rápidos e econômicos. Além disso, você pode rodá-los onde quiser.
Krishna ressalta que não se trata de substituir os modelos maiores, mas de complementá-los. Os modelos menores permitem customização para as necessidades de cada empresa.
Custos menores e maior eficiência
Os modelos menores são até 30 vezes mais baratos para operar do que os modelos de linguagem grandes (LLMs) tradicionais. Assim como o custo de armazenamento e computação caiu drasticamente desde os anos 90, a tecnologia de IA também ficará mais acessível. Isso permitirá aplicar a IA em um número muito maior de problemas.
A IBM utiliza a família Granite de modelos open-source. Esses modelos possuem entre 3 bilhões e 20 bilhões de parâmetros, bem diferente dos LLMs como o GPT-4, que tem mais de 1 trilhão. Outras empresas também estão investindo em modelos menores.
Integração e resultados de negócios
A IBM integra seus modelos Granite 3.0 na plataforma WatsonX. Esta plataforma facilita a criação, treinamento, ajuste e implantação de modelos de IA em larga escala, especialmente para aplicações de negócios específicas. O WatsonX Orchestrate permite construir um agente de IA em menos de cinco minutos e possui 150 modelos pré-construídos.
A era da experimentação com IA acabou. O sucesso será definido pela integração e pelos resultados de negócios. A IBM está focada nisso.
Redes de IA na borda (edge)
Para conectar fontes de dados geograficamente dispersas, a IBM e a Lumen Technologies anunciaram uma parceria. A ideia é criar inferência de IA em tempo real mais próxima da origem dos dados. Isso reduz custos, latência e problemas de segurança.
A Lumen está modernizando sua rede. A integração com o WatsonX na borda permite acesso mais seguro e rápido aos dados, eliminando a latência de redes tradicionais. Exemplos de uso incluem diagnósticos médicos em tempo real e manufatura automatizada.
Conclusão
Em resumo, a tendência é a utilização de modelos de IA generativa menores, específicos e customizados. Essa abordagem proporciona maior eficiência, reduz custos e melhora a segurança. A integração com redes de borda permite a utilização da IA em tempo real, abrindo portas para novas aplicações e soluções inovadoras em diversos setores.
Compartilhe suas experiências com IA na sua empresa!
Fonte: Computerworld