Ao usar este site, você concorda com a Política de Privacidade e nossa Politica de Cookies.
Accept
TechParaTodosTechParaTodosTechParaTodos
Notificação Ver Mais
Tamanho da FonteAa
  • Inovação
  • Produtividade
  • Games
    • Listas e Tops
  • Segurança
  • Criptomoedas
TechParaTodosTechParaTodos
Tamanho da FonteAa
Buscar
  • Inovação
  • Produtividade
  • Games
    • Listas e Tops
  • Segurança
  • Criptomoedas
Follow US
Inovação

IA da Microsoft controla softwares e robôs: Magma é o futuro?

Redação TechParaTodos
Atualizado em: 20 de fevereiro de 2025 22:39
Redação TechParaTodos
Compartilhar
Compartilhar

Você já imaginou uma inteligência artificial capaz de controlar tanto softwares quanto robôs? A Microsoft deu um grande passo nessa direção com o lançamento do Magma, um modelo de IA multimodal que promete revolucionar a forma como interagimos com a tecnologia. Prepare-se para descobrir como essa inovação funciona!

Contents
Multimodalidade e AçãoInteligência EspacialMelhorias em Relação a Modelos AnterioresLimitações e o Futuro

A Microsoft Research apresentou o Magma, um modelo de IA integrado que combina processamento visual e de linguagem para controlar interfaces de software e sistemas robóticos. Se os resultados se mantiverem consistentes fora dos testes internos da Microsoft, isso pode representar um avanço significativo para uma IA multimodal de uso geral que pode operar interativamente em espaços reais e digitais.

Multimodalidade e Ação

O diferencial do Magma é sua capacidade não apenas de processar dados multimodais (texto, imagens, vídeo), mas também de agir sobre eles. Isso significa navegar em interfaces de usuário ou manipular objetos físicos. É uma colaboração entre pesquisadores da Microsoft, KAIST, Universidade de Maryland, Universidade de Wisconsin-Madison e Universidade de Washington.

Ao contrário de outros sistemas de IA multimodais que exigem modelos separados para percepção e controle, o Magma integra essas habilidades em um único modelo base.

Inteligência Espacial

Magma vai além da “inteligência verbal”, incluindo a “inteligência espacial” (planejamento e execução de ações). Treinado com imagens, vídeos, dados de robótica e interações de interface de usuário, ele se posiciona como um agente multimodal verdadeiro.

O modelo introduz dois componentes técnicos: Set-of-Mark, que identifica objetos manipuláveis atribuindo rótulos numéricos (botões clicáveis ou objetos em um espaço de trabalho robótico), e Trace-of-Mark, que aprende padrões de movimento a partir de dados de vídeo. Isso permite tarefas como navegar em interfaces ou direcionar braços robóticos.

Melhorias em Relação a Modelos Anteriores

A Microsoft afirma que o Magma-8B apresenta resultados fortes em navegação de interface de usuário e tarefas de manipulação de robôs. Em benchmarks, ele obteve pontuações competitivas, superando alguns modelos em determinadas áreas, mas ficando atrás de outros em outras.

Os benchmarks, embora impressionantes, devem ser analisados com cautela. A validação científica ainda é necessária para comprovar sua capacidade de medir propriedades úteis dos modelos de IA. A liberação do código permitirá a verificação externa dos resultados.

Limitações e o Futuro

Apesar dos avanços, o Magma ainda possui limitações em tomada de decisões complexas em múltiplas etapas. A Microsoft está trabalhando continuamente em melhorias. O código-fonte será liberado, permitindo que outros pesquisadores contribuam.

O Magma representa um salto significativo na área de IA, permitindo que assistentes operem softwares autonomamente e executem tarefas do mundo real por meio de robótica. A rápida evolução da IA, antes vista com receio, agora é objeto de pesquisa regular, mostrando uma mudança de perspectiva na comunidade científica e tecnológica.

Em resumo, o Magma da Microsoft é uma tecnologia inovadora que integra processamento visual e de linguagem para controlar softwares e robôs. Apesar de suas limitações, representa um avanço significativo na área de IA agentic e promete impulsionar ainda mais a interação entre homem e máquina. Sua liberação pública permitirá uma análise mais aprofundada e o desenvolvimento de novas aplicações.

Compartilhe suas experiências e opiniões sobre o Magma da Microsoft!

Fonte: Ars Technica

TAGGED:inovation

Assine Nossa Newsletter Diária

Fique por dentro! Receba as últimas notícias de última hora diretamente na seu e-mail.

Ao se inscrever, você concorda e reconhece as práticas de dados descritas em nossa Política de Privacidade. Você pode cancelar a inscrição a qualquer momento.
Compartilhe esse Artigo
Facebook Whatsapp Whatsapp Reddit Telegram Copiar Link Print
Deixe um Comentário Deixe um Comentário

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

No TechParaTodos, acreditamos que a tecnologia deve ser simples e acessível. Nosso objetivo é descomplicar o mundo digital com dicas, tutoriais e tendências, ajudando você a aproveitar ao máximo as inovações tecnológicas no dia a dia. 🚀

You Might Also Like

Inovação

Fim dos cortes de preço: Por que consoles estão mais caros?

5 Min de Leitura
Inovação

Perplexity lança navegador com IA: Comet chega para competir

3 Min de Leitura
Inovação

Adeus, Nest: seus termostatos perderão suporte em 2025

3 Min de Leitura
Inovação

OpenAI em apuros: Cópia de dados e a hipocrisia da IA

4 Min de Leitura

Redes Sociais

TechParaTodos - Alguns direitos reservados.
  • Início
  • Quem Somos
  • Fale Conosco
  • Política de Privacidade
  • Política de Cookies
  • Todos os posts
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?