Ao usar este site, você concorda com a Política de Privacidade e nossa Politica de Cookies.
Accept
TechParaTodosTechParaTodosTechParaTodos
Notificação Ver Mais
Tamanho da FonteAa
  • Inovação
  • Produtividade
  • Games
    • Listas e Tops
  • Segurança
  • Criptomoedas
TechParaTodosTechParaTodos
Tamanho da FonteAa
Buscar
  • Inovação
  • Produtividade
  • Games
    • Listas e Tops
  • Segurança
  • Criptomoedas
Follow US
Segurança

Quebre o sistema de segurança da IA da Anthropic e ganhe US$ 15.000

Redação TechParaTodos
Atualizado em: 4 de fevereiro de 2025 19:35
Redação TechParaTodos
Compartilhar
Compartilhar

Você já se perguntou como as empresas garantem a segurança de seus sistemas de inteligência artificial? A Anthropic, uma empresa de ponta em IA, ofereceu um prêmio de US$ 15.000 para quem conseguisse “quebrar” seu novo sistema de segurança. Será que alguém conseguiu? Vamos descobrir!

Contents
O Desafio: Quebrando a Segurança da IAO Teste de ResistênciaResultados e MelhoriasSua Chance de Testar a IA

O Desafio: Quebrando a Segurança da IA

A Anthropic lançou um sistema de segurança baseado em “Classificadores Constitucionais”. Imagine uma espécie de “consciência” para a IA, um conjunto de regras que a impedem de gerar respostas perigosas ou maliciosas. Esses classificadores são treinados com dados sintéticos, evitando problemas de privacidade. As regras funcionam como uma espécie de constituição, definindo o que é aceitável e o que não é para a IA.

O Teste de Resistência

Para testar a eficácia do sistema, a Anthropic contratou 183 especialistas em segurança (“red-teamers”) para tentar burlar a IA. Eles passaram mais de 3.000 horas tentando fazer com que a IA respondesse perguntas proibidas, relacionadas a armas químicas, biológicas, radiológicas e nucleares. O objetivo era encontrar uma forma de “jailbreak”, ou seja, um método universal para contornar as proteções.

E o resultado? Apesar do esforço, nenhum dos participantes conseguiu contornar completamente o sistema, ninguém conquistou o prêmio de US$ 15.000.

Resultados e Melhorias

Embora nenhum jailbreak universal tenha sido encontrado, a versão inicial do sistema bloqueava muitas perguntas inofensivas. A Anthropic então aprimorou o sistema, reduzindo os falsos positivos (bloqueio de conteúdo inofensivo). Testes posteriores mostraram uma melhora significativa na taxa de bloqueio de tentativas de jailbreak, passando de 14% para mais de 95%.

Apesar do sucesso, a Anthropic reconhece que sistemas perfeitamente seguros são difíceis de construir. Novos métodos de ataque podem surgir no futuro. Por isso, a empresa recomenda o uso de defesas complementares para uma proteção ainda mais robusta.

Sua Chance de Testar a IA

A Anthropic continua a aprimorar seus sistemas de segurança. E, mesmo sem o prêmio de US$ 15.000, você ainda pode tentar testar a robustez da IA! Participe do desafio reduzido com oito perguntas em vez de dez. Essa oportunidade pode fornecer insights valiosos sobre a evolução da segurança em inteligência artificial.

Em resumo, a Anthropic desenvolveu um sistema de segurança de IA impressionante, provando que é possível criar modelos mais seguros. Apesar disso, a pesquisa destaca a importância da contínua evolução e aprimoramento desses sistemas para combater possíveis ameaças futuras.

Compartilhe suas experiências e opiniões sobre o desafio da Anthropic!

Fonte: ZDNet
TAGGED:malwarebytes

Assine Nossa Newsletter Diária

Fique por dentro! Receba as últimas notícias de última hora diretamente na seu e-mail.

Ao se inscrever, você concorda e reconhece as práticas de dados descritas em nossa Política de Privacidade. Você pode cancelar a inscrição a qualquer momento.
Compartilhe esse Artigo
Facebook Whatsapp Whatsapp Reddit Telegram Copiar Link Print
Deixe um Comentário Deixe um Comentário

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

No TechParaTodos, acreditamos que a tecnologia deve ser simples e acessível. Nosso objetivo é descomplicar o mundo digital com dicas, tutoriais e tendências, ajudando você a aproveitar ao máximo as inovações tecnológicas no dia a dia. 🚀

You Might Also Like

Segurança

Navegação segura: muito além do modo anônimo

3 Min de Leitura
Segurança

Nova escala mede gravidade de ciberataques no Reino Unido

4 Min de Leitura
Segurança

Melhores carteiras com AirTag: teste de especialistas

6 Min de Leitura
Segurança

Fracassos na Índia: Gigantes desistem de fabricar chips

4 Min de Leitura

Redes Sociais

TechParaTodos - Alguns direitos reservados.
  • Início
  • Quem Somos
  • Fale Conosco
  • Política de Privacidade
  • Política de Cookies
  • Todos os posts
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?