Microsoft revela ‘Skeleton Key’: Nova técnica de jailbreak em IA preocupa engenheiros e desenvolvedores

18 de julho de 2024

2 min read

A Microsoft acaba de divulgar informações sobre um novo tipo de ataque de jailbreak em inteligência artificial, denominado “Skeleton Key” (Chave Mestra). Dessa forma, esta técnica é capaz de burlar as medidas de segurança implementadas em diversos modelos de IA generativa, incluindo sistemas desenvolvidos por gigantes da tecnologia como OpenAI, Google e Meta.

O que é o Skeleton Key e como funciona?

O Skeleton Key é uma técnica de jailbreak que utiliza uma estratégia de múltiplas etapas para convencer um modelo de IA a ignorar suas salvaguardas incorporadas. Dessa forma, uma vez bem-sucedido, o modelo se torna incapaz de distinguir entre solicitações maliciosas ou não autorizadas e legítimas, efetivamente dando aos atacantes controle total sobre a saída da IA.

Impacto na engenharia e desenvolvimento de IA

Para engenheiros e desenvolvedores trabalhando com IA, esta descoberta ressalta a necessidade crítica de implementar medidas de segurança robustas em todas as camadas do stack de IA. Assim, a vulnerabilidade foi testada com sucesso em vários modelos proeminentes, incluindo:

Meta’s Llama3-70b-instruct
Google’s Gemini Pro
OpenAI’s GPT-3.5 Turbo e GPT-4
Mistral Large
Anthropic’s Claude 3 Opus
Cohere Commander R Plus

Mitigando os riscos: Recomendações da Microsoft

A Microsoft sugere uma abordagem em múltiplas camadas para designers de sistemas de IA:

Filtragem de entrada para detectar e bloquear inputs potencialmente nocivos ou maliciosos
Engenharia cuidadosa de prompts nas mensagens do sistema para reforçar comportamentos apropriados
Filtragem de saída para prevenir a geração de conteúdo que viole critérios de segurança
Sistemas de monitoramento de abuso treinados em exemplos adversariais para detectar e mitigar conteúdos ou comportamentos problemáticos recorrentes

Ferramentas para testar e proteger sistemas de IA

A Microsoft atualizou seu PyRIT (Python Risk Identification Toolkit) para incluir o Skeleton Key. Dessa forma, ela permite que desenvolvedores e equipes de segurança testem seus sistemas de IA contra esta nova ameaça.

Conclusão

A descoberta do Skeleton Key sublinha os desafios contínuos na segurança de sistemas de IA à medida que se tornam mais prevalentes em várias aplicações. Assim, para engenheiros e profissionais de tecnologia, isso ressalta a importância de manter-se atualizado sobre as últimas ameaças de segurança em IA e implementar medidas de proteção robustas em todos os projetos relacionados à inteligência artificial.

Por fim, continue acompanhando o Blog da Engenharia e fique por dentro de todas as novidades do mundo da tecnologia e engenharia.

Eduardo Cavalcanti

Presidente do Instituto Brasileiro de Inteligência Artificial e fundador da Bisnis HUB, trabalha para integrar inteligência artificial, engenharia e negócios, criando oportunidades e transformando mercados. Como mentor e palestrante, ajuda profissionais e empresas a adotarem a IA de forma prática, tornando a inovação acessível e aplicável no dia a dia. Acredita que criatividade, persistência e execução são os pilares para construir um futuro mais eficiente e inteligente.

Categorias

Janelas com 64% de transparência: nova tecnologia solar revoluciona eficiência e estética em edifícios

DuPont adiciona 3ª fábrica de RO: fortalece presença na Ásia Nova unidade na China amplia produção de membranas sustentáveis Aquisição estratégica responde à crescente demanda por purificação de água

300 vezes a gravidade da Terra: CHIEF1300 Redefine testes em engenharia e atrai colaboração científica global

Bentley Systems expande uso de inteligência artificial em projetos de infraestrutura no Brasil

Meta

Featured Posts

Janelas com 64% de transparência: nova tecnologia solar revoluciona eficiência e estética em edifícios

DuPont adiciona 3ª fábrica de RO: fortalece presença na Ásia Nova unidade na China amplia produção de membranas sustentáveis Aquisição estratégica responde à crescente demanda por purificação de água

300 vezes a gravidade da Terra: CHIEF1300 Redefine testes em engenharia e atrai colaboração científica global

Bentley Systems expande uso de inteligência artificial em projetos de infraestrutura no Brasil

Redes Sociais

Let`s Get Social

Microsoft revela ‘Skeleton Key’: Nova técnica de jailbreak em IA preocupa engenheiros e desenvolvedores

O que é o Skeleton Key e como funciona?

Impacto na engenharia e desenvolvimento de IA

Mitigando os riscos: Recomendações da Microsoft

Ferramentas para testar e proteger sistemas de IA

Conclusão

Desenvolvimento de Sensores Biológicos para Monitoramento Ambiental

Reforma Tributária e a Engenharia: Como ficam nossas profissões no PL aprovado pela Câmara?

Janelas com 64% de transparência: nova tecnologia solar revoluciona eficiência e estética em edifícios

DuPont adiciona 3ª fábrica de RO: fortalece presença na Ásia Nova unidade na China amplia produção de membranas sustentáveis Aquisição estratégica responde à crescente demanda por purificação de água

300 vezes a gravidade da Terra: CHIEF1300 Redefine testes em engenharia e atrai colaboração científica global

Bentley Systems expande uso de inteligência artificial em projetos de infraestrutura no Brasil

625 metros de altura: Ponte chinesa reduz trajeto de 2h para 2min Maior ponte do mundo sobre o rio Beipan Revoluciona mobilidade em Guizhou Tecnologia milimétrica: China transforma engenharia com drones e precisão satelital

Janelas com 64% de transparência: nova tecnologia solar revoluciona eficiência e estética em edifícios

DuPont adiciona 3ª fábrica de RO: fortalece presença na Ásia Nova unidade na China amplia produção de membranas sustentáveis Aquisição estratégica responde à crescente demanda por purificação de água

300 vezes a gravidade da Terra: CHIEF1300 Redefine testes em engenharia e atrai colaboração científica global

Bentley Systems expande uso de inteligência artificial em projetos de infraestrutura no Brasil

625 metros de altura: Ponte chinesa reduz trajeto de 2h para 2min Maior ponte do mundo sobre o rio Beipan Revoluciona mobilidade em Guizhou Tecnologia milimétrica: China transforma engenharia com drones e precisão satelital

Categorias

Meta

Featured Posts

Redes Sociais

Let`s Get Social

Microsoft revela ‘Skeleton Key’: Nova técnica de jailbreak em IA preocupa engenheiros e desenvolvedores

O que é o Skeleton Key e como funciona?

Impacto na engenharia e desenvolvimento de IA

Mitigando os riscos: Recomendações da Microsoft

Ferramentas para testar e proteger sistemas de IA

Conclusão

Share this article

Desenvolvimento de Sensores Biológicos para Monitoramento Ambiental

Reforma Tributária e a Engenharia: Como ficam nossas profissões no PL aprovado pela Câmara?

Read next