- Google fortalece o Chrome com novas defesas contra ataques de injeção indireta
- Recursos: Alinhamento crítico de usuários e pools de origem do agente para ações mais seguras do agente
- Os agentes registram atividades e buscam aprovação antes de acessar sites confidenciais
O Google está adicionando novas defesas ao navegador Chrome para garantir que os recursos de seu agente não possam ser usados por meio de injeção indireta.
A injeção indireta de prompt é um tipo de ataque em que o agente de IA lê conteúdo de terceiros (como um e-mail recebido) e o executa.
Um exemplo seria um prompt para executar uma transação criptográfica a partir de um plug-in de carteira do navegador escrito em um e-mail. O texto é na cor branca e tamanho de fonte 0, então a vítima não consegue vê-lo, mas se por algum motivo passar o e-mail pela IA, o agente pode avisar.
Alinhamento crítico de usuários e origem dos agentes
Para evitar que isso aconteça, o Google introduziu camadas adicionais de segurança, incluindo alinhamento crítico de usuários e origem do agente. O alinhamento crítico do usuário é um recurso que monitora as ações do agente em um ambiente isolado de conteúdo não confiável.
“O alinhamento crítico do usuário é acionado após a conclusão do planejamento para verificar cada ação proposta”, explica o Google.
“Seu foco principal é o alinhamento da tarefa: determinar se a ação proposta atende ao objetivo declarado do usuário. Se a ação estiver desalinhada, será vetada pelo Alignment Critic. Este componente é projetado para visualizar apenas metadados sobre a ação proposta e não conteúdo da web não filtrado e não confiável, garantindo assim que não pode ser envenenado diretamente da web. Uma ação.”
O conjunto de origem de um agente, por outro lado, garante que o agente só possa acessar dados de fontes relacionadas à tarefa que está executando no momento ou dados que o usuário optou por compartilhar com o agente. “Isso evita que um agente comprometido aja arbitrariamente em origens não relacionadas”, acrescentou o Google. “Para cada tarefa da web, uma função de portão confiável decide quais origens propostas pelo agendador são relevantes para a tarefa. O projeto é dividi-las em dois conjuntos, que são rastreados para cada sessão.”
Finalmente, os agentes agora podem criar um registro de trabalho para observar os usuários e exigirão consentimento explícito antes de navegar para sites confidenciais, como portais bancários ou de saúde.
por meio do Hacker News
O melhor antivírus para cada orçamento
Siga o TechRadar no Google Notícias e adicione-nos como sua fonte padrão para receber notícias, opiniões e opiniões de nossos especialistas em feeds. Certifique-se de clicar no botão Continuar!
E é claro que você também pode Siga o TechRadar no TikTok para receber novidades, análises, unboxings em formato de vídeo e receber atualizações constantes nossas WhatsApp também








