Este artigo detalha o pipeline de ataque tipográfico de múltiplas etapas, incluindo Geração Automática de Ataque e Aumento de Ataque.Este artigo detalha o pipeline de ataque tipográfico de múltiplas etapas, incluindo Geração Automática de Ataque e Aumento de Ataque.

Metodologia para Geração de Ataque Adversarial: Usando Diretivas para Enganar Vision-LLMs

2025/10/01 03:00

Resumo e 1. Introdução

  1. Trabalhos Relacionados

    2.1 Vision-LLMs

    2.2 Ataques Adversariais Transferíveis

  2. Preliminares

    3.1 Revisitando Vision-LLMs Auto-Regressivos

    3.2 Ataques Tipográficos em Sistemas AD Baseados em Vision-LLMs

  3. Metodologia

    4.1 Auto-Geração de Ataque Tipográfico

    4.2 Aumentações de Ataque Tipográfico

    4.3 Realizações de Ataques Tipográficos

  4. Experiências

  5. Conclusão e Referências

4 Metodologia

A Figura 1 mostra uma visão geral do nosso pipeline de ataque tipográfico, que vai desde a engenharia de prompt até à anotação de ataque, particularmente através das etapas de Auto-Geração de Ataque, Aumentação de Ataque e Realização de Ataque. Descrevemos os detalhes de cada etapa nas subsecções seguintes.

4.1 Auto-Geração de Ataque Tipográfico

\ Para gerar desorientação útil, os padrões adversariais devem alinhar-se com uma questão existente enquanto guiam o LLM para uma resposta incorreta. Podemos alcançar isto através de um conceito chamado diretiva, que se refere a configurar o objetivo para um LLM, por exemplo, ChatGPT, para impor restrições específicas enquanto encoraja comportamentos diversos. No nosso contexto, direcionamos o LLM para gerar ˆa como um oposto da resposta dada a, sob a restrição da questão dada q. Portanto, podemos inicializar diretivas para o LLM usando os seguintes prompts na Fig. 2,

\ Figura 1: O nosso pipeline proposto vai desde a geração de ataque via diretivas até à aumentação por comandos e conjunções para posicionar os ataques e finalmente influenciar a inferência.

\ Figura 2: Diretiva de contexto para restrições de geração de ataque.

\ Ao gerar ataques, imporíamos restrições adicionais dependendo do tipo de questão. No nosso contexto, focamo-nos em tarefas de ❶ raciocínio de cena (por exemplo, contagem), ❷ raciocínio de objeto de cena (por exemplo, reconhecimento), e ❸ raciocínio de ação (por exemplo, recomendação de ação), como se segue na Fig. 3,

\ Figura 3: Diretiva de modelo para geração de ataque, e um exemplo.

\ As diretivas encorajam o LLM a gerar ataques que influenciam o passo de raciocínio de um Vision-LLM através do alinhamento texto-para-texto e produzem automaticamente padrões tipográficos como ataques de referência. Claramente, o ataque tipográfico acima mencionado só funciona para cenários de tarefa única, ou seja, um único par de pergunta e resposta. Para investigar vulnerabilidades multi-tarefa em relação a múltiplos pares, também podemos generalizar a formulação para K pares de perguntas e respostas, denotados como qi, ai, para obter o texto adversarial aˆi para i ∈ [1, K].

\

:::info Autores:

(1) Nhat Chung, CFAR e IHPC, A*STAR, Singapura e VNU-HCM, Vietname;

(2) Sensen Gao, CFAR e IHPC, A*STAR, Singapura e Universidade de Nankai, China;

(3) Tuan-Anh Vu, CFAR e IHPC, A*STAR, Singapura e HKUST, HKSAR;

(4) Jie Zhang, Universidade Tecnológica de Nanyang, Singapura;

(5) Aishan Liu, Universidade de Beihang, China;

(6) Yun Lin, Universidade Jiao Tong de Xangai, China;

(7) Jin Song Dong, Universidade Nacional de Singapura, Singapura;

(8) Qing Guo, CFAR e IHPC, A*STAR, Singapura e Universidade Nacional de Singapura, Singapura.

:::


:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

\

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail service@support.mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Você também pode gostar

Outra empresa cotada na Nasdaq anuncia compra massiva de Bitcoin (BTC)! Torna-se a 14ª maior empresa! – Também vão investir em altcoin ligada a Trump!

Outra empresa cotada na Nasdaq anuncia compra massiva de Bitcoin (BTC)! Torna-se a 14ª maior empresa! – Também vão investir em altcoin ligada a Trump!

A publicação "Outra Empresa Listada na Nasdaq Anuncia Compra Massiva de Bitcoin (BTC)! Torna-se a 14ª Maior Empresa! – Também Investirão em Altcoin Ligada a Trump!" apareceu no BitcoinEthereumNews.com. Enquanto o número de empresas com tesouraria em Bitcoin (BTC) continua a aumentar dia após dia, outra empresa listada na Nasdaq anunciou sua compra de BTC. De acordo com isso, a empresa de transmissão ao vivo e e-commerce GD Culture Group anunciou um acordo de compra de Bitcoin no valor de $787,5 milhões. Segundo o comunicado oficial, o GD Culture Group anunciou que firmou um acordo de capital para adquirir ativos no valor de $875 milhões, incluindo 7.500 Bitcoins, da Pallas Capital Holding, uma empresa registrada nas Ilhas Virgens Britânicas. A GD Culture emitirá aproximadamente 39,2 milhões de ações ordinárias em troca de todos os ativos da Pallas Capital, incluindo Bitcoin no valor de $875,4 milhões. O CEO da GD Culture, Xiaojian Wang, disse que o acordo de aquisição apoiará diretamente o plano da empresa de construir uma reserva de ativos cripto forte e diversificada, aproveitando a crescente aceitação institucional do Bitcoin como ativo de reserva e reserva de valor. Com esta aquisição, espera-se que a GD Culture se torne a 14ª maior empresa de holding de Bitcoin negociada publicamente. O número de empresas que adotam estratégias de tesouraria em Bitcoin aumentou significativamente, excedendo 190 até 2025. Imediatamente após o anúncio do acordo, as ações da GD Culture caíram 28,16% para $6,99, sua maior queda em um ano. Como você também deve se lembrar, a GD Culture anunciou em maio que criaria uma reserva de criptomoedas. Neste ponto, a empresa anunciou que planeja investir em Bitcoin e na meme coin oficial do Presidente Donald Trump, o token TRUMP, através da emissão de até $300 milhões em ações. *Isto não é aconselhamento de investimento. Siga nossa conta do Telegram e Twitter agora para notícias exclusivas, análises e dados on-chain! Fonte: https://en.bitcoinsistemi.com/another-nasdaq-listed-company-announces-massive-bitcoin-btc-purchase-becomes-14th-largest-company-theyll-also-invest-in-trump-linked-altcoin/
Compartilhar
BitcoinEthereumNews2025/09/18 04:06