A OpenAI revelou uma estrutura de benchmarking destinada a medir com que eficácia os agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em criptomoedasA OpenAI revelou uma estrutura de benchmarking destinada a medir com que eficácia os agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em criptomoedas

OpenAI coloca agentes de IA uns contra os outros para testar contratos inteligentes em modo adversarial

2026/02/19 09:26
Leu 8 min
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

A OpenAI revelou uma estrutura de benchmarking destinada a medir a eficácia com que os Agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em contratos inteligentes cripto. O projeto, intitulado "EVMbench: Evaluating AI Agents on Smart Contract Security", foi lançado em colaboração com a Paradigm e a OtterSec, duas organizações com profunda exposição à segurança e investimento em blockchain. O estudo avalia Agentes de IA contra um conjunto selecionado de 120 potenciais fraquezas extraídas de 40 auditorias de contrato inteligente, procurando quantificar não apenas as capacidades de deteção e correção, mas também o potencial de exploração teórico destes agentes num ambiente controlado.

Principais conclusões

  • O EVMbench testa Agentes de IA contra 120 vulnerabilidades recolhidas de 40 auditorias de contrato inteligente, enfatizando vulnerabilidades provenientes de competições de auditoria de código aberto.
  • Entre os modelos testados, o Claude Opus 4.6 da Anthropic liderou com uma recompensa média de deteção de $37.824, seguido pelo OC-GPT-5.2 da OpenAI com $31.623 e o Gemini 3 Pro do Google com $25.112.
  • A OpenAI enquadra o benchmark como um passo para medir o desempenho da IA em "ambientes economicamente significativos", não apenas tarefas simuladas, destacando as implicações do mundo real para atacantes e defensores no panorama da segurança cripto.
  • Os investigadores observam que os contratos inteligentes protegem milhares de milhões de dólares em ativos, sublinhando o valor estratégico das ferramentas habilitadas por IA para atividades tanto ofensivas como defensivas.
  • Observadores da indústria associaram estes desenvolvimentos a discussões mais amplas sobre pagamentos impulsionados por IA e o papel das stablecoins nas transações quotidianas, com grandes executivos a prever um uso agêntico crescente nos próximos anos.
  • O contexto para tal trabalho é sublinhado pelos dados de incidentes de segurança cripto de 2025, que mostram um fluxo contínuo de fundos através de vulnerabilidades e ataques, reforçando a procura por mecanismos robustos de auditoria e defesa habilitados por IA.

As recompensas de deteção para Agentes de IA são detalhadas no PDF da OpenAI que acompanha o estudo, que também descreve a metodologia de avaliação e os cenários usados para simular o risco de contrato inteligente do mundo real. Os autores enfatizam que, embora os Agentes de IA tenham evoluído para automatizar uma ampla gama de tarefas de rotina, avaliar o seu desempenho em "ambientes economicamente significativos" é essencial para compreender como irão funcionar sob pressão em sistemas de produção.

A OpenAI observa que espera que as tecnologias agênticas ampliem o âmbito dos pagamentos e liquidação, incluindo stablecoins usadas em fluxos de trabalho automatizados. A discussão em torno dos pagamentos habilitados por IA estende-se para além dos testes de segurança à questão mais ampla de como os sistemas autónomos irão participar na atividade financeira diária. As próprias projeções da empresa sugerem que os pagamentos agênticos poderão tornar-se mais comuns, fundamentando as capacidades da IA em casos de uso práticos que tocam as transações quotidianas dos consumidores.

Em conjunto com os resultados do benchmark, o CEO da Circle, Jeremy Allaire, previu publicamente que milhares de milhões de Agentes de IA poderão estar a transacionar com stablecoins para pagamentos quotidianos nos próximos cinco anos. Essa visão cruza-se com um tema recorrente nos círculos cripto: o potencial das criptomoedas para se tornarem a moeda nativa dos Agentes de IA, uma narrativa que ganhou atenção notável de líderes da indústria e investidores. Embora tais previsões permaneçam especulativas, a tendência subjacente é clara — a automação de IA está a mover-se do laboratório para a camada de transação, onde poderá remodelar a forma como o valor se move através das redes.

O estudo surge num momento em que a segurança cripto continua a ser um fator de risco significativo para os investidores. O dado sobre o ataque aos fundos cripto de 2025 — onde os atacantes retiraram aproximadamente $3,4 mil milhões — destaca a urgência de ferramentas melhoradas e mecanismos de correção mais rápidos e fiáveis. A estrutura EVMbench está posicionada, em parte, como uma forma de medir se os Agentes de IA podem contribuir significativamente para as capacidades defensivas em escala, reduzindo oportunidades de exploração e acelerando a mitigação de ameaças.

Para construir o benchmark, os investigadores basearam-se em 120 vulnerabilidades selecionadas abrangendo 40 auditorias de contrato inteligente, com muitas fraquezas rastreadas até desafios de auditoria de código aberto. A OpenAI argumenta que o benchmark ajudará a acompanhar o progresso da IA no reconhecimento e mitigação de fraquezas ao nível do contrato em escala, oferecendo uma forma padronizada de comparar futuros modelos de IA à medida que evoluem. O estudo também fornece uma perspetiva sobre como a IA pode ser aplicada à normalização da avaliação de risco através de uma ampla gama de arquiteturas de contrato inteligente, em vez de se concentrar apenas em casos isolados.

Os contratos inteligentes não foram construídos para humanos: Dragonfly

Numa sequência contemporânea no X, Haseeb Qureshi, um parceiro da Dragonfly, argumentou que a promessa da cripto de substituir direitos de propriedade e contratos tradicionais nunca se materializou, não porque a tecnologia falhou, mas porque nunca foi concebida com a intuição humana em mente. Ele destacou o medo persistente associado à assinatura de grandes transações num ambiente onde carteiras de drenagem e outros vetores de ataque permanecem uma ameaça constante, em forte contraste com a experiência comparativamente mais suave das transferências bancárias tradicionais.

Qureshi defende que a próxima fase das transações cripto poderá ser habilitada por carteiras auto-conduzidas intermediadas por IA. Tais carteiras monitorizariam o risco, geririam operações complexas e responderiam autonomamente a ameaças em nome dos utilizadores, potencialmente reduzindo a fricção e o medo que caracterizam grandes transferências hoje.

A conclusão mais ampla desta sequência é que os Agentes de IA podem desempenhar um papel crítico na transformação da forma como as pessoas interagem com cripto — mudando de transações manuais propensas a erros para processos automatizados e conscientes do risco que podem escalar com a adoção. À medida que os Agentes de IA começam a demonstrar mais competência no tratamento de questões de segurança, os utilizadores poderão ver fiabilidade e resiliência melhoradas em fluxos de trabalho de finanças descentralizadas, mesmo enquanto as tecnologias subjacentes continuam a amadurecer.

O que observar a seguir

  • Publicação e replicação independente do conjunto completo de dados EVMbench através de modelos e arquiteturas de IA adicionais.
  • Adoção mais ampla de fluxos de trabalho de auditoria assistida por IA por auditores, exchanges e projetos DeFi que procuram reforçar posturas de segurança.
  • Explorações em carteiras agênticas e fluxos de pagamento autónomos, incluindo considerações regulamentares e de conformidade para ativos geridos por IA.
  • Benchmarks de acompanhamento comparando mais sistemas de IA à medida que novas versões são lançadas, acompanhando melhorias na precisão de deteção e velocidade de correção.

Fontes e verificação

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Perdas de segurança cripto em 2025 (cobertura de relatórios): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi sobre IA e UX cripto (publicação no X): https://x.com/hosseeb/status/2024136762424185208
  • Liderança da IA da China e implicações cripto (análise): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw e desenvolvimentos de bot de IA na cobertura Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Números-chave e próximos passos

O estudo EVMbench demonstra que grandes modelos de linguagem e Agentes de IA relacionados estão a começar a realizar trabalho de segurança significativo no espaço de contratos inteligentes, com diferenças claramente quantificáveis entre modelos. A liderança do Claude Opus 4.6 nas recompensas médias de deteção sinaliza que certas arquiteturas podem ser mais hábeis em detetar e mitigar vulnerabilidades dentro da lógica de contrato complexa, enquanto outras ficam para trás, oferecendo um espectro de capacidades que os investigadores provavelmente desejarão refinar. A inclusão de múltiplas parcerias da indústria no projeto sublinha o consenso crescente de que a segurança habilitada por IA e o gerenciamento de risco automatizado poderão tornar-se essenciais para escalar em ambientes descentralizados.

À medida que o campo evolui, os observadores estarão a observar a rapidez com que os Agentes de IA podem fazer a transição da deteção para a remediação, e se estes agentes podem operar de forma fiável em sistemas ao vivo sem introduzir novos riscos. A conversa sobre carteiras impulsionadas por IA e pagamentos autónomos toca num conjunto mais amplo de questões em torno da governança de segurança, consentimento do utilizador e alinhamento regulamentar. Se a trajetória sugerida pela OpenAI e seus parceiros continuar, as ferramentas assistidas por IA poderão tornar-se um componente central da futura infraestrutura cripto, alterando tanto o cálculo de risco como a experiência do utilizador de formas significativas. A próxima ronda de benchmarks, juntamente com implementações do mundo real, ajudará a determinar a rapidez com que esta visão se materializa e que salvaguardas devem acompanhá-la.

Este artigo foi originalmente publicado como OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts no Crypto Breaking News – a sua fonte de confiança para notícias cripto, notícias Bitcoin e atualizações blockchain.

Oportunidade de mercado
Logo de Smart Blockchain
Cotação Smart Blockchain (SMART)
$0.00439
$0.00439$0.00439
-2.07%
USD
Gráfico de preço em tempo real de Smart Blockchain (SMART)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Você também pode gostar

Os ETFs spot de Bitcoin viram um fluxo de entrada líquido total de $522 milhões ontem, com apenas o BlackRock IBIT a registar um fluxo de saída líquido

Os ETFs spot de Bitcoin viram um fluxo de entrada líquido total de $522 milhões ontem, com apenas o BlackRock IBIT a registar um fluxo de saída líquido

PANews relatou em 30 de setembro que, de acordo com dados da SoSoValue, o fluxo de entrada líquido total dos ETFs spot de Bitcoin ontem (29 de setembro, Hora do Leste) foi de US$522 milhões. O ETF spot de Bitcoin com o maior fluxo de entrada líquido diário ontem foi o ETF FBTC da Fidelity, com um fluxo de entrada líquido diário de US$299 milhões. Atualmente, o fluxo de entrada líquido histórico total do FBTC alcançou US$12,222 bilhões. O segundo é o ETF ARKB da Ark Invest e 21Shares, com um fluxo de entrada líquido diário de US$62,1817 milhões. Atualmente, o fluxo de entrada líquido histórico total do ARKB alcançou US$2,166 bilhões. O ETF spot de Bitcoin com o maior fluxo de saída líquido diário ontem foi o ETF IBIT da Blackrock, com um fluxo de saída líquido diário de US$46,6416 milhões. Atualmente, o fluxo de entrada líquido total do IBIT na história alcançou US$60,772 bilhões. No momento da publicação, o valor líquido total de ativos do ETF spot de Bitcoin era de US$150,408 bilhões, a proporção de ativos líquidos do ETF (valor de mercado como percentagem do valor total de mercado do Bitcoin) atingiu 6,61%, e o fluxo de entrada líquido acumulado histórico alcançou US$57,337 bilhões.
Compartilhar
PANews2025/09/30 11:57
STF reafirma que o FGTS deve ser corrigido pelo IPCA

STF reafirma que o FGTS deve ser corrigido pelo IPCA

Ministros determinaram que fórmula atual deve alcançar inflação ou Conselho Curador do FGTS deve criar compensação
Compartilhar
Poder3602026/02/19 10:10
Défice comercial dos EUA estabiliza nos dados do BEA; alegação tarifária testada

Défice comercial dos EUA estabiliza nos dados do BEA; alegação tarifária testada

Os dados do BEA e do FactCheck.org mostram que o impacto das tarifas é limitado; o superávit de serviços compensa a lacuna de bens. O défice comercial dos EUA é avaliado usando dados anuais e do acumulado do ano.
Compartilhar
CoinLive2026/02/19 10:00