Nos últimos dez anos, a inteligência artificial cresceu alimentando-se principalmente do mesmo recurso.Nos últimos dez anos, a inteligência artificial cresceu alimentando-se principalmente do mesmo recurso.

Dados de Fronteira e IA Física: a nova corrida ao ouro da inteligência artificial (e por que a blockchain se torna indispensável)

2025/12/04 02:00

Na última década, a inteligência artificial cresceu alimentando-se principalmente do mesmo recurso: dados públicos da web. Textos, imagens, documentos, fóruns, notícias, blogs, repositórios... uma enorme quantidade de material que os modelos absorveram para construir suas habilidades linguísticas e cognitivas. Mas esta fase está prestes a terminar.

De acordo com projeções citadas pela Messari, a quantidade total de texto público disponível para treino de modelos—aproximadamente 300 trilhões de tokens—poderá estar completamente esgotada entre 2026 e 2032. Isto significa que os grandes modelos "devoraram a internet", e agora precisam de algo mais. A próxima fronteira para a IA já não será a web: será o mundo real.

E é aqui que entra em jogo o conceito de dados de fronteira, o recurso que definirá a competitividade dos modelos futuros. Vídeo, áudio, dados sensoriais, motores, dados robóticos, dados de ação, dados gerados da interação com o mundo físico ou interfaces digitais complexas. Dados que não podem ser simplesmente descarregados: devem ser recolhidos, coordenados, verificados e, sobretudo, incentivados.

Por esta razão, a blockchain não é um detalhe ou uma adição marginal: é a infraestrutura que permite a orquestração desta nova economia de dados.


O Fim do "Web Scraping" e o Início dos Dados de Alto Valor

Os modelos mais avançados de 2025—não apenas linguísticos, mas também multimodais, agênticos e orientados ao raciocínio—já não melhoram com a mera adição de conjuntos de dados textuais genéricos. Eles requerem algo muito mais específico e muito mais caro de recolher: dados que refletem ações, intenções, movimento, interação, manipulação, contexto.

Este é o caso, por exemplo, dos agentes de uso de computador, IA capaz de interagir diretamente com o computador como um humano faria. Para treinar estes sistemas, descrições textuais não são suficientes: são necessárias "trajetórias", que são gravações reais de pessoas realizando tarefas no ecrã.

Um protocolo como o Chakra, mencionado no relatório, desenvolveu uma extensão que permite aos utilizadores gravar o seu ecrã enquanto realizam tarefas diárias: navegar num sistema de gestão, preparar um documento Excel, editar imagens, usar software profissional. Estas gravações tornam-se material inestimável para treinar modelos como o GLADOS-1, o primeiro modelo de uso de computador construído quase inteiramente com dados crowdsourced.

E este é precisamente o ponto: estes dados não existem até que alguém os produza. E devem ser pagos. Tal como se paga pela energia ou pela inferência.


O Valor Crescente dos Pares Gameplay-Ação

Outro exemplo impressionante vem do mundo dos jogos. Uma plataforma como a Shaga, nascida como uma rede descentralizada de jogos na nuvem, produz um subproduto extremamente valioso: os chamados Pares Gameplay-Ação (GAP), que são pares sincronizados do que acontece no ecrã e os comandos que o jogador emite.

Estes são dados que não podem ser recuperados simplesmente assistindo a vídeos no YouTube: precisam ser capturados na fonte, no dispositivo do jogador. E este tipo de conjunto de dados, segundo estimativas relatadas pela Messari, pode valer até $50–$100 por hora de gameplay.

Para contextualizar: a Shaga já acumulou mais de 259.000 horas de gameplay, com um valor estimado de mais de 26 milhões de dólares. E não é coincidência que a OpenAI, um ano antes, tenha oferecido meio bilião para adquirir a Medal, uma plataforma similar especializada precisamente na gravação de gameplay.

Estes dados são usados para treinar modelos de mundo, modelos que não apenas interpretam a linguagem, mas simulam física, causalidade e interação agente-ambiente. Estes são os modelos que permitirão robôs mais inteligentes, agentes autónomos, sistemas avançados de previsão e IA capaz de "mover-se" em ambientes complexos.


IA Física: inteligência entrando no mundo físico

E é precisamente aqui que chegamos à segunda grande onda de dados de fronteira: dados robóticos.

A IA do futuro não residirá apenas em centros de dados. Viverá em robôs, drones, carros autónomos, sensores distribuídos e dispositivos domésticos inteligentes. Cada robô precisará de dados para aprender a mover-se, identificar objetos, tomar decisões e manipular ambientes. E esta recolha de dados é incrivelmente dispendiosa: requer hardware físico, operadores humanos para teleoperação, manutenção contínua e coordenação.

Projetos como PrismaX, BitRobot, GEODNET e NATIX estão a começar a usar mecanismos incentivados típicos da Web3 para distribuir este custo por uma rede global de contribuidores. Em vez de ter uma única empresa a recolher dados robóticos, milhares de utilizadores podem fazê-lo de forma coordenada, recebendo compensação direta.

É a mesma lógica da mineração: mas em vez de poder computacional, aqui a contribuição são os dados reais.


Coordenação máquina-a-máquina: quando a IA age no mundo real

Se robôs e agentes de IA realmente começarem a interagir com o mundo físico, é necessário um nível completamente novo de coordenação. Os robôs precisarão de:

  • identificar-se mutuamente,
  • transacionar pagamentos,
  • comprar serviços,
  • consumir dados,
  • executar tarefas de forma verificável,
  • demonstrar ter realizado uma ação,
  • confiar em registos partilhados de identidade e reputação.

É aqui que surgem iniciativas como OpenMind e Peaq, tentando construir uma infraestrutura on-chain dedicada à comunicação e identidade dos robôs. Um equivalente do DNS, mas para máquinas. Um sistema onde drones, carros autónomos, braços robóticos ou sistemas industriais podem sinalizar a sua presença, certificar as suas ações, pagar outros sistemas e trocar serviços.

É o início da economia das máquinas, uma economia povoada por entidades não-humanas que interagem autonomamente em redes descentralizadas.


Dados Reais Certificados: O Papel da IoTeX e Redes DePIN

O relatório também coloca foco significativo na IoTeX, um protocolo que nos últimos anos transformou a sua infraestrutura numa plataforma abrangente para a recolha, certificação e orquestração de dados do mundo real.

A IoTeX permite a conexão de sensores, dispositivos IoT, sistemas domésticos e equipamentos industriais, fornecendo:

  • uma identidade on-chain verificada para cada dispositivo,
  • um sistema de agregação de dados,
  • um nível de atestação criptográfica via ZK,
  • APIs que permitem aos agentes de IA utilizar esses dados em tempo real.

Hoje, a IoTeX coordena mais de 16.000 dispositivos e dezenas de projetos verticais, proporcionando aos agentes de IA a capacidade de aceder a dados verificados do mundo real. Uma diferença significativa em comparação com o simples scraping.


O Ponto Final: Dados como um Ativo Financeiro

Segundo a Messari, a trajetória é clara: os dados estão a tornar-se um ativo financeiro em todos os aspetos. Assim como hoje se pode investir em computação, GPU e colocação, no futuro será possível investir em "fluxos de dados", comprar direitos de uso, apoiar redes que recolhem dados de fronteira e, em troca, receber retornos económicos.

É uma evolução quase inevitável: se os dados se tornarem escassos, valiosos e difíceis de produzir, então terão um mercado, um preço, procura e oferta.

A Blockchain, mais uma vez, é a camada ideal para:

  • coordenar esta economia,
  • verificar a sua integridade,
  • rastrear a proveniência,
  • distribuir as compensações,
  • proteger os utilizadores,
  • apoiar a escalabilidade global.

Conclusão

A IA não avançará através de modelos cada vez maiores, mas através de dados mais ricos, provenientes do mundo real e recolhidos via redes globais de contribuidores. É a maior corrida ao ouro da próxima década: não a dos chips, mas a dos dados.

Os protocolos Web3 não são um mero detalhe: são a plataforma natural para recolher, verificar, distribuir e compensar aqueles que fornecem estes dados. Se a web foi a matéria-prima da primeira onda de IA, o mundo real será a matéria-prima da segunda.

E desta vez, pela primeira vez, a recolha não será controlada por poucos gigantes, mas pelas redes.

Redes abertas, incentivadas, descentralizadas: a nova infraestrutura dos dados de fronteira.

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.