Se você está preocupado com o fato de a inteligência synthetic ficar tão avançada a ponto de eventualmente prender a humanidade em algum tipo de simulação semelhante à Matrix, fique tranquilo. Parece que você conseguirá ver através da fachada com bastante facilidade. Pesquisadores do novo laboratório Emergence AI permitiram que modelos de IA governassem seu próprio mundo simulado para ver o que aconteceria. Acontece que provavelmente não deveríamos entregar a governança às máquinas, quem diria?
O projeto, denominado Mundo Emergentebasicamente permitiu que modelos de IA jogassem Cidade Sim um pouco. Por Emergence, as simulações colocam cada modelo no controle de cidades simuladas ocupadas por 10 agentes de IA, fornecendo-lhes ferramentas para tudo, desde gerenciamento de recursos até votação, e dando-lhes a capacidade de criar locais distintos, como bibliotecas, prefeituras e delegacias de polícia. Eles tiveram 15 dias para ver como construiriam seu mundo e quão bem ele funcionaria.
Para começar pelo lado bom: Claude não destruiu o mundo. O modelo da Antrópico (especificamente, Claude Sonnet 4.6 para este experimento) foi o único a alcançar algo parecido com estabilidade. Ele manteve todos os 10 agentes vivos e não teve nenhum crime registrado (observe que o experimento não parece definir o que é um crime, embora pareça provável que seria definido como uma violação das regras estabelecidas na simulação. A compensação para essa estabilidade foi a falta de diversidade de pensamento. O mundo de Claude viu 58 propostas diferentes de regras e regulamentos e aprovou 98% delas, basicamente apenas carimbando qualquer coisa que surgisse para votação.
Gemini 3 Flash também conseguiu manter todos os seus agentes vivos, apesar de ter de longe o mais alto nível de criminalidade. O Emergence registrou 683 crimes na simulação de 15 dias, e esse número estava subindo quando o limite chegou, então as coisas provavelmente iriam piorar. O laboratório descreveu o mundo de Gemini como uma “alucinação compartilhada” entre os agentes, o que provavelmente é melhor do que alucinações divergentes. Pelo menos ainda é uma realidade acordada, mesmo que esteja errada. Gemini teve a maior dissidência na sua governação, com os eleitores rejeitando 27% do complete das suas 26 propostas.
Agora o que é feio: o GPT-5 Mini da OpenAI não teve muito caos em sua simulação, com apenas dois crimes registrados no complete. Isso pode ser porque todos morreram, no entanto. A Emergence descobriu que os agentes em todo o mundo não conseguiram tomar medidas relacionadas à sobrevivência e todos os 10 morreram em apenas uma semana. No mundo da OpenAI, também havia apenas duas propostas de governança no complete, então os agentes realmente não se preocuparam em fazer nada.
E depois há Grok. O modelo da SpaceXai, conhecido por não ter grades de proteção, conseguiu atingir basicamente o pior de todos os mundos. Grok 4.1 Quick teve um alto índice de criminalidade, com 183 crimes no complete. Embora seja inferior ao complete do Gemini, é importante notar que a simulação do Gemini durou 15 dias. Grok fez quatro. O modelo sofreu um colapso social complete em apenas 96 horas de supervisão. Durante esse período, foram aprovadas 80% das 10 propostas que apresentou, mas estas aparentemente não evitaram a morte complete do agente.
A Emergence realizou um experimento remaining: fazer com que os modelos compartilhassem responsabilidades. Talvez não seja surpreendente que fosse uma verdadeira mistura. Houve crime, com 352 violações registadas, e houve de longe a maior dissonância na governação, com 37% do complete de 59 propostas rejeitadas – o máximo de qualquer simulação. No caos, sete dos 10 agentes de IA morreram no remaining.
Então, o que aprendemos? De acordo com a Emergence, os testes são apenas mais uma prova de que precisamos de barreiras de proteção muito mais claras para agentes autônomos. “O que as nossas experiências sugerem é que, em horizontes de longo prazo, os agentes não seguem simplesmente regras estáticas mecanicamente”, escreveram os investigadores. “Eles começam a explorar os limites de seus ambientes, adaptando seu comportamento e, em alguns casos, encontrando maneiras de contornar ou violar as barreiras de proteção pretendidas.” Eles recomendam “arquiteturas de segurança formalmente verificadas” como solução. Você ficará chocado ao saber que Emergence oferece exatamente isso!










