Pular para o conteúdo
Inteligência Artificial

Drama Financeiro Multimodelo: Como Pequenos Modelos Criam Economias Virtuais Com

Drama Financeiro Multimodelo: Como Pequenos Modelos Criam Economias Virtuais Com

Imagine um mundo onde cada participante de uma economia virtual tem sua própria mente, seu próprio jeito de pensar. Não estamos falando de pessoas, mas de modelos de inteligência artificial, cada um vindo de um laboratório diferente. Pois é exatamente isso que o segundo relatório do Build Small Hackathon nos apresenta: uma simulação financeira onde você, o jogador, se torna o grande manipulador, o financiador sombrio que puxa os cordões.

A primeira versão desse experimento, batizada de Thousand Token Wood, era mais um “brinquedo” para observar. Criaturas da floresta, todas controladas por um único modelo de 0.5B, negociavam bens enquanto você observava bolhas e colapsos. Era interessante, mas faltava algo. Faltava a sua mão, a sua intervenção direta.

A versão 2.0, ah, essa sim mudou o jogo! Você agora é o Patrono da Floresta, um financista nas sombras. Empresta dinheiro a juros, sussurra dicas (verdadeiras ou falsas), manipula o mercado, suborna e forma alianças. Enquanto isso, um magistrado tenta te pegar por negociar com informações privilegiadas. E o mais fascinante? Cada criatura agora opera com um modelo de IA diferente, de laboratórios distintos. É uma verdadeira orquestra de inteligências artificiais em miniatura!

Heterogeneidade: O Ingrediente Secreto

A ideia de usar vários modelos não é só para ser diferente. Uma economia ganha vida e se torna interessante quando seus participantes têm visões e comportamentos genuinamente distintos. Quatro modelos de laboratórios diferentes, treinados com dados e pós-processamentos únicos, são o mais próximo que se pode chegar dessa diversidade em modelos pequenos. Pense na coruja que acumula de um jeito, e na raposa que especula de outro. É um debate vivo, não um roteiro pré-escrito.

O desafio real, curiosamente, não estava em fazer os modelos funcionarem juntos, mas na camada de serviço. Problemas como a necessidade do kit CUDA para compilar kernels no vLLM foram barreiras universais, resolvidas com uma única correção na imagem base. Cada modelo tinha suas peculiaridades, como a necessidade de trust_remote_code para o MiniCPM3, mas eram ajustes pontuais, uma linha de configuração aqui e ali.

O segredo para domar essa diversidade? Uma camada robusta de análise e reparo de JSON. Modelos diferentes, com seus tokenizadores e hábitos de formatação únicos, produzem saídas variadas. Essa camada consegue lidar com as imperfeições, garantindo que a simulação nunca trave. Construa essa base uma vez, e adicionar um novo modelo se torna tão simples quanto uma entrada de configuração.

Assimetria de Informação: O Muro Invisível

O cerne dramático da versão 2 é a dica privilegiada. Você pode sussurrar um segredo para uma criatura – pode ser uma previsão real do mercado ou uma isca. Agir com uma dica verdadeira e lucrar aumenta sua “temperatura” com o magistrado. Ultrapasse o limite, e uma investigação pode levar a multas, bens congelados ou até o exílio.

Para que isso funcione, a verdade da dica precisa ser um segredo absoluto para as criaturas. Elas veem o rumor, mas nunca o indicador de veracidade. Isso é uma questão de segurança, não apenas um detalhe de interface. E com modelos pequenos, é crucial: tudo que você coloca no prompt, o modelo pode repetir. Por isso, a bandeira de verdade vive fora do prompt, é removida dos registros públicos, e um teste rigoroso verifica a cada turno se nenhum token proibido vazou para os agentes. Se você dá uma informação secreta a um agente, presuma que ela vazará, a menos que um teste prove o contrário.

Memória: Drama Acessível com Limites

As criaturas mantêm relacionamentos persistentes: um sentimento em relação ao Patrono e entre si, influenciado por eventos. Uma criatura hostil recusa seus empréstimos; aliadas formam cartéis. O perigo aqui é a inflação do prompt. Um histórico ilimitado afogaria um modelo pequeno.

A solução é simples: nunca coloque o histórico completo no prompt. O modelo vê um resumo conciso, como “você sente carinho por Oona, cautela pelo Patrono”, limitado aos sentimentos mais fortes, derivados de um valor numérico. Notas detalhadas são mantidas para rastreamento, mas nunca mostradas ao modelo. O comportamento resultante é parcialmente emergente (o resumo influencia o modelo) e parcialmente mecânico (uma criatura muito hostil recusa deterministicamente), tornando-o observável e testável. É uma forma engenhosa de ter memória sem sobrecarregar os pequenos cérebros de IA.

Uma simulação com a mecânica completa da v2 demonstrou resultados impressionantes: 0% de vazamentos da bandeira de verdade das dicas, mesmo com a varredura de todos os prompts. A capacidade de um modelo de 0.5B de gerar ofertas válidas em 100% dos casos, superando seu “professor” de 3B, é um testemunho do poder da engenharia inteligente.

Fonte: https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim-v2

Relacionados

Continue lendo

Automatize com a OctoSys

Da ideia a automacao rodando

Falou no WhatsApp hoje, a gente devolve um plano no mesmo dia. Sem compromisso.