Pular para o conteúdo
Automação

AWS OpenSearch Serverless: Infraestrutura para a Era dos Agentes de IA

AWS OpenSearch Serverless: Infraestrutura para a Era dos Agentes de IA

A infraestrutura de nuvem, por muito tempo, foi moldada pensando em usuários humanos. A gente clica, rola a tela, assiste vídeo. Um padrão até que previsível. Mas os agentes de IA são outra história. Eles podem gerar um pico absurdo de atividade, disparando sub-agentes que consultam centenas de bancos de dados e APIs em segundos, e depois simplesmente desaparecem. Isso não é novidade para quem mexe com automação.

Com essa realidade em mente, a Amazon está reformulando partes cruciais de sua infraestrutura. Recentemente, a AWS lançou sua nova geração do OpenSearch Serverless. É um serviço gerenciado de busca e banco de dados vetorial, feito sob medida para cargas de trabalho de agentes. A promessa é clara: escalar instantaneamente quando os agentes disparam tarefas e reduzir para zero quando não há uso.

Essa movimentação da AWS reflete uma percepção crescente na indústria: a infraestrutura feita para um mundo focado em humanos não aguenta o tranco com o volume de agentes. Embora os agentes de IA ainda sejam uma fatia menor do tráfego total, o tráfego gerado por máquinas já é significativo e só tende a crescer. A Cloudflare, por exemplo, reportou que bots foram responsáveis por 31% do tráfego HTTP nos últimos seis meses. Crawlers de IA, mecanismos de busca e assistentes representaram cerca de um quarto dessas requisições de bot.

Lai Yi Ohlsen, gerente de produto sênior na Cloudflare, projeta que o tráfego não-humano vai superar o humano na primeira metade de 2027. No Google I/O, a gigante da busca mostrou como usuários poderão delegar tarefas a sistemas de IA, como pesquisar produtos ou planejar viagens. Mas não é só no consumo. Empresas estão usando agentes internamente e para clientes, gerando um novo tipo de tráfego de máquina para máquina.

É nesse cenário que o novo OpenSearch Serverless da AWS se encaixa. Tia White, gerente geral do Amazon OpenSearch Service, explicou que os agentes estão saindo da fase de experimentação e indo para produção, criando padrões de tráfego que a infraestrutura anterior não suportava. Eles têm picos sem aviso e ficam ociosos de repente. Empresas precisam de busca que acompanhe isso sem pagar por capacidade ociosa.

A grande sacada técnica dessa nova versão é o desacoplamento da computação do armazenamento. Isso permite que a computação escale em segundos para picos de tráfego de agentes e reduza a zero, o que significa custo zero quando os agentes estão parados. Antes, mesmo na versão Serverless anterior, era preciso ter pelo menos uma instância rodando, pois armazenamento e computação eram acoplados. Era como pagar por uma vaga de estacionamento mesmo quando você não está usando.

No lançamento, o OpenSearch Serverless vai integrar com plataformas de desenvolvimento de IA como Vercel e Kiro. Isso facilita para desenvolvedores implantarem backends de busca e vetoriais para agentes sem precisar gerenciar a infraestrutura. Essa tendência não é exclusiva da AWS. Databricks e Snowflake estão se posicionando como sistemas de memória e recuperação para dados empresariais. A Microsoft atualizou o Azure para lidar com picos de agentes de IA e compartilhar memória entre eles. A Cloudflare, seguindo a mesma linha, lançou infraestrutura para ambientes persistentes e escalabilidade instantânea para agentes.

Quanto mais empresas adotam agentes de IA, maior a pressão para redesenhar a infraestrutura para cargas de trabalho geradas por máquinas. Isso, por sua vez, pode tornar os agentes mais baratos e fáceis de implantar em larga escala. É a automação da automação, e a infraestrutura precisa estar pronta.

Fonte: https://techcrunch.com/2026/05/28/the-internet-is-being-rebuilt-for-machines/

Relacionados

Continue lendo

Automatize com a OctoSys

Da ideia a automacao rodando

Falou no WhatsApp hoje, a gente devolve um plano no mesmo dia. Sem compromisso.