L'API Managed Agents di Google promette un d…

Al Google I/O, il colosso ha annunciato l'introduzione di Managed Agents all'interno della sua API Gemini, una soluzione che promette di trasformare in una singola chiamata API settimane di lavoro per il deployment di agenti. Questo servizio è anche un segnale che Google ritiene che il suo ecosistema, che include il recentemente lanciato Antigravity CLI, sia pronto per gestire autonomamente il livello di esecuzione da inizio a fine.

Prima che un singolo agente venga scritto, le squadre dedicano giorni al lavoro non glamour: creare ambienti di esecuzione, gestire gli ambienti di sperimentazione, configurare l'infrastruttura per le chiamate ai tool. Fornitori di modelli come Anthropic hanno lanciato piattaforme che gestiscono gran parte di questo lavoro — ma l'approccio di Google è diverso.

Nel blog post pubblicato da Google, si sottolinea che gli agenti gestiti nell’API Gemini "astraggo la complessità in modo che possiate concentrarvi sull'esperienza del vostro prodotto e sul comportamento dell’agente". Il servizio è disponibile in anteprima tramite nuelli modelli personalizzati su Google AI Studio.

Un dibattito architetturale

Il crescente interesse nei servizi di agenti gestiti ha portato a una vera e propria discussione architetturale: dove dovrebbe risiedere la gestione degli agenti? All'interno del modello o del suo alloggiamento, oppure in un livello separato d'esecuzione?

Fino a poco tempo fa la gestione degli agenti dipendeva spesso da framework che stavano sopra al modello, orientandone l'esecuzione e permettendo alle squadre di gestire routing ed esecuzione separatamente. Oggi, però, questo strato è in via di assorbimento da parte stessa delle piattaforme.

Confronto con approcci concorrenti

Piattaforme recenti come Claude Managed Agents hanno integrato la gestione degli agenti a livello del modello, anziché su un piano esecutivo separato. L'idea è che il modello debba guidare sia ragionamento che orchestrazione, mentre le aziende mantengono controllo sull’infrastruttura di esecuzione. Analogamente, AWS ha aggiunto nuove funzionalità a Bedrock AgentCore con “managed harnesses” che coniscono le attività preliminari di deployment degli agenti.

L'approccio di Google va oltre, ottimizzando insieme modello, alloggiamento e sandbox, con tutto l’esecutivo funzionante all’interno di ambienti Google, gestiti in sicurezza.

René Sultan, di Ramp e citato nell'annuncio di Google, ha ritenuto che il cambiamento fosse concreto: "Il vero shift con Gemini Managed Agents è che il runtime dell'agente si sposta sulla piattaforma. Con sandbox, infrastruttura ed esecuzione che vengono gestite automaticamente, i developer possono concentrarsi sulla produzione del comportamento specifico dell’agente e lavorare a un ritmo completamente diverso".

La nuova realtà dell’orchestrazione

Le aziende che iniziano da zero con gli agenti possono trovare forti le offerte di piattaforma di Anthropic e Google, soprattutto perché rimuovono molto della difficoltà di deployment mantenendo comunque un certo grado di controllo. Google, però, sta spingendo verso un sistema più verticale, mentre Anthropic punta sul modello come piano di orchestrazione e AWS si concentra sull’autorizzazione.

Tuttavia, questa scelta comporta anche alcuni rischi, come ha sottolineato Arie Trouw, fondatore e CEO di XYO. "Un rischio supplementare è che i developer sostituiscano servizi deterministici con servizi probabilistici, introducendo esiti imprevedibili per gli utenti al meglio, o corruzione dei dati al peggio," ha scritto Trouw in un'email a VentureBeat. "Questa è l’esempio classico di quando si ha un martello straordinario e tutto comincia a sembrare un chiodo. Ho visto questo schema ripetersi diverse volte nel corso degli ultimi decenni, sia come sviluppatore, sia come fondatore di un’azienda."

Considerazioni finali

In sintesi, l'entrata in scena di Managed Agents promette di semplificare drasticamente il lavoro di deployment ma, al contempo, richiede una valutazione attenta da parte delle organizzazioni per non sacrificare troppa flessibilità e controllo. La decisione di affidarsi al livello di esecuzione piuttosto che ad un ambiente autonomo potrebbe avere implicazioni a lungo termine. Le aziende dovranno scegliere in base alla propria tolleranza al rischio e alla velocità di sviluppo richiesta.