Resolve AI afferma che l'ondata di codifica …

Resolve AI, startup di operazioni in produzione finanziata da Greylock e Lightspeed Venture Partners, ha annunciato oggi un ampliamento significativo della sua piattaforma, introducendo agenti attivi in background, una nuova architettura per le indagini e uno spazio condiviso dove ingegneri e agenti AI collaborano in tempo reale per risolvere incidenti. La novità principale è un nuovo sistema di indagine multi-agente sviluppato in-house. Invece di utilizzare un singolo AI per diagnosticare un errore in ambiente di produzione, il sistema invia ora una squadra di agenti specializzati che indagano su diverse ipotesi in parallelo, verificano autonomamente le conclusioni l’uno dell’altro e creano catene causali complete, passando da una causa radice fino al sintomo.

Il CEO e fondatore, Spiros Xanthos, ha illustrato il nuovo approccio a VentureBeat, spiegando che invece di un singolo agente come in precedenza, adesso la piattaforma è simile a una squadra di ingegneri che cercano di risolvere un problema. Xanthos ha affermato che il sistema ha portato a un miglioramento di oltre il 200% nella capacità di identificare la causa radice rispetto alle versioni precedenti della piattaforma di Resolve AI.

L’annuncio segue il boom delle tecnologie di coding assistite da AI, che ha permesso alle squadre di sviluppo di produrre codice molto più veloce rispetto al passato. Tuttavia, mantenere quel software funzionante, monitorare i problemi e garantire la salute operativa del sistema rimane un lavoro manuale estremamente impegnativo. La startup, che ha raccolto 125 milioni di dollari in Serie A con una valutazione di un miliardo di dollari inizialmente, punta a risolvere proprio questo problema, considerando che l'operatività dei software in produzione è la prossima grande frontiera per l’AI.

Casi reali e valutazioni di accuratezza

Il claim sull’aumento del 200% in accuratezza richiede un esame attento. Xanthos è stato sincero sulle dimensioni e i limiti della valutazione: il dato proviene da benchmark in-house e non da un’audizione esterna, anche se il set di casi di valutazione è stato costruito per rappresentare fedeltà al complesso lavoro che le aziende enterprise gestiscono ogni giorno.

Xanthos ha spiegato che le valutazioni non sono dati dei clienti direttamente, ma casi difficili simili a quelli che hanno incontrato alcune delle aziende tech più grandi con cui operano: Coinbase, Salesforce, DoorDash e Zscaler. Si tratta di aziende clienti di Resolve AI. I nuovi agenti AI adesso agiscono come primi risponditori per ogni allarme, di solito triaging entro cinque minuti prima che un ingegnere debba intervenire. Prima i dati mostravano tempi di riduzione della causa radice fino al 87 percento per aziende come DoorDash.

Perché è così importante

"Quando qualcosa va male, può volerci da cinque a dieci minuti solo per che un ingegnere si sieda al computer e si colleghi", ha affermato Xanthos. "Il MTTR medio si attesta attorno a decine di minuti, talvolta ore. Un miglioramento di otto o nove volte è enorme. Non l’abbiamo mai ottenuto prima, nemmeno con AI, strumenti, dati e osservabilità". Il risparmio di tempo e di lavoro manuale apre la possibilità di fare più innovazione senza compromettere la stabilità.

Come gli agenti AI si verificano a vicenda

Uno dei rischi principali dell'uso di modelli linguistici su sistemi operativi critici è la tendenza a produrre risposte plausibili ma errate, che possono portare l’ingegner team a un fallimento. Xanthos ha riconosciuto questo problema di base: "I modelli di AI tendono sempre a dare una risposta, anche quando mancano prove. Spesso, la risposta più probabile è sbagliata".

Per prevenire errori, Resolve ha implementato un sistema di verifica tra gli agenti. Ogni agente deve citare ogni pezzo di una prova utilizzata e presenta le sua analisi a un altro agente per una verifica indipendente. Deve formare una catena completa di causalità, e i agenti peer tentano attivamente di smentire le teorie, individuando lacune logiche.

Ciò ha portato a un meccanismo dove spesso gli stessi agenti si contraddicono, scoprendo nuovi errori. Xanthos ha sottolineato l'enfasi sull'esito positivo del sistema AI di non essere un "black box". A volte, il sistema afferma che non ha abbastanza prove, fornendo percorsi alternativi che gli ingegneri possono seguire. In settori dove gli errori possono causare problemi operativi, l’incertezza calibrata può essere più utile rispetto a una risposta confidente.

Agenti di fondo di lavoro continuo

Oltre agli agenti di risposta agli incidenti, Resolve AI introduce una nuova classe di agenti background che gestiscono il lavoro continuo che le squadre di engineering devono sostenere ma spesso falliscono. Questi agenti vengono eseguiti automaticamente in risposta a eventi — nuovi deploy, alert generati, pull request completate — e accumulano una knowledge base di dati operativi. Quando un ingegnere apre l'interfaccia di Resolve AI, gli agenti hanno già iniziato a investigare: monitorando deployments, analizzando alert, verificando costi e flaggando problemi di configurazione.

Le differenze tra incident response e agenti background

"Puoi ora attivare questi agenti in background sempre — non solo quando viene richiesto un problema specifico, o un alert è attivato", ha spiegato Xanthos. "Molti dei nostri clienti monitorano ora i cambiamenti in produzione prima che causino errori. C’è un agente che lo fa continuamente". L’idea è di rendere più scalabile e sostenibile il lavoro delle operations, che è sempre fondamentale ma spesso trascurato a causa delle priorità per lo sviluppo di nuove funzioni. Questi agenti general-purpose, ha detto, possono gestire una serie di compiti, da controlli di budget e costi su nuovi deployment a attività di post-incidenti come correttivi basati su informazioni raccolte.

Spazio condiviso dove ingegneri e agenti investigano insieme

Un’altra novità chiave è una superficie di indagine condivisa, un workspace in cui ingegneri e agenti AI lavorano insieme durante gli incidenti in tempo reale. Gli agenti forniscono informazioni dinamiche, e ogni elemento rilevato durante l’indagine si aggiorna in tempo reale. Questo spazio condiviso, ha spiegato Xanthos, consente di risolvere complessi problemi operativi come il monitoraggio di nuovi cambiamenti, l’analisi degli alert o il lavoro di follow-up post incidente, in collaborazione.