Dove gli agenti AI funzionano davvero: la ma…

Gli agenti AI non sono una categoria uniforme. Alcune funzioni aziendali li vedono già produrre valore tangibile da oltre un anno, altre sono terreno di sperimentazione con risultati incerti, mentre altre ancora restano prematuramente promettenti. Una mappa onesta delle aree dove gli agenti producono valore e quelle dove non lo fanno è il contributo più utile che una guida possa offrire ai decisori.

I dati di partenza

Secondo un'analisi enterprise del 2026, il 79% delle organizzazioni utilizza agenti AI per diversi scopi, mentre il 66% riporta miglioramenti misurabili in produttività. Il 62% si aspetta un ROI superiore al 100% nei prossimi diciotto mesi. Numeri rilevanti, ma spesso concentrati in funzioni specifiche.

I casi documentati mostrano che i ROI più rapidi si registrano quando i processi sono ripetitivi, le decisioni rientrano in poche categorie e l’output può essere verificato facilmente. Diversamente, dove sono richiesti giudizio, relazioni umane o creatività, gli agenti AI hanno limiti evidenti rispetto alle aspettative di alcuni fornitori.

Workflow documentali

I workflow documentali rappresentano uno dei casi d'uso più maturi per gli agenti AI. Rappresentano un ampio insieme di documenti strutturati o semi-strutturati in entrata verso un’azienda. Esempi comuni include fatture, contratti, capitolati, polizze assicurative, certificati di conformità, referti medici, ecc.

L’agente aiuta a classificare, validare, sintetizzare e instradare il tutto. Funziona bene perché il dominio è limitato, le decisioni nette, e l’output verificabile. Studi BCG-Forrester del 2026 citano riduzioni del tempo di elaborazione del 60-80% sui workflow standard, con un periodo di payback medio di 5,1 mesi.

Esempio concreto: Un agente per il ciclo passivo riceve una fattura, estrae dati strutturati, confronta con l’ordine in ERP, segnala eventuali difformità, propone la registrazione automatica e sospende le fatture sopra una soglia per approvazione umana.

Altro esempio: Un agente per le gare MEPA riceve un capitolato, lo confronta con la base di conoscenza, abbozza risposte tecniche da mandare al gara manager.

Per la PA: Un agente gestisce istanze in ingresso, le instrada e le sintetizza per il dirigente.

Cosa è prematuro

Non va bene la generazione autonomi di contratti complessi, la negoziazione di clausole legali né l’interpretazione di linguaggio ambiguo in documenti. Le decisioni di alto valore o con giudizio legale restano umane almeno fino al 2026.

Cosa è sopravvalutato

I vendor spesso promettono una completa automatizzazione. In realtà, in un piano reale, i sistemi automatizzano il 60-80% del volume e lascia il 20-40% al lavoro umano. I fornitori che promettono il 95% di automazione spesso escludono i casi difficili o propongono soluzioni che falliscono fuori dagli schemi addestrati.

Più utile, per valutare un'offerta: chiedi al fornitore i tassi di errore su documenti veri del cliente e non sull’insieme di benchmark. È qui che si gioca la differenza tra una soluzione che funziona davvero e una che fa bene solo in demo.

Un dettaglio cruciale

La gestione delle eccezioni è spesso sottovalutata. Un buon agente non si limita a classificare: monitora il risultato delle proprie azioni, segnala le discrepanze con il feedback umano successivo e alimenta un ciclo di miglioramento continuo. Senza questo loop, l’agente perde efficacia nel tempo.

Questo aspetto è rilevante soprattutto per le aziende in settori con un turnover documentale alto, come logistica o retail. Si calcola che rappresenti almeno il 30% del valore di lungo periodo.

Customer Operations

Customer operations è una funzione dove gli agenti producono ROI rapido, ma è anche l’area dove le aspettative spesso si scontrano con la realtà. Bisogna distinguere tre livelli di sofisticazione.

Il livello base

Rispondere a domande frequenti o richieste semplici: stato di un ordine, modifiche dati personali, riepilogo contratto, reset di password. Funziona bene. Klarna riporta, per esempio, 60 milioni di dollari di risparmi entro il terzo trimestre 2025, con l'equivalente di 853 dipendenti gestiti da agenti.

Il livello intermedio

Gestire casi complessi con accesso a strumenti come il CRM. L’agente analizza i dati, formula una proposta e la sottopone a un operatore umano per validazione. Per esempio, l’agente “concierge” di Google Cloud permette a Manhattan Associates di accelerare il workflow warehouse o order management.

Il livello avanzato

Gestione end-to-end di casi complessi e autonomi. Qui spesso le aspettative superano le effettive capacità. Klarna ha sperimentato un fallimento con agenti AI a gestire reclami emotivamente carichi e ha reintrodotto operatori umani. La lezione? L’agente è efficace sui casi standard, mentre crea valore aggiunto quando supporta l’umano sui casi non standard.

Un caso emblematico

Klarna è uno dei pochi esempi pubblici di reverse strategico su larga scala. Aveva inizialmente puntato su un servizio clienti completamente AI, ma ha dovuto correggere la rotta: il 5-15% dei casi, che non erano standard, ha causato una perdita di fiducia nei clienti. La strada vincente oggi è un modello ibrido, in cui l’agente gestisce il volume standard con alta precisione e l’umano si occupa dei casi complessi.

Limiti nel customer service

Cosa è prematuro? L’uso per gestire reclami con escalation emotiva o per richieste che coinvolgono aspetti legali pesanti. L’agente AI non ha il contesto emotivo per rispondere in modo percepito come rispettoso.

Roadmap per le PMI italiane

Per le imprese italiane, una roadmap di 90 giorni potrebbe includere:

0-30 giorni: Valutazione dei workflow documentali più ripetitivi (fatture, gare, certificati) e studio dei volumi. Costruzione di un piano pilota con un fornitore.

30-60 giorni: Attivazione dell’agente AI su workflow selezionati; messa a punto di metriche di misura (tempo di elaborazione, errori, rid