D&b Haas Ha Ricostruito Il Database Di 642 M…

La Commercial Graph di Dun & Bradstreet ha rappresentato, per oltre 180 anni, un riferimento per l'analisi creditizia, la gestione del rischio e le strategie di vendita. Con un database che include 642 milioni di aziende e le loro relazioni, gerarchie e profili di rischio, il sistema era stato progettato per gli umani. Il ritmo lento dei credit analysts, la gestione dell'ambiguità da parte dei gestori di rischi e l'applicazione del marketing erano fattori considerati. Quando, però, le aziende hanno cominciato ad avviare agenti autonomi di AI in ambiti come credito, acquisti e catena di fornitura, il vecchio modello ha mostrato i limiti: per gli umani funzionava, ma per le macchine no.

Perché il sistema originale ha fallito per gli agenti AI

Il problema non stava nella semplice struttura del database, ma nella sua architettura frammentata. La Commercial Graph era in realtà una raccolta di sistemi diversi, ciascuno progettato per funzioni specifiche e mercati regionali diversi. Gli analisti umani usavano query SQL o interfacce predefinite per navigare in questa frammentazione. I nuovi agenti autonomi, invece, non potevano farlo. Essi necessitano di latenze molto basse e di dati strutturati in modo coerente.

Il problema era anche di massa: il database era cresciuto di quasi il doppio in cinque anni, passando da 300 milioni a 642 milioni di record aziendali. Ogni record aveva fino a 11.000 campi, con D&B che effettuava circa 100 miliardi di verifiche mensili. Non era possibile interrogare in tempo reale un sistema così vasto e frammentato, soprattutto per agenti che non potevano aspettare.

Gli agenti necessitavano inoltre di informazioni dinamiche. I sistemi legacy registravano relazioni statiche, per esempio un collegamento tra un CEO e una sua azienda. Ma gli agenti che effettuano analisi sul credito o rischi terzi hanno bisogno di tracciare mutamenti. Cosa accade quando il CEO si trasferisce in un’altra azienda? Come si propaga il cambiamento di proprietà di una controllata? I vecchi sistemi necessitavano di lavoro manuale personalizzato per gestire questi aspetti, un’operazione impraticabile per le macchine.

Come hanno ricostruito il sistema

La soluzione di Dun & Bradstreet ha richiesto una riconsiderazione completa. Inizialmente hanno consolidato i loro vecchi database, migrandoli su infrastrutture cloud, riconfigurando i dati a livello strutturale e costruendo una “data fabric” per normalizzare i record internazionali in modo conforme alle normative locali.

Un Graph unificato di conoscenza

Il risultato è un knowledge graph unificato che traccia miliardi di relazioni tra le 642 milioni di aziende e che viene costantemente aggiornato e arricchito tramite algoritmi AI. Questo sistema permette di mantenere la complessità dei dati, ma in una forma accessibile rapidamente.

Strato di accesso strutturato

Su questa base è stato creato uno strato di accesso strutturato per gli agenti. L’accesso diretto tramite SQL era irrealizzabile a causa delle esigenze di latenza. D&B ha quindi creato strumenti accessibili tramite MCP (Management Console for Professionals), dove i dati sono forniti contestualizzati per il tipo di query effettuata. Una macchina per risolvere corrispondenze e identità risiede dietro ogni richiesta, assicurando che l’output corrisponda a una realtà precisa, non solo ad una corrispondenza per nome.

Risolto il problema di identità

L’architettura rinnovata ha risolto il problema del recupero dati, ma ha toccato un altro tema cruciale: l'autenticazione. Un sistema costruito per gli umani non è facilmente estendibile a macchine autonomi. Dun & Bradstreet ha introdotto un modello di registrazione per agenti. Ogni agente deve registrarsi con un IP verificato e chiave di accesso unica, simile al modello di autenticazione per gli umani.

“Abbiamo il concetto equivalente del Know Your Customer, ma applicandolo agli agenti. Si chiama Know Your Agent”, ha detto Gary Kotovets, Chief Data and Analytics Officer di D&B. Il sistema non si limita a verificare l'identità in entrata, ma fornisce un meccanismo per gestire l'incongruenza nell'outbound. Quando più agenti partecipano a uno stesso workflow ma finiscono per analizzare dati diversi, serve un passo obbligatorio di verifica dell'entità.

Verifica dell'entità come riferimento fisso

D-B ha introdotto un agente dedicato di verifica, integrabile in qualsiasi workflow come elemento persistente. Questo agente utilizza il protocollo A2A di Google per garantire compatibilità con qualsiasi strumento di orchestrazione adottato dai clienti.

Quattro fattori per aziende che implementano agenti autonomi

Lavorando a questo riprogettare, Dun & Bradstreet ha individuato quattro elementi fondamentali per le aziende che adottano agenti autonomi.

1. Fondamenti dati prima dell’infrastruttura dei agenti

I CDO e i CIO con cui hanno collaborato hanno tutti menzionato lo stesso problema: non poter creare l’infrastruttura AI desiderata finché i dati non sono strutturati, normali e accessibili. D&B aveva già una base solida, ma molte aziende non ce l’hanno. Questo diventerà un problema cruciale.

2. Progetta relazioni dinamiche, non statiche

I sistemi tradizionali registrano punti di connessione istantanei come “una persona che appartiene a un’azienda”, ma la logica degli agenti necessita informazioni che mutano nel tempo. Se il dato non traccia l'evoluzione, l’agente lo riprodurrà in modo errato.

3. Integra controlli di coerenza entità in workflow multi-agent

Quando diversi agenti lavorano su un singolo ente, la garanzia che siano sempre riferiti al medesimo record è essenziale. I controlli di verifica dell'entità non possono essere considerati opzionali. Devono essere parte attiva della progettazione del workflow.

4. Includi la tracciabilità del dato fin dall’inizio

Ogni risposta AI prodotta da un agente deve poter tornare al suo punto di origine. Nell’ambito di analisi finanziarie, di rischio o di catene di fornitori, un errore potrebbe avere conseguenze concrete. La tracciabilità del dato non deve essere aggiunta dopo problemi emergenti. Deve far parte della struttura iniziale.

“Fin da subito avevamo chiaro da dove veniva ogni dato, e potevamo tracciare la catena fino alla fonte originale. Questo ha rappresentato la chiave per lo sviluppo di nuove capacità