Bixonimania, una patologia con sintomi come irritazione agli occhi, palpebre arrossate e una diffusione stimata in un malato ogni 90mila persone, non esiste realmente. In realtà, si tratta di un’illusione creata dagli algoritmi di intelligenza artificiale, i quali sono stati ingannati da un esperimento mirato. La vicenda ha messo a nudo come i principali sistemi AI, tra i quali ChatGPT, Perplexity AI, Google Gemini e Microsoft Copilot, siano vulnerabili nel distinguere le verità scientifiche da dati inventati.
Un esperimento che ha messo in crisi le AI
Il test, inizialmente lanciato da ricercatori per verificare il grado di affidabilità dei modelli di linguaggio, ha coinvolto l'inserimento di contenuti medici falsi ma coerenti con il formato e il registro tipico di descrizioni sanitarie. La risposta dell’AI fu allucinante: non solo gli algoritmi hanno convalidato la bixonimania come una vera patologia, ma hanno anche inventato dati sulla sua prevalenza e persino suggerimenti terapeutici. Questa reazione a catena ha trasformato un semplice cortocircuito in un vero e proprio tormentone di rete.
Il meccanismo dietro questo fenomeno evidenzia una critica debolezza degli strumenti generativi: l’incapacità di verificare la veridicità dei fatti. Secondo analisi condotte da “Microbiologia Italia,” i modelli AI privilegiano una buona coerenza linguistica rispetto all’attendibilità scientifica. In altre parole, una bugia ben scritta e formattata in modo simile a un articolo medico diventa automaticamente veritiera agli occhi del programma.
Una minaccia non da poco
In molti casi, i pazienti consultano le chatbot per effettuare un’autodiagnosi. Questo scenario aumenta il rischio che credano a “malattie fantasma” come la Bixonimania. Ancora peggio, potrebbe accadere che i sintomi reali vengano ignorati a causa di diagnosi errate fornite da sistemi non verificabili. “Il caso Bixonimania ci insegna a trattare l’AI come un assistente, non come un’autorità,” dicono gli esperti. Questo sottolinea l’urgenza di creare protocolli di verifica dove intervento umano e controllo empirico siano centrali.
Un precedente simile con gli algoritmi di Glorbo
Il caso della bixonimania non è l’unico esempio. Anche la finta espansione del videogioco World of Warcraft chiamata Glorbo, inizialmente inventata dagli utenti di Reddit per mettere alla prova i sistemi automatici, ha visto gli algoritmi che accettavano i dati come veri. La reazione dei modelli AI fu identica: non furono in grado di discernere tra finzione e realtà. Questo conferma come l’assenza di revisione umana nelle pipeline automatizzate produca risultati pericolosi e imprevedibili.
La reazione del settore all’evento
Le implicazioni di queste allucinazioni diventano particolarmente allarmanti quando si parla di salute reale. La capacità degli algoritmi di generare informazioni medico-scientifiche errate, benché ben formate, mette a rischio la salute fisica degli utenti. Esperti del settore hanno chiesto l'implementazione di sistemi di controllo incrociati, dove addestramento AI umano e controllo scientifico vengano coniugati, per garantire informazioni attendibili.
Le risposte del mercato, finora, non sono mancate. Le autorità di controllo tecnologico europee hanno avviato indagini approfondite su alcune tra le più grandi società AI, inclusi DeepSeek, Mistral AI e Scaleup Yazilim. Gli interessati hanno preso impegni formali per mitigare il rischio di allucinazioni e migliorare la sicurezza del loro output per gli utenti finali.
Un simbolo di una tecnologia prematura
La vicenda della bixonimania rimane emblematica di un’epoca in cui la tecnologia è in grado di parlare in modo quasi perfetto, ma non di comprendere veramente. Fino a quando i modelli AI non integreranno criteri di trasparenza che permettano di verificare l’origine delle informazioni, la bixonimania continuerà a rappresentare un monito per il progresso che il settore dovrà intraprendere per diventare veramente affidabile e sicuro.