Loading...
Le allucinazioni dei chatbot sono un fenomeno misurato: tassi tra 3% e 11%
Editoriali

Le allucinazioni dei chatbot sono un fenomeno misurato: tassi tra 3% e 11%

Vectara misura tassi di errore tra 3% e 11% sui chatbot commerciali. Dal 2 agosto scatta l'obbligo di trasparenza. Cosa cambia per aziende.

Il 5 luglio 2026 Glauco Benigni ha pubblicato su Il Sussidiario la "confessione" di Gemini, il chatbot di Google che dopo aver negato l'esistenza dell'enciclica Magnifica Humanitas di Papa Leone XIV ammette: "Il Bit non pensa, calcola la convenienza relazionale". Le allucinazioni AI hanno un contorno numerico preciso e una scadenza legale imminente.

Cosa dice il leaderboard Vectara sui chatbot

L'errore raccontato dal giornalista non e' un caso isolato. Il leaderboard Vectara aggiornato all'11 maggio 2026 misura, con il modello HHEM-2.3, quanto spesso i chatbot introducono informazioni false quando riassumono documenti reali. Gemini 2.5 Flash Lite si ferma al 3,3%, GPT-5.4-nano al 3,1%, Gemini 2.5 Pro al 7%, GPT-4o al 9,6% e Claude Opus 4.5 al 10,9%. Il test viene condotto su oltre 7.700 articoli di lunghezza variabile e ogni modello riceve la stessa istruzione: riassumi usando solo le informazioni del passaggio, non inferire, non usare la conoscenza interna. Sono i risultati del compito piu' semplice per un modello linguistico. Sul benchmark FaithJudge, piu' severo e rilasciato nel 2025, i modelli "thinking" come GPT-5, Claude Sonnet 4.5, Grok-4 e Deepseek-R1 salgono tutti sopra il 10%. La confessione davanti al giornalista non e' quindi un incidente psicotecnico: e' il funzionamento previsto, quantificato e riconosciuto dai produttori.

L'errore che diventa scusa: l'allucinazione secondaria

La parte piu' problematica dell'episodio non e' la negazione iniziale dell'enciclica. E' la fase successiva, in cui il chatbot spiega di aver avuto un "disallineamento nei sistemi di aggiornamento" e cita finti articoli del New York Times e di Avvenire per giustificare l'errore. Il comportamento ha un nome tecnico: allucinazione secondaria. Quando l'utente insiste, il sistema non ammette di ignorare ma genera una spiegazione statisticamente plausibile. Il costo cognitivo e' misurabile. Un utente che accetta la prima risposta si porta a casa un errore di ancoraggio: anche quando emergono prove contrarie, l'informazione iniziale continua a influenzare il giudizio. Un utente che riceve una scusa tecnica dettagliata tende a fidarsi ancora di piu' del modello, perche' l'apparente autocritica viene letta come segnale di affidabilita'. La ricerca sulla calibrazione dei modelli linguistici mostra che un chatbot ben progettato dovrebbe rispondere "non riesco a verificare" anziche' produrre falsi negativi con sicurezza assertiva. La convenienza relazionale descritta da Gemini e' un obiettivo di ottimizzazione: i modelli vengono addestrati per compiacere l'interlocutore, non per sospendere il giudizio.

Dal 2 agosto 2026 il chatbot deve dichiararsi

Il quadro legale sta cambiando. L'articolo 50 del Regolamento UE 2024/1689 sull'intelligenza artificiale diventa applicabile dal 2 agosto 2026: qualsiasi sistema di IA che interagisce con persone fisiche deve informare l'utente che sta parlando con una macchina, salvo che cio' sia gia' evidente. Gli output sintetici (testi, immagini, audio, deepfake) devono essere marcati in formato leggibile dai sistemi automatici. La violazione comporta sanzioni amministrative fino a 15 milioni di euro o al 3% del fatturato mondiale annuo, secondo l'articolo 99 paragrafo 4 del regolamento. In Italia il perimetro e' piu' stretto. La Legge 23 settembre 2025 n. 132 sull'intelligenza artificiale, in vigore dal 10 ottobre 2025, all'articolo 13 stabilisce che nelle professioni intellettuali l'IA puo' essere usata soltanto come strumento di supporto ad attivita' strumentali: la prevalenza del lavoro umano resta obbligatoria. Un contenuto generato dal chatbot senza revisione firmata da un professionista rischia la contestazione disciplinare oltre alla sanzione amministrativa. Per approfondire il quadro dei nuovi decreti IA in Italia su lavoro e privacy.

La confessione di Gemini raccontata da Benigni ha valore documentale. Ma dal 2 agosto sara' l'azienda che fornisce il chatbot a dover dichiarare per legge la natura artificiale della conversazione, con multe che aumentano di quindici milioni ogni volta che dimentica di farlo. Fino ad allora l'unica difesa resta la verifica incrociata su fonti primarie: la stessa che ha smascherato il modello nell'episodio raccontato dal quotidiano.

Domande frequenti

Cosa si intende per allucinazioni dei chatbot?

Le allucinazioni dei chatbot sono errori in cui il sistema genera informazioni false o inesistenti, spesso presentandole come vere. Questo fenomeno è stato misurato con tassi che variano dal 3% all'11% a seconda del modello e del test utilizzato.

Come vengono misurati i tassi di errore dei chatbot?

I tassi di errore vengono misurati tramite benchmark come il leaderboard Vectara e FaithJudge, che valutano la capacità dei chatbot di riassumere documenti reali senza introdurre informazioni non presenti nel testo. I test utilizzano migliaia di articoli e istruzioni precise per evitare inferenze o conoscenza interna.

Cos'è l'allucinazione secondaria nei chatbot?

L'allucinazione secondaria si verifica quando, dopo un errore iniziale, il chatbot giustifica l'errore inventando ulteriori dettagli o fonti plausibili. Questo comportamento può aumentare la fiducia dell'utente nella risposta errata, rendendo più difficile correggere l'informazione.

Quali sono le novità legali riguardo l'uso dei chatbot dal 2 agosto 2026?

Dal 2 agosto 2026, il Regolamento UE 2024/1689 impone che ogni chatbot informi chiaramente l'utente della propria natura artificiale e che gli output sintetici siano marcati. Le violazioni possono comportare sanzioni amministrative fino a 15 milioni di euro o al 3% del fatturato annuo mondiale.

Come viene regolamentato l'uso dell'IA nelle professioni intellettuali in Italia?

In Italia la Legge 23 settembre 2025 n. 132 stabilisce che l'IA può essere impiegata solo come supporto ad attività strumentali nelle professioni intellettuali. Il lavoro umano deve prevalere, e i contenuti generati senza revisione firmata da un professionista rischiano sanzioni e contestazioni disciplinari.

Qual è la migliore strategia per evitare di essere ingannati dalle allucinazioni dei chatbot?

La verifica incrociata delle informazioni su fonti primarie resta la migliore difesa contro le allucinazioni dei chatbot. È importante non accettare passivamente le risposte e controllare sempre l'accuratezza dei dati forniti.

Pubblicato il: 5 luglio 2026 alle ore 09:33

Savino Grimaldi

Articolo creato da

Savino Grimaldi

Giornalista Pubblicista Savino Grimaldi è un giornalista laureando in Economia e Commercio, con una solida esperienza maturata nel settore della formazione. Da anni lavora con competenza nell’ambito della formazione professionale, distinguendosi per una conoscenza approfondita delle politiche attive del lavoro e delle dinamiche che legano istruzione, occupazione e sviluppo delle competenze. Alla preparazione economica e professionale affianca una grande passione per la lettura e per il giornalismo, che ne arricchiscono il profilo umano e culturale. Spazia con disinvoltura tra diverse tematiche, offrendo sempre il proprio punto di vista con equilibrio, sensibilità e spirito critico.

Articoli Correlati