Citazioni false x12 in tre anni: arXiv vieta i paper IA non verificati

Dal 2023 le citazioni false nei paper sono cresciute 12 volte. ArXiv introduce il primo ban di un anno per chi usa l'IA senza verificare.

Dodici volte in più di citazioni fabbricate rispetto al 2023: è il dato pubblicato a maggio da ricercatori della Columbia University su The Lancet. Il numero spiega perché arXiv, il principale archivio di preprint accademici al mondo ha introdotto il primo ban sistematico contro i paper scritti con intelligenza artificiale non supervisionata.

Il ban di arXiv: come funziona e chi riguarda

arXiv è gestito dalla Cornell University e raccoglie oltre due milioni di paper in fisica, matematica, informatica e scienze affini. Da maggio 2026, gli autori che caricano articoli con prove incontrovertibili di contenuti IA non verificati ricevono un ban di 12 mesi. Al termine, per pubblicare di nuovo devono prima superare la peer review presso una rivista specializzata.

La regola non vieta l'uso dell'intelligenza artificiale. I ricercatori possono usare i modelli linguistici per bozze, editing e analisi dei dati. Il problema è la verifica: ogni affermazione, ogni dato, ogni citazione generata da un modello deve essere controllata dall'autore. Il ban scatta solo in presenza di prove incontrovertibili che questa verifica non è avvenuta, secondo Thomas Dietterich, presidente della sezione informatica di arXiv.

Non è il primo segnale dall'editoria scientifica. Springer Nature richiede la dichiarazione di ogni utilizzo di language model nella sezione Methods del manoscritto e vieta le immagini generate da IA. Elsevier ha eliminato l'IA da tutte le fasi di peer review e impone obblighi di disclosure stringenti per gli autori. Nessuno dei grandi editori accetta un modello linguistico come autore.

Citazioni fabbricate: la misura concreta del danno

Il dato della Columbia University mette in prospettiva quanto è cambiata la produzione scientifica con l'arrivo di ChatGPT. Le citazioni inventate dai modelli linguistici - quelle che rimandano a lavori che non esistono o a esperimenti mai condotti - sono aumentate di 12 volte dal 2023. Non è un fenomeno di nicchia: un paper con citazioni false viene citato da altri paper, e le false affermazioni si propagano nella letteratura accademica prima che qualcuno le smaschere.

Le ritrattazioni esistono, ma il processo è lento. Un articolo ritirato dopo anni di circolazione ha già influenzato revisori, decisori politici, altri ricercatori. Il danno non si annulla con la ritrattazione.

I numeri sulla produzione confermano la portata del cambiamento. Dopo il lancio di ChatGPT, le submission a una singola rivista analizzata sono aumentate del 42%. Entro l'inizio del 2026, la maggior parte dei manoscritti accademici esaminati mostrava qualche forma di utilizzo di language model. Gli articoli prodotti con l'aiuto dell'IA risultano in media meno leggibili, complicando il lavoro dei revisori.

Chi pubblica con l'IA senza verificare guadagna posizioni nelle classifiche di produttività accademica. Chi mantiene standard di verifica rigorosa pubblica meno e viene penalizzato nei sistemi di valutazione. Questo incentivo distorto è quello che le nuove policy cercano di correggere.

Cosa cambia per i ricercatori italiani

Le regole di arXiv, Springer Nature ed Elsevier riguardano la ricerca internazionale, ma i ricercatori italiani sono esposti quanto i colleghi stranieri. Chi pubblica in fisica, matematica o informatica usa arXiv quotidianamente come canale di preprint. Chi lavora in ambito biomedico pubblica su riviste Elsevier o Springer Nature.

Il messaggio operativo è concreto: documentare l'uso degli strumenti di intelligenza artificiale dall'inizio del processo di scrittura, controllare ogni citazione e ogni dato prodotto da un modello, dichiarare gli strumenti nella sezione appropriata. Non è un aggravio burocratico, è la differenza tra un articolo accettato e un ban di un anno.

Con il Nobel Giorgio Parisi che chiede di attrarre ricercatori americani in Italia e con progetti di frontiera come Solaris per l'osservazione del Sole dall'Antartide, costruire una reputazione scientifica affidabile è più urgente che mai. Paper gonfiati dall'IA senza verifica pesano sugli indicatori bibliometrici con cui i ricercatori italiani vengono valutati a livello internazionale.

L'intelligenza artificiale applicata con rigore produce risultati verificabili: lo dimostra il progetto Google per asfalto autoriparante con IA. Il principio è lo stesso che arXiv vuole estendere alla pubblicazione scientifica: tecnologia sì, ma con supervisione umana sui risultati.

I ban di maggio 2026 sono un inizio. La sfida per la comunità scientifica non è escludere l'IA dai laboratori, ma costruire sistemi di verifica capaci di tenere il passo con la velocità di produzione che i modelli linguistici rendono possibile.

Citazioni false x12 in tre anni: arXiv vieta i paper IA non verificati

Il ban di arXiv: come funziona e chi riguarda

Citazioni fabbricate: la misura concreta del danno

Cosa cambia per i ricercatori italiani

Articoli Correlati

Italia sesta al mondo per ransomware: il 67% delle vittime è una PMI

Figure 03, robot instancabili: quanto lavoro umano è davvero a rischio?

Celle solari perovskite: dalla trasparenza alle finestre fotovoltaiche