Il matematico ungherese Paul Erdős era famoso per la sua capacità di porre problemi nell’arco di una carriera durata oltre sei decenni. Alla sua morte, nel 1996, Erdős aveva totalizzato un’eredità di oltre 1000 problemi irrisolti, che spaziavano dalla matematica combinatoria alla teoria dei numeri. I problemi di Erdős hanno spesso una formulazione semplice, per questo motivo, di recente matematici anche non professionisti hanno iniziato a tentare di risolverli inserendoli in strumenti di intelligenza artificiale come ChatGPT, approfittando dei progressi che, negli ultimi mesi, hanno compiuto modelli di AI come questo.
È questo quello che hanno fatto Kevin Barreto, studente di matematica all’Università di Cambridge, e Liam Price, matematico dilettante, che hanno risolto alcuni problemi utilizzando l’AI, iniziando dal problema 728 (che riguarda la Teoria dei numeri, clicca qui per saperne di più ) e sottoponendolo a ChatGPT-5.2 Pro.
La dimostrazione generata da ChatGPT, è stata poi verificata mediante l’ausilio di un altro strumento di AI, Aristotle, che converte il linguaggio della dimostrazione convenzionale in Lean, linguaggio di programmazione matematica. In questo modo, i computer possono immediatamente controllare l’esattezza di una dimostrazione.
A metà gennaio, Barreto e Price avevano risolto con queste modalità un totale di 6 problemi di Erdős, sebbene un successivo esame da parte di matematici professionisti abbia poi rivelato che di 5 di questi esisteva già soluzione nella letteratura matematica. L’unico problema ancora completamente aperto era il 205 che Barreto e Price hanno risolto. Inoltre, gli strumenti di AI hanno consentito piccoli avanzamenti in altri 7 problemi aperti.
Barreto ha comunque sottolineato che i problemi risolti sono relativamente semplici, se confrontati anche solo con i più complessi problemi di Erdős (che gli attuali modelli di intelligenza artificiale non riescono ancora a risolvere), per esempio quelli che prevedono un premio in denaro per la dimostrazione.
Lavori come questi potrebbe anche consentire ai matematici di mettere in pratica un metodo di lavoro completamente nuovo, afferma Terence Tao dell’Università della California, Los Angeles, che ha contribuito a convalidare alcune delle soluzioni proposte da Barreto e Price.
“I matematici spesso si concentrano su un numero limitato di problemi difficili a causa del tempo limitato, mentre molti problemi meno difficili ma comunque importanti non ricevono molta attenzione. Se gli strumenti di intelligenza artificiale potessero essere applicati a tutti questi problemi contemporaneamente, si potrebbe arrivare a un modo più empirico e scientifico di fare matematica” afferma Tao “in cui diversi metodi di risoluzione di un problema potrebbero essere testati su larga scala. Non facciamo matematica su larga scala perché non abbiamo le risorse intellettuali, ma l’intelligenza artificiale sta dimostrando che è possibile.”











Dalle prime indicazioni, solo un problema su 10 (il nono) sembra sia stato risolto da un LLM. Per un altro (il decimo) è molto probabile che la soluzione (corretta) abbia ripreso una soluzione già disponibile in rete. Nessuno dei LLM si è avvicinato in alcun modo alla soluzione dei 10 problemi.
Secondo Kevin Barreto, sembra che i modelli abbiano avuto non poche difficoltà, confessando di essere in qualche modo deluso dai risultati.
In sintesi, sembra che al momento i matematici possano dormire sonni tranquilli.
“This manuscript represents our preliminary efforts to come up with an objective and realistic methodology for assessing the capabilities of AI systems to autonomously solve research-level math questions… Our core observation is that an ideal test should involve research math questions which arose naturally in the process of a mathematician’s own research, were subsequently solved by the mathematician, but have not yet been posted to the internet (molti problemi dichiarati come risolti per la prima volta da AI, in realtà avevano soluzioni nascoste in qualche dimenticato sito web, ndr)…. The answers to our set of ten research level math questions have been encrypted and posted to https://1stproof.org. The authors will release the answers on February 13, 2026.”
Dovremo quindi attendere poco per avere una prima credibile risposta sulle capacità AI di risolvere problemi in autonomia, e per iniziare a chiarire i dubbi di molti matematici sul fatto che le risposte AI siano meno contributo alla ricerca che componente di qualche campagna di marketing. (Per inciso, tra gli 11 matematici di professione che hanno contribuito a definire i 10 problemi c’è anche una medaglia Fields.)
https://arxiv.org/pdf/2602.05192