“È come cercare di orientarsi in un labirinto grande quanto la Terra. Si tratta di percorsi lunghissimi da esplorare, e ce n’è solo uno che funziona”, così Ali Shehper, della Rutgers University, descrive l’impresa di risolvere alcune tipologie particolarmente complesse di problemi aperti di matematica. È il caso, per esempio, della congettura di Andrews–Curtis, un problema di Teoria dei Gruppi proposto per la prima volta nel 1965.
Molti studiosi ritengono che tale congettura sia falsa, ma nessuno è mai riuscito finora a dimostrarlo, sebbene esistano ampie classi di controesempi potenzialmente in grado di confutarla. Proprio qui entra in gioco il lavoro con l’IA che stanno conducendo Shehper e colleghi del CalTech. In un articolo pubblicato su arXiv, infatti, il team guidato da Sergei Gukov descrive lo sviluppo di un nuovo tipo di algoritmo di machine learning capace di risolvere problemi matematici che richiedono sequenze estremamente lunghe, che possono arrivare anche al milione (e oltre) di passaggi.
Il gruppo ha utilizzato il nuovo algoritmo per verificare la bontà di intere famiglie di possibili controesempi (in particolare analizzando due gruppi che giacevano senza risposta da 25 e 44 anni) e sono riusciti a escluderle. “Escludere alcuni controesempi ci dà maggiore fiducia nella validità della congettura originale e ci aiuta a sviluppare nuove intuizioni sul problema principale. Ci offre nuovi modi di pensarci”, commenta Shehper. Gukov paragona l’affrontare questi problemi matematici al “cercare di andare da A a B” attraverso percorsi estremamente tortuosi che richiedono migliaia, milioni o persino miliardi di passaggi, come se si dovesse risolvere un cubo di Rubik incredibilmente complesso.
La particolarità di questo algoritmo risiede, in un certo senso, nella sua “originalità”. “Se chiedi a ChatGPT di scrivere una lettera, produrrà qualcosa di standard. È difficile che generi qualcosa di unico e altamente originale. È un buon pappagallo”, spiega Gukov. “Il nostro programma, invece, è bravo a trovare outlier, una sequenza di passaggi che non è intuitiva, che difficilmente un matematico (o algoritmo tradizionale) penserebbe di provare, perché è troppo strana, lunga o apparentemente illogica”. Per addestrare il programma, i ricercatori hanno utilizzato un modello di machine learning noto come apprendimento per rinforzo (reinforcement learning). Prima hanno mostrato all’IA problemi facili da risolvere, poi via via problemi sempre più complessi. “Il sistema prova varie mosse e riceve una ricompensa quando risolve un problema”, conclude Shehper. “lo incoraggiamo a ripetere le strategie che funzionano, mantenendo però un certo livello di curiosità. Alla fine, sviluppa nuove strategie migliori di quelle che potrebbero trovare gli esseri umani. È questa la magia dell’apprendimento per rinforzo”.