Una rete neurale artificiale, ‘addestrata’ per il semplice rilevamento di oggetti visivi, ha mostrato di sviluppare spontaneamente una sorta di ‘senso del numero’ simile a quello che, negli umani, consente di fare una stima di massima del numero di oggetti presenti in un determinato scenario.
Contare gli oggetti contenuti in un’immagine digitale, per un computer è un compito delicato. Prima di tutto perché la macchina deve sapere esattamente come sono fatti gli oggetti, come appaiono, prima di poterli contare. Tuttavia, gli oggetti non hanno sempre lo stesso aspetto: cambia la loro illuminazione, la posizione, l’esposizione, etc. Tutti gli approcci computazionali di successo per la rilevazione degli oggetti contenuti in immagini funzionano costruendo una sorta di “quadro statistico” di un oggetto, a partire da numerosi singoli esempi, in una sorta di “apprendimento” simile a quello umano. In questo modo, il computer può riconoscere la presenza di un oggetto con un certo grado di sicurezza. Per ‘allenare’ la macchina, si usano esempi che contengono o non contengono l’oggetto: il computer, cercando di ‘indovinare’, calibra il suo modello statistico in base ai risultati dei suoi tentativi.
Nel nuovo studio, pubblicato su Science Advances, una rete neurale artificiale di apprendimento approfondito (“deep learning”) addestrata al semplice rilevamento di oggetti in una immagine, ha sviluppato spontaneamente una sorta di “senso del numero” umano. I ricercatori dell’Università di Tubinga, in Germania, hanno scoperto che unità specifiche all’interno della rete si “sintonizzavano” improvvisamente su un numero astratto di fronte a un certo “mucchio” di oggetti di uno stesso tipo, proprio come avrebbero potuto fare i neuroni di un vero cervello. Il computer si rendeva cioè conto che un’immagine di quattro mele era simile a una foto di quattro gatti, perché c’era quel “quattro” in comune.
La ricerca suggerisce che potremmo essere sulla strada giusta per avere, un giorno, Intelligenza Artificiale sempre più simile a quella umana. Applicare questo tipo di apprendimento ad altre attività – magari al riconoscimento di segnali che si verificano in un periodo di tempo piuttosto che concentrandosi sui pixel di un’immagine – potrebbe generare sistemi con qualità ancora più umane. In questo modo, le macchine potrebbero iniziare a ‘familiarizzare’ con cose che una volta ritenevamo esclusivamente appannaggio dell’uomo, come il ritmo musicale o il senso della causalità.