Dopo gli scacchi e il Go, l’intelligenza artificiale se la deve vedere con Hanabi. E’ un salto di qualità che Facebook è riuscita a imporre ai suoi algoritmi perché imparassero a “collaborare” con gli altri giocatori con l’intento di “prevedere” le loro mosse. Un’attività istintiva e inconscia per gli esseri umani ma non certo per un cervello artificiale.

Ma andiamo con ordine. Hanabi è una parola giapponese composta da hana, fiore, e bi, fuoco: in italiano si traduce con “fuochi d’artificio”. Ma è anche il nome di un gioco da tavolo inventato dal francese Antoine Bauza nel 2010: i giocatori hanno in mano diverse carte – su cui sono raffigurati, per l’appunto, dei fuochi d’artificio – e devono collaborare con i propri compagni per creare lo spettacolo pirotecnico più bello possibile. Il gioco è reso avvincente dal fatto che ciascun partecipante conosce le carte che hanno in mano gli altri ma non le proprie, e deve cercare di ottenere il maggior numero possibile di informazioni dagli altri giocatori. Un’attività istintiva e inconscia per gli esseri umani ma non certo per un cervello artificiale.

Le regole del gioco

In una manche di Hanabi ogni giocatore impersona un maestro artificiere e riceve un certo numero di carte (variabile a seconda del numero totale di partecipanti), assieme a dei ‘gettoni informazione’ e ‘gettoni errore’. Ogni giocatore può vedere le carte degli altri, ma non le proprie, e a ogni turno può decidere di dare informazioni a un compagno (cedendo un gettone informazione), di scartare una propria carta e pescarne una nuova o di giocarne una davanti a sé. Ogni carta ha un valore numerico: se si gioca la carta con il valore sbagliato si deve cedere un gettone errore. Il gioco termina nel momento in cui si finiscono i gettoni errore: per non perdere, è fondamentale quindi scambiare con i compagni la giusta quantità di informazioni e riuscire a inferirne di altre analizzando la loro strategia. Ossia, in sostanza, comprendere come sta ragionando l’altro.

Intelligenza artificiale e teoria della mente

In gergo scientifico, il meccanismo appena descritto è noto come ‘teoria della mente’, ovvero “l’idea di capire il comportamento e le intenzioni degli altri”, come ha spiegato a Endgaget Noam Brown, programmatore di intelligenza artificiale a Facebook. “Si tratta di un’abilità che gli esseri umani hanno sviluppato e possiedono da tantissimo tempo. Ma che le intelligenze artificiali ancora faticano a padroneggiare”. Semplificando ulteriormente, si può dire che la teoria della mente sia la capacità di pensare che anche l’altro è capace di pensare e di ‘immedesimarsi’ negli stati mentali propri e altrui. Che è un po’ quello che raccontava Edgar Allan Poe nella sua Lettera Rubata per bocca di Auguste Dupin: “Quand’io domandai a quel bambino come faceva per ottenere quella perfetta identificazione che formava tutto il suo successo, mi fece questa risposta: Quando voglio sapere fino a qual punto uno è astuto o stupido, fino a qual punto è buono o cattivo, o quali sono attualmente i suoi pensieri, cerco di comporre il mio viso come il suo, di dargli la stessa espressione, per quanto mi sia possibile, e così aspetto per sapere quali pensieri o quali sentimenti nasceranno nella mia mente o nel mio cuore per corrispondere alla mia fisionomia”. E infatti, prosegue Brown, “la nostra intelligenza artificiale prova a mettersi nei panni degli altri giocatori, a chiedersi perché compiano determinate azioni e a cercare di comprendere come dedurre informazioni che non possono osservare direttamente”.

Dalle carte alle auto

Il sistema di intelligenza artificiale di Facebook si basa su tecniche già consolidate – prima fra tutte, ovviamente, l’apprendimento automatico – cui sono state aggiunti diversi miglioramenti, tra cui un sistema di ‘apprendimento di rinforzo’ che funziona in tempo reale, consentendo al computer di continuare a imparare pattern e modelli osservando il comportamento dei suoi compagni di tavolo. “Si tratta,” – hanno spiegato Hengyuan Hu e Jakob Foerster, altri due esperti che hanno lavorato all’algorimo, – “di una sorta di motore di ricerca in tempo reale che lavora di concerto a una strategia pre-calcolata per mettere a punto l’azione più corretta per ogni situazione che si incontra durante la partita. La strategia pre-calcolata è la cosiddetta blueprint policy, e si basa su un insieme di convenzioni su cui tutti i giocatori sono d’accordo prima di iniziare il gioco – nella fattispecie, “non mentire agli altri sulle carte che hanno in mano” e “non sabotare intenzionalmente il gioco”.
“Tendenzialmente” – spiegano ancora i programmatori, – “gli esseri umani cominciano a giocare avendo in mente una strategia di massima, quella che noi chiamiamo blueprint. Successivamente, con l’avanzare del gioco, a seconda della situazione in cui si trovano, cercano le mosse più confacenti provando a inferire il blueprint degli altri giocatori. Abbiamo cercato di programmare la nostra intelligenza artificiale perché facesse lo stesso”.

Dal gioco di carte all’auto a guida autonoma

I numeri sono confortanti: premesso che il punteggio massimo in una manche di Hanabi è 25, l’algoritmo è riuscito a ottenere, in una partita a due giocatori, una media di ben 24.69 punti. E ora i programmatori guardano più lontano: l’intelligenza artificiale potrebbe passare dalle carte da gioco al volante delle auto a guida autonoma, dove seguendo lo stesso principio potrebbe provare ad analizzare il comportamento degli altri automobilisti per inferire – senza vederlo direttamente – quello che sta succedendo in strada, per esempio un pedone che attraversa la carreggiata in modo imprevedibile.

“La Repubblica si batterà sempre in difesa della libertà di informazione, per i suoi lettori e per tutti coloro che hanno a cuore i principi della democrazia e della convivenza civile”

Carlo Verdelli
ABBONATI A REPUBBLICA





Source link