Robotica e AI

Intelligenza artificiale per non esperti

6 March 2017 | Scritto da Andrea Geremicca

Solitamente articoli di questo tipo iniziano con la definizione accademica presa da wikipedia, ma non è questo il caso, troppe definizioni diverse, nessuna adatta a far capire veramente, ad un neofita come me, cosa sia e come funzioni l’intelligenza artificiale.

In diversi articoli ho notato che i programmi di intelligenza artificiale sono spesso indicati come AI Agent, un oggetto che può percepire i dati dell’ambiente circostante attraverso i sensori e ne può influenzare lo stato attraverso i suoi attuatori. Tutto quello che avviene tra questi due momenti è il vero “core” dell’intelligenza artificiale e si chiama controllo di strategia. Il funzionamento appare abbastanza semplice, l’agente riceve segnali dal mondo esterno attraverso i sensori, decide quindi come comportarsi di conseguenza, in base a quello che ha deciso, mette in moto i suoi attuatori, che modificano in qualche modo l’ambiente circostante. Questo ciclo ovviamente avviene più e più volte e prende il nome di ciclo percezione azione.

Per comprendere bene un AI Agent ho bisogno di contestualizzarlo, ho bisogno di comprenderne il funzionamento in un mercato definito. Uno dei mercati più sviluppati in tal senso è la Finanza. Gli hedge fund e le società che gestiscono patrimoni e titoli gareggiano per creare un sistema “pensante e capace di apprendere” che svolga le operazioni di trading e si adatti in modo intelligente alle condizioni di mercato, più abile e veloce di qualunque manager in carne ed ossa. Si legge sul Financial Times : Gli hedge fund di maggior successo oggi “assumono computer scientist molto più che economisti ed esperti di investimenti” e “usano le tecniche ‘quantitative’ abilitate dai moderni modelli computazionali e matematici”. L’intelligenza artificiale è solo il prossimo passo e farà sembrare arcaici persino gli attuali sistemi di calcolo per gli investimenti che pure sono velocissimi e ultra-complessi. Il Warren Buffett del futuro potrebbe avere le forme di un super-algoritmo.

Torniamo allo schema di prima, in questo caso l’agente sarà un Agente di Trading e l’ambiente sarà verosimilmente il mercato azionario. Attraverso i sensori possiamo recepire tantissime diverse informazioni come ad esempio l’andamento di un titolo, possiamo leggere news e seguire alcuni eventi. Attraverso gli attuatori eserciteremo poi delle operazioni di acquisto o vendita, il controllo di strategia dovrà ovviamente tenere conto di tantissimi fattori che influenzeranno la decisione finale. Ci sono, mi sembra tutto chiaro, passiamo ad un altro mercato e vediamo se ho capito bene.

Un altro settore molto affascinante dove l’intelligenza artificiale trova sempre più spazio è il settore del gioco. Ogni volta che penso al mix tra gioco e intelligenza artificiale mi viene in mente Deep Blue, ve lo ricordate ? Deep Blue è stato il primo calcolatore a vincere una partita a scacchi contro un Campione del Mondo in carica, Garry Kasparov. Questa prima vittoria, Deep Blue — Kasparov, è una famosa partita di scacchi, giocata il 10 febbraio 1996. In ogni caso Kasparov vinse 3 incontri e pareggiò 2 delle partite seguenti, battendo Deep Blue con un risultato di 4–2. Deep Blue fu poi profondamente aggiornato (non ufficialmente soprannominato “Deeper Blue”) e nel maggio 1997 giocò nuovamente contro Kasparov, aggiudicandosi la rivincita (questa parte l’ho presa da wikipedia).

Qualche giorno fa ho letto che l’intelligenza artificiale (AI) ha battuto l’uomo a poker. È la prima volta che succede e questo risultato, definito “storico” dagli scienziati ha fatto il giro del mondo, ma ci eravate già riusciti nel 1996 no? Quali sono le differenze nei due giochi? Per capirlo ho seguito online una lezione sulle terminologie dell’AI. Una delle prime cose che ho imparato è che esiste una netta distinzione tra completamente o parzialmente osservabile. Un ambiente è completamente osservabile se il nostro agente è capace di ispezionarlo completamente, in questo caso, in qualsiasi momento il nostro agente è capace di prendere una decisione corretta. È facile capire il significato di parzialmente osservabile, tuttavia in questo scenario entra in gioco un fattore molto interessante che non avevo mai preso in considerazione, la memoria. Quando un agente non riesce ad osservare l’intero ambiente, può aiutarsi con la memoria degli scenari precedenti. Pensiamo al gioco del Black Jack, le carte non sono tutte osservabili, ma l’analisi delle mani precedenti fornisce un dato importantissimo al fine di prendere la decisione finale.

Un’altra cosa molto interessante che ho scoperto è che l’ambiente ha altre variabili, può essere infatti definito deterministico o stocastico.Deterministico quando le azioni dell’agente determinano in maniera univocail risultato, per esempio negli scacchi non c’è una casualità quando si muove un pezzo. Il gioco dei dadi è invece stocastico, perchè il risultato non può essere previsto, la casualità gioca un ruolo fondamentale in questo ambiente. Le variabili non finisco qui ovviamente, eccone altre due, ambiente discreto o continuo? Un ambiente discreto è un ambiente in cui hai un numero finito di scelte possibili, quindi è misurabile, come ad esempio avviene nel gioco della dama. Nel caso di un ambiente continuo, abbiamo ovviamente una serie infinita di possibili azioni, quindi non è misurabile, un esempio pratico è il gioco delle freccette, esiste un numero infinito di modi in cui angolare le freccette o accelerarle.

Infine abbiamo la variabile buono o cattivo, mi spiego meglio, l’ambiente può essere benevolo o avverso. Nello scenario benevolo, l’ambiente potrebbe essere completamente casuale, potrebbe quindi non avere un obiettivo, ad esempio il tempo come fattore metereologico, potrebbe essere avverso, ma non è li per batterci. Nel caso dello scenario avverso, l’ambiente è un nostro avversario, come avviene in quasi tutti i giochi. Ora è tutto più chiaro, i coefficienti di difficoltà non erano gli stessi ovviamente.

Non è stato un momento epico perchè l’AI è riuscita a bluffare, lo è stato perchè ha vinto contro chi bluffava.

Andrea Geremicca
Andrea Geremicca

Contributor

Dal 2014 fa parte dell’Organizing team del TEDx Roma ed è visiting professor e Mentor presso la John Cabot University. Andrea studia e racconta nei suoi articoli gli impatti delle tecnologie esponenziali sulla nostra società.

leggi tutto