Ogni giorno sentiamo parlare di questa tecnologia miracolosa e delle sue
prodezze, a volte anche troppo. Ogni giorno la usiamo per chiedere una spiegazione dell'ultimo argomento di
Fisica, quale sia il ristorante più vicino a me, se sia lecito ghostare una
certa persona su Instagram; a volte anche troppo.
Ma cos'è veramente l'intelligenza artificiale? È davvero in grado di avere
opinioni e provare sensazioni? Come fa ad invantare, a creare?
Partiamo dall'inizio, e torniamo indietro. Molto indietro.
Nel 1943, il neurobiologo Warren McCulloch e il suo
collega matematico Walter Pitts riescono a simulare la struttura di un neurone
umano in un programma informatico. Il sistema è semplice: il
"neurone" prende da ogni "sinapsi" dei numeri di input, li
moltiplica ciascuno per coefficienti diversi in base alla loro importanza, e
poi li somma; se il risultato finale è maggiore di una certa soglia si attiva,
altrimenti no. Visto che l'applicazione di questa soglia non è un'operazione
lineare, il programma si avvicina ancora di più ai neuroni naturali, che
derivano la loro complessità e abilità proprio dal fatto che sono sistemi
intrinsecamente non lineari.
Da questa tecnologia si sono poi sviluppate le cosiddette "reti
neurali", cioè reticoli di "neuroni" in successione che si
attivano a vicenda. Questi vengono allenati con vari dati e immagini
"etichettati", per esempio foto di animali associate al nome della
loro specie, in base ai quali adattano i coefficienti delle varie
moltiplicazioni in base al coefficiente di errore assegnato ad ogni output; in
questo modo avranno più peso sul risultato le caratteristiche che aiutano maggiormente
a definire un certo animale. Dopo molto allenamento, il programma sarà così in
grado di classificare l'immagine di un gatto come "gatto", e di
distinguerla da quella di un cane.
Fino agli anni Ottanta-Novanta, questo era tutto ciò che l'intelligenza
artificiale riusciva a fare. Lo sviluppo chiave nella direzione di quella che
oggi chiamiamo generativa è l'autoencoder, cioè, da sé, un sistema
perfettamente inutile: un'immagine di un particolare soggetto, in questo caso
tenendo l'esempio di un gatto, viene data in pasto a una rete neurale, che,
associando ogni sinapsi a un pixel della foto, genera alcuni numeri di output, secondo il processo descritto in precedenza; queste quantità entrano poi in un'altra rete neurale,
uguale alla prima ma simmetrica, che da essi risale all'immagine di partenza.
Nella pratica non serve a niente, quindi. Tuttavia, la seconda parte di questa
rete è ora in grado di tradurre un numero limitato di valori in immagini di
gatti; inserendo delle quantità a caso, quindi, produrrà delle foto di gatti
mai visti prima, perché inesistenti. Tutti i sistemi di generazione AI di foto e video si basano su una
variazione di questo processo, poi espanso e generalizzato per facilitare la
creazione di immagini di ogni tipo e soggetto.
Tra ricerche e sviluppi, siamo arrivati agli anni 2010. Dopo un periodo
di stagnazione nel miglioramento dell'AI, nel 2017 alcuni ricercatori di Google
pubblicano un articolo in cui illustrano il funzionamento del Transformer, un
nuovo modello basato su una tecnologia simile all'autoencoder che permette di
filtrare le informazioni importanti da quelle poco utili in sequenze come
quelle di testo.
Da qui un paio di anni dopo partono i ricercatori di OpenAI per creare GPT, un
sistema di produzione testuale allenato sul seguente obiettivo: data una parte
di testo, indovina statisticamente la parola successiva, in base a una scala di
probabilità. Ovviamente servivano molti dati da analizzare per questo training,
ma non era un problema, dato il fatto che c'era l'intero Internet a
disposizione; la cosa più sorprendente è che, aumentando la potenza
computazionale, i risultati miglioravano di pari passo, senza dar segno di
fermarsi. Tuttora, anche se sappiamo come l'AI è costruita, non abbiamo ancora
compreso perché sembra non smettere mai di migliorare. Nel dubbio, i miliardi
di dollari spesi in microprocessori all'anno da aziende di AI hanno fatto sì
che Nvidia, il loro principale produttore, diventasse nel 2025 la prima azienda
al mondo a superare i 5 trilioni di dollari di capitale; dall'altra parte, in
Stati americani come Virginia, Nevada e Georgia, la costruzione sempre più
diffusa e sregolata di data centers (hub di migliaia di microprocessori)
stanno spingendo moltissimi cittadini che vivono nell'area sull'orlo della
protesta.
È così che funziona l’AI, quindi: alla fine dei conti, è solo una
macchina molto brava a fare statistica. Di pensiero proprio non ha nulla, non capisce
nulla, ma rielabora parole e informazioni che vede online. Sono convinto che
questo sia sempre più importante da tenere a mente, mano a mano che la
tecnologia si evolve e le risposte che dà diventano sempre più naturali e
"umane": non frutto di una riflessione, ma solo di un calcolo
probabilistico.
di Francesco Montecchi
0 Commenti