Tutto nasce dal cognitivismo, una branca della psicologia applicata che concepisce la mente umana come una macchina sofisticata, in grado di elaborare le informazioni sensoriali e meta-cognitive in maniera sequenziale. La metacognizione è la capacità di riflettere sui propri stati mentali. Nel corso del ventesimo secolo, l’intelligenza artificiale è passata dall’essere una mera teoria filosofica e psicologica, a un elemento cardine della società. Le reti neurali artificiali sono un tipo di tecnologia di intelligenza artificiale che ha rivoluzionato il campo del machine learning. Il loro funzionamento si basa su una struttura composta da nodi interconnessi chiamati neuroni, che sono organizzati in strati simili al cervello umano.
Inline Style vi racconterà la rivoluzione delle reti neurali. Partiremo con la loro creazione negli anni ‘80, per poi spiegare in dettaglio il funzionamento dell’intelligenza artificiale. Siete pronti a tuffarvi in un mondo straordinariamente complesso? Bene, si parte!
Da Alan Turing alla Rivoluzione delle Reti Neurali negli anni ‘80
L’informatico britannico Alan Turing non ha contribuito direttamente alla teoria delle reti neurali artificiali, ma ha avuto un ruolo importante nel campo dell’intelligenza artificiale e del cognitivismo, che hanno fornito la base teorica per lo sviluppo delle reti neurali. Nel 1950, Turing pubblicò un articolo intitolato “Computing Machinery and Intelligence“, in cui propose il famoso “test di Turing” per valutare la capacità di una macchina di mostrare comportamenti intelligenti simili a quelli umani. Alcuni di voi avranno visto Ex Machina, film fanta-thriller in cui due programmatori testano una IA proprio col test di Turing, scoprendo che è davvero senziente. In ultima analisi, ecco a cosa serve il famoso test.
L’articolo ha avuto un grande impatto sulla teoria dell’intelligenza artificiale e ha stimolato il dibattito sulla natura della mente. Infatti il dualismo cartesiano era ancora discusso: la res cogitans e la res extensa, cioè rispettivamente realtà psichica e realtà fisica. Ancora si discuteva se la mente fosse prodotta dal cervello oppure no. Oggi le neuroscienze ci dicono che c’è uno stretto legame tra cervello e mente, smentendo il dualismo di Cartesio.
Inoltre, Turing ha sostenuto la teoria del cognitivismo, che considera la mente come un sistema di elaborazione delle informazioni simile a un computer. Questa teoria ha influenzato la progettazione delle prime reti neurali, che si basavano su modelli matematici di neuroni artificiali e di connessioni sinaptiche. E arriviamo appunto agli anni ‘80, quando furono concepite le prime reti neurali artificiali.
Infatti grazie all’impiego dei semiconduttori, le reti neurali furono implementate in hardware su chip specializzati, chiamati reti neurali artificiali analogiche (ANN). Queste reti neurali analogiche furono utilizzate per risolvere problemi di controllo industriale, elaborazione di segnali e riconoscimento di pattern. Tuttavia, le reti neurali analogiche erano limitate dai poco sofisticati componenti elettronici e dalla difficoltà di programmazione.
Un decennio dopo, gli informatici sono riusciti ad implementare le reti neurali in maniera software su un computer. Da allora, il machine learning è esploso.
Definizione di machine learning: perché è importante
Perché l’intelligenza artificiale viene usata? Per risolvere problemi, così rende la nostra vita più comoda e semplice. E per farlo un’intelligenza artificiale deve imparare. Il machine learning è una tecnologia che dona l’intelligenza alle macchine, consentendo loro di apprendere e migliorare continuamente. Attraverso la raccolta di dati, il machine learning è in grado di rilevare schemi e creare modelli che aiutano a prendere decisioni autonome, senza il bisogno di essere esplicitamente programmate per ogni situazione. È come se le macchine sviluppassero una sorta di istinto, assimilando informazioni e affinando le loro prestazioni, in maniera simile a come il cervello umano apprende.
Ma attenzione, una super intelligenza non equivale a una macchina capace di autoriflessione: può essere cento volte più intelligente di Einstein senza tuttavia essere consapevole. Un esempio noto è Deep Blue, IA sviluppata da IBM. Nel 1997, Deep Blue ha sconfitto il campione del mondo di scacchi Garry Kasparov in un match di sei partite. L’evento ha attirato l’attenzione mondiale, poiché è stata la prima volta che una macchina ha battuto un campione del mondo in uno sport intellettuale come gli scacchi.
Comunque, quali sono gli ingranaggi che permettono il funzionamento del machine learning? Le reti neurali. Indaghiamo le reti neurali, spiegandole nella maniera più elementare possibile.
L’architettura profonda delle reti neurali
Come abbiamo scritto in precedenza, le reti neurali sono una struttura composta da neuroni artificiali, nodi interconnessi che ricordano molto i neuroni del cervello umano. Tuttavia, non possiamo accontentarci di tale definizione, perché per capire il funzionamento di una rete neurale dobbiamo conoscere la sua architettura profonda, che è ben più intricata. Per capire le reti neurali, bisogna prendere una lente di ingrandimento e osservare i componenti da vicino.
Armatevi di pazienza e prendete appunti!
Una rete neurale è costituita da diversi elementi che lavorano insieme per creare un sistema di apprendimento automatico. Qui di seguito sono elencati i principali componenti di una rete neurale.
Input
L’input rappresenta l’informazione che viene fornita alla rete neurale, come immagini, suoni o testo. Ad esempio, è un input quando scriviamo un comando a ChatGPT o a MidJourney.
Livello nascosto dei neuroni artificiali
I neuroni artificiali sono i componenti fondamentali della rete neurale e corrispondono alle unità di elaborazione dell’informazione. Un neurone riceve input dall’esterno e produce un output interno, che a sua volta diventa l’input per i neuroni successivi, fino a quando l’utente riceve un output finale. Chiamati anche nodi, i neuroni artificiali sono moduli software che collaborano per risolvere un problema. Molti neuroni artificiali operano su livelli nascosti. Che significa? Il livello nascosto (o hidden layer, in inglese) di una architettura di reti neurali rappresenta un insieme di neuroni che elaborano l’input in modo intermediario tra l’input stesso e l’output finale. Il termine “nascosto” deriva dal fatto che questo livello non è direttamente visibile all’esterno della rete neurale, poiché non rappresenta né l’input né l’output finale visibile all’utente. Tipo l’inconscio.
Pesi
I pesi rappresentano i valori che determinano l’importanza di ciascun input per il neurone. Ogni neurone ha un vettore di pesi associato, che viene aggiornato durante il processo di apprendimento. Infatti non basta che un neurone artificiale elabori informazioni: il processo di apprendimento umano è basato anche sull’importanza che dà a certe informazioni rispetto ad altre, in modo da minimizzare gli errori. Una IA deve fare lo stesso. Supponiamo un robot che lavora alla reception di un hotel. Deve imparare a riconoscere i volti degli ospiti per accoglierli personalmente. Per farlo, utilizzeremo una rete neurale con un singolo neurone, che prenderà in input un’immagine del volto dell’ospite.
Per addestrare la rete neurale, inizieremo fornendo alla rete numerose immagini di volti di ospiti che si sono presentati alla reception in passato. Ogni immagine sarà rappresentata come un vettore di numeri, dove ogni elemento del vettore rappresenta il valore dei pixel dell’immagine. Durante la fase di apprendimento, la rete neurale cercherà di determinare i pesi migliori che minimizzano l’errore tra l’output della rete (cioè la previsione sul volto dell’ospite) e l’output desiderato (cioè il volto dell’ospite stesso). In altre parole, la rete neurale cercherà di capire quali sono i tratti del volto degli ospiti che devono essere presi in considerazione per riconoscere correttamente il volto di Caio e Sempronio.
Funzioni di attivazione
Le funzioni di attivazione determinano se un neurone deve essere attivato o meno, in base al valore di input e al vettore di pesi associato. Immaginiamo che il robot precedente debba distinguere tra due ospiti: Anna e Marco. Ogni volta che il robot vede il volto di Anna o di Marco, cattura una foto dell’immagine e la inserisce nella rete neurale. Fin qui ci siamo. Ora, all’interno della rete neurale, ogni neurone è programmato per riconoscere tratti specifici del volto, come gli occhi, il naso e la bocca. In questo caso, la funzione di attivazione potrebbe semplicemente decidere se l’ospite riconosciuto è Anna o Marco, e attivare il neurone corrispondente.
Strati
Gli strati sono un gruppo di neuroni che elaborano l’input in modo simile. Una rete neurale può avere uno o più strati, a seconda della complessità del problema che si vuole risolvere.
Output:
L’output rappresenta la risposta della rete neurale al problema che si vuole risolvere. L’output può essere una previsione numerica, una classificazione o un’azione.
Funzione di perdita
La funzione di perdita calcola la differenza tra l’output della rete neurale e il valore atteso. Questo valore viene utilizzato per migliorare il modello durante il processo di apprendimento. Possiamo considerarlo un processo di feedback.
Algoritmo di apprendimento
L’algoritmo di apprendimento determina come la rete neurale deve essere aggiornata per migliorare le sue prestazioni. Ci sono diversi tipi di algoritmi di apprendimento.
Tipologie di reti neurali
Le reti neurali artificiali possono essere distinte in base alla direzione in cui i dati fluiscono dalla loro entrata all’uscita:
- Un esempio sono le reti neurali feedforward, che elaborano i dati in modo lineare, da nodi di ingresso a nodi di uscita, in cui ogni nodo in un livello è collegato a tutti i nodi del livello successivo. Le reti feedforward migliorano le loro previsioni attraverso un processo di feedback.
- Parecchie reti neurali artificiali utilizzano anche un algoritmo di backpropagation per apprendere e correggere i loro errori.
- Le reti neurali convoluzionali sono specificamente progettate per l’analisi di immagini, attraverso l’estrazione e l’elaborazione di diverse caratteristiche dell’immagine, come i bordi, il colore e la profondità.
Concludendo, forse avrete sentito parlare di deep learning. Cos’è? In altre parole, il deep learning utilizza reti neurali di più livelli per creare modelli più complessi e accurati rispetto al machine learning tradizionale.
Conclusione
Cari lettori, il futuro ormai è alle porte! L’intelligenza artificiale è una tecnologia in continua evoluzione che sta cambiando radicalmente il mondo in cui viviamo. Grazie alla sua capacità di apprendere dai dati e di elaborare informazioni complesse, sta rivoluzionando settori come la medicina, l’industria, il marketing, la finanza e molti altri. Forse, un giorno, non lavoreremo più.
Se vi è piaciuto questo articolo, condividetelo sui social media. Ci date una mano a diffondere il sapere tecnologico. In questo modo possiamo anche crescere. Inoltre, vi invitiamo a seguirci su Instagram per rimanere sempre aggiornati.
COMMENTI