Un recente studio condotto presso la Ohio State University ha rivelato importanti limitazioni nei modelli di linguaggio di grandi dimensioni (LLM), come ChatGPT, nel comprendere e descrivere i fiori. Questo compito, che gli esseri umani svolgono con naturalezza, risulta complesso per i modelli di intelligenza artificiale. I LLM sono stati addestrati su vasti insiemi di dati testuali e immagini, ma non hanno esperienze dirette legate a sensazioni come il tatto o l’olfatto. Qihui Xu, autore principale dello studio e ricercatore post-dottorato in psicologia, ha affermato che “un modello di linguaggio di grandi dimensioni non può annusare una rosa o toccare i petali di una margherita”. Senza queste esperienze sensoriali, i LLM non riescono a rappresentare un fiore nella sua complessità e ricchezza. Questo studio offre spunti significativi per comprendere le differenze tra intelligenza artificiale e percezione umana.
Analisi comparativa tra esseri umani e modelli di linguaggio
Xu e il suo team hanno condotto un’analisi comparativa delle conoscenze sui fiori tra esseri umani e modelli di linguaggio. Hanno utilizzato un database contenente 4.442 parole, tra cui termini come “fiore”, “zoccolo” e “umoristico”. Il confronto ha coinvolto esseri umani e due modelli di LLM sviluppati da OpenAI e Google. Per valutare le capacità di entrambi i gruppi, sono state impiegate due misure distinte. La prima, nota come Glasgow Norms, richiedeva ai partecipanti di esprimere valutazioni delle parole su nove dimensioni, tra cui eccitazione e concretezza. La seconda misura, denominata Lancaster Norms, si concentrava sull’analisi dei concetti delle parole e sulla loro connessione con le informazioni sensoriali. Questo approccio ha permesso di esaminare come esseri umani e LLM percepiscono e descrivono i fiori.
Obiettivi della ricerca e risultati ottenuti
L’obiettivo principale della ricerca era esaminare le relazioni tra i LLM e gli esseri umani attraverso l’uso delle parole. Nella prima fase dell’analisi, i ricercatori hanno osservato come i concetti venissero correlati da entrambi i gruppi. Ad esempio, esseri umani e intelligenza artificiale concordano nel ritenere che alcuni concetti suscitino un’eccitazione emotiva maggiore rispetto ad altri. Nella seconda fase, l’attenzione si è spostata sulla capacità di stabilire connessioni tra le parole. Un esempio emblematico è rappresentato dalla relazione tra “pasta” e “rose”, entrambe caratterizzate da un profumo intenso. Sebbene entrambe possano essere valutate come fortemente coinvolgenti per il nostro senso dell’olfatto, la percezione umana tende a considerare la pasta più simile a un noodle che a una rosa. Questo perché non ci limitiamo a confrontare gli oggetti in base a un solo senso, ma consideriamo anche l’aspetto visivo e il sapore.
Limitazioni dei modelli di linguaggio di grandi dimensioni
I risultati hanno mostrato che i LLM presentano una buona correlazione con i concetti umani, ma emergono differenze significative quando si tratta di descrivere elementi legati a esperienze sensoriali. In particolare, l’intelligenza artificiale ha mostrato lacune nel catturare le sfumature dell’esperienza umana. I ricercatori hanno affermato che “la rappresentazione umana del ‘fiore’ integra esperienze e interazioni diverse in una categoria coerente”. Nonostante i LLM elaborino enormi quantità di testo, non riescono a catturare alcuni concetti con la stessa profondità degli esseri umani. Questo studio evidenzia l’importanza delle esperienze sensoriali nella comprensione e descrizione del mondo.
Prospettive future per i modelli di linguaggio
Nonostante le limitazioni attuali, Xu ha sottolineato che i LLM sono in un costante processo di evoluzione e miglioramento. In futuro, si prevede che l’integrazione di dati sensoriali e tecnologie robotiche migliorerà notevolmente le capacità di ragionamento e interazione con il mondo fisico. Lo studio è stato pubblicato sulla rivista scientifica Nature Human Behavior, contribuendo a una comprensione più profonda delle differenze tra intelligenza artificiale e esperienza umana. Questo progresso potrebbe portare a modelli di linguaggio più sofisticati e capaci di interagire in modo più efficace con gli esseri umani.