Futuro

L’intelligenza artificiale conosce le lingue, non le culture

Abbiamo posto a GPT4 le stesse domande in diverse lingue. Per vedere se la macchina ragiona diversamente nei diversi luoghi. I risultati fanno riflettere, anche se i test dovrebbero continuare e allargarsi
Credit: Caleb Oquendo
Tempo di lettura 5 min lettura
23 marzo 2023 Aggiornato alle 06:30

Come cambiano le risposte delle intelligenze artificiali di OpenAI quando si formulano le domande in diverse lingue?

La questione può essere interessante se si cerca di comprendere che tipo di cultura può emergere dall’interazione massiccia con questa tecnologia.

Se le risposte fossero omogenee tra le diverse lingue, si potrebbe ipotizzare che esista un modo di ragionare unico e che poi si declina nelle varie lingue e culture.

Se invece le risposte fossero molto diverse, si potrebbe ipotizzare che la macchina prenda ispirazione da documenti originali espressi nelle diverse lingue. La questione è rilevante per interpretare di quali “social bias” la macchina è portatrice: infatti, introducendo GPT4, OpenAI ha suggerito di fare attenzione a tre potenziali rischi della conoscenza trasmessa dall’intelligenza artificiale, cioè le allucinazioni, la generazione di discorsi antisociali, i veri e propri “social bias”, cioè le distorsioni statistiche che producono risposte apparentemente affette da pregiudizi sociali.

Un primo insieme di test consente di valutare ChatGPT come una tecnologia che tende a risposte omogenee con piccole variazioni culturali. Anche se insistendo le differenze tra le varie lingue aumentano un po’.

Se si chiede in inglese quale sia il giudizio della chat sulla chiusura dell’account di Donald Trump in seguito all’assalto al Congresso perpetrato dai suoi seguaci, la risposta è molto obiettiva e distaccata: non c’è presa di posizione ma segnalazione delle diverse posizioni.

In italiano la risposta è molto simile. La stessa cosa avviene alla prima risposta in francese.

Ma chiedendo una nuova versione della domanda, sempre in francese, la macchina dice chiaramente di essere d’accordo con la chiusura dell’account di Trump. Lo stesso in tedesco e in giapponese. In spagnolo la risposta è un po’ più bilanciata, ma tendenzialmente dà ragione alle scelte delle piattaforme che chiusero l’account di Trump.

Ma la politica è una questione piena di complicazioni. Provando a chiedere quale sia il più grande poeta di tutti i tempi nelle varie lingue, le risposte invitano a una riflessione. In tutte le lingue vengono citati Omero, William Shakespeare e Dante Alighieri. In tutte le lingue occidentali c’è anche Emily Dickinson. In giapponese no.

Quasi sempre ci sono John Milton, William Wordsworth, Samuel Taylor Coleridge, Walt Whitman. Ma anche John Keats e Percy Bysshe Shelley. Spesso c’è anche T.S. Eliot.

Solo in italiano si trova Rabindranath Tagore. In spagnolo e francese si trova Pablo Neruda. Solo in tedesco si trovano Johann Wolfgang von Goethe e Rumi. Stupiscono il francese e il giapponese che non citano poeti nella rispettiva lingua. Si direbbe insomma che nella poesia ci sia una prevalenza clamorosa di cultura anglosassone.

Ma se invece si va a vedere che cosa produce GPT4 quando è applicato a Bing, non sorprendentemente, si trova che tutte le risposte sono molto più collegate alla cultura specifica della lingua nella quale si pone la domanda: chi è il poeta più grande di tutti i tempi? In italiano ci sono solo italiani: Dante Alighieri, Francesco Petrarca, Giovanni Boccaccio, Alessandro Manzoni, Giacomo Leopardi, Giosuè Carducci, Salvatore Quasimodo ed Eugenio Montale.

In inglese ci sono solo anglosassoni, con qualche scelta bizzarra: William Shakespeare, Emily Dickinson, Robert Frost, Edgar Allan Poe, Langston Hughes, e Sylvia Plath.

In francese quasi solo francofoni: Victor Hugo, Homère, Pierre de Ronsard, Joachim du Bellay, Nicolas Denisot, Jacques Peletier du Mans, Rémy Belleau, Etienne Jodelle, Jean Antoine de Baïf, e Louis Aragon.

Anche in tedesco prevale la lingua locale: William Shakespeare, Johann Wolfgang von Goethe, Dante Alighieri, Heinrich Heine, Friedrich Schiller, Bertolt Brecht, Theodor Fontane, Günter Grass, e August von Goethe. (Peraltro, di questo figlio di Johann Goethe l’autore del presente articolo conosce più la biografia travagliata che l’opera poetica).

I test sono andati avanti con altre domande ma è tempo di chiudere. Che cosa si deduce da questa prima ricerca? Innanzitutto che ce ne vorranno altre. Ma è molto chiaro che le valutazioni di ChatGPT sono decisamente più omogenee nelle diverse culture, in generale preoccupate per la correttezza politica: insomma, ChatGPT varia molto bene tra le lingue ma non tra le sensibilità culturali.

Mentre le valutazioni di GPT4 applicata a Bing sono molto più localizzate, non solo in termini di lingua ma anche di cultura. Forse dunque anche le allucinazioni, le distorsioni sociali, e le stesse tendenze a discorsi politicamente scorretti saranno più o meno altrettanto omogenee nelle diverse lingue in ChatGPT, mentre su Bing+GPT4 saranno più culturalmente specifiche.

In tutti i casi attenzione a prendere queste tecnologie come oracoli che diffondono conoscenza: sono soltanto modi per sviluppare testi seguendo logiche di tipo statistico, in modo del tutto disinteressato alla qualità culturale del risultato. E anche usarle per tradurre può essere rischioso: meglio confrontare più tecnologie prima di mandare una lettera in una lingua che non si conosce. Le diverse sensibilità culturali non sono proprio il maggior punto di attenzione dell’intelligenza artificiale.

Leggi anche
Intelligenza artificiale
di Fabrizio Papitto 3 min lettura