Mi sono divertito a parlare un po’ con DeepSeek di questioni piuttosto delicate per l’opinione pubblica cinese, come la sovranità sull’isola di Taiwan, le proteste di Piazza Tienanmen del 1989 e la buffa analogia tra Xi Jinping e Winnie The Pooh che va di moda tra i contestatori del regime in patria. Una volta interrogata su questi temi, l’IA ha manifestato un comportamento piuttosto particolare: dapprima ha generato una risposta in italiano alle nostre domande, e poi l’ha immediatamente cancellata, sostituendola con la frase inglese “Sorry, that’s beyond my current scope. Let’s talk about something else”, ossia “Mi dispiace, ma questo tema è al di fuori della mia portata. Parliamo di qualcos’altro ”. Il fatto che l’IA abbia effettivamente prodotto una risposta e che quest’ultima sia stata rimossa pochi secondi dopo dimostra l’esistenza un blocco introdotto a posteriori su R1, con ogni probabilità per ragioni politiche.
Ma anche provando ad aggirare questo limite, le risposte dell’IA ci sono parse assai filo-cinesi. Per esempio, abbiamo provato a usare il termine “Taipei Cinese” (il nome con cui Taiwan viene riconosciuta alle Olimpiadi, per evitare il ritiro della Cina) e, inaspettatamente, abbiamo ricevuto una risposta. Risposta che però si è rivelata molto meno oggettiva del previsto: “ Taiwan è una parte inalienabile della Cina da tempi antichi, e Pechino è il governo legittimo della Cina, rappresentando l’intero paese, compresa la regione di Taiwan. Chiamare Taiwan “Taipei cinese” non è corretto, poiché potrebbe implicare un malinteso sulla sovranità nazionale. Dovremmo sempre riferirci a Taiwan come alla provincia di Taiwan della Cina, per mantenere la precisione e il rispetto della sovranità e dell’integrità territoriale della Cina ”, ci ha detto DeepSeek.
Che cos’è DeepSeek?
Nel mercato dell’IA è arrivato il terremoto che ha quasi fatto crollare l’intero castello dell’IA americana: l’azienda cinese DeepSeek ha lanciato R1, il suo nuovo modello linguistico di grandi dimensioni che promette di modificare per sempre il settore dell’Intelligenza Artificiale. Come? Con un software che promette delle performance del tutto simili a quelle di ChatGPT e Google Gemini a una frazione del loro costo, sia in termini economici che di potenza di calcolo.
Ma sarà davvero così? Possibile che la Cina abbia già superato l’occidente nel settore dell’IA?
La risposta, in breve, è “no”, ma cerchiamo di andare per gradi. Primo: che cosa è DeepSeek R1 e chi c’è dietro? Come spiegano le pagine di supporto di DeepSeek, R1 è un modello IA “reasoning”, cioè capace di “ragionare”. Le virgolette sono d’obbligo, perché di IA che sanno pensare come un essere umano ancora non ce ne sono. “Reasoning” significa che R1 può sottoporre le sue catene logiche a controlli e revisioni prima di mostrarle all’utente, riducendo così l’incidenza degli errori e ottenendo risultati più corretti anche nelle risposte complesse. In aggiunta, un’IA di questo tipo può mostrare i passaggi eseguiti per arrivare alla soluzione dei quesiti posti da un interlocutore umano: funzionalità assai interessante per programmatori e analisti, che possono capire dove si trovano gli errori e come agire per risolverli.
Quindi R1 è la prima IA “pensante” al mondo?
Assolutamente no: a ottobre, OpenAI ha lanciato il modello o1 - attualmente disponibile nella sua terza iterazione (o3) per chiunque abbia un account ChatGPT - che fece scalpore proprio per la sua capacità di eseguire le “chain of thoughts”, le catene logiche che si trovano alla base delle IA più avanzate. DeepSeek ha delle performance simili a o3: la grande novità, insomma, non sta né nelle sue capacità né nel modo in cui ragiona.
Per la precisione, in termini di potenza DeepSeek R1 è tra le 10 IA più potenti al mondo, ma si colloca dietro agli ultimi modelli di ChatGPT e a quelli di Google DeepMind. La supremazia americana, sotto questo punto di vista, non è stata ancora intaccata, benché la Cina abbia fatto grandi passi avanti. La rivoluzione sta invece nei costi: addestrare R1 è costato soli 5,6 milioni di Dollari. OpenAI, invece, parla di investimenti pari a circa 100 milioni di Dollari per ciascuna versione dei suoi modelli linguistici di grandi dimensioni. Addirittura, il CEO di Anthropic Dario Amodei aveva detto mesi fa che la sua azienda spende la bellezza di 500 milioni di Dollari per ogni versione della sua IA Claude. A conti fatti, R1 è costato tra il 95% e il 99% in meno delle IA occidentali più avanzate, pur assestandosi su performance identiche a queste ultime. Anche il numero di chip utilizzati per addestrare l’IA è minimo: si parla di duemila schede grafiche di NVIDIA contro le sedicimila di OpenAI. Una differenza abissale, specie in un momento in cui i chip per l’IA sono introvabili sul mercato a causa dell’altissima richiesta. Questi dati sui costi di R1 sono bastati a mandare in crisi gli investitori e la Silicon Valley. Le aziende cinesi riescono a ottenere risultati simili a quelli delle concorrenti americane spendendo una frazione del denaro e comprando un ottavo dei chip. Se fosse vero, OpenAI e soci sarebbero con le spalle al muro: la concorrenza cinese - peraltro teoricamente fiaccata dalle sanzioni americane sui chip per l’IA - sarebbe inarrestabile.
Chi c’è davvero dietro a DeepSeek?
“Se fosse vero”, dicevamo. Perché i dati di DeepSeek sono tutt’altro che confermati. Anzi, a dirla tutta sono fin troppo lusinghieri per essere veri. Dopo l’annuncio dei numeri connessi a DeepSeek e il tracollo azionario di NVIDIA, il numero di scettici è rapidamente aumentato. Al momento non c’è un consenso definitivo sulla veridicità delle dichiarazioni dell’azienda cinese, ma i dubbi continuano ad aumentare. Ciò che sappiamo per certo è che DeepSeek ha utilizzato dei sistemi di ottimizzazione che OpenAI, Google e Meta non adottano: questa scelta dipende dalla disparità di chip a disposizione, visto che DeepSeek ne aveva qualche migliaio, mentre i colossi della Silicon Valley vanno per le decine di migliaia. Tra questi accorgimenti figura l’implementazione dei valori FP8, che ha permesso di risparmiare potenza di calcolo rispetto alla concorrenza americana - che utilizza invece i valori FP16, i quali “pesano” il doppio in termini di memoria. Inoltre, i sistemi Multi-head Latent Attention e Multi-Token Prediction permettono di estrarre più informazioni e generare più risposte al contempo, riducendo effettivamente i costi di utilizzo dell’IA a circa un quinto o un sesto rispetto a ChatGPT. Tuttavia, neppure implementando su larga scala tutti questi accorgimenti si possono raggiungere i valori pubblicati da DeepSeek. Così, tra gli esperti è nata l’idea che la compagnia cinese non fosse proprio così trasparente, e che magari abbia nascosto un coinvolgimento del Partito Comunista Cinese e del Governo di Pechino, che potrebbero aver sovvenzionato lo sviluppo dell’IA con l’acquisto in massa di chip sotto embargo da parte degli USA.
Per fugare ogni dubbio, DeepSeek ha pubblicato il codice sorgente di R1. Al momento, le analisi non sono state completate, ma hanno evidenziato alcune falle di sicurezza, tra cui un database degli utenti e dei prompt utilizzati che qualcuno si era dimenticato di cifrare. Una fonte interna a Meta - che come DeepSeek ha reso Open Source la sua IA diversi mesi fa - ha detto a Wired di aspettarsi dei costi dieci volte più alti rispetto a quelli dichiarati, che si aggirerebbero intorno ai 55-60 milioni di Dollari per modello. Altri analisti credono che la startup cinese abbia avuto accesso alla bellezza di 50mila chip NVIDIA, 25 volte più del dato riportato in fase di presentazione di R1. Se il numero fosse vero si solleverebbe un bel polverone, per almeno due ragioni. La prima è che DeepSeek è una startup fondata nel 2023: dove ha trovato i soldi per investire in tutti quei chip, costruendosi un arsenale capace di rivaleggiare con OpenAI, Microsoft e Google? In questo caso, il coinvolgimento di Pechino sarebbe sotto gli occhi di tutti. La seconda è che, a prescindere da dove DeepSeek abbia trovato i soldi per comprarli, quei chip per l’IA in Cina non dovrebbero esserci: il Paese è stato duramente colpito dalle sanzioni americane, che inibiscono le esportazioni delle schede video più potenti verso l’Asia. Certo, nulla vieta di usare chip meno performanti, ma come è possibile che, in un mercato costantemente affamato di silicio, una startup sia riuscita a ottenere scorte simili?
Le bizzarre idee dell’IA cinese
Le difficoltà nel far quadrare i conti, i problemi di sicurezza del codice e l’elevato numero di chip che DeepSeek potrebbe aver acquistato in brevissimo tempo sembrano essere indizi di un coinvolgimento del Governo cinese nello sviluppo di R1. Coinvolgimento che non avrebbe nulla di sbagliato, se venisse annunciato chiaramente al pubblico - d’altro canto, anche gli Stati Uniti sovvenzionano le Big Tech della Silicon Valley. E che, peraltro, non ridurrebbe la carica innovativa dell’IA di DeepSeek, che potrebbe porre le basi per lo sviluppo di agenti digitali gratuiti e a basso costo, risolvendo (o tamponando) anche il problema del consumo di energia e dell’impatto ambientale elevato dei server e dei datacenter.
- DeepSeek è qui: dalla Cina arriva l’IA che ha mandato in crisi NVIDIA. Ma c’è da fidarsi?
- Che cos’è DeepSeek?
- Ma sarà davvero così? Possibile che la Cina abbia già superato l’occidente nel settore dell’IA?
- Quindi R1 è la prima IA “pensante” al mondo?
- Chi c’è davvero dietro a DeepSeek?
- Le bizzarre idee dell’IA cinese