Chi è Liang Wenfeng, il fondatore di DeepSeek, l’intelligenza artificiale cinese che sta sfidando gli USA
A gennaio 2025, DeepSeek-R1, un modello open source della società cinese di IA DeepSeek ha fatto tremare la Silicon Valley. D'altronde con soli 6 milioni di dollari, la Cina ha creato un modello di intelligenza artificiale in grado di sfidare le principali aziende tech statunitensi come OpenAi, Microsoft e Google. Dietro al successo del nuovo modello c'è Liang Wenfeng, "un ragazzo molto nerd con una pettinatura orribile che parlava di costruire un cluster da 10.000 chip per addestrare i propri modelli" ricorda uno dei suoi soci. "Non lo prendemmo sul serio, l'abbiamo snobbato."
Wenfeng, 40 anni, nato a Zhanjiang, da anni lavora nel settore, anche se non rispetta i canoni del pioniere dell'intelligenza artificiale (come per esempio Sam Altman). Non è un imprenditore, viene dal mondo della finanza, e ha cominciato a utilizzare l'intelligenza artificiale nelle sue strategie di trading per prevedere le tendenze di mercato e prendere decisioni di investimento. Poi nel 2023 ha fondato DeepSeek, per sviluppare un'intelligenza artificiale generale, in grado di eguagliare l'intelligenza umana.
Il suo obiettivo, come spiega in un'intervista è "smettere di seguire e iniziare a guidare". Per anni le aziende cinesi hanno sfruttato le innovazioni tecnologiche sviluppate altrove "ma questo non è sostenibile. Questa volta, il nostro obiettivo non sono i profitti rapidi, ma l'avanzamento della frontiera tecnologica per guidare la crescita dell'ecosistema". Il piano sta funzionando. E infatti lo sviluppo di un'intelligenza artificiale all'avanguardia a una frazione del costo rispetto ai rivali occidentali ha sollevato nuovi dubbi sulle centinaia di miliardi di dollari pianificati nel settore.
Chi è Liang Wenfeng, il fondatore di DeepSeek
Liang è nato nel 1985 a Zhanjiang, nel Guangdong , suo padre era un insegnante di scuola elementare. Ha studiato all'Università di Zhejiang, una delle più antiche e prestigiose università della Cina. Si è laureato in Ingegneria dell'informazione elettronica nel 2007 e un Master in Ingegneria dell'informazione e della comunicazione nel 2010. La sua tesi di master era intitolata "Ricerca sull'algoritmo di tracciamento del bersaglio basato su telecamera PTZ a basso costo".
Nel 2015, Wenfeng e due suoi compagni di corso creano un hedge fund quantitativo, High-Flyer, che si affida "alla matematica e all'intelligenza artificiale per investimenti quantitativi". Secondo il suo sito, nel 2019 High-Flyer gestiva almeno 10 miliardi di dollari di asset. Nel 2021, Liang inizia ad acquistare migliaia di GPU Nvidia per il suo progetto parallelo di intelligenza artificiale. I suoi soci non lo prendono sul serio, sembrava, dicevano, un miliardario in cerca di un nuovo hobby eccentrico. E invece è l'inizio di DeepSeek. E infatti nel 2023 apre un laboratorio costola di High Flyer per sviluppare la sua intelligenza artificiale.
Perché il progetto DeepSeek spaventa gli Stati Uniti
Il modello apre un nuovo fronte della guerra fretta tecnologica tra Stati Uniti e Cina. DeepSeek infatti, al di là di tutti i blocchi sulle esportazioni, dimostra che si può vincere cambiamo le regole del gioco. L'azienda cinese ha infatti deciso di modificare la struttura fondamentale dei modelli IA e utilizzare in modo più efficace le sue risorse, che sono limitate.
Come ha spiegato Marina Zhang, professoressa associata presso l'Università della tecnologia di Sydney a Wired Usa: "A differenza di molte aziende cinesi di AI che si basano molto sull'accesso a hardware avanzato, DeepSeek si è concentrata sul massimizzare l'ottimizzazione delle risorse basata sul software. Ha adottato metodi open source, mettendo in comune le competenze collettive e promuovendo l'innovazione collaborativa. Questo approccio non solo mitiga i vincoli dal punto di vista delle risorse, ma accelera anche lo sviluppo di tecnologie all'avanguardia, facendo spiccare DeepSeek sui concorrenti più chiusi".
In un documento pubblicato a fine dicembre, i ricercatori di DeepSeek hanno spiegato di aver costruito e addestrato il modello utilizzando 2.000 chip Nvidia H800 a un costo inferiore a 6 milioni di dollari. Molto più basso rispetto alla concorrenza. Elon Musk, per esempio, sta allenando Grok 3, il suo modello IA, su 100.000 GPU H100 di Nvidia. Mark Zuckerberg avrebbe acquistato 350.000 GPU Nvidia H100 nel 2024.
Wenfeng non cerca "profitti eccessivi" e la sua azienda "non diventerà closed-source". L'obiettivo infatti è creare un'industria cinese dell'intelligenza artificiale in grado di recuperare terreno e compere con gli Stati Uniti. "Spesso diciamo che c'è un divario di uno o due anni tra l'IA cinese e quella americana, ma il vero divario è tra originalità e imitazione", ha detto nell'intervista tradotta. "Se questo non cambia, la Cina sarà sempre un Paese che segue".