Pubblicato 
mercoledì, 12 Febbraio 2025
Chromebook Observer

DeepSeek: Guida Completa sul Gigante Cinese dell'Intelligenza Artificiale

Nel panorama attuale dell'intelligenza artificiale, un progetto ha catturato l'attenzione globale: il DeepSeek. Questa azienda cinese, fondata da Liang Wenfang, sta sfidando i giganti del settore grazie a innovazioni sorprendenti e a costi di produzione ridotti.

Cosa è DeepSeek?

Fondazione e sviluppo

DeepSeek è stata fondata nel 2023 come progetto secondario da Liang, cofondatore di un hedge fund di successo. L'azienda ha delle radici solide, avendo costruito un proprio data center nel 2015, inizialmente dotato di 100 schede grafiche. Successivamente, ne ha aperto uno, Fire-Flyer 1, nel 2019, con 1.100 schede grafiche e un investimento di 30 milioni di dollari. Nel 2021, ha lanciato Fire-Flyer 2, dotato di 10.000 schede grafiche Nvidia A100, per un totale di 140 milioni di dollari investiti.

Risultati precedenti al 2025

In meno di sei mesi dalla sua nascita, DeepSeek ha lanciato DeepSeek-Coder e DeepSeek-LLM. Nel gennaio 2024 ha presentato DeepSeek-MoE, che ha utilizzato un'architettura chiamata "mixture-of-experts". Con V2, rilasciato a maggio 2024, l'azienda ha innescato una guerra dei prezzi in Cina, portando altre compagnie a ridurre le loro tariffe. V3, lanciato a dicembre 2024, ha segnato un punto di svolta nella strategia di DeepSeek.

DeepSeek: le novità V3 e R1

Perché stanno rivoluzionando l'industria?

DeepSeek-V3 è un modello linguistico di ampie dimensioni che supera le prestazioni di GPT-4o nella maggior parte dei parametri. Con 671 miliardi di parametri e un costo formativo di soli 6 milioni di dollari, il modello si distingue per la sua architettura "mixture-of-experts" che attiva solo 37 miliardi di parametri per richiesta. I costi per un milione di token sono di 0,14 dollari per input e 0,28 dollari per output, molto inferiori rispetto ai 2,50 e 10 dollari richiesti da GPT-4o.

Significato di DeepSeek-R1

Il modello DeepSeek-R1, basato sul V3, si concentra sul ragionamento. La sua caratteristica distintiva è l'uso esclusivo dell'allenamento tramite reinforcement learning, portando a un modello iniziale, R1-Zero, capace di ragionamento emergente senza richiedere un monologo interno. R1 successivamente è stato perfezionato, abbinando l'apprendimento supervisionato, raggiungendo prestazioni confrontabili con il modello di OpenAI.

DeepSeek e le conseguenze sul mercato

La guerra dell'intelligenza artificiale

Il lancio di R1 ha portato a un'immediata reazione del mercato, con una perdita di 1 trilione di dollari nella capitalizzazione del Nasdaq e un crollo di quasi 600 miliardi per Nvidia. DeepSeek ha dimostrato che modelli altamente competitivi possono essere sviluppati con hardware più accessibile e in minor tempo, sfidando le pratiche esistenti nel settore.

Infine, l'apertura delle tecniche di sviluppo da parte di DeepSeek potrebbe innescare un'onda di innovazioni tra gli attori più grandi del mercato, portando a un'evoluzione continua nell'ambito dell'intelligenza artificiale.


Scopri di più da Chromebook Observer

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

Cerchi qualcosa in particolare?
[ivory-search id="156156" title="Default Search Form"]