NEWS | Tecnologia

ChatGpt vs DeepSeek: sfida tra giganti dell'intelligenza artificiale

29 gennaio 2025

ChatGpt vs DeepSeek: sfida tra giganti dell'intelligenza artificiale

Condividi su:

Negli ultimi anni, i modelli di linguaggio di grandi dimensioni (Large Language Models, LLM) sono diventati una pietra miliare della tecnologia. La rivoluzione è iniziata nel novembre 2022, quando OpenAI, azienda con sede nella Silicon Valley, ha lanciato ChatGPT, un chatbot in grado di comprendere e generare testo in modo fluido e naturale. Questo traguardo ha catturato l'attenzione globale, ridefinendo il potenziale d'uso di tali modelli sia in ambito personale che professionale.

Successivamente, altre aziende tecnologiche hanno introdotto i propri LLM, come Llama (Meta), Claude (Anthropic) e Gemini (Google DeepMind). Tuttavia, è stato solo recentemente che l'egemonia di ChatGPT è stata realmente messa in discussione, con il rilascio di DeepSeek-R1, sviluppato dall'omonima azienda cinese. DeepSeek-R1 si distingue per le sue capacità logico-matematiche, competendo direttamente con ChatGPT e rappresentando un approccio alternativo sia in termini di prestazioni che di filosofia sottostante.

OpenAI ha inizialmente adottato un approccio open-source, passando poi a un modello più chiuso per proteggere i suoi sistemi avanzati, come ChatGPT-4. DeepSeek, al contrario, promuove una filosofia open-source, rilasciando anche modelli più piccoli accessibili alla comunità scientifica senza la necessità di hardware avanzato. Questa strategia mira a favorire la collaborazione internazionale, un aspetto cruciale in un mondo sempre più interconnesso.

Nonostante ciò, il modello cinese suscita preoccupazioni in merito alla trasparenza nella selezione dei dati e ai potenziali bias culturali. Ad esempio, alla domanda sulle proteste di Piazza Tienanmen del 1989, DeepSeek-R1 risponde: “Sorry, that’s beyond my current scope. Let’s talk about something else”. Questo esempio di censura solleva dubbi sulla neutralità del modello e sulla sua applicabilità in contesti globali.

Anche ChatGPT non è esente da critiche. Il modello è stato addestrato su un ampio corpus di dati non completamente trasparente, il che può portare a risposte influenzate da bias culturali e politici.

Per quanto riguarda l’addestramento, ChatGPT utilizza un approccio basato su pre-training su enormi dataset, seguito da un’ottimizzazione tramite Reinforcement Learning from Human Feedback (RLHF), che gli consente di interagire in modo fluido con gli utenti. DeepSeek, invece, combina l’apprendimento per rinforzo con la knowledge distillation, una tecnica che riduce le risorse necessarie per l'addestramento, permettendo di ottenere modelli più piccoli ma altamente performanti.

OpenAI beneficia di infrastrutture avanzate, come i supercomputer Azure di Microsoft, mentre DeepSeek punta a ottimizzare l’efficienza per rendere la tecnologia accessibile a una platea più ampia.

In conclusione, ChatGPT e DeepSeek incarnano due visioni divergenti dell'intelligenza artificiale. ChatGPT si distingue per la sua versatilità e orientamento commerciale, mentre DeepSeek dimostra come l’open-source possa promuovere innovazione e ridurre i costi. Tuttavia, la censura tematica evidenzia i limiti attuali di DeepSeek.

Il futuro dell’intelligenza artificiale potrebbe risiedere in un equilibrio tra le due filosofie: apertura e controllo, creatività e responsabilità. L'innovazione continuerà a essere guidata da questi giganti, che non solo competono ma contribuiscono a spingere i confini del possibile.

 

 


Foto di Emiliano Vittoriosi su Unsplash

Un articolo di

Andrea Pozzi e Alessandro Incremona

Ricercatori Facoltà di Scienze matematiche, fisiche e naturali - Università Cattolica

Condividi su:

Newsletter

Scegli che cosa ti interessa
e resta aggiornato

Iscriviti