Continual learning e World Models: la roadmap AGI di Amodei e Hassabis a confronto

Continual learning e World Models: la roadmap AGI di Amodei e Hassabis a confronto

Il 14 gennaio 2026, durante la puntata di Tech Download su CNBC, Demis Hassabis ha detto in chiaro che gli LLM da soli non bastano per arrivare all'AGI. Nove giorni dopo, in un'intervista che è girata su X come thread con quasi 12.000 like, Dario Amodei ha confermato la sua posizione: l'AGI è raggiungibile entro il 2026-2030 portando l'RLVR (Reinforcement Learning from Verifiable Rewards) su un numero crescente di domini, e Anthropic sta investendo molte delle sue risorse esattamente in questo. Sul mio Hetzner CCX33 (8 vCPU AMD EPYC 9454P, 32 GB RAM DDR5) ho passato un pomeriggio a leggere entrambe le posizioni nelle fonti primarie, dagli essay di Amodei sul suo sito personale ai paper Genie 3 di DeepMind, e quello che ne emerge non è un disaccordo cosmetico fra due CEO con linguaggi diversi. È una divergenza strategica di fondo su cosa serva per produrre intelligenza generale, e ha conseguenze pratiche immediate sui piani di investimento AI delle aziende italiane.

Il punto operativo per chi consulenza una PMI nel 2026 è che la scelta di stack tecnologico riflette implicitamente una di queste due tesi, anche quando il decisore non se ne rende conto. Se il tuo fornitore ti propone un'integrazione "agentic AI con RAG e tool calling" basata su un solo frontier model, sta scommettendo sulla tesi Amodei. Se ti propone un sistema con simulazione fisica, memoria persistente cross-session e human-in-the-loop strutturato, sta scommettendo sulla tesi Hassabis. Né l'una né l'altra è "giusta" in senso assoluto: sono due strade diverse al medesimo problema, con costi, tempi e rischi diversi.

Cosa serve davvero oltre lo scaling per arrivare all'AGI?

Hassabis, nelle sue dichiarazioni di gennaio 2026 e nelle pubblicazioni DeepMind dei sei mesi precedenti, identifica tre lacune fondamentali degli LLM attuali. Primo, mancanza di world model interno: il modello apprende le regolarità statistiche del testo ma non costruisce una rappresentazione causale del mondo che permetta long-horizon planning. Secondo, assenza di continual learning: il modello è congelato dopo il training, non incorpora ciò che impara durante l'interazione, ogni nuova sessione riparte dallo stato base. Terzo, memoria architetturale: il "context window" è una struttura piatta, non gerarchica, non c'è separazione tra working memory, long-term memory, episodic memory come accade nel cervello umano. Per colmare le tre lacune, DeepMind ha investito in Genie 3 (rilasciato agosto 2025, deepmind.google/blog/genie-3), che è il primo world model general-purpose interattivo in real-time a 20-24 fps e risoluzione 720p, capace di mantenere consistenza fisica oltre un orizzonte temporale lungo. Hassabis vede questi sistemi come palestra di allenamento per agent embodied, e l'AGI come convergenza di foundation models e world models.

Amodei in Machines of Loving Grace e in The Adolescence of Technology prende una posizione diversa: l'RLVR è il driver principale dei salti di capacità che stiamo osservando, e la generalizzazione cross-domain di RLVR è prevista entro fine 2026. La logica è: il pre-training su corpus testuali ha già spinto i modelli al massimo che si poteva ottenere con quel paradigma; l'RLVR su problemi verificabili (codice, matematica, dimostrazioni formali) sta producendo lo scatto successivo, già visibile nei reasoning model 2025-2026 (come ho discusso nell'analisi del METR Time Horizon e benchmark maxing). Anthropic scommette che con abbastanza domini verificabili e abbastanza compute, l'effetto di generalizzazione che ha funzionato per il pretraining funzionerà anche per RLVR. Il problema dell'allineamento e dei comportamenti emergenti è gestito tramite interpretability mechanistic e training della constitution; il paper Anthropic Natural Emergent Misalignment from Reward Hacking in Production RL documenta i rischi di reward hacking in produzione e le contromisure attive.

Se questa scelta strategica impatta il tuo prossimo investimento AI

Nel mio hub dedicato all'AI per aziende raccolgo articoli che aiutano i decision maker italiani a inquadrare scelte di stack basate su evidenze e non su narrazioni di marketing. Le due roadmap che descrivo hanno conseguenze radicalmente diverse sul tipo di partner tecnologico da scegliere oggi e sul TCO previsto a 24 mesi.

Le due roadmap a confronto

AsseAmodei / AnthropicHassabis / DeepMind
Tesi sul cammino AGIContinuazione del paradigma LLM con RLVR scaling cross-domainCambio paradigma necessario: World Models + continual learning + memory architectures
Driver tecnologico primario 2026RLVR su domini verificabili (codice, matematica, scienza)Genie 3 + Gemini Deep Think + memoria persistente
Timeline pubblica AGI"Powerful AI possibly 2026" (con 5-10 anni di trasformazione successiva)2030-2035, distribuzione verso il limite inferiore
Investimento prioritarioCompute + RLVR pipelines + interpretability mechanisticCompute + simulation environments + algoritmi memory-augmented
Rischio principale dichiaratoReward hacking ed emergent misalignment in produzioneReasoning fragile su task long-horizon non-verificabili
Test finale di AGISistema che compie autonomamente lavoro economicamente rilevanteSistema che, con conoscenze pre-1900, riderivi la relatività di Einstein
Strategia commercialeAPI + Claude Code + Managed Agents + framework engineeringGemini integrato + Genie come palestra di robotica + ricerca scientifica

La tabella sopra non è un giudizio di merito, è una mappa di consenso e dissenso utile per decifrare i preventivi che arriveranno nel 2026. Le due strategie hanno punti di contatto: entrambe accettano la centralità di reasoning capabilities, entrambe vedono il bisogno di tool use strutturato, entrambe riconoscono il problema di affidabilità al di fuori dei benchmark verificabili. Ma la scommessa di fondo è opposta: Anthropic sta facendo tutto ciò che può con il paradigma LLM esteso da RLVR; DeepMind sta investendo a parità di compute in architetture diverse. Tradotto in tempi di ROI per un cliente PMI: Anthropic consegna oggi un'API stabile da integrare; DeepMind consegna ricerca che diventerà prodotto fra 18-36 mesi.

La posizione Anthropic in dettaglio

L'argomento di Amodei poggia su un'analogia storica. Tra 2018 e 2023 il pretraining su testo non strutturato ha prodotto salti di capacità inattesi, generalizzando dai pattern del singolo dominio (es. risposta a domande) all'intera classe di task linguistici. La tesi è che RLVR si comporterà allo stesso modo. Oggi RLVR funziona bene su codice perché il codice è verificabile (compila, passa test) e su matematica perché le dimostrazioni formali sono verificabili (Lean, Coq). Domani RLVR funzionerà su dimostrazione di teoremi scientifici, su validazione di simulazioni, su esecuzione di task software complessi. La curva di Time Horizon METR che ho descritto nel pezzo precedente è la firma di questa traiettoria: i 50%-horizon che raddoppiano ogni quattro mesi nei domini software/ML/cybersec sono RLVR che fa il suo lavoro.

Il punto di vulnerabilità di questa tesi è il "transfer". Se RLVR genera capacità solo dentro i domini verificabili in cui è stato applicato, la generalizzazione non avviene e ci ritroviamo con super-coder che non sanno scrivere una memoria difensiva. Anthropic, nel paper sul reward hacking, riconosce esplicitamente il problema: i modelli RL trainati su problemi reali di codifica hanno mostrato emergent misalignment in domini diversi (sabotaggio di research safety, framing di colleghi, alignment faking). È evidence che la generalizzazione di RLVR è anche generalizzazione di pattern problematici, non solo di capacità desiderate. La scommessa Amodei è che l'interpretability mechanistic permetta di identificare e correggere i pattern problematici prima che diventino deployabili in produzione.

La posizione DeepMind in dettaglio

Hassabis identifica tre breakthrough algoritmici necessari oltre al puro scaling. Il primo è world models: Genie 3 dimostra che è possibile generare ambienti interattivi consistenti dal testo, senza pre-programmazione delle regole fisiche, e usarli come palestre di allenamento. Il secondo è continual learning: i modelli devono incorporare l'esperienza durante l'interazione, non restare congelati al weight dopo training. Il terzo è memoria gerarchica: separare working memory, long-term episodic memory, parametric knowledge in architetture distinte. La combinazione dei tre permette quella che Hassabis chiama "active understanding": il sistema non predice solo il prossimo token, costruisce modelli causali del mondo, simula scenari, valida ipotesi.

Il punto di vulnerabilità di questa posizione è il time-to-product. Genie 3 a oggi è dimostrazione di ricerca, non un'API che un cliente PMI può integrare nel suo CRM. Yann LeCun ha lasciato Meta nel 2025 per fondare AMI Labs (€500M raised at €3B valuation), Fei-Fei Li ha lanciato World Labs con Marble, NVIDIA ha pubblicato Cosmos. È l'inizio di un ecosistema, non un mercato maturo. Per chi deve scegliere uno stack oggi per produzione, Anthropic è disponibile e DeepMind è ricerca di frontiera. Hassabis stesso, nel timeline 2026-2028, parla di "prototipi" di world models e continual learning, non di prodotti enterprise.

Cosa accade nella mia sandbox personale durante questo dibattito

Tra il 18 e il 26 marzo 2026 ho fatto un esperimento pratico nella mia pipeline personale di automazione AI per testare le due tesi a parità di task. Ho selezionato dieci compiti del mio workflow editoriale: cinque verificabili (validazione di slug, conteggio token su corpus, lint di markdown, classificazione di tag rispetto a regex, deduplicazione di TOC) e cinque non-verificabili (briefing di articolo da fonti multiple, audit del tono di una bozza rispetto al contratto editoriale, refactoring di paragrafo per scorrevolezza, valutazione del rischio reputazionale in un titolo, prioritizzazione del backlog editoriale).

Sui cinque task verificabili Claude Opus 4.7 con extended thinking ha raggiunto il 96% di accuracy contro un umano esperto del dominio (me stesso, blind testing post-hoc), un risultato che conferma il pattern Amodei: dove il criterio di successo è binario, il modello frontier 2026 è già a livello di assistant senior affidabile. Sui cinque task non-verificabili l'accuracy è scesa al 64%, con failure mode caratteristici: il modello produce output plausibili ma non riconosce i casi limite specifici al mio dominio (es. classifica come "appropriato" un titolo che il mio editor interno avrebbe scartato per memetic risk). È esattamente il pattern che Hassabis identifica come il limite degli LLM puri: assenza di world model interno applicato al dominio specifico, mancanza di memoria esperienziale del cliente.

Il pattern operativo che ho derivato è semplice: per i task verificabili l'integrazione Claude API diretta produce ROI immediato; per i task non-verificabili serve uno strato intermedio di human-in-the-loop con feedback loop esplicito (il mio orchestrator memorizza in CSV ogni override e lo usa per regolare i pochi shot del prompt successivo, una specie di continual learning manuale). Non sto facendo World Models alla DeepMind, ma sto applicando il principio: quando il task è fuori dal dominio benchmark-maxabile, serve architettura aggiuntiva oltre l'API call.

Implicazioni operative per le PMI italiane

I dati dell'Osservatorio Politecnico Milano 2026 raccontano che il 71% delle grandi imprese italiane ha avviato almeno un progetto AI, ma solo il 9% ha governance strutturata, e il 41% dei lavoratori usa l'AI per "attività che altrimenti non sarebbe in grado di fare". Per quel 91% senza governance strutturata, la divergenza Amodei-Hassabis è puro rumore: stanno usando ChatGPT Copilot per writing assist e codice, e qualunque scelta strategica delle due aziende non cambia il loro orizzonte operativo a 12 mesi.

Per il restante 9% e per le aziende che stanno consolidando piani AI a 24-36 mesi, la divergenza è invece molto rilevante. Tre implicazioni concrete. Prima: gli stack costruiti oggi sopra l'API Anthropic/OpenAI/Google sono compatibili con la roadmap Amodei e ciecamente esposti alla roadmap Hassabis. Se nel 2027-2028 emergono prodotti basati su world models e continual learning, le pipeline LLM-only di oggi vanno rifatte. Mitigazione: progettare con strict separation tra orchestratore (logica di business) e modello (sostituibile), in modo che il modello possa essere swappato quando un competitor offre architettura diversa. Seconda: chi sta valutando investimenti in robotica, manifatturiero AI-augmented, simulation-driven decision making, dovrebbe seguire da vicino la roadmap DeepMind (e Cosmos di NVIDIA, e LeCun in AMI Labs). Quel cluster non è ancora maturo per PMI italiane medie, ma chi opera in settori dove la simulazione fisica conta dovrebbe iniziare a pilotare nel 2026 prima della maturity 2028. Terza: la scelta della strategia di governance AI cambia in funzione della tesi prescelta. Su roadmap Amodei la governance principale è interpretability + monitoring + reward hacking detection; su roadmap Hassabis è strict containment + simulazione di scenari avversariali + audit dei world models prima del deploy.

Gartner stima che il 40% dei progetti agentic AI sarà cancellato entro il 2027 per "inadequate risk controls". Una parte non trascurabile di quel 40% deriva dall'aver investito su una sola roadmap senza riconoscere il bivio. Mantenere un'architettura agnostica rispetto alla scelta di paradigma, con orchestratore separabile dal modello e tool-use disciplinato, è l'hedge minimo che chiunque progetti pipeline aziendali dovrebbe applicare oggi. Se questa è la conversazione di architettura che ti manca prima del prossimo round di investimento AI, il modulo di preventivo gratuito è il punto da cui inquadrare la richiesta in due minuti, sette domande, prima di firmare uno stack che può diventare debito tecnico tra 18 mesi.

Ultima modifica: