Archivio

Archivio Articoli del Maggio 2026

Pagina 1 di 3

Maurizio Fonte - Consulente Informatico - Ingegnere del Software e Cyber Security Specialist Freelance

Continual learning e World Models: la roadmap AGI di Amodei e Hassabis a confronto

Continual learning e World Models: la roadmap AGI di Amodei e Hassabis a confronto Dario Amodei e Demis Hassabis, i due CEO più autorevoli del settore AI, disegnano due roadmap diverse verso l'AGI. Amodei scommette su RLVR cross-domain come futuro scatto di generalizzazione. Hassabis sostiene che serva altro: continual learning, World Models, esperienza fisica simulata. Dietro il disaccordo una scelta di investimento che impatta le roadmap aziendali dei prossimi due anni. Confronto delle due strategie con dati 2025-2026 e implicazioni sul tipo di pipeline da costruire oggi. Continua a leggere
Ultima modifica:

Anthropic prompt caching workspace-level: ridurre il 95% dei costi API su un RAG aziendale

Anthropic prompt caching workspace-level: ridurre il 95% dei costi API su un RAG aziendale Dal 5 febbraio 2026 Anthropic offre prompt caching a livello di workspace, con cache hit al 10% del prezzo input standard. Ho migrato il mio chatbot RAG aziendale (system prompt da 3.800 token, 340 documenti retrieval context) e misurato un risparmio del 95% sulla parte prompt ricorrente. Ti racconto passo passo la migrazione, gli errori che ho fatto con la cache invalidation, e come stackare caching + batch per arrivare al minimo teorico. Continua a leggere
Ultima modifica:

METR Time Horizon e benchmark maxing: come leggere i grafici di progresso degli LLM senza farsi ingannare

METR Time Horizon e benchmark maxing: come leggere i grafici di progresso degli LLM senza farsi ingannare Il grafico METR che mostra Opus 4.6 capace di risolvere compiti di 12 ore di lavoro umano nel 50% dei casi è virale come prova di AGI imminente. Letto per intero, il paper limita il test a software, ML e cybersec, con CI da 5 a 65 ore. Il fenomeno si chiama benchmark maxing: i benchmark misurabili sono tutti su task verificabili, mentre legali, commerciali e medici restano fermi. Analizzo METR, RLVR e AA Omniscience per distinguere progresso da hype. Continua a leggere
Ultima modifica:

LangGraph pickle RCE CVE-2026-27794: supply chain alarm sulle pipeline LLM e come l'ho trovato

LangGraph pickle RCE CVE-2026-27794: supply chain alarm sulle pipeline LLM e come l'ho trovato Sto auditando una pipeline LangGraph nella mia sandbox di red team quando noto un'entry sospetta in Redis: un oggetto binario serializzato con pattern pickle. L'indagine porta a CVE-2026-27794 - JsonPlusSerializer(pickle_fallback=True) cade su pickle deserialization quando msgpack fallisce, e scrivere su cache Redis = RCE. Ti mostro la catena completa dalla scoperta al PoC all'hardening, con sigma rule Wazuh per rilevare la classe di attacco. Continua a leggere
Ultima modifica:

Leggere un paper AI nel 2026: guida critica a benchmark, metodologia e claim esagerati

Leggere un paper AI nel 2026: guida critica a benchmark, metodologia e claim esagerati Su arXiv ogni giorno escono centinaia di paper AI e pochi thread Twitter li traducono in claim virali. The Illusion of Thinking di Apple è stato risposto con The Illusion of the Illusion of Thinking, paper semi-scherzoso scritto in larga parte da Claude Opus, e intere community scientifiche lo hanno citato senza leggerlo. Saper leggere un paper AI con occhio critico nel 2026 è competenza di business: la mia checklist in otto passaggi per capire se un lavoro porta evidenze o hype. Continua a leggere
Ultima modifica:

Cloudflare AI Crawl Control e Content Signals: governance del training crawler per il tuo blog aziendale

Cloudflare AI Crawl Control e Content Signals: governance del training crawler per il tuo blog aziendale Il crawl-to-referral ratio di Anthropic è 73.000:1, quello di OpenAI 1.700:1. Il deal storico 'contenuto in cambio di traffico' è rotto. Cloudflare ha risposto con AI Crawl Control e Content Signals Policy, dal luglio 2025 in default-block per i crawler AI sul free tier. Approfondisco le tre categorie (search, ai-input, ai-train), come distinguere senza rompere SEO, il pay-per-crawl beta, e l'impatto strategico dell'acquisizione Human Native di gennaio 2026. Continua a leggere
Ultima modifica:

Lo strawberry problem e l'aritmetica degli LLM: diagnosi di quando NON usare un modello linguistico

Lo strawberry problem e l'aritmetica degli LLM: diagnosi di quando NON usare un modello linguistico Chiedi a GPT-5.4 quante R ci sono in strawberry e può ancora sbagliare. Chiedigli di moltiplicare due numeri di venti cifre e collassa. Non è qualità, è conseguenza strutturale di tokenizzazione, natura probabilistica del prossimo token e mancanza di un vero sistema due. Diagnosi operativa di cinque famiglie di compiti che non vanno mai chiesti a un LLM direttamente, con il criterio pratico per riconoscerle prima di progettare una pipeline che costerà sei mesi e fallirà. Continua a leggere
Ultima modifica:

Qdrant 1.15 asymmetric quantization e binary storage: 10x meno VRAM per stesso recall

Qdrant 1.15 asymmetric quantization e binary storage: 10x meno VRAM per stesso recall Qdrant 1.15 porta asymmetric quantization in produzione: puoi comprimere i vettori a 1,5 bit (24x compressione) mantenendo scalar query alla risoluzione piena. Sul dataset da 180k embedding della mia sandbox, la RAM residente del vector DB è passata da 1,6 GB a 170 MB con recall@10 in calo di soli 0,8 punti. Tutorial completo: setup, configurazione Compose con binding, migrazione da uncompressed, benchmark. Continua a leggere
Ultima modifica:

Tokenizzazione degli LLM e italiano: la tassa nascosta del 64% sulla bolletta API e come ridurla

Tokenizzazione degli LLM e italiano: la tassa nascosta del 64% sulla bolletta API e come ridurla Un prompt in italiano consuma mediamente 1,64 volte i token di un equivalente in inglese. Misura verificata su GPT-4 e Claude Opus 4.7 nel 2026, con tre costi aziendali ignorati: bolletta API più alta, context window saturato prima, performance peggiori su lingue meno rappresentate. Analizzo i tokenizer BPE sulle lingue romanze, riporto le misure raccolte nella mia pipeline personale di automazione AI, e propongo tre strategie concrete per ridurre il tokenaggio in produzione. Continua a leggere
Ultima modifica:

AI Act 2 agosto 2026: checklist 90 giorni per PMI italiane anche se il rinvio arriverà

AI Act 2 agosto 2026: checklist 90 giorni per PMI italiane anche se il rinvio arriverà Il 26 marzo 2026 il Parlamento Europeo ha votato il rinvio dell'AI Act Annex III al 2 dicembre 2027, ma il trilogue non è concluso e gli standard CEN-CENELEC non sono pronti. La posizione prudente per una PMI italiana è pianificare come se la deadline del 2 agosto 2026 fosse ancora binding. Otto azioni concrete da eseguire in 90 giorni, dalla mappatura dei sistemi AI al balancing test documentato, con checklist sanitaria e tempo di esecuzione stimato per ogni passo. Continua a leggere
Ultima modifica: