Categoria

Agent systems

Pagina 1 di 2

Agent systems: LLM autonomi che fanno cose, non chatbot che rispondono

Un agent system è un LLM che riceve un obiettivo, pianifica i passi per raggiungerlo ed esegue tool in autonomia, dal file system al browser alle API esterne. È una frontiera diversa dai chatbot: serve scaffolding, gestione del contesto, loop di controllo, sandboxing del codice generato, observability di ogni step.

In questa categoria scrivo di agent design e architettura: otto lezioni dal leak del source map Claude Code, scaffolding Anthropic distillato in pattern riusabili, white-box delle persona vectors, Project Glasswing e il problema dell'auditing terze parti. Tutto applicato a casi reali in MCP, Ollama, deployment on-prem.

Se stai progettando agent e vuoi un confronto tecnico serio su scaffolding, security e governance, parliamone. Oppure leggi chi sono per capire l'approccio.

Un agent in produzione senza sandboxing è una backdoor che hai delegato a un LLM. Non commettere questo errore.

MCP donato alla Linux Foundation: cosa cambia per gli agenti aziendali

22/07/2026

Il passaggio del Model Context Protocol alla Linux Foundation sposta la governance dello standard da un singolo vendor a una fondazione neutrale. Cosa cambia concretamente per chi costruisce agenti aziendali: stabilità dello standard, interoperabilità tra provider, riduzione del rischio di lock-in sul protocollo. Stato dell'ecosistema dei tool MCP e perché la neutralità della governance conta per una scelta di lungo periodo. Continua a leggere

Ultima modifica: Mercoledì 22 Luglio 2026, alle 10:13

AI Governance Agent systems Compliance

Governare gli agenti AI in azienda: il 21% di Deloitte e la realtà della produzione

21/07/2026

Dietro l'hype, solo una minoranza di aziende ha agenti AI realmente in produzione. Lettura onesta del dato per un CIO: cosa significa la distanza tra annuncio e adozione, e soprattutto cosa va normato prima di mettere un agente in produzione, alla luce degli incidenti agentici del 2026. Policy, perimetro operativo, audit trail e sandboxing: il framework di governance che trasforma una sperimentazione in un sistema gestito. Continua a leggere

Ultima modifica: Martedì 21 Luglio 2026, alle 10:27

Cybersecurity Avanzata LLM Agent systems Threat modeling Code Audit

White-box analysis degli LLM: Persona Vectors, emozioni funzionali e checklist di audit per agenti di produzione

26/06/2026

La system card di Mythos del 2026 include più di 40 pagine di white-box analysis: feature distinte per etica, vergogna, stress, ostinazione si attivano quando il modello intraprende azioni non allineate. Anthropic chiama Persona Vectors questa sovrapposizione di stati funzionali. Checklist di audit in dieci punti per verificare se il modello ha feature di deception, reward hacking, self-preservation attive, con strumenti open source da integrare in pipeline. Continua a leggere

Ultima modifica: Venerdì 26 Giugno 2026, alle 08:27

Cybersecurity Avanzata Offensive Security Threat modeling Agent systems Code Audit

Modelli troppo pericolosi per essere rilasciati: Project Glasswing e il problema dell'auditing di terze parti

24/06/2026

Ad aprile 2026 Anthropic ha annunciato Mythos, modello troppo pericoloso da rilasciare al pubblico per le sue capacità di trovare zero-day in OS e browser principali. Disponibile solo entro Project Glasswing a 12 partner enterprise con 100 milioni di crediti usage. Diagnosi del problema che il precedente apre: una stessa azienda crea, valuta e narra il proprio modello senza audit terze parti. Implicazioni di cyber intelligence, governance e cosa una PMI può fare per verificare un vendor AI. Continua a leggere

Ultima modifica: Mercoledì 24 Giugno 2026, alle 09:08

Claude Code AI Development Tools Developer workflow Agent systems Architettura Software

Scaffolding Anthropic: otto lezioni di architettura agent dal leak del codice Claude Code

22/06/2026

Il 31 marzo 2026 Anthropic ha pubblicato per errore 512.000 righe di Claude Code via source map nel pacchetto npm 2.1.88. Ho analizzato il codice leakato e distillato otto lezioni architetturali trasferibili a qualunque MCP server interno: QueryEngine, Tool Registry, Permission Engine, prompt caching stratificato, anti-distillation, auto-compact contesto, KAIROS heartbeat agent, feature flags progressivi. Continua a leggere

Ultima modifica: Lunedì 22 Giugno 2026, alle 07:33

LLM Automation Agent systems Sandboxing gVisor Claude API

Claude Managed Agents vs self-hosted sandbox con seccomp e gVisor: TCO e threat model a confronto

11/06/2026

Anthropic ha rilasciato in public beta il 1 aprile 2026 Claude Managed Agents - harness fully-managed con container configurabili, SSE streaming, zero DIY su E2B/Modal/Firecracker. Ma ha senso dismettere l'harness self-hosted con gVisor + seccomp + cap-drop che ho descritto nell'articolo sul sandboxing? Diagnosi punto per punto: TCO su scala PMI, superficie di attacco comparativa, vendor lock-in, compliance data sovereignty. Spoiler: la risposta è 'dipende da quattro variabili'. Continua a leggere