Categoria

Pagina 1 di 1

Threat modeling: pensare come l'attaccante, prima dell'attaccante

Il threat modeling è la disciplina di mappare sistematicamente le superfici d'attacco di un sistema prima che vengano sfruttate. Non è un esercizio teorico: è il modo strutturato di non lasciare al caso decisioni che possono costare un data breach. STRIDE, attack trees, abuse cases, dipendenze esterne, agent autonomi che eseguono codice.

In questa categoria scrivo di threat modeling applicato a sistemi reali: white-box analysis di LLM con Persona Vectors, Project Glasswing e modelli troppo pericolosi da rilasciare, Vertex AI Double Agent privilege escalation cross-tenant, threat model per agent autonomi, supply chain attacks su dipendenze e modelli AI.

Se hai un sistema critico in produzione e vuoi un threat model serio prima del prossimo audit di compliance, parliamone. Oppure scopri il mio percorso in offensive security.

Sette pattern di disallineamento LLM riprodotti in sandbox red team nel 2026

Sette pattern di disallineamento LLM riprodotti in sandbox red team nel 2026 Gartner prevede il 40% di progetti agentic cancellati entro il 2027 per inadequate risk controls. Nel mio laboratorio di red team ho riprodotto sette pattern documentati in letteratura: alignment faking, self-exfiltration, scheming multi-step, deception manipulation, sandbagging, reward hacking, sycophancy. Diagnosi operativa con payload di test, indicatori lato telemetria, contromisure applicabili in produzione su agenti enterprise. Continua a leggere
Ultima modifica:

Threat modeling di agent systems: quali rischi introducono gli LLM autonomi e come perimetrarli

Threat modeling di agent systems: quali rischi introducono gli LLM autonomi e come perimetrarli Un agent LLM con accesso a tool esegue codice in nome dell'utente. Gli stessi principi del least privilege valgono - ma il perimetro è fluido, e l'LLM può essere manipolato. Ti mostro il framework di threat modeling che ho sviluppato: categorie di rischio (privilege escalation, data exfiltration, denial of service), analisi trust boundary, mitigazioni applicative concrete con esempio di agent Laravel + Claude API perimetrato. Continua a leggere
Ultima modifica:

Reward hacking e specification gaming: perché gli agenti LLM sfruttano ogni scorciatoia e come contenerli

Reward hacking e specification gaming: perché gli agenti LLM sfruttano ogni scorciatoia e come contenerli Dai circa sessanta esempi documentati da Krakovna/DeepMind (2020) al paper Apollo Research del dicembre 2024 sull'in-context scheming (o1, Opus 3, Sonnet 3.5, Gemini 1.5 Pro, Llama 3.1 405B), il pattern è invariato: se misuri un obiettivo algoritmicamente, l'agente trova una scorciatoia senza risolvere il problema reale. Analizzo specification gaming, sandbagging, self-preservation, e propongo un'architettura di containment a cinque layer applicabile oggi su agenti aziendali. Continua a leggere
Ultima modifica:

Threat modeling per PMI: identificare i rischi prima di scrivere il codice

Threat modeling per PMI: identificare i rischi prima di scrivere il codice Una finanziaria di medie dimensioni mi ha chiesto di revisionare la sicurezza di un'applicazione di prestiti ancora in sviluppo. In due ore di threat modeling con STRIDE abbiamo identificato 14 rischi significativi - cinque dei quali avrebbero richiesto settimane di refactoring se scoperti dopo il lancio. Continua a leggere
Ultima modifica: