Categoria

Pagina 1 di 2

Risk Management: decidere cosa proteggere prima di come proteggerlo

Risk management IT è il prerequisito di qualsiasi strategia di sicurezza seria. Prima di spendere budget in strumenti, vanno identificati gli asset critici, mappate le minacce realistiche, valutato l'impatto potenziale. Solo a quel punto le scelte tecniche hanno un senso economico e operativo.

In questa categoria scrivo di metodologie di risk assessment applicabili alle PMI, integrazione con obblighi NIS2 e GDPR, matrici di rischio pratiche, prioritizzazione degli interventi. Per un assessment sulla tua azienda scrivimi, oppure leggi il mio percorso in consulenza strategica IT.

Deepfake detection al 78% e provenance: tutorial per configurare Content Credentials e SynthID in azienda

Deepfake detection al 78% e provenance: tutorial per configurare Content Credentials e SynthID in azienda Il miglior detector commerciale deepfake del 2026 raggiunge 78% di accuratezza su 44 ore di video, esperti forensi arrivano al 90% dichiarato. Dato il limite strutturale, la strategia difensiva passa dalla provenance: Content Credentials (firma C2PA) e SynthID (tracce nei metadata Google Veo). Tutorial pratico per configurare entrambi su un workflow aziendale, con analisi dei casi aggirabili, interoperabilità limitata, valore residuo legale e reputazionale. Continua a leggere
Ultima modifica:

Propaganda AI e spirale del delirio: checklist di protezione del brand per PMI con visibilità mediatica

Propaganda AI e spirale del delirio: checklist di protezione del brand per PMI con visibilità mediatica Il provvedimento Garante Privacy gennaio 2026 contro Grok/ChatGPT/Clothoff ha cristallizzato un pattern emergente: quando la qualità dei deepfake è alta, anche i contenuti autentici vengono considerati fake da pezzi di opinione pubblica. È il liar dividend. Per una PMI italiana con CEO visibile, testimonial o portavoce, è un rischio reputazionale nuovo. Checklist operativa in dodici punti per protezione del brand: monitoring, procedure di verifica, policy interna, contrattualistica. Continua a leggere
Ultima modifica:

AA Omniscience e il confronto sulle allucinazioni: quale modello sa dire "non lo so" nel 2026

AA Omniscience e il confronto sulle allucinazioni: quale modello sa dire "non lo so" nel 2026 AA Omniscience di Artificial Analysis (novembre 2025) misura su 6.000 domande in 6 domini un fenomeno che le big AI preferiscono ignorare: quando il modello non sa, inventa o dice non lo so? Solo 3 modelli su 36 ottengono punteggio sopra zero (Claude Opus 4.1, GPT-5.1, Grok 4). Anthropic occupa le prime 3 posizioni per hallucination rate più basso. Tabella comparativa 2026 e implicazioni pratiche per chi sta scegliendo un modello per la pipeline aziendale. Continua a leggere
Ultima modifica:

Lo strawberry problem e l'aritmetica degli LLM: diagnosi di quando NON usare un modello linguistico

Lo strawberry problem e l'aritmetica degli LLM: diagnosi di quando NON usare un modello linguistico Chiedi a GPT-5.4 quante R ci sono in strawberry e può ancora sbagliare. Chiedigli di moltiplicare due numeri di venti cifre e collassa. Non è qualità, è conseguenza strutturale di tokenizzazione, natura probabilistica del prossimo token e mancanza di un vero sistema due. Diagnosi operativa di cinque famiglie di compiti che non vanno mai chiesti a un LLM direttamente, con il criterio pratico per riconoscerle prima di progettare una pipeline che costerà sei mesi e fallirà. Continua a leggere
Ultima modifica:

Perché le allucinazioni LLM non si risolvono col prompting: rappresentazione distribuzionale e limiti architetturali

Perché le allucinazioni LLM non si risolvono col prompting: rappresentazione distribuzionale e limiti architetturali Nel 2023 Sam Altman prometteva di risolvere le allucinazioni in due anni; nel 2025 OpenAI stessa pubblica "Why Language Models Hallucinate" (arxiv 2509.04664) mostrando che sono strutturalmente inevitabili. AA-Omniscience 2025 di Artificial Analysis: 36 modelli su 40 più propensi a sbagliare che sapere. GPT-5.5 xhigh: 86% hallucination rate vs Opus 4.7 max 36%. Perché il prompting non le elimina, pattern di validazione esterna che funzionano in produzione. Continua a leggere
Ultima modifica:

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base The Illusion of Thinking di Apple (arxiv 2506.06941, Shojaee et al. giugno 2025) ha documentato tre regimi di performance dei LRM: bassa complessità dove il modello base è equivalente e più efficiente, media dove il reasoning guadagna, alta dove entrambi collassano a zero accuracy. Tabella comparativa con Torre di Hanoi, River Crossing, critica di Lawsen, Limit of RLVR (Yue 2025), implicazioni di progetto: cosa demandare davvero a un LRM e cosa deve restare in algoritmo formale. Continua a leggere
Ultima modifica:

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri Chain-of-thought nel 2022 ha sbloccato il ragionamento negli LLM; nel 2026 è tra i principali contributori a latenza, costi e overthinking. Il paper Anthropic Reasoning Models Don't Always Say What They Think (2505.05410) ha mostrato CoT faithful solo nel 25% dei casi su Claude 3.7 Sonnet. Checklist in sette criteri per decidere quando attivare, disattivare o vincolare il thinking su Claude, GPT-5.4 e Gemini 3.1, con ROI misurabile. Continua a leggere
Ultima modifica:

Valutare un LLM prima di adottarlo: checklist su benchmark, data leaking e chatbot Arena

Valutare un LLM prima di adottarlo: checklist su benchmark, data leaking e chatbot Arena I benchmark pubblici sono la prima fonte che tutti consultano, la più manipolabile. MMLU 5-shot non è confrontabile con Gemini CoT-uncertainty-routing. Il data leaking invalida percentuali straordinarie. LMArena (rebrand Arena 28 gennaio 2026) usa Bradley-Terry su preferenze utente ma pesca da domande non controllate. Checklist in otto criteri per valutare un LLM prima del commitment enterprise, con held-out interni su dominio italiano. Continua a leggere
Ultima modifica:

Distillation e Deep Seek: la tecnica con cui un modello piccolo eredita le capacità di uno grande

Distillation e Deep Seek: la tecnica con cui un modello piccolo eredita le capacità di uno grande La distillation insegna a un modello piccolo (student) a imitare le risposte di uno grande (teacher) su un compito specifico. OpenAI ha accusato Deep Seek di averla usata contro i termini GPT-4; Anthropic ha inserito in Claude Code un sistema anti-distillation con tool call fittizi. Resta lo strumento principe per portare capacità da 1,8T parametri a 8B runnabili su laptop. Analizzo tecnica, errori operativi e quando ha senso in una pipeline PMI italiana. Continua a leggere
Ultima modifica: