Archivio

Archivio Articoli del Aprile 2026

Pagina 1 di 3

Maurizio Fonte - Consulente Informatico - Ingegnere del Software e Cyber Security Specialist Freelance

Servire text/markdown agli agenti AI senza Cloudflare: content negotiation RFC 9110 on-origin con Laravel, Symfony e PHP vanilla

Servire text/markdown agli agenti AI senza Cloudflare: content negotiation RFC 9110 on-origin con Laravel, Symfony e PHP vanilla Claude Code, Cursor e OpenCode mandano già Accept: text/markdown e pagano -80% sui token. Cloudflare ha lanciato 'Markdown for Agents' ma non è l'unica via: implementare la content negotiation RFC 9110 direttamente on-origin ti dà controllo totale senza dipendenze edge. Ti mostro come farlo da Laravel 12, Symfony 7 e PHP vanilla, evitando il falso cloaking di cui parla Mueller. Continua a leggere
Ultima modifica:

Gestire molti progetti attivi con AI come co-pilota: metodo di un consulente senior per non impazzire

Gestire molti progetti attivi con AI come co-pilota: metodo di un consulente senior per non impazzire Gestire molti progetti attivi contemporaneamente è un problema cognitivo, non tecnico. Il context switching è costoso. Nella mia pipeline personale l'AI fa da co-pilota: knowledge management automatico, session handoff con memoria persistente, generazione di recap pre-chiamata cliente. Ti racconto il metodo e le automazioni concrete che mi permettono di non perdere qualità cambiando contesto. Continua a leggere
Ultima modifica:

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base The Illusion of Thinking di Apple (arxiv 2506.06941, Shojaee et al. giugno 2025) ha documentato tre regimi di performance dei LRM: bassa complessità dove il modello base è equivalente e più efficiente, media dove il reasoning guadagna, alta dove entrambi collassano a zero accuracy. Tabella comparativa con Torre di Hanoi, River Crossing, critica di Lawsen, Limit of RLVR (Yue 2025), implicazioni di progetto: cosa demandare davvero a un LRM e cosa deve restare in algoritmo formale. Continua a leggere
Ultima modifica:

Rust per inference edge di modelli leggeri: quando la performance supera la produttività di Python

Rust per inference edge di modelli leggeri: quando la performance supera la produttività di Python Python vince sulla produttività in fase di prototipazione AI. Rust vince in produzione edge quando la latenza e la memoria contano. Framework come Candle, Burn e ort rendono possibile eseguire modelli embedding e di classificazione con binari da 20 MB, latenza sub-millisecondo, memoria bounded. Ti mostro i casi d'uso dove ho sostituito Python con Rust: embedding generator per RAG, classificatori di intent, preprocessing pipeline. Con confronto diretto su benchmark reali. Continua a leggere
Ultima modifica:

Il riposizionamento dell'ingegnere senior nell'era del prompt operator

Il riposizionamento dell'ingegnere senior nell'era del prompt operator L'ingegnere che l'AI sostituisce non è quello che fa il lavoro che l'AI può fare. È quello che non ha mai costruito il giudizio per riconoscere quando l'AI sbaglia. Il riposizionamento da autore di codice a intent manager non è una concessione, è la skill tecnica che decide chi sopravvive a questa transizione di carriera. Continua a leggere
Ultima modifica:

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri Chain-of-thought nel 2022 ha sbloccato il ragionamento negli LLM; nel 2026 è tra i principali contributori a latenza, costi e overthinking. Il paper Anthropic Reasoning Models Don't Always Say What They Think (2505.05410) ha mostrato CoT faithful solo nel 25% dei casi su Claude 3.7 Sonnet. Checklist in sette criteri per decidere quando attivare, disattivare o vincolare il thinking su Claude, GPT-5.4 e Gemini 3.1, con ROI misurabile. Continua a leggere
Ultima modifica:

L'architettura del codebase AI-friendly: deep modules, AI come dependency, e perché il debito non si refactora da solo

L'architettura del codebase AI-friendly: deep modules, AI come dependency, e perché il debito non si refactora da solo Architetture pensate per umani aiutano l'AI di più di architetture pensate per l'AI. Moduli profondi con interfacce semplici. AI integrata come dependency lenta e non deterministica, dietro circuit breaker e fallback. E la verità che spinge il mercato in direzione opposta: il debito accumulato oggi non sarà refactorato da nessun modello futuro, perché refactoring richiede intent originale, non sintassi. Continua a leggere
Ultima modifica:

AI-assisted debugging: usare Claude per analizzare stack trace e trovare la root cause in 20 minuti

AI-assisted debugging: usare Claude per analizzare stack trace e trovare la root cause in 20 minuti Stack trace PHP con 40 frame, log Nginx con 3.000 righe, crash non deterministico ogni 6 ore. Il debugging tradizionale richiede ore. Con un workflow Claude-assistito porto molti casi dalla segnalazione alla root cause in 20 minuti. Ti mostro come strutturo il contesto per l'LLM, i prompt specializzati per diversi tipi di errore, e i casi dove l'AI sbaglia in modo prevedibile. Continua a leggere
Ultima modifica:

Oltre lo specs-to-code: design concept, ubiquitous language e TDD per non annegare nell'output AI

Oltre lo specs-to-code: design concept, ubiquitous language e TDD per non annegare nell'output AI Scrivi una spec, lasci che l'AI la trasformi in codice, e quando qualcosa non va riapri solo la spec. È seducente. Non funziona: ogni iterazione produce codice peggiore. Il problema non è la spec, è che mancano le ossa del design su cui appoggiarla. Design concept, ubiquitous language, TDD: tre discipline pre-AI che oggi contano di più, non di meno. Continua a leggere
Ultima modifica:

Ragionamento con tool: Alpha Evolve e Codex per far risolvere problemi formali a un LLM

Ragionamento con tool: Alpha Evolve e Codex per far risolvere problemi formali a un LLM Gli LLM sono ragionatori euristici, non formali: Torre di Hanoi a 10 dischi = accuracy zero. Se chiedi al modello di scrivere il programma che la risolve, accuracy 100%. Principio identico in AlphaEvolve DeepMind (2506.13131): matrix mult 4x4 in 48 scalar mult, primo miglioramento in 56 anni su Strassen. Tutorial operativo sul tool use in Claude, GPT-5.3-Codex e Gemini, sandboxing sicuro, recovery rate, loop infiniti. Continua a leggere
Ultima modifica: