Categoria

LLM Automation

Pagina 3 di 8

LLM Automation: dall'esperimento all'infrastruttura produttiva

LLM automation è l'uso ingegnerizzato di modelli linguistici in pipeline aziendali reali: generazione di contenuti, classificazione automatica, estrazione di dati, code review assistito. Costruisco e gestisco infrastrutture LLM in produzione, con attenzione a costi, qualità dell'output e governance.

In questa categoria scrivo di LLM automation applicata: architetture di prompt, orchestrazione multi-step, MCP server custom, evaluation, monitoring. Parliamone per un'automazione LLM seria, scopri il mio percorso.

LLM Automation Claude API MCP Agent systems Token Optimization

Anthropic Tool Search Tool e Programmatic Tool Calling: agenti con 50+ tool MCP senza saturare il context

04/05/2026

Anthropic Tool Search Tool e Programmatic Tool Calling: agenti con 50+ tool MCP senza saturare il context

Quando un agent LLM ha 50+ tool registrati via MCP, il token overhead del solo prompt di registrazione supera i 20k token e saturare il context è questione di pochi turni. Anthropic ha rilasciato Tool Search Tool e Programmatic Tool Calling per spostare questo overhead da statico a dinamico - ti mostro il setup, i numeri misurati nella mia pipeline, e i trade-off di latenza. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM Automation Consulenza IT Developer workflow Productivity Claude Code

Gestire molti progetti attivi con AI come co-pilota: metodo di un consulente senior per non impazzire

29/04/2026

Gestire molti progetti attivi con AI come co-pilota: metodo di un consulente senior per non impazzire

Gestire molti progetti attivi contemporaneamente è un problema cognitivo, non tecnico. Il context switching è costoso. Nella mia pipeline personale l'AI fa da co-pilota: knowledge management automatico, session handoff con memoria persistente, generazione di recap pre-chiamata cliente. Ti racconto il metodo e le automazioni concrete che mi permettono di non perdere qualità cambiando contesto. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM LLM Automation AI Automation Risk Management Consulenza IT

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base

28/04/2026

Large reasoning model e paper Apple: tre regimi di performance, collasso e confronto con i modelli base

The Illusion of Thinking di Apple (arxiv 2506.06941, Shojaee et al. giugno 2025) ha documentato tre regimi di performance dei LRM: bassa complessità dove il modello base è equivalente e più efficiente, media dove il reasoning guadagna, alta dove entrambi collassano a zero accuracy. Tabella comparativa con Torre di Hanoi, River Crossing, critica di Lawsen, Limit of RLVR (Yue 2025), implicazioni di progetto: cosa demandare davvero a un LRM e cosa deve restare in algoritmo formale. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

Multi-Stack Rust LLM Automation Edge Computing Performance

Rust per inference edge di modelli leggeri: quando la performance supera la produttività di Python

27/04/2026

Rust per inference edge di modelli leggeri: quando la performance supera la produttività di Python

Python vince sulla produttività in fase di prototipazione AI. Rust vince in produzione edge quando la latenza e la memoria contano. Framework come Candle, Burn e ort rendono possibile eseguire modelli embedding e di classificazione con binari da 20 MB, latenza sub-millisecondo, memoria bounded. Ti mostro i casi d'uso dove ho sostituito Python con Rust: embedding generator per RAG, classificatori di intent, preprocessing pipeline. Con confronto diretto su benchmark reali. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM Automation AI Engineering Senior Developer Intent Driven Development Career Transition

Il riposizionamento dell'ingegnere senior nell'era del prompt operator

24/04/2026

Il riposizionamento dell'ingegnere senior nell'era del prompt operator

L'ingegnere che l'AI sostituisce non è quello che fa il lavoro che l'AI può fare. È quello che non ha mai costruito il giudizio per riconoscere quando l'AI sbaglia. Il riposizionamento da autore di codice a intent manager non è una concessione, è la skill tecnica che decide chi sopravvive a questa transizione di carriera. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM LLM Automation AI Automation Developer workflow Risk Management

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri

24/04/2026

Chain-of-thought: quando attivarlo e quando disattivarlo: checklist in sette criteri

Chain-of-thought nel 2022 ha sbloccato il ragionamento negli LLM; nel 2026 è tra i principali contributori a latenza, costi e overthinking. Il paper Anthropic Reasoning Models Don't Always Say What They Think (2505.05410) ha mostrato CoT faithful solo nel 25% dei casi su Claude 3.7 Sonnet. Checklist in sette criteri per decidere quando attivare, disattivare o vincolare il thinking su Claude, GPT-5.4 e Gemini 3.1, con ROI misurabile. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM Automation Software Architecture Circuit Breaker OpenTelemetry Refactoring

L'architettura del codebase AI-friendly: deep modules, AI come dependency, e perché il debito non si refactora da solo

23/04/2026

L'architettura del codebase AI-friendly: deep modules, AI come dependency, e perché il debito non si refactora da solo

Architetture pensate per umani aiutano l'AI di più di architetture pensate per l'AI. Moduli profondi con interfacce semplici. AI integrata come dependency lenta e non deterministica, dietro circuit breaker e fallback. E la verità che spinge il mercato in direzione opposta: il debito accumulato oggi non sarà refactorato da nessun modello futuro, perché refactoring richiede intent originale, non sintassi. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

AI Development Tools Claude Code Debugging LLM Automation Developer workflow

AI-assisted debugging: usare Claude per analizzare stack trace e trovare la root cause in 20 minuti

23/04/2026

AI-assisted debugging: usare Claude per analizzare stack trace e trovare la root cause in 20 minuti

Stack trace PHP con 40 frame, log Nginx con 3.000 righe, crash non deterministico ogni 6 ore. Il debugging tradizionale richiede ore. Con un workflow Claude-assistito porto molti casi dalla segnalazione alla root cause in 20 minuti. Ti mostro come strutturo il contesto per l'LLM, i prompt specializzati per diversi tipi di errore, e i casi dove l'AI sbaglia in modo prevedibile. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM Automation Domain Driven Design Test Driven Development Specification Driven Development Claude Code

Oltre lo specs-to-code: design concept, ubiquitous language e TDD per non annegare nell'output AI

22/04/2026

Oltre lo specs-to-code: design concept, ubiquitous language e TDD per non annegare nell'output AI

Scrivi una spec, lasci che l'AI la trasformi in codice, e quando qualcosa non va riapri solo la spec. È seducente. Non funziona: ogni iterazione produce codice peggiore. Il problema non è la spec, è che mancano le ossa del design su cui appoggiarla. Design concept, ubiquitous language, TDD: tre discipline pre-AI che oggi contano di più, non di meno. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

LLM LLM Automation AI Development Tools Developer workflow Claude Code

Ragionamento con tool: Alpha Evolve e Codex per far risolvere problemi formali a un LLM

22/04/2026

Ragionamento con tool: Alpha Evolve e Codex per far risolvere problemi formali a un LLM

Gli LLM sono ragionatori euristici, non formali: Torre di Hanoi a 10 dischi = accuracy zero. Se chiedi al modello di scrivere il programma che la risolve, accuracy 100%. Principio identico in AlphaEvolve DeepMind (2506.13131): matrix mult 4x4 in 48 scalar mult, primo miglioramento in 56 anni su Strassen. Tutorial operativo sul tool use in Claude, GPT-5.3-Codex e Gemini, sandboxing sicuro, recovery rate, loop infiniti. Continua a leggere

Ultima modifica: Venerdì 19 Giugno 2026, alle 10:51

Calendario

Archivi