Categoria

Pagina 5 di 7

LLM Automation: dall'esperimento all'infrastruttura produttiva

LLM automation è l'uso ingegnerizzato di modelli linguistici in pipeline aziendali reali: generazione di contenuti, classificazione automatica, estrazione di dati, code review assistito. Costruisco e gestisco infrastrutture LLM in produzione, con attenzione a costi, qualità dell'output e governance.

In questa categoria scrivo di LLM automation applicata: architetture di prompt, orchestrazione multi-step, MCP server custom, evaluation, monitoring. Parliamone per un'automazione LLM seria, scopri il mio percorso.

Go come inference gateway per LLM: perché Golang vince su PHP e Node quando la latenza conta davvero

Go come inference gateway per LLM: perché Golang vince su PHP e Node quando la latenza conta davvero PHP e Node sono ottimi per la logica di dominio, ma come inference gateway per LLM sotto carico soffrono: event loop Node saturabile con chiamate lente, PHP-FPM worker-bound con decine di secondi di attesa per token streaming. Go risolve entrambi: concorrenza nativa con goroutine, latenza sub-10ms sui routing decision, gestione elegante di streaming SSE verso migliaia di client paralleli. Ti mostro l'architettura gateway Go che ho costruito come front-end unificato per modelli LLM eterogenei. Continua a leggere
Ultima modifica:

LLM per generazione test automatici: da 5% a 70% di copertura su codebase PHP legacy

LLM per generazione test automatici: da 5% a 70% di copertura su codebase PHP legacy Partire da 5% di copertura test su un codebase legacy è demoralizzante. Portarla al 70% in 3 mesi è realistico con LLM nell'anello di supporto - ma solo se il processo è strutturato. Ti mostro il workflow che ho testato: LLM genera characterization test sul comportamento esistente, sviluppatore verifica, itera. Con catalogo degli anti-pattern LLM tipici (test che passano sempre, assertion inutili) e come rilevarli. Continua a leggere
Ultima modifica:

Supply chain security di applicazioni AI: pinning dei modelli, audit di Langchain e LlamaIndex, integrity checks

Supply chain security di applicazioni AI: pinning dei modelli, audit di Langchain e LlamaIndex, integrity checks L'ecosistema AI è diventato un target di supply chain attack: modelli pubblicati su Hugging Face con backdoor, librerie Langchain/LlamaIndex con transitive dependencies non audit-abili, update automatici che introducono drift di comportamento. Ti mostro la strategia di hardening che applico: pinning dei modelli a digest SHA-256 (non tag), audit automatico delle dipendenze via Snyk/Dependabot, integrity checks su ogni deploy, separazione di ambienti con policy di network egress controllato. Continua a leggere
Ultima modifica:

LLM per code review automatica in pipeline GitHub e GitLab: qualità senza rallentamenti

LLM per code review automatica in pipeline GitHub e GitLab: qualità senza rallentamenti La code review umana è collo di bottiglia in molti team piccoli. Gli LLM possono affiancare i reviewer senior, non sostituirli, a condizione che la pipeline sia ben progettata. Ti mostro l'integrazione GitHub Actions + Claude API che ho implementato: prompt strategy per ridurre falsi positivi, esclusione di file sensibili, combinazione con PHPStan per ridurre rumore, controllo dei costi per PR. Continua a leggere
Ultima modifica:

Laravel Horizon per chiamate LLM asincrone: retry strategy, cost tracking, timeout management in produzione

Laravel Horizon per chiamate LLM asincrone: retry strategy, cost tracking, timeout management in produzione Le chiamate LLM sono lente (5-30 secondi), costose (€ per token), soggette a errori transitori (rate limit, 529 overloaded). Farle sincrone nel ciclo HTTP è un anti-pattern garantito. La pipeline giusta passa da Horizon con job dedicati: retry con backoff esponenziale per errori transitori, cost tracking per job con alerting anomalie, timeout management che distingue tra retry-safe e fatal. Ti mostro l'architettura completa con codice reale che uso nella mia pipeline personale su Claude API. Continua a leggere
Ultima modifica:

Costruire un chatbot aziendale con RAG su documentazione interna: guida pratica

Costruire un chatbot aziendale con RAG su documentazione interna: guida pratica Il servizio assistenza di un cliente rispondeva alle stesse 50 domande 100 volte al settimana. Ho costruito un chatbot RAG su 200 documenti interni (manuale prodotto, FAQ, procedure): il sistema risponde correttamente al 78% delle domande senza escalation umana. Self-hosted su VPS, zero dati verso API esterne. Continua a leggere
Ultima modifica:

Containerizzare LLM self-hosted su VPS con GPU: nvidia-container-toolkit, orchestrazione di modelli multipli

Containerizzare LLM self-hosted su VPS con GPU: nvidia-container-toolkit, orchestrazione di modelli multipli Containerizzare un LLM self-hosted non è come containerizzare PHP-FPM. Serve nvidia-container-toolkit per passthrough GPU, gestione dei modelli come persistent volume, orchestrazione di modelli multipli (uno generalista, uno specializzato, un embedding model) con routing intelligente per caso d'uso. Ti mostro l'architettura Docker Compose che uso su VPS GPU: configurazione GPU passthrough, persistent cache, health check, monitoring dei VRAM consumption e risposta alle OOM. Continua a leggere
Ultima modifica:

LLM per la generazione di migration SQL: gestire l'evoluzione dello schema senza errori

LLM per la generazione di migration SQL: gestire l'evoluzione dello schema senza errori Ho iniziato a usare Claude per generare migration SQL complesse su schemi di database con 200 tabelle e vincoli FK intricati. Il risultato non è mai corretto al 100% senza supervisione - ma riduce il tempo di scrittura dell'80%. Vi mostro il workflow: contesto da fornire all'LLM, validazione sistematica e i casi dove l'AI sbaglia. Continua a leggere
Ultima modifica:

Wiki tecnica sempre aggiornata con LLM: parser AST, freshness loop e linter sulla documentazione generata

Wiki tecnica sempre aggiornata con LLM: parser AST, freshness loop e linter sulla documentazione generata La documentazione tecnica invecchia nel secondo in cui viene scritta. Automatizzarla con LLM funziona ma solo se il processo è rigoroso: estrazione strutturata da annotation PHPDoc e Symfony, generazione markdown con template vincolanti, pubblicazione automatica su wiki con review obbligatoria. Ti mostro la pipeline che ho costruito nel mio laboratorio su una codebase Symfony di riferimento da 200.000 righe, con controllo di qualità via linter. Continua a leggere
Ultima modifica:

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B Symfony 7 ha un dominio business ricco ma l'ecosistema AI vive in Python. La soluzione production è un'architettura ibrida: Symfony gestisce dominio, auth e autorizzazione; un servizio Python (LangChain, LlamaIndex, custom) orchestra l'LLM. La comunicazione viaggia via Symfony Messenger su RabbitMQ, Python consuma. Ti mostro il pattern su un portale B2B: schema dei messaggi, error handling cross-stack, tracing distribuito, deployment con Docker Compose. Continua a leggere
Ultima modifica: