Categoria

Pagina 6 di 7

LLM Automation: dall'esperimento all'infrastruttura produttiva

LLM automation è l'uso ingegnerizzato di modelli linguistici in pipeline aziendali reali: generazione di contenuti, classificazione automatica, estrazione di dati, code review assistito. Costruisco e gestisco infrastrutture LLM in produzione, con attenzione a costi, qualità dell'output e governance.

In questa categoria scrivo di LLM automation applicata: architetture di prompt, orchestrazione multi-step, MCP server custom, evaluation, monitoring. Parliamone per un'automazione LLM seria, scopri il mio percorso.

Wiki tecnica sempre aggiornata con LLM: parser AST, freshness loop e linter sulla documentazione generata

Wiki tecnica sempre aggiornata con LLM: parser AST, freshness loop e linter sulla documentazione generata La documentazione tecnica invecchia nel secondo in cui viene scritta. Automatizzarla con LLM funziona ma solo se il processo è rigoroso: estrazione strutturata da annotation PHPDoc e Symfony, generazione markdown con template vincolanti, pubblicazione automatica su wiki con review obbligatoria. Ti mostro la pipeline che ho costruito nel mio laboratorio su una codebase Symfony di riferimento da 200.000 righe, con controllo di qualità via linter. Continua a leggere
Ultima modifica:

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B Symfony 7 ha un dominio business ricco ma l'ecosistema AI vive in Python. La soluzione production è un'architettura ibrida: Symfony gestisce dominio, auth e autorizzazione; un servizio Python (LangChain, LlamaIndex, custom) orchestra l'LLM. La comunicazione viaggia via Symfony Messenger su RabbitMQ, Python consuma. Ti mostro il pattern su un portale B2B: schema dei messaggi, error handling cross-stack, tracing distribuito, deployment con Docker Compose. Continua a leggere
Ultima modifica:

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza Le chat AI moderne richiedono streaming token-per-token a latenza sub-secondo. PHP non è lo strumento giusto per questo: Node.js lo è. Ti mostro l'architettura ibrida che ho implementato: Laravel gestisce sessione e business logic, un servizio Node/TypeScript standalone gestisce lo streaming via SSE verso il browser. Con gestione di backpressure, reconnect, cost tracking e integrazione con Claude API. Continua a leggere
Ultima modifica:

Rate limiting e cost governance per applicazioni AI: token budgeting, edge throttling, difesa anti-abuso

Rate limiting e cost governance per applicazioni AI: token budgeting, edge throttling, difesa anti-abuso Un'applicazione AI senza rate limiting è una bolletta che esplode in 48 ore quando uno scraper trova il tuo endpoint pubblico. Ti mostro lo stack di cost governance che applico: token budgeting per utente autenticato (non solo request count), edge throttling con Cloudflare per scudo pre-applicativo, alerting real-time su anomalie, hard cap mensile che taglia l'accesso quando si sfora. Con codice Laravel e config edge concreta. Continua a leggere
Ultima modifica:

LLM self-hosted su VPS Hetzner con Ollama: deployment in produzione per PMI con vincoli di data sovereignty

LLM self-hosted su VPS Hetzner con Ollama: deployment in produzione per PMI con vincoli di data sovereignty Claude API funziona bene, ma alcune PMI non possono mandare i loro dati fuori dall'UE o verso provider americani. La soluzione è un LLM self-hosted su VPS europeo. Ti racconto il processo che ho seguito per mettere Llama 3.3 e Mistral su un Hetzner AX102 in produzione: dimensionamento GPU/RAM, sicurezza di rete, integrazione con backend PHP via API, monitoring e performance reali rispetto a Claude Sonnet. Continua a leggere
Ultima modifica:

Migrazione PHP 7.4 a 8.3 LLM-assisted: il workflow che trasforma 200.000 righe in settimane invece di mesi

Migrazione PHP 7.4 a 8.3 LLM-assisted: il workflow che trasforma 200.000 righe in settimane invece di mesi Migrare 200.000 righe di PHP da 7.4 a 8.3 manualmente è un progetto da 2-3 mesi. Con un workflow LLM-assisted scende a 2-3 settimane senza sacrificare qualità. Nella mia pipeline combino Rector per le trasformazioni meccaniche, Claude per i breaking change complessi, test caratterizzanti generati dal LLM, regression testing incrementale. Ti mostro il workflow reale con tempi giornalieri e le trappole tipiche. Continua a leggere
Ultima modifica:

Integrare LLM nella pipeline CI/CD: automazione sicura senza creare debito tecnico invisibile

Integrare LLM nella pipeline CI/CD: automazione sicura senza creare debito tecnico invisibile Un LLM nella pipeline CI/CD è un'arma a doppio taglio. Può accelerare code review, generare test, rilevare anti-pattern - o introdurre debito tecnico che emerge solo mesi dopo. Ti mostro l'architettura che uso: boundaries chiari tra suggerimenti AI e decisioni umane, gate di sicurezza per output automatici, logging delle azioni per audit post-deploy. Con esempi reali di GitHub Actions e guardrail applicativi. Continua a leggere
Ultima modifica:

GPU cloud per inference LLM self-hosted: Scaleway, Lambda Labs e RunPod a confronto per PMI italiane

GPU cloud per inference LLM self-hosted: Scaleway, Lambda Labs e RunPod a confronto per PMI italiane Self-hosting di LLM medi (Llama 3 70B, Mistral Large) richiede GPU di classe A100 o H100 che non trovi su Hetzner o OVH tradizionali. I provider specializzati sono Scaleway (EU, GDPR-friendly), Lambda Labs (best performance, US-based), RunPod (cheapest spot instances). Ti mostro il confronto su workload reali: costi orari effettivi per token, latenza, affidabilità dell'orchestrazione, compliance GDPR per PMI italiane che non possono esportare dati fuori dall'UE. Continua a leggere
Ultima modifica:

Python e PHP nella stessa pipeline AI: FastAPI come orchestrator di LLM per backend Laravel

Python e PHP nella stessa pipeline AI: FastAPI come orchestrator di LLM per backend Laravel Python è la lingua franca delle librerie AI: Langchain, Transformers, LlamaIndex. PHP non ha questo ecosistema, ma ha la logica di business. La soluzione pragmatica è un'architettura ibrida: FastAPI come orchestrator degli LLM, Laravel come backend di dominio. Ti mostro il pattern di comunicazione, l'autenticazione inter-servizi, il deployment su singolo VPS e le trappole che ho incontrato mettendo questa architettura in produzione. Continua a leggere
Ultima modifica:

Structured output validation di LLM in PHP: schemi JSON, fail-safe e difesa da hallucination in produzione

Structured output validation di LLM in PHP: schemi JSON, fail-safe e difesa da hallucination in produzione Un LLM in produzione che restituisce testo libero è una bomba a orologeria: prima o poi hallucinerà un valore fuori range e romperà la pipeline a valle. La difesa strutturale è lo structured output con JSON Schema validato rigorosamente, più fail-safe multi-livello per le risposte malformate. Ti mostro i pattern che uso in PHP: prompt con schema esplicito, parsing difensivo, retry con correzione automatica, fallback a pipeline deterministica. Con codice reale Laravel e Symfony. Continua a leggere
Ultima modifica: