Categoria

Pagina 6 di 7

LLM Automation: dall'esperimento all'infrastruttura produttiva

LLM automation è l'uso ingegnerizzato di modelli linguistici in pipeline aziendali reali: generazione di contenuti, classificazione automatica, estrazione di dati, code review assistito. Costruisco e gestisco infrastrutture LLM in produzione, con attenzione a costi, qualità dell'output e governance.

In questa categoria scrivo di LLM automation applicata: architetture di prompt, orchestrazione multi-step, MCP server custom, evaluation, monitoring. Parliamone per un'automazione LLM seria, scopri il mio percorso.

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B

Symfony 7 come backend di dominio e Python come gateway LLM: architettura production per applicazioni B2B Symfony 7 ha un dominio business ricco ma l'ecosistema AI vive in Python. La soluzione production è un'architettura ibrida: Symfony gestisce dominio, auth e autorizzazione; un servizio Python (LangChain, LlamaIndex, custom) orchestra l'LLM. La comunicazione viaggia via Symfony Messenger su RabbitMQ, Python consuma. Ti mostro il pattern su un portale B2B: schema dei messaggi, error handling cross-stack, tracing distribuito, deployment con Docker Compose. Continua a leggere
Ultima modifica:

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza Le chat AI moderne richiedono streaming token-per-token a latenza sub-secondo. PHP non è lo strumento giusto per questo: Node.js lo è. Ti mostro l'architettura ibrida che ho implementato: Laravel gestisce sessione e business logic, un servizio Node/TypeScript standalone gestisce lo streaming via SSE verso il browser. Con gestione di backpressure, reconnect, cost tracking e integrazione con Claude API. Continua a leggere
Ultima modifica:

Rate limiting e cost governance per applicazioni AI: token budgeting, edge throttling, difesa anti-abuso

Rate limiting e cost governance per applicazioni AI: token budgeting, edge throttling, difesa anti-abuso Un'applicazione AI senza rate limiting è una bolletta che esplode in 48 ore quando uno scraper trova il tuo endpoint pubblico. Ti mostro lo stack di cost governance che applico: token budgeting per utente autenticato (non solo request count), edge throttling con Cloudflare per scudo pre-applicativo, alerting real-time su anomalie, hard cap mensile che taglia l'accesso quando si sfora. Con codice Laravel e config edge concreta. Continua a leggere
Ultima modifica:

LLM self-hosted su VPS Hetzner con Ollama: deployment in produzione per PMI con vincoli di data sovereignty

LLM self-hosted su VPS Hetzner con Ollama: deployment in produzione per PMI con vincoli di data sovereignty Claude API funziona bene, ma alcune PMI non possono mandare i loro dati fuori dall'UE o verso provider americani. La soluzione è un LLM self-hosted su VPS europeo. Ti racconto il processo che ho seguito per mettere Llama 3.3 e Mistral su un Hetzner AX102 in produzione: dimensionamento GPU/RAM, sicurezza di rete, integrazione con backend PHP via API, monitoring e performance reali rispetto a Claude Sonnet. Continua a leggere
Ultima modifica:

Migrazione PHP 7.4 a 8.3 LLM-assisted: il workflow che trasforma 200.000 righe in settimane invece di mesi

Migrazione PHP 7.4 a 8.3 LLM-assisted: il workflow che trasforma 200.000 righe in settimane invece di mesi Migrare 200.000 righe di PHP da 7.4 a 8.3 manualmente è un progetto da 2-3 mesi. Con un workflow LLM-assisted scende a 2-3 settimane senza sacrificare qualità. Nella mia pipeline combino Rector per le trasformazioni meccaniche, Claude per i breaking change complessi, test caratterizzanti generati dal LLM, regression testing incrementale. Ti mostro il workflow reale con tempi giornalieri e le trappole tipiche. Continua a leggere
Ultima modifica:

Integrare LLM nella pipeline CI/CD: automazione sicura senza creare debito tecnico invisibile

Integrare LLM nella pipeline CI/CD: automazione sicura senza creare debito tecnico invisibile Un LLM nella pipeline CI/CD è un'arma a doppio taglio. Può accelerare code review, generare test, rilevare anti-pattern - o introdurre debito tecnico che emerge solo mesi dopo. Ti mostro l'architettura che uso: boundaries chiari tra suggerimenti AI e decisioni umane, gate di sicurezza per output automatici, logging delle azioni per audit post-deploy. Con esempi reali di GitHub Actions e guardrail applicativi. Continua a leggere
Ultima modifica:

GPU cloud per inference LLM self-hosted: Scaleway, Lambda Labs e RunPod a confronto per PMI italiane

GPU cloud per inference LLM self-hosted: Scaleway, Lambda Labs e RunPod a confronto per PMI italiane Self-hosting di LLM medi (Llama 3 70B, Mistral Large) richiede GPU di classe A100 o H100 che non trovi su Hetzner o OVH tradizionali. I provider specializzati sono Scaleway (EU, GDPR-friendly), Lambda Labs (best performance, US-based), RunPod (cheapest spot instances). Ti mostro il confronto su workload reali: costi orari effettivi per token, latenza, affidabilità dell'orchestrazione, compliance GDPR per PMI italiane che non possono esportare dati fuori dall'UE. Continua a leggere
Ultima modifica:

Python e PHP nella stessa pipeline AI: FastAPI come orchestrator di LLM per backend Laravel

Python e PHP nella stessa pipeline AI: FastAPI come orchestrator di LLM per backend Laravel Python è la lingua franca delle librerie AI: Langchain, Transformers, LlamaIndex. PHP non ha questo ecosistema, ma ha la logica di business. La soluzione pragmatica è un'architettura ibrida: FastAPI come orchestrator degli LLM, Laravel come backend di dominio. Ti mostro il pattern di comunicazione, l'autenticazione inter-servizi, il deployment su singolo VPS e le trappole che ho incontrato mettendo questa architettura in produzione. Continua a leggere
Ultima modifica:

Structured output validation di LLM in PHP: schemi JSON, fail-safe e difesa da hallucination in produzione

Structured output validation di LLM in PHP: schemi JSON, fail-safe e difesa da hallucination in produzione Un LLM in produzione che restituisce testo libero è una bomba a orologeria: prima o poi hallucinerà un valore fuori range e romperà la pipeline a valle. La difesa strutturale è lo structured output con JSON Schema validato rigorosamente, più fail-safe multi-livello per le risposte malformate. Ti mostro i pattern che uso in PHP: prompt con schema esplicito, parsing difensivo, retry con correzione automatica, fallback a pipeline deterministica. Con codice reale Laravel e Symfony. Continua a leggere
Ultima modifica:

MCP server personalizzati per Claude Code: estendere il workflow aziendale con tool custom

MCP server personalizzati per Claude Code: estendere il workflow aziendale con tool custom Claude Code fuori dalla scatola è potente, ma nei workflow aziendali complessi serve l'integrazione con database interni, API di gestionali proprietari, automazioni custom. Gli MCP server sono la risposta: un protocollo aperto per esporre tool strutturati agli agent LLM. Ti mostro l'architettura di un MCP server in PHP che ho costruito per interrogare database aziendali in sicurezza, con schema, validation e logging. Continua a leggere
Ultima modifica: