Ricerca

Risultati per "chunk"

9 risultati dal blog · 0.7191 ms

Articoli dal blog

Trovati 9 risultati

Costruire un chatbot aziendale con RAG su documentazione interna: guida pratica

Come costruire un chatbot aziendale con RAG su documentazione interna: embedding, vector store, LLM integration e deployment privato per PMI italiane.

A novembre 2025 un'azienda del settore servizi di manutenzione macchinari industriali - 90 dipendenti interni di cui 14 in assistenza tecnica, fatturato annuo intorno ai 21 milioni di euro, circa 450 clienti PMI italiane con parchi macchinari diversi - mi ha raccontato un problema operativo ricorrente. Il team di assistenza tecnica riceveva in media 180 chiamate settimanali dai clienti: guasti, richieste di supporto sui manuali operativi, verifiche di compatibilità ricambi, procedure di m... continua a leggere
Knowledge management AI-assisted per codebase legacy: memoria persistente su progetti di 10+ anni

Knowledge management AI-assisted per codebase legacy: indicizzazione con embeddings, memoria persistente cross-session, retrieval contestuale per sviluppo quotidiano.

Il 15 marzo 2026 ho completato la prima versione funzionante del mio sistema di knowledge management AI-assisted sulla codebase di riferimento che uso come campo di prova: 200.000 righe di Symfony 7.2 su PHP 8.3, 12 anni di storia git (ricostruita artificialmente per simulare l'età di un legacy vero), 4.300 commit, 780 issue tracker chiuse, 50 pagine di wiki interne, 12 ADR (architectural decision record) scritti nel corso del tempo. L'infrastruttura è un Hetzner EX101 (Intel Core ... continua a leggere
Red team di RAG systems aziendali: prompt injection attraverso documenti indicizzati e difese applicative

Red team di RAG systems: prompt injection via documenti indicizzati, exfiltration di chunk sensibili, pivoting tra tenant. Proof of concept e strategie di difesa.

Il 22 gennaio 2026 ho allestito nella mia sandbox di audit un RAG system rappresentativo di quello che vedo nelle PMI italiane che stanno sperimentando l'AI interna: backend Laravel 12, database PostgreSQL 16 con estensione pgvector su una VM Hetzner CX43, embedder locale bge-m3 multilingua italiano servito da Ollama, Claude Sonnet 4.5 come reasoner, un corpus iniziale di 1.240 documenti di esempio - manuali operativi, procedure qualità, FAQ prodotto, ticket di supporto archiviati, policy... continua a leggere
pgvector in produzione: indici HNSW, IVFFlat e tuning per applicazioni AI con dataset medi

pgvector in produzione: confronto indici HNSW e IVFFlat, tuning parametri, dimensionamento, integrazione con Laravel e pipeline di embedding.

Ho iniziato questa sessione di benchmarking il 23 febbraio 2026 nella mia sandbox di laboratorio su un Hetzner CX42 (8 vCPU Intel Xeon Gold 5412U, 16 GB RAM DDR4, 160 GB NVMe), Debian 12, PostgreSQL 16.2 con l'estensione pgvector 0.7.4, Laravel 12 su PHP 8.3 per l'applicazione di ricerca semantica. Il dataset di partenza era un corpus di 180.432 chunk di documentazione tecnica sintetica (manuali, articoli, specifiche), ognuno trasformato in embedding a 768 dimensioni con il modello Nomic Embed T... continua a leggere
Fine-tuning vs RAG: quale approccio scegliere per applicazioni aziendali specifiche

Confronto tecnico tra fine-tuning e RAG per applicazioni LLM aziendali: quando usare ciascun approccio, costi, complessità e casi d'uso per PMI italiane.

Il 12 giugno 2025 sono stato contattato dal socio di uno studio legale romano specializzato in diritto del lavoro e contenzioso previdenziale per PMI italiane, con un organico di 14 avvocati fra soci e associati e un portafoglio di circa 380 aziende clienti attive. Lo studio aveva avviato tre mesi prima una collaborazione con un consulente AI esterno per costruire un assistente virtuale basato su LLM capace di rispondere in italiano preciso alle domande degli avvocati su normativa specifica - ar... continua a leggere
Chatbot aziendale con RAG su documentazione interna: guida completa self-hosted per privacy massima

Chatbot RAG aziendale self-hosted: embedding, pgvector, integrazione Laravel, frontend chat, privacy by design, deployment su VPS europeo.

Ho completato il deploy del mio prototipo di chatbot RAG self-hosted il 28 marzo 2026, su due server distinti per separare i ruoli operativi: un Hetzner GEX44 (RTX 4000 Ada con 20 GB VRAM, Intel Xeon Gold 5412U, 64 GB RAM DDR5, 2x NVMe 1,92 TB, Debian 12) che ospita i modelli di inferenza - Ollama con un Llama 3.1 8B quantizzato 4-bit come generatore, un container text-embeddings-inference di Hugging Face con Nomic Embed Text v1.5 per gli embedding - e un Hetzner CCX33 (8 vCPU AMD EPYC 9454P, 32... continua a leggere
Cryptography in PHP: usare libsodium correttamente per cifrare dati sensibili

Come usare libsodium in PHP per cifrare dati sensibili correttamente: symmetric encryption, key derivation, authenticated encryption e errori comuni da evitare.

A ottobre 2025 ho condotto un audit di sicurezza applicativa per un'azienda del settore servizi legali - 28 dipendenti, fatturato annuo intorno ai 5 milioni di euro, piattaforma Laravel 10 che gestisce fascicoli di circa 4.000 clienti con dati sensibili di natura legale (atti notarili, contratti riservati, corrispondenza con controparti). L'audit aveva scope ampio, ma uno dei capitoli più rivelatori ha riguardato la crittografia applicata ai campi sensibili del database. La piattaforma ci... continua a leggere
PHP e memory management: come evitare i memory leak nelle applicazioni di lunga esecuzione

Come identificare e correggere memory leak in applicazioni PHP di lunga esecuzione: worker queue, daemons e profiling con Blackfire.

PHP è stato progettato per il modello request-response: il processo nasce, elabora la richiesta, muore. In quel modello, i memory leak non sono un problema - qualsiasi memoria allocata viene liberata automaticamente alla fine del processo, che vive per qualche centinaio di millisecondi. Ma il PHP moderno non vive più solo nel modello request-response: i worker di Laravel Horizon processano migliaia di job senza riavviarsi, i daemon con Octane e Swoole mantengono l'applicazione in m... continua a leggere
Backup VPS su Hetzner, OVH, Contabo, Digital Ocean e Aruba: strategie avanzate per aziende

Strategia backup 3-2-1-1-0 per VPS con BorgBackup, append-only repo su Hetzner Storage Box, test di ripristino automatizzati e retention GFS. Caso reale PMI.

A settembre 2024 un cliente veneto - PMI manifatturiera con gestionale Laravel 10 su un VPS Contabo da 8 vCPU, 30 GB di RAM e 400 GB SSD - mi ha chiamato dopo che un ransomware aveva cifrato l'intero filesystem del server. Il gestionale coordinava la produzione di tre linee di assemblaggio con circa 120 ordini giornalieri, e ogni ora di fermo costava al cliente circa 4.500 euro in ritardi sulle consegne e penali contrattuali. Il backup esistente era un mysqldump schedulato ogni notte alle 02:00,... continua a leggere