Categoria

Pagina 1 di 1

Server-Sent Events: streaming HTTP unidirezionale a costo zero rispetto a WebSocket

Le chat AI moderne richiedono streaming token-per-token a latenza sub-secondo. WebSocket sono overkill: serve solo direzione server-to-client e l'autoricongiungo HTTP basta. I Server-Sent Events sono la scelta corretta quasi sempre: standard HTTP, gestione reconnect nativa nel browser, nessun protocollo aggiuntivo da mantenere.

In questa categoria scrivo di SSE applicati a chat AI: SDK TypeScript lato client per consumer-facing app (reconnect su disconnessione, error recovery che distingue transienti da permanenti, cost tracking client-side), architettura ibrida Laravel per logica di business + Node per streaming a bassa latenza.

Se devi implementare streaming LLM real-time in modo serio, parliamone. Oppure scopri il mio approccio.

SDK TypeScript per consumer di API AI: streaming SSE, error recovery, cost tracking lato client

SDK TypeScript per consumer di API AI: streaming SSE, error recovery, cost tracking lato client Un'applicazione AI consumer-facing richiede un SDK TypeScript robusto lato client: streaming SSE che gestisce reconnect su disconnessione rete, error recovery discriminando errori transitori da permanenti, cost tracking per mostrare il consumo utente, tipizzazione forte sugli output strutturati del backend. Ti mostro l'architettura dell'SDK che ho costruito come libreria interna: API pulita, zero dipendenze browser, supporto React/Vue/vanilla, pattern di ripresa sessione dopo navigazione. Continua a leggere
Ultima modifica:

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza

Node.js e TypeScript per streaming real-time di LLM: architettura per chat AI a bassa latenza Le chat AI moderne richiedono streaming token-per-token a latenza sub-secondo. PHP non è lo strumento giusto per questo: Node.js lo è. Ti mostro l'architettura ibrida che ho implementato: Laravel gestisce sessione e business logic, un servizio Node/TypeScript standalone gestisce lo streaming via SSE verso il browser. Con gestione di backpressure, reconnect, cost tracking e integrazione con Claude API. Continua a leggere
Ultima modifica: