Anthropic Economic Index: i dati di uso reale di Claude nei mestieri e cosa dicono alle aziende italiane

Il 19 marzo 2026 Anthropic ha rilasciato il "Learning curves" report dell'Economic Index con dati di utilizzo Claude di febbraio 2026, e l'ho letto sul mio Hetzner CCX33 (8 vCPU AMD EPYC 9454P, 32 GB RAM DDR5) con un occhio specifico: cosa dice questo report a un consulente che lavora con PMI italiane. La metodologia Anthropic è solida: incrocio fra il classification system ONET del US Department of Labor (oltre 900 occupazioni, circa 20.000 task lavorativi codificati) e i dati di utilizzo reale degli utenti Claude.ai e dell'API, anonimizzati con pipeline privacy-preserving. Ne esce per ciascun mestiere un grafico a due cerchi: il cerchio "limite teorico" che misura quanti task ONET di quel mestiere Claude potrebbe in linea di principio aiutare a svolgere, e il cerchio "uso reale" che misura quali task gli utenti effettivamente delegano a Claude oggi. La differenza fra i due cerchi è la storia che il consulente AI 2026 deve saper leggere prima di proporre qualunque automazione a un cliente PMI.

I dati di febbraio 2026 dicono che il 49% dei mestieri ha già almeno il 25% dei propri task svolti con Claude, che le occupazioni Computer e Mathematical assorbono il 35% delle conversazioni Claude.ai, e che la concentrazione dei task top 10 è scesa dal 24% di novembre 2025 al 19% di febbraio 2026 (segnale di diversificazione delle use case). Numeri positivi presi singolarmente, ma il loro significato cambia se li metti accanto ai dati Osservatorio Politecnico Milano 2026 sul mercato italiano: il 41% dei lavoratori italiani usa AI per "attività che altrimenti non sarebbe in grado di fare", l'84% delle grandi aziende ha acquistato licenze GenAI, ma solo il 9% ha governance strutturata. La distanza fra cerchio teorico e cerchio reale negli US è già misurabile; in Italia rischiamo di trovarci con due grafici sovrapposti dove nessuno ha mai misurato la distanza, e il consulente che la misura per primo per i suoi clienti porta valore difendibile.

Cos'è davvero l'Anthropic Economic Index e perché contano i due cerchi?

L'Economic Index nasce con uno scopo dichiarato: dare a ricercatori e policymaker dati anticipati sull'impatto economico dell'AI, prima che le statistiche tradizionali del lavoro (occupazione, salari, layoff) registrino i cambiamenti con il consueto lag. La fonte dati primaria sono le conversazioni Claude.ai e i workflow API, classificati automaticamente sui 20.000 task ONET. Anthropic pubblica due flussi: il "limite teorico" basato su una valutazione di Claude sulla propria capacità di assistere ciascun task ONET (cerchio interno), e l'"uso reale" basato sulla frequenza con cui gli utenti effettivamente sollecitano Claude su quel task (cerchio esterno). I due cerchi raramente coincidono: il cerchio teorico è quasi sempre molto più ampio del cerchio reale. Quel divario non è bug, è pattern strutturale che il consulente serio deve saper leggere.

I dati del March 2026 report sono pieni di segnali concreti. Il salario medio orario degli utenti Claude.ai è sceso da $49.30 di gennaio 2025 a $47.90 di febbraio 2026, ma resta ben sopra il $37.30 di salario medio nazionale US: l'utenza è ancora prevalentemente knowledge worker laureato, ma in graduale diffusione verso lavori a salario inferiore. L'augmentation è risalita davanti all'automation (52% vs 45% a novembre 2025), invertendo il trend di agosto 2025 dove l'automation aveva sorpassato. Le interazioni si stanno diversificando: file creation, memory persistente, Claude Skills hanno reso l'uso più collaborativo e iterativo. E poi c'è il dato chiave per il consulente B2B: i workflow API per "business sales" e "automated trading" sono raddoppiati fra novembre 2025 e febbraio 2026, segnale che l'integrazione enterprise sta entrando in fase produttiva.

Se vuoi capire dove conviene davvero automatizzare nella tua PMI

Nel mio hub dedicato all'AI per aziende raccolgo gli articoli che separano il rumore dalla sostanza nelle integrazioni LLM. Se stai pianificando di automatizzare un mestiere o un workflow specifico, la conversazione utile parte dalla mappatura dei task O*NET reali del ruolo, non dalla brochure del fornitore.

Perché il cerchio reale resta sempre più piccolo del cerchio teorico

Tre vincoli strutturali tengono il cerchio reale stretto rispetto al teorico, e nessuno dei tre è risolvibile con prompt engineering migliore. Il primo è l'affidabilità: come ho mostrato nell'articolo sul METR Time Horizon e benchmark maxing, i modelli reasoning 2026 hanno 80%-horizon piatto a 27-32 minuti, il che significa che oltre quella soglia di durata l'agente fa errori inaccettabili per uso autonomo. Per task verificabili (codifica, calcolo, classificazione) la soglia è alta; per task non verificabili (giudizio commerciale, scelta legale, valutazione clinica) la soglia crolla, come ho discusso nelle cinque famiglie di compiti che non vanno date a un LLM diretto. Il cerchio reale si ferma dove l'affidabilità del modello scende sotto il livello accettabile per quel task specifico.

Il secondo vincolo è la barriera legale. Per molti mestieri, i task O*NET su carta sembrano "automatibili" perché tecnicamente l'LLM produce un output adeguato. Ma il task è regolato da norme che impongono firma umana, validazione professionale, responsabilità dichiarata. Un commercialista può usare Claude per redigere bozze di documenti contabili; non può delegargli la firma del bilancio. Un avvocato può usare Claude per ricerca giurisprudenziale; non può delegargli la stesura della memoria di parte. Per il GDPR Art. 22 una decisione completamente automatizzata su un dato personale deve avere base giuridica esplicita, dichiarazione informativa, diritto di opposizione. Per l'AI Act in vigore dal 2 agosto 2026, sistemi high-risk (recruitment, scoring, valutazione di rischio) hanno obblighi di documentazione, monitoraggio, gestione del rischio che spostano il delta delle ore necessarie per l'integrazione molto sopra il "ti chiamo l'API e ho fatto".

Il terzo vincolo è il trust. È il più sottile e il meno discusso. Ogni decisione che il modello prende per conto dell'utente o del cliente entra in una catena di responsabilità: chi risponde se l'output è sbagliato, chi audit-a, chi ha il kill switch. Le aziende mature riconoscono che il trust si costruisce con un track record di mesi, non con la prima demo. L'utente individuale può tollerare un errore Claude su un riassunto perché si fida di rivedere; un'azienda di customer service deve dimostrare al cliente finale (e al regolatore) che il workflow ha controlli appropriati. Il cerchio reale resta indietro al cerchio teorico per il tempo che serve a costruire trust istituzionale, che è una funzione della maturità organizzativa più che della capacità del modello.

Sette categorie di mestiere PMI italiane: dove va il cerchio reale

Su queste tre cause strutturali ho mappato sette categorie di mestiere tipiche delle PMI italiane, usando come griglia il dataset Anthropic plus i pattern di adoption che osservo nei progetti di consulenza. Il dato per ognuna è prescrittivo, non esaustivo.

Sviluppatori. Cerchio teorico: copertura quasi totale dei task tecnici (codifica, debugging, refactoring, code review, documentazione, test). Cerchio reale: già al 50-70% per le aziende che hanno adottato Claude Code o Cursor in produzione, con la crescita dei workflow API che assorbe sempre più lavoro. La barriera legale è bassa, l'affidabilità su task verificabili è alta, il trust si costruisce in poche settimane. È il mestiere dove il delta teorico-reale è più stretto e si chiude più velocemente. Implicazione PMI: investimento ROI evidente sui team da 3+ sviluppatori senior con task standardizzato.

Contabili e amministrativi. Cerchio teorico: data entry, riconciliazione bancaria, classificazione documenti, prima nota, generazione di reportistica. Cerchio reale: 20-30%, frenato da barriera legale (firma del bilancio, dichiarazioni fiscali) e da affidabilità (errori sui numeri sono inaccettabili). Il delta si chiude lentamente perché il professionista deve mantenere il controllo finale e la responsabilità professionale. Implicazione PMI: automatizzare i task pre-validation che il commercialista poi rifinisce, non il giudizio finale.

Legali e contrattualistica. Cerchio teorico: ricerca giurisprudenziale, prima stesura clausole, riassunto contratti, due diligence documentale, analisi di rischio. Cerchio reale: 15-25%, frenato da hallucination su citazioni precise (pattern documentato in fake citations across US courts dal 2023) e da barriera professionale di responsabilità. Il delta è ampio e si chiude solo con architetture RAG su corpus normativo verificato e blocco hard sull'output. Implicazione PMI: collaborare con studio legale che adotta l'AI in pipeline, non sostituirlo.

HR e people. Cerchio teorico: screening CV, prima stesura job description, generazione domande di colloquio, analisi clima. Cerchio reale: 10-20%, frenato fortissimamente da AI Act (recruitment è high-risk) e GDPR Art. 22 (decisioni automatizzate su candidati). Il delta è massimo e si chiude meno velocemente. Implicazione PMI: usare AI per task accessori (parafrasare job description, suggerire domande), mai per il triage automatico dei candidati.

Commerciali e vendite. Cerchio teorico: prospect enrichment, prima bozza email, riassunto chiamate, CRM update, proposta commerciale strutturata. Cerchio reale: 30-45%, in crescita rapida (Anthropic ha raddoppiato i workflow API "business sales" tra novembre 2025 e febbraio 2026). Il delta si chiude dove il commerciale ha tempo limitato e l'output AI accelera la prima bozza che poi rifinisce. Implicazione PMI: investire qui prima che nelle altre categorie, ROI a 60-90 giorni se la sales force è pronta a integrare nel proprio workflow.

Project manager. Cerchio teorico: status report, riassunto riunione, generazione di milestone, risk assessment, follow-up email. Cerchio reale: 25-35%, frenato da specificità del contesto progetto (l'AI non sa cosa è successo nella riunione di mercoledì se non gliel'hai data). Il delta si chiude man mano che memoria persistente e Claude Skills entrano in produzione. Implicazione PMI: investimento moderato, lasciare al PM la scelta degli strumenti che integra nel proprio workflow.

Tecnici di supporto e customer service. Cerchio teorico: triage ticket, risposta a domanda standard, escalation, knowledge base authoring. Cerchio reale: 40-55%, in larga crescita perché Anthropic API ha sviluppato workflow specifici per "automated support for payment and billing issues". Il delta si chiude dove il volume è alto e il task è standardizzabile. Implicazione PMI: integrazione con disclaimer chiaro al cliente finale, statistiche di accuracy sopra una soglia, escalation automatica ai casi anomali.

Cosa misurare nella tua azienda per replicare il framework Anthropic

L'Economic Index nasce per gli US e copre Claude.ai e Claude API a livello aggregato. Per riportare lo stesso schema dentro una PMI italiana servono tre passi concreti, niente di esotico, fattibile in 4-6 settimane. Primo passo, fare l'inventario dei task ONET dei ruoli che si vogliono studiare: ONET è pubblico (onetonline.org), per ogni ruolo elenca dieci-venti task con descrizione operativa. Si selezionano i ruoli reali presenti in azienda, si copia la lista task in un foglio condiviso, si chiede al titolare del ruolo di marcare quali sono effettivamente quelli che fa nelle sue giornate (perché ONET è generico US, alcuni task non si applicano). Questo è il "cerchio teorico" del ruolo nella tua azienda specifica. Secondo passo, attivare il logging strutturato delle interazioni AI per chi ha autorizzazione di usare Claude o ChatGPT in produzione: ogni interazione tagged sul task ONET corrispondente. Dopo due-quattro settimane si ottiene il "cerchio reale" empirico misurato sulla popolazione aziendale.

Terzo passo, calcolare il delta per ogni ruolo e classificarlo nelle tre cause: dove il delta è dovuto ad affidabilità, dove a barriera legale, dove a trust. Questa classificazione è la mappa di prioritizzazione per gli investimenti dei prossimi 12-18 mesi: i ruoli con delta alto e causa "trust" sono i più facili da chiudere (formazione + comunicazione + casi pilota), quelli con causa "affidabilità" richiedono architettura aggiuntiva (RAG verificato, validation pipeline, human gate), quelli con causa "barriera legale" richiedono coinvolgimento del compliance officer e revisione contratti con terzi. Il framework Anthropic non è un benchmark da leggere passivamente; è un esempio metodologico che diventa utile quando lo applichi al tuo perimetro specifico, e che il consulente serio porta come deliverable di engagement.

Una conseguenza non banale di questa mappatura è che il consulente AI serio non pitcha "automatizziamo il tuo customer service", pitcha "investiamo dove il delta teorico-reale può chiudere e dove il vincolo dominante è gestibile in 90-180 giorni". Sviluppatori e commerciali sono prioritari nelle PMI italiane medie del 2026; legali e HR sono prioritari solo se l'azienda ha già governance AI matura per gestire il rischio normativo. Anthropic stessa, nelle conclusioni del March 2026 report, parla di rapid diffusion con equalizzazione fra stati US prevista in 2-5 anni a un ritmo "circa 10 volte più veloce della diffusione di tecnologie economicamente rilevanti del 20° secolo". Per le PMI italiane questo significa che la finestra temporale per costruire vantaggio competitivo serio sull'integrazione AI non è due anni, è dodici-diciotto mesi. Chi parte adesso con mappatura del proprio cerchio teorico e cerchio reale può posizionarsi nel quartile alto del proprio settore prima che il mercato chiuda la finestra. Se vuoi una conversazione tecnica su quale categoria di mestiere della tua PMI ha il delta più stretto e dove conviene partire, il modulo di preventivo gratuito è il punto da cui inquadrare la richiesta in due minuti, sette domande.