Strumenti AIIn primo piano

Claude Fable 5: il primo modello Mythos di Anthropic arriva al pubblico

Il 9 giugno 2026 Anthropic ha rilasciato Claude Fable 5, primo modello pubblico della classe Mythos. 95,5% su SWE-bench, memoria persistente, task autonomi multi-giorno. Prezzo doppio di Opus 4.8, gratis su Pro/Max/Team fino al 22 giugno.

··7 min di lettura
Claude Fable 5 di Anthropic, primo modello Mythos pubblico, stile editoriale paper su sfondo cream
In breve. Il 9 giugno 2026 Anthropic ha rilasciato Claude Fable 5, il primo modello pubblico della classe Mythos, un gradino sopra a Opus 4.8. Benchmark dichiarati: 95,5% su SWE-bench Verified, task autonomi che durano giorni, memoria persistente tra sessioni, visione capace di vincere a Pokémon FireRed da soli screenshot grezzi. Prezzo doppio rispetto a Opus 4.8 ($10 input, $50 output per milione di token). Gratis su Pro, Max e Team fino al 22 giugno per testarlo.
95,5%
su SWE-bench Verified, benchmark di riferimento per la generazione di codice reale
2x
il prezzo rispetto a Claude Opus 4.8 ($10 input, $50 output per milione di token)
22 giu
ultima data per provarlo gratis sui piani Pro, Max e Team prima del prezzo pieno
4
canali di accesso: API Anthropic, app Claude, AWS Bedrock, GitHub Copilot

A pochi giorni dall'apertura di Project Glasswing all'agenzia europea ENISA, di cui abbiamo scritto in Claude Mythos e l'UE, Anthropic ha fatto un passo che molti non si aspettavano così presto. Il 9 giugno 2026 ha rilasciato al pubblico Claude Fable 5, il primo modello della famiglia Mythos accessibile a chiunque abbia un piano Anthropic. La differenza con i Mythos ad accesso ristretto (quelli che hanno trovato 10.000 vulnerabilità nel software critico mondiale) è una sola: Fable 5 ha i safeguards attivi, gli altri no.

Per chi costruisce prodotti AI, è il salto di livello più significativo dell'anno. Per chi li usa in azienda, conviene capire bene quando vale la differenza di prezzo e quando no.

I benchmark, e cosa significano davvero

Anthropic ha pubblicato un valore di 95,5% su SWE-bench Verified, il benchmark che valuta la capacità di un modello di chiudere issue reali da repository GitHub. Su SWE-bench Pro, una variante più severa, Fable 5 sta intorno all'80%, contro il 69% di Opus 4.8. Per dare misura, fino a un anno fa gli stessi benchmark erano sotto il 40% per i modelli più potenti disponibili. La curva di miglioramento, su questo asse, è quasi verticale.

Le novità più rilevanti, oltre al raw skill di codice, sono tre.

Task autonomi multi-giorno. Fable 5 può essere lasciato a lavorare su un compito che richiede ore o giorni interi senza supervisione continua. Sviluppa, debugga, deploya, monitora i log, corregge da solo. Anthropic mostra esempi di task durati 30 ore consecutive senza intervento umano significativo. Per chi gestisce automazioni serie, è il primo modello che si avvicina davvero al concetto di "agente che lavora come un junior senior".

Memoria persistente tra sessioni. Il modello mantiene contesto utile attraverso conversazioni diverse, senza che ogni volta sia necessario ri-spiegare l'azienda, gli obiettivi, le preferenze di stile. È lo stesso filone che abbiamo raccontato a proposito di Claude Skills auto-miglioranti, portato a livello di sistema invece che di skill singola.

Sistema visivo all'altezza. Anthropic ha mostrato Fable 5 battere Pokémon FireRed da zero, usando solo screenshot grezzi del gioco e gestendo l'inventario, gli incontri, le mappe. Sembra un caso curioso, è in realtà la dimostrazione che il modello sa "vedere" e pianificare a partire da contesti visivi mai visti prima. Per chi lavora con interfacce non standard, dashboard custom, file PDF complessi, è un cambio di livello.

Il prezzo, e quando vale la differenza

Fable 5 costa dieci dollari per milione di token in input, cinquanta in output. Esattamente il doppio di Opus 4.8 (che sta a 5 e 25). Per i carichi tipici di una PMI italiana, una conversazione media di lavoro pesa intorno a 5-15 mila token totali, quindi il costo per task resta nell'ordine dei centesimi. Su volumi piccoli la differenza di prezzo è insignificante.

La situazione cambia con i task lunghi e gli agenti. Far girare un agente Fable 5 che lavora 24 ore di fila può consumare facilmente 5-10 milioni di token, e lì i costi diventano reali. La regola pratica che stiamo usando con i clienti è semplice: Fable 5 per task in cui la qualità del singolo passo conta più del totale (revisioni legali, analisi finanziarie complesse, generazione codice mission-critical). Opus 4.8 per workflow ad alto volume con tolleranza all'errore (classificazione email, sintesi di documenti standard, primo livello di supporto).

L'opportunità del periodo di prova. Fino al 22 giugno 2026 Fable 5 è gratis su tutti i piani Pro, Max e Team. Per una PMI che vuole capire se vale il salto, sono dodici giorni per testare il modello sul proprio caso d'uso reale, senza vincoli di consumo. La cosa da fare in pratica è isolare un task ricorrente che oggi costa tempo umano, e farlo girare in parallelo con Fable 5 e Opus 4.8 sugli stessi input. La differenza, se c'è, si vede entro mezza giornata di testing serio.

La parte sensibile: Fable 5 con safeguards, Mythos 5 senza

Anthropic stessa, nei giorni precedenti al lancio, aveva diffuso un documento di safety dove ammette che la classe Mythos sta arrivando a capacità "preoccupanti" su certi domini, soprattutto cybersecurity offensiva. Il rilascio pubblico di Fable 5 avviene quindi con tutta una serie di filtri attivi, l'equivalente di un "lock" sulle capacità più sensibili. La versione senza filtri, internamente chiamata Mythos 5, resta riservata a partner di infrastruttura critica e ricercatori di cybersecurity vagliati, dentro al programma Glasswing che abbiamo raccontato.

Per le PMI italiane il messaggio è duplice. Quello che si compra via API è una versione consapevolmente limitata. Le capacità più "pericolose" (creazione di malware, scoperta sistematica di zero-day) restano fuori dalla portata commerciale. Allo stesso tempo, però, anche Fable 5 con safeguards è il modello più potente mai reso disponibile pubblicamente, e introduce un rapporto qualità-costo che cambia il calcolo di alcuni progetti AI lasciati in stand-by negli ultimi mesi.

Cosa fare in azienda nei prossimi quindici giorni

Tre azioni concrete, da impostare entro il 22 giugno.

Identificare un task pilota di valore reale. Non l'esperimento da demo. Una cosa che oggi succede in azienda, prende tempo a una persona qualificata, e per cui un modello AI di qualità superiore farebbe la differenza. Esempi tipici: revisione contratti con clausole non standard, analisi di rendiconti finanziari di clienti, scrittura di documentazione tecnica di prodotto, debugging di codice legacy. Su come scegliere il task giusto abbiamo dedicato spazio in Come implementare l'AI in una PMI italiana.

Confrontare Fable 5 e Opus 4.8 in cieco. Stessi input, output anonimi, valutazione da chi conosce il task. Spesso la differenza di prezzo non si traduce in differenza di qualità percepita: per molti compiti aziendali Opus 4.8 è ancora la scelta migliore. Per altri (analisi profonde, agentic workflow lunghi) la differenza è netta. Solo il test reale lo dice.

Pianificare il prezzo per dopo il 22 giugno. Se il pilota funziona, decidere subito budget e use case. Far girare un agente Fable 5 senza limiti su un task ad alto volume può portare bollette mensili a quattro cifre. Mettere un tetto di spesa sull'API key e definire un alert al 50% del budget aziendale è igiene basilare, ma viene saltato dal 90% delle aziende che adottano AI per la prima volta.

Il quadro che emerge

Fable 5 si inserisce in una sequenza precisa. La settimana scorsa Google ha firmato il deal da 30 miliardi con SpaceX per il compute. Pochi giorni dopo Apple ha confermato il miliardo annuale a Google per Gemini in Siri. Adesso Anthropic mette in commercio la propria punta di diamante. I tre laboratori frontier stanno alzando insieme il livello, ognuno sul proprio asse: Google sul compute, Apple sulla distribuzione, Anthropic sulla qualità del modello. Per le aziende italiane il messaggio operativo è semplice. Smettere di rimandare i progetti AI in attesa che "le cose si calmino". Le cose non si calmeranno, e ogni mese di attesa costa una posizione in più persa rispetto alla concorrenza.

Per il quadro normativo che accompagna tutto questo, restano valide le coordinate della nostra guida pratica all'AI Act per le aziende italiane. Per il taglio di scelta tra modelli, è utile il confronto in ChatGPT vs Claude vs Gemini per la tua azienda. Quando le scelte diventano più articolate, una consulenza IT specializzata con esperienza nei processi italiani aiuta a evitare i contratti da pentirsene fra sei mesi.

Tag

Claude Fable 5AnthropicMythosSWE-benchagenti AImodelli AI 2026AI per PMI

Articolo scritto da

Ritratto di Gabriele Pecchioli
Gabriele Pecchioli

Consulente IT & AI per PMI italiane · Prato

Founder di Unicorn Digital. Consulente IT e AI per PMI italiane, basato a Prato. Scrive di intelligenza artificiale applicata alle imprese dal 2015.

Letture correlate

Indice · 5 sezioni