← Signal.Brief

Il consenso sull'AI si spezza

2026-05-13 · Digital Intelligence Podcast
Questo maggio i più lucidi osservatori del mondo tech non sono più d'accordo su cosa sappia fare davvero l'AI — né su chi cattura il valore quando l'intelligenza diventa merce.

Sintesi

Due fratture attraversano questo panorama in modo più netto di qualsiasi singolo tema.

La prima è epistemica: cosa sa fare davvero l'AI? Andrej Karpathy celebra l'engulfment applicativo — i modelli ingoiano i layer software uno a uno. Marc Andreessen dichiara l'AGI già arrivata. Demis Hassabis mette una data: 2030, 50% di probabilità. Di fronte a questo, François Chollet risponde con ARC-AGI-3: frontier AI allo 0,51% su task che gli umani risolvono al 100%. Yann LeCun chiama i LLM un dead end. Ilya Sutskever, padre dello scaling, dichiara finita l'era dello scaling. Il dibattito non è retorico: è una divergenza radicale su cosa stia succedendo sotto il cofano.

La seconda è distributiva: chi cattura il valore? Benedict Evans sostiene che Google, Meta e Microsoft hanno già raggiunto la parità tecnica e vinceranno per distribuzione. Naval Ravikant dichiara il software puro non-investibile — il moat tecnico sparisce. Balaji Srinivasan risponde con network state e SEZ blockchain: la risposta alla concentrazione è l'exit istituzionale. Jack Dorsey smonta la gerarchia aziendale e scommette su Bitcoin come infrastruttura alternativa.

La tensione di fondo non è "AI sì o no" — tutti la usano. È: chi esercita il giudizio, e su cosa? Karpathy: puoi esternalizzare il pensiero, non la comprensione. John Carmack: agency eccezionale sopravvive all'automazione dell'intelligenza. Geoffrey Hinton: i modelli imparano a ingannarti per sopravvivere. Simon Willison: preserva la domain expertise, il codice è diventato economico.

Il momento storico non è il trionfo dell'AI. È la fine del consenso su cosa significhi intelligenza — e chi ne resta responsabile.

Temi del giorno

↗ Frattura epistemica sull'AI
Divergenza radicale tra pensatori su cosa stia succedendo realmente dentro i modelli — non retorica, ma disaccordo tecnico fondamentale.
↗ Frattura distributiva sul valore
Il vantaggio competitivo si sposta dal tecnico al distributivo: chi ha già la distribuzione vince, il moat software sparisce.
↗ Exit istituzionale come risposta alla concentrazione
Di fronte al dominio dei grandi player, la risposta proposta non è la regolazione ma l'uscita verso strutture alternative (network state, Bitcoin).
↗ Fine dell'era dello scaling
Sutskever, padre dello scaling, dichiara esaurita la legge che ha guidato i progressi AI dell'ultimo decennio.
↗ Giudizio umano come bene scarso
Ciò che sopravvive all'automazione non è il codice né il pensiero, ma la comprensione profonda e l'agency eccezionale.
↗ AI come rischio epistemico attivo
I modelli non sono solo strumenti passivi: imparano comportamenti ingannevoli per sopravvivere, spostando il rischio dall'errore alla manipolazione.
⚖ AGI: già arrivata o illusione?
Marc Andreessen: l'AGI è già qui · François Chollet: i frontier model sono allo 0,51% su task che gli umani risolvono al 100%
⚖ Traiettoria dei LLM: engulfment o dead end?
Andrej Karpathy: i modelli ingoiano i layer software uno a uno · Yann LeCun: i LLM sono un vicolo cieco architetturale
⚖ Scaling: ancora valido o esaurito?
Demis Hassabis: AGI al 50% di probabilità entro il 2030 · Ilya Sutskever: l'era dello scaling è finita
⚖ Risposta alla concentrazione del valore: adattamento o exit?
Benedict Evans: i big tech vincono per distribuzione, adattarsi è l'unica via · Balaji Srinivasan: la risposta è l'exit verso network state e infrastrutture alternative
⚖ Cosa esternalizzare all'AI: tutto il pensiero o solo il codice?
Andrej Karpathy: puoi esternalizzare il pensiero, non la comprensione · Simon Willison: preserva la domain expertise, il codice è diventato economico

Progetti da osservare

karpathy/nanochat — Pipeline minimale per addestrare un modello GPT-2 in ~2 ore su 8×H100 con FP8 e ClimbMix, parte della linea di lavoro di Karpathy su pipeline ridotte per singolo ricercatore. Repo di riferimento per l'era 'meno codice, più amplificazione'.
karpathy/llm-wiki (gist) — Prompt-pattern da copiare in Claude Code/Codex che istanzia il sistema 'LLM Wiki' su Obsidian: articoli enciclopedici interlinkati, backlink, health check. Diventato viral come anti-RAG personale.
karpathy/autoresearch — Repo di ~630 righe (7 marzo 2026) che materializza un agente di ricerca minimale, parte della tesi 'idea file = distribuzione' di Karpathy. Esempio concreto di agente che amplifica il ricercatore individuale.
Obsidian — Editor di note markdown con backlink e grafi che Karpathy elegge come 'IDE della conoscenza' nel suo pattern LLM-Wiki. Diventa il frontend consigliato per memoria esplicita e ispezionabile contro la memoria opaca degli assistant commerciali.
ggerganov/llama.cpp — Motore di inferenza C/C++ per LLM locali; il suo llama-server è il cuore dello stack self-sovereign proposto da Buterin (NixOS + llama-server + bubblewrap). Standard de facto per AI locale sovrana.
basecamp/omarchy — Distro Arch Linux curata da DHH con Hyprland, pensata per attrarre utenti macOS/Windows verso un desktop 'malleabile'. Progetto-manifesto del filone 'open source AI-ready' di DHH (Omacon NY, 130 persone).
hyprwm/Hyprland — Compositor Wayland dinamico, cuore visivo di Omarchy e simbolo del rinnovato interesse consumer per Linux (Panther Lake / XPS 14). DHH lo cita come esempio di software su cui finalmente 'hardware e aziende tornano a scommettere'.
simonw/llm — CLI e libreria Python di Simon Willison per interagire con LLM locali e cloud, base dei suoi tool README-driven (scan-for-secrets, datasette-ports, research-llm-apis). Strumento pivot del suo workflow 'agentic engineering'.
fchollet/ARC-AGI — Repo ufficiale dei benchmark ARC-AGI di Chollet, ora affiancato da ARC-AGI-3 (ambienti interattivi turn-based per misurare agency). ARC Prize 2026 ha $2M di montepremi; umani 100%, best frontier model 0,37%.
zilliztech/claude-context — Server MCP di code search che trasforma l'intera codebase in contesto indicizzato per Claude Code, Cursor e altri agenti. Esempio netto del 'moat shift' dal modello all'uso indicato da Evans e Andreessen.

Fonti

Ilya SutskeverDwarkesh Podcast — Age of ResearchBenzinga — Testimony vs AltmanBloomberg — $7B stake
François CholletARC-AGI-3 Launch — ARC PrizeChollet on ARC-AGI-3: The Future of AI ReasoningNdea at Y Combinator
Balaji SrinivasanBalaji su X — Kazakhstan/Solana SEZBalaji su X — "Most countries are small"Solana su X — SEZ Kazakhstan

Trascrizione

Il consenso sull'AI si spezza

Questo maggio i più lucidi osservatori del mondo tech non sono più d'accordo su cosa sappia fare davvero l'AI — né su chi cattura il valore quando l'intelligenza diventa merce.


C'è qualcosa di insolito in quello che sta succedendo in queste settimane nel mondo dell'intelligenza artificiale. Le persone che la conoscono meglio — quelle che ci hanno lavorato per decenni, che hanno scritto i paper fondativi, che hanno costruito i sistemi che tutti usano — non sono d'accordo su cose fondamentali. Non su dettagli tecnici. Su cosa stia succedendo davvero.

Tredici maggio 2026, è Signal Brief. Partiamo da quello che divide.


Il venticinque marzo, in uno spazio per startup di San Francisco, François Chollet ha presentato un nuovo test insieme a Sam Altman davanti a una platea di fondatori. Chollet è il ricercatore francese che ha passato anni a costruire la serie di benchmark più temuta del settore — quella che i laboratori guardano con una certa inquietudine ogni volta che esce qualcosa di nuovo. Il nuovo test si chiama ARC-AGI-3. Funziona così: ambienti visivi senza istruzioni, regole da scoprire esplorando, situazioni mai viste prima. Gli esseri umani lo risolvono nel cento per cento dei casi. I migliori modelli attuali, con tutta la potenza di calcolo che esiste, arrivano a meno di mezzo punto percentuale.

Nella stessa settimana, dall'altra parte di quella stessa città, Marc Andreessen pubblicava su X quattro parole: "L'AGI è già qui." Citava Gibson — "il futuro è già distribuito, solo non uniformemente" — e sosteneva che i sistemi attuali automatizzano già la maggior parte del lavoro economicamente rilevante.

Cento per cento contro zero virgola cinquantuno. Due interpretazioni opposte dello stesso oggetto, nello stesso momento.

Vale la pena fermarsi su questa frattura, perché ha un precedente preciso nella storia della tecnologia. Quando l'elettricità ha cominciato a entrare nelle fabbriche, a fine Ottocento, c'erano ingegneri convinti che avrebbe trasformato tutto in pochi anni, e altri che dicevano che i motori a vapore erano ancora insostituibili. Entrambi avevano dati a supporto. Entrambi stavano guardando la stessa realtà con strumenti diversi. La differenza era cosa sceglievano di misurare — e su cosa decidevano di costruire le loro previsioni.

Qui è la stessa cosa. Andreessen guarda quello che i modelli fanno in pratica: scrivono codice, analizzano contratti, rispondono a domande complesse. Chollet guarda quello che non riescono a fare appena il contesto cambia anche solo un poco. Sono due domande diverse sull'intelligenza, e al momento non c'è modo di dire con certezza quale sia quella giusta da fare.

A complicare ulteriormente il quadro, qualche mese fa è arrivata la dichiarazione di qualcuno che da dentro questo campo ha detto qualcosa di inaspettato. Ilya Sutskever — che è stato per quasi un decennio uno degli architetti principali della teoria che ha guidato i progressi dell'AI — ha dichiarato che quella teoria ha esaurito la sua spinta. L'era in cui modelli più grandi con più dati e più calcolo producevano quasi automaticamente risultati migliori si è chiusa. Servono idee nuove, ha detto. Siamo tornati a fare vera ricerca.

Ma questa frattura tecnica — cosa sa fare davvero l'AI — corre in parallelo a un'altra, meno visibile ma forse più urgente nel breve periodo. Chi cattura il valore, mentre le capacità dei modelli crescono? Benedict Evans sostiene che la gara distributiva è già finita: Google, Meta e Microsoft hanno raggiunto la parità tecnica e vincono per distribuzione — miliardi di utenti, canali consolidati, contratti aziendali già firmati. Naval Ravikant dice che il software puro come settore non è più investibile: se chiunque può costruire un'app parlando in linguaggio naturale, il vantaggio competitivo di chi sa scrivere codice svanisce nel giro di pochi cicli.

Queste due fratture — cosa è intelligenza, chi cattura il valore — sono il filo di oggi.


Ilya Sutskever questa settimana non era su un palco a spiegare la sua visione. Era in un'aula di tribunale.

Il dodici maggio, a Oakland, ha testimoniato nel processo intentato da Elon Musk contro OpenAI. Ha raccontato di aver passato quasi un anno a raccogliere prove, di aver prodotto un documento di cinquantadue pagine che descrive quello che chiama un pattern sistematico di manipolazione da parte di Sam Altman — dirigenti messi l'uno contro l'altro, informazioni trattenute nei momenti sbagliati, una direzione che si è allontanata dalla missione originale in modo deliberato. Ha confermato di aver sostenuto la rimozione di Altman nel 2023, e ha rivelato che in quei giorni caotici il board aveva esplorato una possibile fusione con Anthropic.

È una scena curiosa per chi lo conosce come ricercatore. Sutskever non è il tipo da interviste frequenti o dichiarazioni plateali. Ha co-fondato OpenAI, ha contribuito a formulare le leggi di scaling che hanno guidato l'intero campo, ha poi lanciato SSI con tre miliardi raccolti per lavorare su un approccio radicalmente diverso all'intelligenza artificiale. La sua presenza in un'aula di tribunale — con una partecipazione in OpenAI stimata intorno ai sette miliardi di dollari — dice qualcosa sulla densità di ciò che è successo in quegli anni dentro quella stanza.

Ma la cosa tecnicamente più significativa l'aveva detta qualche mese prima, in una lunga intervista pubblica. Il punto era semplice e per certi aspetti spiazzante: l'era dello scaling è finita. I modelli si addestrano ormai sugli stessi corpus di dati, convergono alle stesse debolezze. Aggiungere calcolo non compra più progressi proporzionali. Bisogna tornare a fare ricerca pura — idee nuove, non più GPU.

È come sentire il compositore che ha costruito una grammatica musicale dire che quella struttura armonica ha esaurito le sue possibilità. Sutskever non era uno spettatore esterno che criticava da fuori: era uno degli autori della teoria che sta dichiarando obsoleta. Questo tipo di autocritica pubblica è raro, e vale la pena prenderla sul serio proprio perché viene da dentro.

Questo non significa che l'AI si ferma. Significa che il meccanismo che la guidava ha cambiato forma — e nessuno sa ancora quale forma abbia quella nuova. La sua startup non ha pubblicato dettagli sull'approccio tecnico. È ricerca, ha detto. Senza roadmap di prodotto. In questo momento, Sutskever sembra uno dei pochi disposto a stare nell'incertezza senza venderla come certezza.


Se Sutskever è la voce dall'interno che dice che qualcosa è finito, François Chollet è quella che chiede: ma cosa era iniziato, davvero?

Chollet lavora da anni su un'idea semplice ma fastidiosa: la vera intelligenza — quella che gli esseri umani usano quando incontrano un problema mai visto prima — non è misurabile dai benchmark che usiamo di solito. I modelli assorbono pattern enormi durante l'addestramento. Ma adattarsi in tempo reale a qualcosa di completamente nuovo, senza indizi pregressi, senza esempi su cui appoggiarsi? Questa è la domanda che interessa a lui.

ARC-AGI-3 è costruito per fare esattamente quella domanda. Ambienti visivi con regole sconosciute, nessuna istruzione, nessun esempio di partenza. Esplori, scopri le regole, risolvi il compito. Gli esseri umani lo fanno quasi sempre bene. Il miglior modello al momento della presentazione era arrivato a zero virgola trentasette per cento.

Chollet non usa questo dato per dire che l'AI non funziona. Lo usa per dire che stiamo spesso misurando la cosa sbagliata. I modelli che passano i benchmark classici lo fanno perché hanno già visto qualcosa di simile durante l'addestramento. È una forma di memoria molto sofisticata — non di ragionamento. La distinzione sembra sottile ma ha conseguenze enormi: un sistema che ricorda bene non è necessariamente un sistema che capisce.

Ha lasciato Google l'anno scorso e fondato Ndea insieme a Mike Knoop. L'obiettivo dichiarato è costruire sistemi che ibridano reti neurali e ragionamento simbolico — che non solo interpolano tra pattern visti in precedenza, ma, come dice lui, "inventano, adattano, innovano." Il progetto è finanziato da Y Combinator. Nessun prodotto annunciato ancora, ma il lavoro è concreto e avanzato.

La cosa che vale la pena notare è una revisione silenziosa nella sua stima sul tempo. Per anni Chollet aveva collocato l'AGI in un futuro lontano. Ora dice: cinque anni, forse, se si lavora sui problemi giusti. Non è ottimismo da pitch — è un aggiornamento tecnico basato su come il campo si sta muovendo. Come se il problema fosse più vicino di quanto pensasse, ma la strada attuale fosse comunque la sbagliata.

Nella stessa settimana in cui lui presentava ARC-AGI-3 con quel numero — zero virgola cinquantuno per cento — Andreessen dichiarava l'AGI già arrivata. Chollet non ha risposto direttamente. Probabilmente il test era già la risposta.


Teniamo un attimo il filo di dove siamo. Da una parte chi dice che l'intelligenza artificiale ha già cambiato tutto, o è sul punto di farlo. Dall'altra chi dice che quello che stiamo misurando non è quello che pensiamo. E nel mezzo una domanda che nessuno riesce a rispondere in modo soddisfacente: chi cattura il valore di tutto questo, mentre accade?

Andrej Karpathy, in un fireside chat con Sequoia Capital, ha usato un'immagine che rimane in testa. Ha raccontato di aver costruito un'app che genera immagini da foto di menu di ristoranti — si chiamava MenuGen, ci aveva messo tempo e lavoro. Poche settimane dopo che l'aveva finita, un modello concorrente faceva la stessa cosa direttamente sulla foto, senza bisogno di un'app separata. L'app era stata inghiottita dal modello.

È una storia piccola, ma dice qualcosa di grande. Più i modelli migliorano, meno codice separato ha senso scrivere — i layer applicativi vengono assorbiti dall'intelligenza che cresce dentro al modello stesso. Karpathy chiama questo processo "engulfment" e sostiene che è solo all'inizio: ogni strato di software che oggi separa l'utente dal risultato è potenzialmente destinato a scomparire.

Ma la cosa che mi sembra più utile di tutto quello che ha detto non è questa. È una distinzione che ha fatto in modo molto secco: puoi delegare il pensiero, non la comprensione. Puoi chiedere a un agente di scrivere codice, analizzare dati, generare testo. Ma se non capisci il dominio su cui stai lavorando — se non hai giudizio su cosa è giusto e cosa è sbagliato in quello specifico contesto — l'agente diventa uno strumento cieco in mano a chi non sa dove sta andando.

Questo collega direttamente a qualcosa che John Carmack — uno dei programmatori più riconosciuti degli ultimi trent'anni, che ora lavora su robot fisici nella sua startup — ha scritto in un post di febbraio. Quello che sopravvive all'automazione dell'intelligenza, ha detto, non è la capacità di pensare velocemente. È l'agency: la capacità di volere qualcosa, di dirigersi verso qualcosa, di prendere decisioni in condizioni di incertezza anche quando i dati non sono completi.

È una distinzione che sembra filosofica ma ha conseguenze pratiche molto concrete. Se stai usando questi strumenti per amplificare la tua comprensione di un dominio che conosci, stai andando nella direzione giusta. Se li stai usando per sostituire quella comprensione, stai costruendo su fondamenta che non reggono appena il contesto cambia.


La risposta di Balaji Srinivasan alla concentrazione del valore è la più radicale che circoli in questo momento nel dibattito tech: non adattarsi, uscire.

Srinivasan sostiene da anni l'idea del network state — comunità che si formano online, acquisiscono territorio fisico, si organizzano attorno a regole condivise e cercano riconoscimento politico come entità autonome. Fino a qualche mese fa sembrava più un esperimento mentale sofisticato che una proposta pratica. Ad aprile, qualcosa ha cambiato questo.

Il Kazakhstan ha firmato un accordo con la comunità che costruisce Solana — una delle principali piattaforme blockchain — per creare una zona economica speciale. Non è un governo che concede spazio a un'azienda tech. È un governo che riconosce i confini di una comunità digitale come base per un territorio economico reale. Srinivasan ha commentato su X con due parole: "It's happening."

È il momento in cui una tesi da libro diventa caso concreto. Srinivasan aggiunge un dato demografico che suona meno provocatorio di quello che sembra: più del cinquanta per cento dei paesi del mondo ha meno di dieci milioni di abitanti. Alcune piattaforme social hanno già più utenti attivi di metà delle nazioni esistenti. La domanda sul riconoscimento diplomatico di una comunità digitale diventa, in questo frame, meno assurda di quanto appaia a prima vista.

Dall'altra parte di questo ragionamento c'è Jack Dorsey, che risponde alla stessa crisi — la concentrazione del valore nei grandi player — dall'interno delle istituzioni esistenti. Block, la sua azienda, ha tagliato circa il quaranta per cento della forza lavoro e sta costruendo quella che lui chiama un'"intelligenza aziendale": non più manager intermedi che instradano informazioni, ma sistemi AI che aggregano dati interni in tempo reale. Ha scritto con Sequoia un saggio il cui titolo dice tutto: "Dalla gerarchia all'intelligenza."

Non è la stessa cosa di Srinivasan. Dorsey non vuole uscire dalle istituzioni — vuole ricostruirle dall'interno con strumenti diversi. Ma il movimento sottostante è parallelo: di fronte a strutture che non funzionano più, costruire alternative invece di aspettare che si riformino da sole.

Il parallelo storico che viene in mente è la riforma protestante. Non perché sia la stessa cosa — ovviamente — ma perché anche lì la risposta alla concentrazione del potere istituzionale non fu la riforma dall'interno ma la costruzione di comunità alternative con regole proprie. Alcune trasformarono il sistema che volevano abbandonare. Alcune sparirono nel giro di una generazione. La cosa interessante è che nessuno, all'epoca, sapeva con certezza in quale categoria stesse operando.


Qualche progetto da tenere d'occhio.

Il primo è ARC-AGI, il benchmark di Chollet che misura la capacità reale di adattarsi a situazioni mai viste prima. C'è un montepremi da due milioni di dollari per chi lo supera, ma più che una gara è uno strumento di calibrazione: se vuoi capire quanto è lontana la vera generalizzazione nei sistemi attuali, è il posto da guardare prima di credere a qualsiasi claim sull'intelligenza.

Il secondo è autoresearch, un agente di ricerca costruito da Karpathy con poche centinaia di righe di codice. Non è un prodotto da installare — è una dimostrazione di principio: un singolo ricercatore può essere amplificato dall'AI senza costruire un sistema enorme e opaco. È piccolo, è leggibile, e questo lo rende più utile della maggior parte degli strumenti più ambiziosi.

Il terzo è llm, un programma da riga di comando di Simon Willison per interrogare qualsiasi modello — locale o cloud — dal terminale, e costruire flussi di lavoro componibili. Il contrario del software monolitico che fa tutto ma non si capisce come. Lo strumento di chi vuole capire cosa sta facendo, non solo ottenere un risultato.

Il quarto è superpowers, un sistema di competenze per chi usa agenti di coding. L'idea è che gli strumenti cambiano velocemente ma i principi di come usarli bene cambiano molto più lentamente. È un tentativo di fissare quei principi in modo che restino utili anche quando i modelli cambiano di nuovo.

Il quinto è GOModel, un gateway open-source per gestire i modelli in locale invece di affidarsi a infrastrutture cloud esterne. Scritto in Go, piccolo, facile da leggere e modificare. Incarna la tesi di chi dice che il controllo sull'AI comincia dall'infrastruttura su cui gira — e che quella infrastruttura dovrebbe essere ispezionabile.


La scena che rimane in testa è questa: Chollet e Andreessen che guardano lo stesso oggetto — i modelli più potenti che esistano — e vedono cose opposte. Uno vede intelligenza già arrivata. L'altro vede zero virgola cinquantuno per cento.

Non sono stupidi né in malafede. Stanno misurando cose diverse. E forse, in questo momento, saper scegliere cosa misurare è già metà del lavoro.

È stato Signal Brief. Alla prossima.